Konvertor T602 do HTML (c)1997,98 Štěpán Roh verze 1.02 Tato utilitka slouží k převodu souborů ve formátu Text602 3.0 do HTML 3.2. Provádí nejenom strukturální konverzi, ale také konverzi českých znakových sad. Volitelně je možná i externí konverze obrázků a konverze tabulek, která je ale velice experimentální a nepřesná. Výsledný HTML soubor je částečně zbaven formátování, zmizí dělící znaménka, vzdálenosti odstavců se sjednotí, tabulky vypadají jinak (zcela jinak) apod. Ovládání -------- Ovládání se děje pomocí příkazové řádky : ta má tři formy - žádost o nápovědu : -?, /?, -h, /h - příkaz : t602html [-[přepínač]...} vstupní_soubor [výstupní_soubor] přepínače : q ... tichý mód sjméno_výstupní_znakové_sady (implicitně isolat2) t ... konverze tabulek ix ... konverze obrázků - pro x = r ... vynechání u ... ponechání původního odkazu c ... externí konverze cjméno_konfiguračního_souboru (implicitně t602html.ini v adresáři konvertoru) pozn.: vstupní a výstupní soubor nesmí být stejný není-li uveden výstupní soubor, konvertuje se do souboru se jménem vstupního a příponou .HTM - jméno textového souboru s více příkazy (tzv. dávkový mód) : @jméno_dávkového_souboru Znakové sady ------------ Znakové sady jsou uloženy v souborech jméno_sady.CHS. Tyto musí být v adresáři konvertoru. Jejich formát odpovídá formátu RFC 1345. Soubory koi8cs.chs, pclat2.chs a keybcs2.chs musí existovat (jedná se o sady používané v 602 souborech). Formát dávkového souboru ------------------------ Kromě normálních příkayových řádek (viz výše) může obsahovat : ; text_poznámky - poznámka @set jméno_přepínače parametr - globální nastavení přepínače (může být lokálně změněno v příkazové řádce) @unset jméno_přepínače - zrušení globálního nastavení přepínače @echo text - vypsání textu (i při tichém módu) Formát konfiguračního souboru ----------------------------- Řádka Konfiguračního souboru má formát 'jméno_klíče=hodnota'. Možné klíče jsou : title - titulek HTML souboru - první znaky %% se nahradí jménem T602 souboru (implicitně 'Soubor %%') prolog - soubor jehož obsah se uvede mezi HTML hlavičku a zkonvertovaný text (implicitně žádný) epilog - soubor jehož obsah se uvede mezi zkonvertovaný text a konec HTML (implicitně žádný) picsext - přípona zkonvertovaných obrázků (implicitně '.gif') picscmd - program, jenž se má spustit při konverzi obrázků - parametry budou původní jméno obrázku a jméno s příponou picsext - je-li jméno prázdné, odkaz na zkonvertovaný obrázek se sice zařadí, ale jméno obrázku se uloží do souboru c602pics.txt v akt. adresáři (implicitně žádný) Výsledný HTML soubor -------------------- Formát odpovídá finální verzi dokumentu W3C o HTML 3.2. Po konverzi obsahuje : Text titulku text prologu zkonvertovaný 602 text epilogu Poznámky -------- Vysoké, široké a velké písmo se konvertují na stejné, cca. dvojnásobné písmo. Konverze tabulek je opravdu velice nepřesná a někdy se snaží zkonvertovat i to, co není tabulkou. Soubory s formáty znakových sad (.CHS) se vždy hledají v adresáři konvertoru. Jméno znakové sady musí být totožno se jménem souboru (přípona .CHS se doplní). Některé soubory ve formátu T602 obsahují kombinace znaků, které v editoru vytvořit nejdou a které mohou konvertor zmást (příkladem budiž všechny CTI*.* soubory dodávané s T602 3.0). HTML výstup není dokonalý neboť víceméně kopíruje strukturu T602 souboru i se všemi tamními hrůzami. Mezery (i tvrdé) se stahují na jednu. Dělicí znaménka se ruší. Titulek, prolog a epilog se do výstupní znakové sady nekonvertují. Parametry obrázku jako otočení apod. se ignorují. Ze systémových dot-commands se využije pouze @CT (znaková sada), ostatní mizí. Z uživatelských pouze .PI, ostatní mizí. Soubor priklad.602 a konfigurační soubor ukazují většinu možností konvertoru. Soubor pr_lab2.602 ukazuje příklad klasického souboru v T602. Konverze výše uvedených příkladů se provede příkazem 't602html @t602html.thb' Verze 1.02 má opravenu chybu v přepínači -c, v helpu a ve čtení dávkového souboru. Vnitřní provedení ----------------- Vnitřně se postupuje sekvenčním způsobem. Systémové a uživatelské příkazy (tzv. dot commands) se interpretují do odpovídajících HTML tagů. Obrázky se konvertují dle nastavení přepínače -i. Taktéž se provádí zrušení dělících znamének a jiných speciálních znaků T602 (typy písma se převádějí do tagů). Čárová grafika je konvertována do tagů označujících tabulku. Poté následuje konverze do jiné znakové sady, jejíž definice (odpovídající RFC 1345) je načtena ze souboru. Unita konvertující znakové sady pracuje tak, že načte obě sady z definičních souborů, vytvoří tabulku odpovídajících si číselných kódu a provede převod. Štěpán Roh (e-mail : src@post.cz)