RTF-tiedostomuoto

RTF-tiedostomuoto on tarkoitettu tekstin siirtämiseen siten, että ainakin osa tekstin muotoiluista kuten kursivoinneista siirtyy mukana. Kyse ei ole sen enempää rakenteellisesta kuin ulkoasunkaan tarkoin säilyttävästä muodosta vaan jostakin niiden väliltä.

Mihin sitä käytetään?

RTF:n käyttöä selostaa whatis.comissa oleva kuvaus RTF:stä näin (suom. JK):

RTF (Rich Text Format) on tiedostomuoto, joka mahdollistaa tekstitiedostojen siirron erilaisten tekstinkäsittelyohjelmien ja erilaisten käyttöjärjestelmien välillä. Voit esimerkiksi luoda tiedoston Microsoft Word 97:llä Windows 95:ssä, tallentaa sen RTF-tiedostona (se saa tiedostonnimen päätteeksi ".rtf") ja lähettää sen jollekulle, joka käyttää WordPerfect 6.0:aa Windows 3.1:ssä, ja hän voi avata tiedoston ja lukea sen.

Yllä lainattu selostus saattaa antaa liian valoisan kuvan siitä, miten hyvin tekstit muotoiluineen ovat siirrettävissä. Tavallisimmat tekstinkäsittelyohjelmat joka tapauksessa osaavat sekä lukea RTF-muotoisen tiedoston että tallentaa niillä kirjoitetun tiedoston RTF-muotoisena (tyypillisesti File-valikon Save As -vaihtoehdon kautta). Ja teknisesti RTF on siinä mielessä varsin turvallinen, että RTF-tiedosto koostuu vain Ascii-merkeistä; muut merkit ovat jossakin koodimuodossa, joka esittää ne Ascii-merkkejä käyttäen. Eri asia sitten on, miten hyvin alkuperäiset muotoilut todella säilyvät.

Myös tekstinskannausohjelmat (OCR-ohjelmat) usein tuottavat RTF:ää, jolloin mukaan saadaan informaatiota tekstin muotoilusta paperiversiossa. Näin saatu tiedosto voidaan sitten avata tekstinkäsittelyohjelmalla, muuntaa esim. HTML-muotoon tms.

RTF:ää ei pidä sekoittaa ETF:ään (Enriched Text Format) eli text/enriched-muotoon, joka on yksinkertaisempi, notaatioiltaan erilainen ja lähinnä vain meilissä ("sähköpostissa") käytetty. Ks. Enriched Text Format -- A Primer.

Miltä RTF näyttää?

RTF-muotoa sinänsä ei ole tarkoitettu ihmisen suoraan kirjoitettavaksi eikä luettavaksi. Mutta RTF on ulkonaisesti eräänlaista tekstiä, tosin sotkuista.

Seuraavassa tarkasteltava esimerkkidokumentti sisältää tekstin
Tämä on yksinkertainen koe, jossa on myös lihavoitua ja alleviivattua tekstiä
(siten, että itse tekstissä on kyseiset korostukset).

Katsotaan esimerkkinä erästä alkeellista Wordillä kirjoitettua dokumenttia, jossa on lyhyt teksti ja siinä eräitä korostuksia. Tallennettuna RTF-muotoon (Wordin Save As -toiminnolla) se on tiedostona aivan erilainen, mutta esim. Wordillä avattuna se näyttää samanlaiselta. Seuraavassa on yksinkertaistettu ote RTF-muotoisesta versiosta sellaisenaan katsottuna:

{T\'e4m\'e4 on }{\i yksinkertainen}{  koe, jossa on my\'f6s }{\b 
lihavoitua}{  ja }{\ul alleviivattua}{  teksti\'e4.}

Esimerkiksi ä-kirjain esiintyy koodimuodossa \'e4 (missä e4 on ä-merkin koodi heksadesimaalisena). Korostukset ovat mukana siten, että esim. \i tarkoittaa kursivointia (engl. italics) ja aaltosulut {} osoittavat, mitä osaa tekstistä kursivointi koskee. Edellä lainatun osan lisäksi RTF-muoto sisältää tiedon fonteista.

Muuntaminen RTF-muodosta muihin muotoihin (esim. HTML)

Useimmat tavalliset tekstinkäsittelyohjelmat kuten MS Word osaavat lukea RTF-muotoa suoraan, joten erillinen muuntaminen RTF-muodosta esim. Wordin sisäiseen muotoon on yleensä tarpeetonta.

Muunlaisia muunnoksia varten on erilaisia ohjelmia esimerkiksi kokoelmassa RTF-Tools. Muunnoksia voidaan tehdä RTF-muodosta esim. pelkäksi tekstiksi, TeX- tai LaTeX-muotoon, troff-muotoon tai HTML-muotoon.

Koska RTF-muoto sisältää tarkahkoja tietoja ulkoasusta kun taas HTML-kieli esittää dokumentin loogisen rakenteen, niin muunnos kumpaankaan suuntaan ei voi tapahtua niin, että informaatio säilyy sellaisenaan. Käytännössä muunnos RTF:stä HTML:ään tapahtuu siten, että osa RTF-muodon sisältämistä muotoiluista muuntuu vastaavaksi HTML-merkkaukseksi. Asian laadusta johtuu, että tulos sisältää tällöin lähinnä ns. fonttitason elementtejä.

Seuraavat tiedot eivät enää pidä paikkaansa, vaan RTFtoHTML-linkit viittaavat erääseen kaupalliseen tuotteeseen, joka lienee tullut maksuttoman ohjelman seuraajaksi.

Yleisimmin käytetty muunnosohjelma lienee RTFtoHTML. Se on saatavissa useisiin eri käyttöympäristöihin (PC, Mac, Unix ym.). Ohjelman mukana tulee laaja käyttöohje. Esimerkiksi ohjelman PC-versiota käytetään DOSin komentotasolta, yksinkertaisimmin tähän tapaan:
rh2w95 tiedostonnimi.rtf
Jos tällä tavoin käsittelemme edellä mainitun triviaalin esimerkkidokumentin, saamme HTML-muotoisen version, jossa tekstin merkkaus on seuraava:

<DIV ALIGN="LEFT">Tämä on <I>yksinkertainen</I> koe, jossa on
myös <B>lihavoitua</B> ja <U>alleviivattua</U> tekstiä.<BR></DIV>

Tämä ei ole erityisen loogista eikä tyylikästä, mutta tieto kursivoinnista, lihavoinnista ja alleviivauksesta on mukana ja dokumentti jossain mielessä "toimii" ja kelvannee ainakin jatkomuokkauksen pohjaksi (huomattavasti paremmin kuin esim. Wordin "Save As HTML" -toiminnolla saatava sotku).

Tampereen yliopiston Hypermedian perusteet -kurssin aineistoon sisältyy osuus Word tekstin muuttaminen HTML:ksi, jossa on suomenkielisiä ohjeita RTFtoHTML:n käytöstä. Ohessa on pieni esimerkki RTFtoHTML:n tuottamasta HTML-dokumentista.

Ohjelman puutteista mainittakoon, että se kirjoittaa taulukoiden HTML-merkkaukseen kiinteät leveysmääritteet (width) soluille. Tämä rajoittaa vakavasti HTML-version mukautuvuutta erilaisiin katselutilanteisiin, mutta sopivilla työkaluilla tuo haitallinen merkkaus on poistettavissa.

Nimeäminen ja mediatyyppi

Lähes aina RTF-muotoisen tiedoston nimi loppuu merkkeihin .rtf muun muassa siksi, että Internet Explorer tunnistaa tiedoston RTF-muotoiseksi tämän perusteella.

Periaatteessa se, mikä on ratkaisevaa Webissä, meilin liitetiedostoissa ym., on datalle ilmoitettu mediatyyppi (MIME-tyyppi). RTF-tiedostoille varattu mediatyyppi on text/rtf. Se kuuluu luokkaan, jota RFC 2046 luonnehtii, kohdassa 4.1. Text Media Type, seuraavasti:

Beyond plain text, there are many formats for representing what might be known as "rich text". An interesting characteristic of many such representations is that they are to some extent readable even without the software that interprets them. It is useful, then, to distinguish them, at the highest level, from such unreadable data as images, audio, or text represented in an unreadable form. In the absence of appropriate interpretation software, it is reasonable to show subtypes of text to the user, while it is not reasonable to do so with most nontextual data. Such formatted textual data should be represented using subtypes of text.

RTF-muodon määrittely

Mediatyypin text/rtf virallisesti rekisteröidyssä määrittelyssä ilmoitetut spesifikaation osoitteeet ovat vanhentuneet. Microsoftin sivuilta löytyy Rich Text Format (RTF) Specification, version 1.6.

Lisäksi on olemassa hypertekstinä (HTML-muodossa) spesifikaation aiempi versio 1.4 sekä kuvaus versioiden 1.4 ja 1.5 eroista.

Lisätietoja: About RTF, Rich Text Format.

Huomaa, että kun Web-selaimella seurataan linkkiä RTF-tiedostoon, se ehkä toimii sellaisen konfiguraation mukaan, että se automaattisesti avaa tiedoston esim. Wordillä selaimen ikkunaan tai erilliseen ikkunaan. Jos haluat vain ladata tiedoston kovalevyllesi myöhemmin tutkittavaksi, voit yleensä tehdä sen klikkaamalla linkkiä hiiren oikeanpuoleista nappia käyttäen ja valiten vaihtoehdon "Save As" tms.