Kielimerkkaus, luku 1 Kielimerkkauksen tarkoitus:

Kielimerkkauksen perustelut WAI-esteettömyyssuosituksissa

Esteettömyyden eli saavutettavuuden (englanniksi accessibility) yleisestä merkityksestä kertoo Esteettömyysesite. WAI-suosituksilla tarkoitetaan WWW-konsortion eli W3C:n esittämiä esteettömyyssuosituksia, erityisesti sivujen tekemistä koskevaa WCAG 1.0 -suositusta, josta esimerkiksi Euroopan parlamentin päätöslauselma toteaa, että sitä pidetään maailmanlaajuisena standardina.

WCAG 1.0:ssä ja siihen liittyvissä teknisissä ohjeissa kielimerkkausta käsittelevät seuraavat kohdat:

Kohta 4, Clarify natural language usage, itse WCAG 1.0 -suosituksessa eli Web Content Accessibility Guidelines 1.0.
Kohta Identifying changes in language dokumentissa HTML Techniques for Web Content Accessibility Guidelines 1.0..

Näistä ensin mainittu viittaa (edellä jo kuvattujen syiden lisäksi) Braille-kirjoituksen tuottamiseen. Eri kielille käytetään erilaisia Braille-muunnelmia. Aiheesta kertoo laajemmin dokumentti Braille symbols in Swedish braille.

Teknisempi ohjeisto sisältää itse asiassa tarkemmat, havainnollisemmat perustelut kuin itse suositus. Seuraavassa on perustelujen suomennos, jossa on hakasulkeissa selventäviä lisäyksiä:

Kielen vaihtumisen ilmoittaminen on tärkeää useista syistä:

Käyttäjät, jotka lukevat dokumenttia Braille-esityksenä, voivat käyttää sopivia ohjauskoodeja (merkkausta) siellä, missä kieli vaihtuu, taatakseen, että tekstiä Brailleksi muuntava ohjelma tuottaa oikeita merkkejä (esimerkiksi kirjaimia, joissa on tarkkeita). Nämä ohjauskoodit lisäksi estävät ohjelmaa tuottamasta Braille-lyhenteitä (contractions), jotka voisivat hämmentää käyttäjää. Braille-lyhenteet yhdistävät usein esiintyviä merkkiyhdistelmiä, jotka muuten vaatisivat useita Braille-soluja, yhdeksi soluksi. Esimerkiksi "ing", joka normaalisti vaatii kolme solua, yhden kullekin merkille, voidaan lyhentää yhdeksi soluksi [mutta tämä englannin kielessä hyödyllinen menettely voi hämätä muunkielisten tekstien esittämisessä].

Samaan tapaan puhesyntetisaattorit, jotka "puhuvat" monia kieliä, voivat tuottaa tekstin käyttäen sopivaa aksenttia ja oikeaa ääntämystä. Jos kielen vaihtumisia ei ole merkattu, syntetisaattori tekee parhaansa lausuakseen sanat sillä kielellä, jota se ensisijaisesti käyttää. Täten syntetisaattori, joka käyttää englantia peruskielenä, voisi lausua ranskan autoa tarkoittavan sanan "voiture", englannin sanan "voter" [ja tämä hämäisi, jos sana esiintyy englanninkielisen tekstin joukossa].
Käyttäjät, jotka eivät itse osaa kääntää kielestä toiseen, voivat käyttää automaattisia käännösohjelmia heille outojen kielen kääntämiseen.

Viimeksi mainittua kohtaa voisi selventää ja täydentää seuraavasti: Kielenkääntämisessä, tapahtuipa se automaattisesti tai ihmisen tekemänä, on tietysti olennaista tietää, mitä kieltä käännettävä teksti on. Ihminen toki näkee tekstistä, mitä kieltä se on, jos hän ylipäänsä pystyisi kääntämään sitä. Käännösohjelmien tilanne on toinen. Lisäksi kielen vaihtuminen kesken tekstin voi aiheuttaa vaikeuksia ihmisellekin, varsinkin, jos kääntäjä ei tunne sitaatin tai vieraskielisen termin kieltä; tietokoneohjelma menee sekaisin vielä paljon helpommin. Jos esimerkiksi suomeksi käännettävässä englanninkielisessä tekstissä on ranskankielinen sitaatti, riippuu tilanteesta, olisiko se käännettävä vai säilytettävä alkukielisenä. Joka tapauksessa kielimerkkaus voi auttaa välttämään pahimman vaihtoehdon automaattisessa kielenkääntämisessä: ohjelma kääntää ranskaa kuten se olisi englantia, ja tulos on luultavasti aivan sotkua. Kielimerkkauksen ja muun merkkauksen merkitystä kielenkääntämiselle eräiltä kannoilta käsittelee tarkemmin dokumentti Translation-friendly authoring.

Voi tuntua oudolta, että WAI-suosituksissa koko dokumentin kielen merkkaaminen on alemmalla prioriteetilla (3) kuin kielen vaihtumisen merkkaaminen (joka on prioriteettitasolla 1). Onhan koko dokumentin kielen merkkaaminen hoidettavissa yhdellä ainoalla määritteellä, kun taas kaikkien vaihtumisten merkkaaminen voi olla hyvin työlästä ja vaatia pohdintaa ja hankalia ratkaisuja. Taustalla lienee se seikka, että esimerkiksi puhesyntetisaattoria voi käyttäjä yleensä helposti käskeä lukemaan teksti halutun kielen sääntöjen mukaan, jos se ylipäänsä sitä kieltä tukee. Sen sijaan olisi lähinnä mahdotonta se, että käyttäjä kesken lukemisen ohjailisi syntetisaattoria vaihtamaan kieltä.

Seuraava osa: Muita perusteluja

Kirjoittamisen ajankohta: 2002-06-23. Päivitetty viimeksi 2007-12-03. Teknisiä korjauksia 2017-12-11.

Tämä sivu kuuluu Jukka "Yucca" Korpelan avoimeen tietosivustoon Datatekniikka ja viestintä.