Kannanotto tietotekniikan kotoistuksen ajanilmaisuihin

Tietotekniikan kotoistus -hanke esitti helmikuussa 2005 julkisen kannanottopyynnön, joka koskee dokumenttia Kalenteritiedot suomeksi. Tämän johdosta esitän seuraavan kannanoton.

Yleisiä huomautuksia

Mielestäni luonnostenkin tulisi olla saatavilla yleisesti käyttökelpoisessa, esteettömässä muodossa, käytännössä HTML-muodossa. Tiedon saatavuus vain PDF-muodossa rikkoo muun muassa Euroopan parlamentin verkkosivujen esteettömyydestä esittämää kannanottoa ja Julkisen hallinnon suositusta JHS 129 vastaan.

Dokumentin otsikko antaa liian suppean kuvan sen sisällöstä, koska se käsittelee ajan ilmaisuja eikä vain kalenteritietoja.

Dokumentissa ei käsitellä kysymystä siitä, mitkä ovat CLDR-tietokantaan määriteltävät lausekkeet, jotka kuvaavat suomen kielessä käytettävät ajan ilmaisujen muodot. Nämä ovat olennaisia määrittelyjä, kun taas sanalliset kuvaukset ovat CLDR:n kannalta toissijaisia.

Kalenterityypit

Kalenterityyppien nimet tulee kirjoittaa gemena-alkuisina, siis buddhalainen kalenteri jne. Tämä vastaa suomen kielen käytäntöä ja normeja: ilmaisuja ei tulkita erisnimiksi.

Kuukaudet

Kuukaudennimien ”lyhyiksi muodoiksi” esitetyt tammi, helmi jne. eivät ole suomen kielen mukaisia. Ne lienevät mukana ainoastaan siksi, että monissa virheellisesti toteutetuissa kotoistuksissa on käytetty tällaisia ilmaisuja.

Ainoat suomen kielen mukaiset kuukaudennimien lyhenteet olisivat tammik., helmik. jne. Niiden käyttöön ei toisaalta ole mitään syytä, koska ne eivät juurikaan lyhennä ilmaisuja ja koska suomen kielessä on vakiintunut tapa käyttää kuukauden numeroa, ellei käytetä kuukauden nimeä. Lyhyet ja kapeat muodot tulisi siten määritellä numeroiksi 1, 2, jne., mahdollisesti liittäen numeroon järjestyslukua osoittava piste, mutta tämä riippuu päiväysten muodon määrittelevästä lausekkeesta.

Yksikirjaimiset kuukaudennimien lyhenteet olisivat erittäin epäselviä ja poikkeaisivat suomen kielen käytännöistä. Tilanne on toinen kuin viikonpäivien nimissä, joille saattaa olla perusteltua määritellä yksikirjaimiset kapeimmat vaihtoehdot tietyissä kalenteriesityksissä käytettäviksi.

Kuukauden ilmaisut tulisi määritellä suomen kielen mukaisiksi, ei orjallisesti pyrkien kirjainten käyttöön englannin kielen mallin mukaan.

Päivämäärät

Päivämäärien esityksiä kuvattaessa tulisi selostaa, mitä CLDR:n määrittelyjä kukin muoto vastaa ja missä niitä on tarkoitus käyttää. Sellaisia ilmaisuja kuin ”perjantai 7.1.2005” ei tulisi käyttää, koska ne ovat aivan epäloogisia: jos kerran viikonpäivä ilmaistaan sanalla, tulisi kuukauden nimikin ilmaista sanalla.

Epäsuositeltavia päivämäärien esityksiä ei tulisi edes mainita, koska maininta voidaan tulkita niin, että esitykset ovat hyväksyttäviä vaikkakaan eivät suositeltavia. Tässä yhteydessä ei ole syytä esittää sellaista kannanottoa.

Myöskään ei tulisi mainita päivämäärämuotoja, joissa esiintyy sana ”päivänä”. Päivämäärien monenkirjavasta esityksestä on enimmäkseen jo päästy eroon, eikä siihen ole syytä uudestaan yllyttää.

Päiväyksistä tulisi esittää:

Sellainen esitysmuoto kuin 05-01-07 on ehdottoman hylättävä niin tekstissä kuin muuallakin. Se aiheuttaa todellisia ja suuria väärinkäsityksen mahdollisuuksia, koska tällaisia muotoja käytetään myös tilanteissa, joissa ne on tarkoitettu tulkittavaksi standardinvastaisesti merkityksessä päivä-kuukausi-vuosi. Esimerkiksi Helsingin seudun yleisten kirjastojen järjestelmän tulosteet käyttävät tätä menettelyä. Yksinään tämä seikka tekee esitysmuodon hylättäväksi, sillä lukija ei voi tietää, miten ilmaisu kulloinkin on tulkittava.

Kellonajat

Ehdotan, että kellonaikojen esitysmuoto suomen kielessä määritellään CLDR:ssä sellaiseksi, että tuntien ja minuuttien sekä minuuttien ja sekuntien välisenä erottimena on kaksoispiste. Lisäksi ehdotan, että tähän liitetään sanallinen selostus, jonka mukaan tekstissä käytetään yleisesti ja kansallisten normien mukaan myös pistettä.

Perusteluksi esitän, että kaksoispisteen käyttö edistää selkeyttä, koska se selvemmin ilmaisee, että kyseessä on kellonaika. Lisäksi kaksoispisteen käyttö on yleisesti tunnettua ja ymmärrettyä.

Esityksessä ei lainkaan puututa aikavyöhykkeen ilmaisemisen tapaan silloin, kun vyöhyke esitetään sanallisesti. Tapa tulisi määritellä sellaiseksi, että vyöhykkeen ilmaisu on suomen kielen mukaisesti partitiivissa, esimerkiksi ”Itä-Euroopan aikaa”. Tämä tulisi ratkaista ennen aikavyöhykkeiden nimeämistä, koska menettely käytännössä edellyttää, että nimissä ei ole adjektiiviattribuutteja (kuten CLDR:ssä nyt on).

Aikakausi

Lyhenteille jKr. ja eKr. ei ole tarpeen määritellä mitään toissijaisia lyhenteitä. Sen sijaan voidaan toki mainita sanallisesti, että suomen kielessä käytetään myös lyhenteitä jaa. ja eaa. Niitä ei ole mitään syytä määritellä ”toissijaisiksi”, vaan ne ovat yksinkertaisesti monien kirjoittajien käyttämiä lyhenteitä. Kun CLDR:ssä joudutaan tekemään valinta, on loogisin ja neutraalein mahdollinen valinta se, jossa valitaan vanhempi ja yleisempi vaihtoehto.

Mikäli halutaan erikseen luoda paikallisasetusten kokoelma, jossa käytetään lyhenteitä jaa. ja eaa., niin asia tulisi käsitellä osana laajempaa kokonaisuutta, jossa yleisesti otetaan kantaa siihen, miten erilaiset henkilökohtaiset ja kulttuuriryhmäkohtaiset asetukset toteutetaan. Kyse on yleensä teknisesti melko pienistä muutoksista kielikohtaisiin asetuksiin, mutta tähän voi sisältyä useita erilaisia, toisistaan loogisesti riippumattomia muutoksia. Esimerkiksi se, haluaako joku nähdä mieluummin lyhenteen jaa. kuin lyhenteen jKr., on loogisesti riippumatonta siitä, haluaako hän kellonaikoihin pisteen vai kaksoispisteen taikka maiden nimistöön jonkin erityisen, yleisistä perusasetuksista poikkeavan vaihtoehdon. Ei liene kuviteltavissa, että jokaista mahdollista yhdistelmää kohti määriteltäisiin erillinen asetusten kokoelma. Näin ollen joudutaan CLDR-työssä tekemään periaateratkaisuja, ja ennen niitä on turhaa kehitellä suomen kielen asetuksiin vaihtoehtoja, joita ei käytettäisi mihinkään.

Turhaa on myös miettiä, mitkä olisivat lyhenteiden jKr. ja eKr. lavennukset. Normaalitekstissäkään, saati tietokoneohjelmilla generoiduissa teksteissä, nämä lyhenteet eivät käytännössä juuri koskaan esiinny lavennettuina. CLDR:n nykyisessä rakenteessa ei myöskään ole kohtaa, johon lavennukset määriteltäisiin.

Lisäksi ehdotetut lavennukset ovat järjettömiä pyrkimyksiä uskontopoliittiseen korrektisuuteen. Lyhenteet johtuvat ilmaisuista ”jälkeen Kristuksen (syntymän)” ja ”ennen Kristusta” (tai ”ennen Kristuksen syntymää ”). Ehdotetut ”pitkät muodot” ovat keinotekoisia sepitteitä.

12-tuntinen kello

Vakiintuneet ja normien mukaiset lyhenteet ovat ”ap.” ja ”ip.”. Ei ole mitään syytä ottaa määrittelyihin vanhentuneita lyhenteitä ”epp.” ja ”jpp.”, jotka ovat useimmille käsittämättömiä. Jos ehdotus on tältä osin vitsi, niin se on huono vitsi.

Yleisiä lyhenteitä

Tässä yhteydessä on tarpeetonta ottaa kantaa lyhennekysymyksiin, jotka ovat osittain kiistanalaisia (vko ~ vk, t ~ h, vrk ~ pv ~ d). Koko kohta tulisi poistaa. Jos CLDR jossain vaiheessa vaatii kannanottoa näihin asioihin, niihin voidaan palata. Tällöin tulisi huolellisesti erottaa toisistaan yleiskielisessä tekstissä käytettävät lyhenteet ja ajan yksiköiden tunnukset.

Juutalainen kalenteri

Ehdotetut juutalaisen kalenterin kuukaudennimet eivät ole minkään siirtokirjoituskaavan mukaisia eivätkä myöskään suomen kielen kirjoitusjärjestelmään mukautettuja asuja. Heprealaisen kirjaimiston suomalaiseen tai kansainväliseen siirtokirjoitukseen ei kuulu akuutin käyttö painomerkkinä.

Juutalaisen kalenterin kuukaudennimet eivät ole juurikaan esiintyneet suomenkielisessä tekstissä muualla kuin teologisessa ja uskonnollisessa kirjallisuudessa. Tämän mukaisesti ehdotan, että käytetään niitä nimiä, jotka esiintyvät vuoden 1992 raamatunsuomennoksen verkkoversion yhteydessä olevalla sivulla ”http://www.evl.fi/raamattu/1992/mitat.html”, kuitenkin niin, että niihin liitetään (yleisen käytännön mukaisesti) osa -kuu ja että nimiin lisätään toisen adar-kuun (esityksessä: adárkuu II) nimi: tisri-kuu, hesvan-kuu, kislev-kuu, tebet-kuu, sebat-kuu, adar-kuu, II adar-kuu, nisan-kuu, ijjar-kuu, sivan-kuu, tammus-kuu, ab-kuu, elul-kuu. Pitkän perinteen takia voidaan nämä nimet katsoa suomen kieleen mukautetuiksi sovinnaisnimiksi, vaikka niiden käyttö onkin ollut varsin rajoittunutta. Yhdysmerkin käyttö on perusteltua, koska nimet ovat suhteellisen harvinaisia ja yhdysmerkki auttaa hahmottamaan nopeasti, että kyse on kuukaudennimestä. Yhdysmerkillisiä muotoja on käytetty myös mm. raamatunsuomennoksessa (sekä uusimmassa että sen edellisessä suomennoksessa).

Islamilaiset kalenterit

Ehdotetut islamilaisten kalenterien kuukausien ja viikonpäivien nimet eivät ole minkään siirtokirjoituskaavan mukaisia eivätkä myöskään suomen kielen kirjoitusjärjestelmään mukautettuja asuja. Arabian siirtokirjoituksen menetelmien kirjavuus ei todellakaan anna aihetta keksiä vielä uutta menetelmää, joka vain lisäisi kirjavuutta.

Jos halutaan tulkita islamilaisten kalenterien nimet lainasanoiksi, jotka mukautetaan suomen kirjoitusjärjestelmään, ei ole perusteita käyttää painomerkkiä (akuuttia). Suomen kielessähän ei aksenttimerkkejä käytetä, ja lisäksi suomen kielessä paino on lainasanoissakin ensimmäisellä tavulla. Aksenttia tuskin on myöskään missään käytetty tällaisissa yhteyksissä. Suomenkielisissä teksteissä ei juuri ole esiintynyt muita islamilaisen kalenterin kuukaudennimiä kuin ramadan, joka tiettävästi on aina kirjoitettu juuri näin, ilman aksenttia. Epäloogista olisi lainasanatulkinnassa myös se, että kirjoituksessa jätettäisiin osoittamatta al-artikkelin assimiloituminen ääntämyksessä (esim. al-sabt pro as-sabt).

Jos taas tulkitaan kyseiset nimet arabian kielen sanoiksi, jotka esitetään siirtokirjoituksella, niin luonnollista olisi soveltaa suomalaista standardia. Toinen vaihtoehto on jonkin kansainvälisen standardin käyttö. Tällöinkään ei painomerkkiä tule käyttää, koska se ei kuulu mihinkään yleiseen arabian siirtokirjoituksen menetelmään. Akuuttia kyllä käytetään eräissä translitterointikaavoissa, mutta aivan toisessa merkityksessä.

Akuutin käyttöä voitaisiin perustella sillä, että se antaa arabiaa osaamattomalle vihjeen sanan ääntämyksestä. Tämäkin kuitenkin edellyttäisi, että akuutti tulkitaan painomerkiksi, eikä tämä ole mitenkään itsestäänselvää. Lisäksi kotoistettujen kuukaudennimien tarkoitus ei ole kielenopetus vaan se, että nimet ovat tunnistettavissa. Yleisestä käytännöstä poikkeavalla kirjoitusasulla on tällöin lähinnä vieraannuttava vaikutus.

Tällä perusteella ehdotan, että nimet korjataan suomalaisen standardin mukaisiksi. Tämä merkitsee aksenttien poistamista, j:n korvaamista y:llä ja dž:n korvaamista j:llä. Tällöin kirjoitusasu vastaa paremmin myös kansainvälisiä käytäntöjä, jotka ovat monille tuttuja mm. lehdistön käyttämistä kirjoitusasuista.

Espoossa 23. helmikuuta 2005.
Jukka K. Korpela, tietokirjailija
jkorpela@cs.tut.fi
puh. (09) 888 2675, 040 8448 617