Kirjainten tarinoita, luku 2 Kirjaimiston synty :

2.11 Aakkosjärjestys

Aakkosjärjestyksen synty

Aakkostemme järjestys A, B, C jne. perustuu muinaisseemiläisen aakkoston järjestykseen, mutta monia muutoksia on tapahtunut. Muinaisseemiläisen järjestyksen alkuperä jää historian hämäriin.

Kun roomalaiset omaksuivat kreikkalaisilta Y:n ja Z:n lisättäviksi vanhaan aakkostoonsa, he lisäsivät nämä aakkoston loppuun, X:n jälkeen. Samanlaisesta syystä ruotsalais-suoma­lai­seen aakkostoon on lisätty uudet merkit loppuun: Å, Ä ja Ö. Kuitenkin noin sata vuotta sitten, kun suomen aakkostoon lisättiin Š ja Ž, ne koettiin siinä määrin vain S:n ja Z:n muun­nel­mik­si, että ne tulkittiin aakkostuksessa niitä vastaaviksi. (Tosin Nyky­suomen sana­kirjassa aakkostettiin Š ja Ž omina kirjaiminaan, mutta menettelystä luovuttiin sitten.) Vastaavasti esimerkiksi saksan aakkostuksessa käsitetään Ä, Ö ja Ü vain A:n, O:n ja U:n muunnelmiksi.

Aakkostuksen merkitys

Aakkosjärjestyksellä on useita merkityksiä:

Nimien tai muiden tietojen laittaminen aakkosjärjestykseen helpottaa tiedon löytämistä. Tämä tietysti edellyttää, että tietojen lukija tuntee käytetyn aakkostuksen. Aakkostuksen merkitys tiedon löytämisessä on vähentynyt, kun on siirrytty digitaalisiin aineistoihin, joista tietoa voi etsiä hakutoiminnoilla. Esimerkiksi kirjan hakemistossa aakkostus on kuitenkin edelleen olennaista.

Kirjaimiston opettamisessa ja oppimisessa aakkosjärjestys on hyödyllinen apuneuvo.

Kun kirjaimilla on jokin järjestys, niitä voidaan käyttää lukujen tavoin asioiden numerointiin. Tällainen käyttö on hyvin vanhaa. Muinaiset kreikkalaiset jopa käyttivät kirjaimia numeroina; heillä ei siis ollut mitään erillisiä numeromerkkejä.

Aakkostuksen periaatteet

Aakkosjärjestys on kielikohtainen. Esimerkiksi latinalaista aakkostoa käyttävissä kielissä on yleensä sama perusjärjestys, mutta lisäkirjaimet on usein sijoitettu eri paikkoihin. Tark­keel­lis­ten kirjainten käsittely vaihtelee.

Joissakin kielissä käsitellään joitakin kahden kirjaimen yhdistelmiä (digrafeja) aak­kos­tuk­ses­sa yhtenä kirjaimena. Esimerkiksi espanjassa käsiteltiin aiemmin ch:ta ja ll:ää kum­paa­kin yhtenä kirjaimena, niin että esimerkiksi ch-alkuiset sanat tulivat aakkostuksessa kaikkien muiden c-alkuisten sanojen jälkeen. Vuonna 1994 espanjan kielen akatemioiden yhteiselin kuitenkin päätti luopua tästä käytännöstä.

Aakkosjärjestys on muutenkin muuttuvainen asia. Samassa kielessäkin saattaa olla eri aakkostusperiaatteita eri aikoina ja jopa samaan aikaan. Puhelinluetteloissa saatetaan soveltaa eri järjestystä kuin muualla.

Lisäksi monikieliset aineistot tuovat omia ongelmiaan. Esimerkiksi puhelinluettelossa on yleensä erikielisiä nimiä, joissa voi esiintyä myös maan valtakielelle vieraita kirjaimia. Tällöin voidaan ehkä soveltaa valtakielen aakkostusta sopivasti täydennettynä ja muunnettuna.

Vahvasti monikielinen aineisto, kuten kansainvälisen kokouksen osallistujaluettelo, voi vaatia erilaista lähestymistapaa. Jotta aakkostus olisi kaikkien mahdollisimman hyvin ymmär­ret­tä­vissä, sen tulisi olla mahdollisimman neutraali. Tätä varten on Unicode-konsortio kehit­tä¤nyt yleis­maailmallisen aakkos­järjestyksen, ns. DUCET-aakkostuksen, joka kattaa koko Unicode-merkistön. Sen haittana on kuitenkin se, ettei se ole kenenkään helposti hallittavissa. Se soveltuu käytettäväksi lähinnä silloin, kun on pakko aakkostaa vahvasti monikielinen aineisto johonkin tunnettuun järjestykseen.

Suomalainen aakkostusstandardi

Tässä selostetaan pääkohtia suomalaisesta standardista SFS 4600:2000, Aakkostaminen ja siihen liittyvä ryhmittely. Standardi on kuitenkin osittain varsin epäkäytännöllinen ja poikkeaa eräistä kansainvälisistä aakkostusstandardeista. Niinpä siitä on usein syytä poiketa eri syistä. Poikkeamista tulisi mainita luettelon selityksissä, vaikka useimmat ihmiset eivät selityksiä luekaan.

Nykyajan kielenoppaan kohdassa Aakkos­järjestys on uudempi ja laajempi esitys aakkostuksesta.

Suomalainen standardi määrittelee seuraavat periaatteet:

– Kirjaimet v ja w käsitetään aakkostuksessa samaksi kirjaimeksi (esimerkki järjestyksestä: Valta, Waltari, Virta), toisin kuin esim. englannin aakkostussäännöissä. Standardin mukaan kuitenkin monikielisessä aineistossa voidaan v ja w aakkostaa erikseen, ja tätä noudatetaan yhä yleisemmin – ja tulkiten monikielisyyden ehtoa väljästi.
– Useimmat tarkkeet jätetään huomiotta, eli esimerkiksi é käsitellään aakkostuksessa kuten e. Tämä koskee myös hattu-s:ää ja hattu-z:aa (š ja ž). Kuitenkin merkit å, ä ja ö toki kuuluvat vakiintuneille paikoilleen.
– Gemenan ja versaalin välillä ei tehdä eroa.

Syynä w:n käsittämiseen vain v:n muunnelmaksi lienee lähinnä se, että suomen kielessä w on ollut vanhastaan käytössä v-äänteen merkkinä, kuten W:n tarinassa tarkemmin kerrotaan. Vaikka 1900-luvulla v vakiintui, jäi w-kirjain moniin nimiin. Siltä kannalta on luonnollista esi­mer­kik­si puhelin­luettelossa aakkostaa Virtanen ja Wirtanen samoin. Toisaalta jos esi­mer­kik­si amerikkalainen etsii nimeä suomalaisesta puhelinluettelosta, hän tuskin osaa ennalta odottaa, että v:llä ja w:llä alkavat sanat ovat sekaisin. Suuntaus onkin kohti w:n aakkostamista erikseen. Tätä voidaan muodollisestikin perustella sillä, että miltei mikä tahansa luettelo on ymmärrettävissä ”monikieliseksi”. Se, miten w on aakkostettu, on usein hyvä joka tapauksessa mainita erikseen luettelon käyttöohjeessa.

Jos kahden ilmaisun ainoa ero on se, että toisessa on kirjaimeen liittyvä tarke ja toisessa ei, aakkostetaan ensin se, jossa tarketta ei ole. Esimerkiksi Linden aakkostetaan ennen sanaa Lindén (mutta Lindén, A. ennen nimeä Linden, B.) ja sakki ennen sanaa šakki.

Edellä kuvatusta periaatteesta jättää tarkkeet huomiotta aakkostuksessa on muutama poikkeus:

– ü ja ű aakkostetaan kuten y (eikä kuten u)
– õ ja ő aakkostetaan kuten ö (eikä kuten o).

Eräät latinalaiseen aakkostoon (ilmaisun laajassa merkityksessä) kuuluvat merkit käsitellään aakkostuksessa seuraavasti:

– ø kuten ö
– æ kuten ae
– œ kuten oe
– ß kuten ss
– đ ja ð kuten d
– þ kuten th

ŋ (äng-kirjain) kuten n.

Ns. Kotoistus-hankkeessa on määritelty osittain tästä poikkeava aakkostus, jonka mukaiset määrittely on sisällytetty kansainväliseen CLDR-tietokantaan, joten se toimii uusien tieto­tek­nis­ten ratkaisujen pohjana. Tämän aakkostuksen mukaan ű aakkostetaan kuten u, õ, ő ja œ kuten o, ß kuten s, w kuten v, æ kuten ä, ð erillisenä merkkinä d:n jälkeen ja þ erillisenä merkkinä ö:n jälkeen. Lisäksi ǥ aakkostetaan kuten g ja ŧ kuten t.

Olemassa olevat tietokoneohjelmien lajittelutoiminnot soveltavat usein suomen kielelle kokonaan vieraita aakkostusperiaatteita. Tietokoneohjelman tuottama aakkosellinen lista tulisikin tarkistaa etenkin siltä osin, ovatko ä ja ö oikeilla paikoillaan ja onko w:tä käsitelty halutulla tavalla.

Muut kuin latinalaiset kirjaimet aakkostetaan standardin mukaan latinalaisten kirjainten jälkeen, kirjaimistot keskenään niiden suomenkielisen nimen mukaan ja kunkin kirjaimiston sisällä ”yleisesti hyväksyttyyn” järjestykseen. Täten siis latinalaiset kirjaimet tulevat ensin, sitten esim. arabialaiset, kreikkalaiset ja kyrilliset. (Jos esim. venäläinen nimi kirjoitetaan translitteroituna, se tietenkin aakkostetaan kuten muutkin latinalaisin kirjaimin kirjoitetut ilmaisut.) Tältä osin standardi on erittäin epäkäytännöllinen. Jos joudutaan aakkostamaan aineistoa, jossa on käytetty eri kirjoitusjärjestelmiä, kannattaa yleensä käyttää jotain kansainvälistä aakkostusta. Kotoistus-hankkeessa määritelty aakkostus noudattaa muiden kuin latinalaisten merkkien osalta DUCET-aakkostusta.