Nykyajan kielenopas, luku 4 Kirjoitusmerkit:

Aakkosjärjestys

Yleistä aakkostuksesta

Aakkostuksen merkitys

Aakkostuksella on merkitystä lähinnä järjestettäessä tietoja luetteloiksi, joista on voi­ta­va helposti hakea tietoja silmäilemällä. Aakkostamisen merkitys on vähentynyt, kun tieto­tek­niik­ka on teh­nyt yhtä useammissa tilanteissa mahdolliseksi hakea tietoja suoraan haku­toimin­noil­la eikä luet­te­loi­ta se­laa­mal­la.

Aakkostaminen on silti usein tarpeen. Sen oikeellisuudella saattaa olla huomattavakin mer­ki­tys esimerkiksi silloin, kun kokouksen osallistujista pitää tehdä aak­ko­sel­linen lista. Myös painetun kirjan aakkosellisella hakemistolla on suuri merkitys. Hakemisto on usein tarpeen myös e-kirjassa, koska hyvin tehdyssä hakemistossa on viittaukset tärkeimpiin kohtiin, joissa kukin hakusana esiintyy.

Aakkostussäännöt

Eri kielissä ja eri yhteyksissä on käytössä erilaisia aakkostustapoja. Esimerkiksi ö-kirjain on suomen kielessä erillinen kirjain aakkoston lopussa, kun taas saksassa se rinnastetaan aak­kos­tuk­ses­sa o-kirjaimeen ja erotetaan siitä vain niissä harvoissa tapauksissa, joissa niiden ero on kahden sanan ainoa ero. Turkin kielessä taas ö on aakkostuksessa erillinen kirjain kuten suomessa, mutta sijoitetaan o:n jälkeen.

Vaikka suomen kielen perusaakkosten järjestys on varsin vakiintunut, on yksityiskohdissa ongelmia ja eroavuuksia. Lisäksi vieraiden kirjainten, numeroiden, välimerkkien ja erikois­merkkien huomioon ot­ta­mi­ses­sa on suuriakin eroja aakkostustavoissa.

Seuraavassa kuvaillaan tärkeimpiä aakkostus­säännöstöjä. Tarkempia tietoja on artik­ke­lis­sa Lajittelun aakkoset (Tietolinja 2/2020).

Suomalainen aakkostusstandardi SFS 4600

Huonosti tunnettu ja heikosti noudatettu

Aakkostamista koskeva kansallinen standardi SFS 4600 on melko huonosti tunnettu, ja sitä noudatetaan lähinnä vain kirjasto­alalla. Kuvaavaa on, että Kielitoimiston nimiopas kyllä suosittelee standardin mukaista aakkostusta, mutta ei itse noudata sitä.

Luonteeltaan SFS 4600 on lähinnä nimien kuten henkilön­nimien, paikan­nimien ja teosten nimien aakkostamisen standardi. Seuraavassa kuvataan sen pääkohdat. Lisätietoja siitä on sivulla Aakkostus Suomessa.

Kirjainten järjestys

Standardin uusin painos SFS 4600:2022 määrittelee kaksi aakkostustapaa:

Muutoksena aiempaan on, että kummassakin aakkostus­tavassa kaksois-v w käsitetään eril­li­sek­si kirjaimeksi, joten esimerkiksi kaikki w:llä alkavat sanat aakkostuvat viimeisen v:llä al­ka­van sanan jälkeen.

Valta, Virta, Waltari

Tarkkeiden vaikutus

Useimmat tarkemerkit (diakriittiset merkit), kuten akuutti aksentti, jätetään huomiotta. Esim. é käsi­tel­lään siis aakkos­tuk­ses­sa kuten e. Sääntö koskee myös š- ja ž-kirjainta. Kuitenkin suomen- tai ruotsin­kielisen aineiston aakkostuksessa merkit å, ä ja ö kuuluvat vakiintuneille paikoilleen. Lisäksi ü ja ű aakkostetaan kuten y, ja kirjaimet õ ja ő aakkostetaan kuten ö.

Linna, Linné, Lintunen
saalis, šakki, samppanja, šeikki, sekki

Sanoittainen ja kirjaimittainen aakkostus

Ihmisten nimet aakkostetaan yleensä siten, että ensisijainen aakkostus on sukunimen mu­kaan, ja toissijaisesti otetaan huomioon etunimet. Muussa aakkostuksessa on käytössä kak­si vaihtoehtoista periaatetta silloin, kun aakkostettavat tiedot koostuvat useista sanoista:

Kansallinen standardi suosittelee ensisijaisesti sanoittaista aakkostusta. Käytännön han­ka­luu­te­na siinä on, että lukija ei aina tiedä, kirjoitetaanko hänen etsimänsä ilmaisu yhteen vai erik­seen. Lisäksi se johtaa usein järjestykseen, joka voi tuntua oudolta:

Suomen ympäristökeskus, Suomenlinna

Kirjaimittaista aakkostusta käytettäessä olisi järjestys esimerkissä päinvastainen eli aak­kos­tet­tai­siin ikään kuin kirjoitusasu olisi ”Suomenympäristökeskus”.

Muut merkit kuin kirjaimet

Standardin mukaan muut merkit kuin kirjaimet jätetään yleensä huomiotta.

A/B aakkostetaan kuten AB
e-kirja aakkostetaan kuten ekirja
Virta & Lahti aakkostetaan kuten Virta Lahti
%-merkki aakkostetaan kuten merkki

Tähän on kuitenkin seuraavat poikkeukset:

Sukunimien etuliitteet

Ihmisten sukunimien etuliitteet tuottavat usein ongelmia aakkostuksessa. Niitä koskeva standardin osa on sekava ja epäjohdonmukainen, eikä lukijoiden voi olettaa tuntevan sitä. Toisaalta ongelma ei käytännössä useinkaan ole suuri, koska esimerkiksi von Fieandtit ovat varmaankin tottuneet etsimään nimeään sekä V-kirjaimen että F-kirjaimen kohdalta.

Sääntöjen mukaan jätetään useimmat meille tutut etuliitteet, kuten ruotsin ”af, ranskan ”de”, hollannin ”van der” ja saksan ”von”, huomiotta aakkostuksessa, eli esim. von Fieandt tulee aakkostaa F-kirjaimen kohdalle. Sen sijaan esimerkiksi brittiläisten nimien alussa oleva ”O’” (esim. ”O’Connor”) käsitetään osaksi itse nimeä (ja heittomerkki jätetään huomiotta aakkostuksessa).

Modernit aakkostusperiaatteet

Tasoittaisuus

Nykyaikainen ajattelu aakkostusasioissa perustuu tasoittaisuuteen:

Ajattelutapa etenee siis päinvastaiseen suuntaan kuin esimerkiksi standardissa SFS 4600, joka määrittelee vain kansallisesti tärkeimpien merkkien jär­jes­tyk­sen ja täydentää sitä lisäsäännöillä. Periaatteessa ero on vain muodollinen, mutta käy­tän­nös­sä SFS 4600 käsittelee merkkejä sitä epämääräisemmin ja huo­li­mat­to­mam­min, mitä enemmän mennään vanhan perusmerkistömme ulkopuolelle.

Unicode-aakkostussäännöt

Unicode-aakkostussäännöt (Unicode Collation Algorithm) määrittelevät merkkien ja merkki­jonojen järjestyksen tavalla, joka ei ota huomioon merkityksiä eikä merkkien muodostamia yhdistelmiä. Niiden mukaan esimerkiksi merkkijono 100 on ennen merkkijonoa 99, koska merkki 1 on ennen merkkiä 9.

Merkkien perus­jär­jes­tys Unicode-aakkostus­säännöissä voidaan yksin­ker­tais­taen kuvata näin:

  1. Välilyönti ja siihen rinnastettavat merkit.
  2. Välimerkit. (Myös mm. §, @, /, &, %.)
  3. Erikoismerkit (symbolit).
  4. Numerot.
  5. Latinalaiset peruskirjaimet a:sta z:aan ja niiden jälkeen þ (thorn).
  6. Kreikkalaiset kirjaimet.
  7. Muut kirjaimistot määrätyssä järjestyksessä.

Unicode-aakkosjärjestyksestä on melko havain­nol­li­sia taulukoita Unicode-konsortion sivus­tos­sa Collation Charts. Se käyttää melko vaikeaa käsitteistöä, mutta sen taulukoita voi usein hyödyntää ilman syvällistä ymmärtämistä. Esimerkiksi kohdista Punctuation ja General-Symbol voi tarkistaa erikoismerkkien keskinäisen järjestyksen, jos joutuu käsin lajittelemaan aineistoa, jossa on tietotekniikan tms. erikoismerkkejä (esimerkiksi `^_ jne.).

Tietokoneohjelmien (esimerkiksi Excel ja Word) lajittelu­toimintojen tekemä aakkostus voi riippua siitä, mikä on määritelty aineiston kieleksi, eikä se välttämättä vastaa täysin mitään standardia.

Yleiseurooppalainen aakkosjärjestys ja suomalainen sovellus

Kansainvälinen standardi ISO/IEC 14651 määrittelee Unicoden aakkos­järjestykseen pe­rus­tu­van tavan ”räätälöidä” erilaisia aakkostustapoja eri kielten ja kulttuurien tarpeisiin. Sen pohjalta on laadittu eurooppalainen standardi EN 13710. Sen mukaan numerot aakkostetaan kaikkien kirjainten jälkeen.

Eurooppalaisen standardin mukaan ä ja å käsitetään tällöin a:n tarkkeellisiksi muodoiksi ja ö o:n tarkkeelliseksi muodoksi. Tämä on Unicoden aakkosjärjestyksen mukaista ja vastaa Euroopan kielissä tavallisinta käytäntöä, mutta on tietysti suomen ja ruotsin kieleen sovel­tu­ma­ton. Se on tarkoitettu toisaalta monikielisen aineiston aakkostamiseen, toisaalta kieli­kohtaisten aakkostusten määrittelemisen pohjaksi.

Eurooppalaisen standardin suomalainen versio SFS-EN 13710 sisältää lyhyen, mutta tärkeän liitteen, jonka mukaan suomalainen perinne otetaan huomioon seuraavina poikkeamina kansainvälisistä standardeista:

Aakkostus on ensisijaisesti kirjaimittaista, mutta myös sanoittain aakkostaminen on mahdollista. Lukuja ym. koskevat erikois­säännöt puuttuvat, joten luvut aakkostetaan merkkijonoina (esim. 100, 2, 2200, 23) eikä luku­arvon mukaan.

Seuraava esimerkki sisältää ilmauksia SFS-EN 13710:n mukaisessa aakkosjärjestyksessä.

A/B
AB
Abba
Delaware
Ðilas
OAU
œuvre
ohra
saalis
šakki
salainen
übermukava
Ylermi
Zorn
Þór
Åberg
Æble
Äyräpää
Ørsted
Öölanti
α 42
5