Aakkostus Suomessa
Standardin SFS 4600 lyhyt selitys ja kommentaari

Tämä dokumentti selostaa lyhyesti Suomen kansallisen standardin SFS 4600, Aakkostaminen ja siihen liittyvä ryhmittely mukaiset aakkostussäännöt ja hiukan kommentoi niitä, muun muassa sanoittaista ja kirjaimittaista aakkostusta. Tavoitteena on kuvata eräitä pääkohtia lähinnä aakkosellisten luetteloiden käyttäjiä varten. Usein esimerkiksi kirjojen hakemistoissa sovelletaan standardin mukaista aakkostusta, joka joiltakin osin poikkeaa siitä, mitä ihmiset usein odottavat. Luetteloa tehtäessä tarvitaan usein tarkempia tietoja ja itse standardiin perehtymistä, ainakin, jos listassa esiintyy esim. ihmisten tai yhteisöjen nimiä, joita koskevat eräät erityissäännöt. Itse standardi on ostettavissa Suomen standardisoimis­liitolta ja luettavissa joissakin kirjastoissa.

Standardin SFS 4600 nykyinen versio (4. painos) julkaistiin 14.10.2022. Edellinen versio oli vuodelta 2000.

Tietoja muista aakkostustavoista on Nyky­ajan kielen­oppaan kohdassa Aakkos­järjestys.

Perussääntöjä

Kirjainten perusjärjestys on suomen- tai ruotsin­kielistä aineistoa lajiteltaessa tuttu:
a b c d e f g h i j k l m n o p q r s t u v w x y z å ä ö.

Muunlaisessa aineistossa noudatetaan yleis­eurooppalaista järjestystä, jossa thorn-kirjain on z:n jäljessä ja jossa å ja ä aakkostetaan tarkkeellisena a:na ja ö tarkkeellisena o:na. Järjestys on siis seuraava:
a b c d e f g h i j k l m n o p q r s t u v w x y z ž

Lisäksi standardi määrittelee:

Standardin vuoden 2022 versioon otettiin yksikäsitteisesti w:n tulkitseminen erilliseksi kirjaimeksi. Aiemmin v ja w käsitettiin aakkostuksessa samaksi kirjaimeksi (esimerkki järjestyksestä: Valta, Waltari, Virta). Tosin tähän oli lisäys, jonka mukaan monikielisessä aineistossa voidaan v ja w aakkostaa erikseen. Syynä w:n aiempaan käsittämiseen vain v:n muunnelmaksi lienee lähinnä se, että suomen kielessä w on ollut vanhastaan käytössä v-äänteen merkkinä.

Sanoittainen vai kirjaimittainen aakkostus?

Ehkä suurimmat ongelmat aakkosellisten luetteloiden käytössä aiheuttaa se, että sanan­välien käsittelytapoja on kaksi: sanoittainen, jossa sananväli (tyhjämerkki, välilyönti) otetaan huomioon, ja kirjaimittainen, jossa se jätetään huomiotta. Standardi ei sano asiaa kovin selvästi, mutta ilmeinen tarkoitus on, että sanoittaisessa aakkostuksessa tyhjämerkin ajatellaan edeltävän kaikkia muita merkkejä.

Esimerkiksi ”kevyt sinko” ja ”kevytpaino” ovat sanoittaisessa aakkostuksessa tässä jär­jes­tyk­ses­sä, koska tyhjämerkin ajatellaan olevan muita merkkejä ennen, joten merkkijono ”kevyt ” edeltää merkkijonoa ”kevytp”. Ehkäpä luonnollisin tapa ajatella sanoittaista aakkostusta on se, että etsittäessä ilmaisua siten aakkostetusta luettelosta haetaan ensin ensimmäinen sana ja vasta sitten ruvetaan kiinnittämään huomiota muihin sanoihin. Kirjaimittaisessa aak­kos­tuk­ses­sa järjestys on ”kevytpaino” ja ”kevyt sinko”, koska jälkimmäinen aakkostetaan ikään kuin se olisi kirjoitettu ”kevytsinko”.

Standardi suosittelee sanoittaista aakkostustapaa, ja lisää: ”Jos tästä poiketaan, se on ilmaistava luettelon tai hakemiston käyttö­ohjeessa.” Lisäksi sukunimissä on aina noudatettava sanoittaista aakkostusta. Tämähän lienee selvää; haluamme, että kaikki Virta-nimiset ihmiset ovat listassa ennen Virtanen-nimisiä. Kirjaimittainen aakkostushan merkitsisi esim. järjestystä ”Virta, Jukka”, ”Virtanen, Jukka”, ”Virta, Paavo”! Mutta monet eivät varmaankaan muutoin pidä sanoittaista aakkostusta luonnollisena ja ilmeisenä periaatteena, etenkään siksi, että yhteen tai erikseen kirjoittamisessa on suurta horjuvuutta. Mistä luettelon käyttäjä etukäteen tietää, onko siinä kirjoitettu ”kevytsinko” vai ”kevyt sinko”? Niinpä minusta olisikin hyvä aina ilmaista luettelon käyttöohjeessa, kumpaa aakkostustapaa on noudatettu, ja selventää asiaa esimerkillä. Toki aivan pienet luettelot eivät mitään käyttöohjetta tarvitse; jos lista mahtuu yhdelle sivulle, niin eiköhän siitä näe tarpeeksi helposti, mitä se sisältää.

Standardi toteaa, että sanakirjoissa noudatetaan yleensä kirjaimittaista aakkostusta. Se lisää: ”Tämä helpottaa sanaliittojen löytämistä, jos ei tiedä, kirjoitetaanko ne yhdyssanoiksi vai ei.”

Suomalaiseen kirjaimistoon kuulumattomat kirjaimet

Edellä kuvatusta periaatteesta jättää tarkkeet huomiotta aakkostuksessa on muutama poikkeus silloin, kun aineiston kieli on suomi tai ruotsi:
ü ja ű (u, jossa on kaksoisakuutti; unkarissa käytetty) aakkostetaan kuten y (eikä kuten u)
õ ja ő (o, jossa on kaksoisakuutti; unkarissa käytetty) aakkostetaan kuten ö (eikä kuten o).

Eräät latinalaiseen aakkostoon (ilmaisun laajassa merkityksessä) kuuluvat merkit käsitellään aakkostuksessa seuraavasti:
ų kuten ö
ę kuten ä, jos aineisto on suomen- tai ruotsinkielinen, muutoin ae
œ (oe-ligatuuri; ranskassa käytetty) kuten oe
ß kuten ss
đ (d, jossa on poikkiviiva; saamessa käytetty) ja š kuten d
ž kuten th, jos aineisto on suomen- tai ruotsinkielinen (muuten erillinen kirjain z:n jälkeen)
ŋ (äng-merkki, ”n jossa on jalka oikealla”; äng-äänteen merkkinä saamessa käytetty) kuten n.

Muut kuin latinalaiset kirjaimet aakkostetaan latinalaisten kirjainten jälkeen, kirjaimistot keskenään niiden suomenkielisen nimen mukaan ja kunkin kirjaimiston sisällä ”yleisesti hyväksyttyyn” järjestykseen. Täten siis latinalaiset kirjaimet tulevat ensin, sitten esi­mer­kik­si arabialaiset, kreikkalaiset ja kyrilliset. (Jos esim. venäläinen nimi kirjoitetaan trans­lit­te­roi­tu­na, se tietenkin aakkostetaan kuten muutkin latinalaisin kirjaimin kirjoitetut ilmaisut.)

Monikirjaimistoinen aineisto voidaan standardin mukaan kuitenkin aakkostaa myös ENV 13170:n mukaan. ”ENV” tarkoittaa eurooppalaista esistandardia. Kyseinen ENV määrittelee ns. European Ordering Rules -säännöt (ks. EOR-luonnosta).

Muut merkit kuin kirjaimet

Hakemistoon otetaan usein ilmaisuja, joissa on muitakin merkkejä kuin kirjaimia. Niitä voi sisältyä esimerkiksi tuotteiden nimiin. Esimerkiksi ohjelmointikielen käsikirjan hakemistoon halutaan ehkä ottaa erikoismerkkejä kuten % ja # omiksi hakusanoikseen, jos niillä on kielessä jokin erityinen merkitys.

Numerot aakkostetaan ennen kirjaimia. Numerojonot aakkostetaan numeerisen järjestyksen mukaan, lukuina, esim. ”9”, ”10”, eikä merkkijonoina. Desimaali- ja murtoluvuille on erityis­sääntö­jä. Myös roomalaiset numerot aakkostetaan lukuarvonsa mukaan, esim. ”V”, ”IX”.

Muut merkit jätetään yleensä huomiotta. Tämä koskee sellaisiakin merkkejä, jotka vastaavat sanoja, kuten & ja %, samoin kuin yhdysmerkkiä, lyhenteisiin kuuluvaa pistettä jne. Esimerkiksi ”F/E” aakkostetaan siis kuten ”FE”. Erikois­merkit voidaan kuitenkin ottaa huomioon neljännellä lajittelu­tasolla.

Huomattakoon kuitenkin, että sananvälit ovat merkitseviä sanoittaisessa (siis suositellussa) aakkostuksessa. Vaikka esim. lyhenteen ”fil. kand.” pisteet jätetään huomiotta, se käsitellään sanoittaisessa aakkostuksessa kuten ”fil kand” (ja vain kirjaimittaisessa kuten ”filkand”). Sananvälien käytön horjuvuuden takia tästä voi seurata ongelmia. Esimerkiksi ”f.o.b.” sijoittuu sanoittaisessa aakkostuksessa aika eri tavalla kuin ”f. o. b.”.

Lisäksi on erikoissääntö, jonka mukaan ajatusviiva otetaan huomioon kuten sananväli. Se siis otetaan huomioon sanoittaisessa aakkostuksessa, kirjaimittaisessa ei. Tästäkin johtuu ongelmia sen takia, että usein ajatusviivan tilalle kirjoitetaan yhdysmerkki, vieläpä jättämättä tyhjää väliä sen ympärille.

Lisäpoikkeuksia

Standardissa on lisäksi seuraavia asioita koskevia lisäsääntöjä, jotka merkitsevät poikkeuksia yleisistä säännöistä:

Erityisen hankalia ovat sukunimien etuliitteet. Niistä osa luetaan osaksi sukunimeä, osaa ei, eikä tässä ole mitään selvää sääntöä. Standardin aiemmassa versiossa oli aiheesta opastava taulukko, jonka sisältö oli seuraava:

KieliEtuliitteet, jotka luetaan sukunimeen Etuliitteet, joita ei lueta sukunimeen
englanti A’, Ab, Ap, D’, De, Fitz, M’, Mac, Mc, O’, Van -
espanja la, las, los, San, Santa, Santo de, de la, de las, de los, del
hollantiver de, den, der, ‘t, ten, ter, thor, van, van den, van der, vander, van’t
italia d’, dagli, dai, dal, dalla, dalle, de, de’, degli, dei, del’, della, delle, di, la, San, Santo de, de’, degli, dei, de li (ennen 1800-lukua eläneiden aatelisten henkilöiden nimissä)
portugali Santo, Sćo d’, da, das, de, do, dos
ranska des, du, l’, la, le, les, Saint, Sainte d’, de
ruotsi d’, de, du af, van, von, von der
saksa am, auf’m, aus’m, im, vom, zum, zur de, von, von dem, von den, von der, zu, zu dem, zu den, zu der

Menettely on paitsi mielivaltainen myös vaikeasti muistettava, koska eri kielten osalta nou­da­te­taan erilaisia periaatteita. Esimerkiksi ranskan osalta käytäntö on selitettävissä ja muis­tet­ta­vis­sa sellaisena, että pelkästä prepositiosta koostuva etuliite käsitellään nimestä eril­li­se­nä, kun taas etuliitteen ja artikkelin yhdistelmästä muodostunut sana (esim. du < de + le) tai artikkeli (esim. la) käsitetään nimeen kiinteästi kuuluvaksi. Mutta muiden kielten osalta menet­te­lyt ovat toisenlaiset.

Standardin nykyisessä versiossa on etuliitteiden ja artikkelien käsittelyä entisestään mutkistettu. Tämä johtuu siitä, että kirjasto­alalla on pitkään noudatettu aakkostusta, joka pyrkii noudattamaan eri kielten ja kulttuurien käytännöt tällaisissa asioissa, ja kun niistä on kertynyt lisää tietoa, on tullut myös lisää sääntojä.

Kansallis­kirjaston verkko­sivuilta ovat vapaasti saatavilla Standardin SFS 4600 liitedokumentit, jotka käsittelevät artikkelien ja etuliitteiden vaikutusta aakkostukseen.

Sukunimiä sisältävässä aakkostetussa luettelossa on aina syytä kertoa, miten etuliitteelliset nimet on aakkostettu, jos niitä esiintyy. Tosin jos niitä on vain muutamia, on ajateltavissa, että ne otetaan luetteloon sekä etuliitteen mukaan että ilman sitä aakkostettuina siten, että toinen esiin­ty­mis­tä viittaa toiseen (esimerkiksi ”de Gaulle ks. Gaulle, de”).

Loppuhuomautuksia

Aakkostussäännöt ovat siis suhteellisen mutkikkaat, ja lisäksi niiden niiden toteuttaminen ohjelmoinnissa on huomattavan hankalaa. Yleisessä tapauksessa jouduttaisiin oikeastaan tekemään tekstin semanttinen analyysi! Esimerkiksi merkkijonoa ”II” on käsiteltävä eri yhteyksissä eri tavoin sen mukaan, onko kyseessä lukua 2 tarkoittava roomalainen numero vai kaksikirjaiminen lyhenne jostakin. Vastaavasti esim. merkkijono ”en” voi olla asia­yhtey­den mukaan ruotsin kielen artikkeli, joka on jätettävä huomiotta, tai ruotsin kielen lukusana tai jotain ihan muuta.

Käytännössä joudutaankin soveltamaan yksinkertaistettuja algoritmeja ja ”käsin” korjaamaan joitakin yksityiskohtia. Usein on suotavaa ottaa esimerkiksi hakemistoon sama ilmaisu kahteen tai useampaan paikkaan silloin, kun eri aakkostustavat sijoittaisivat sen aivan eri kohtiin, tai liittää hakemistoon lyhyt selostus aakkostusperusteista.

Kokonaisuudessaan SFS 4600 on sopimaton automaattiseen aakkostukseen, mutta sitä voidaan käyttää puoliautomaattisesti: aineisto aakkostetaan ohjelmalla ja sen jälkeen se tarkistetaan ja korjataan ihmis­työnä. Tämä saattaa sopia esimerkiks nimiluetteloihin, teosluetteloihin, sanastoihin yms.

Standardia voidaan pitää monelta osin epäonnistuneena, eikä sitä sellaisenaan juurikaan noudateta kirjasto­alan ulkopuolella, paitsi sattumalta – nimittäin silloin, kun aakkostettava aineisto on niin yksin­ker­tai­nen, ettei aakkostuksessa synny mitään ongelmia. Standardin noudattamista kuitenkin suo­si­tel­laan mm. Kielitoimiston oikeinkirjoitusoppaassa ja Kielitoimiston nimioppaassa. Jäl­kim­mäi­ses­sä itsessään ei kuitenkaan noudateta sitä. Ks. sivua Kielitoimiston oikein­kirjoitus­oppaan ja Kielitoimiston nimioppaan virheitä.