Tämä dokumentti selostaa lyhyesti Suomen kansallisen standardin SFS 4600, Aakkostaminen ja siihen liittyvä ryhmittely mukaiset aakkostussäännöt ja hiukan kommentoi niitä, muun muassa sanoittaista ja kirjaimittaista aakkostusta. Tavoitteena on kuvata eräitä pääkohtia lähinnä aakkosellisten luetteloiden käyttäjiä varten. Usein esimerkiksi kirjojen hakemistoissa sovelletaan standardin mukaista aakkostusta, joka joiltakin osin poikkeaa siitä, mitä ihmiset usein odottavat. Luetteloa tehtäessä tarvitaan usein tarkempia tietoja ja itse standardiin perehtymistä, ainakin, jos listassa esiintyy esim. ihmisten tai yhteisöjen nimiä, joita koskevat eräät erityissäännöt. Itse standardi on ostettavissa Suomen standardisoimisliitolta ja luettavissa joissakin kirjastoissa.
Standardin SFS 4600 nykyinen versio (4. painos) julkaistiin 14.10.2022. Edellinen versio oli vuodelta 2000.
Tietoja muista aakkostustavoista on Nykyajan kielenoppaan kohdassa Aakkosjärjestys.
Kirjainten perusjärjestys on suomen- tai ruotsinkielistä aineistoa
lajiteltaessa tuttu:
a b c d e f g h i j k l m n o p q r s t u v w x y z å ä ö.
Muunlaisessa aineistossa noudatetaan yleiseurooppalaista järjestystä,
jossa thorn-kirjain on z:n jäljessä ja jossa å ja ä aakkostetaan tarkkeellisena
a:na ja ö tarkkeellisena o:na. Järjestys on siis seuraava:
a b c d e f g h i j k l m n o p q r s t u v w x y z ž
Lisäksi standardi määrittelee:
Standardin vuoden 2022 versioon otettiin yksikäsitteisesti w:n tulkitseminen erilliseksi kirjaimeksi. Aiemmin v ja w käsitettiin aakkostuksessa samaksi kirjaimeksi (esimerkki järjestyksestä: Valta, Waltari, Virta). Tosin tähän oli lisäys, jonka mukaan monikielisessä aineistossa voidaan v ja w aakkostaa erikseen. Syynä w:n aiempaan käsittämiseen vain v:n muunnelmaksi lienee lähinnä se, että suomen kielessä w on ollut vanhastaan käytössä v-äänteen merkkinä.
Ehkä suurimmat ongelmat aakkosellisten luetteloiden käytössä aiheuttaa se, että sananvälien käsittelytapoja on kaksi: sanoittainen, jossa sananväli (tyhjämerkki, välilyönti) otetaan huomioon, ja kirjaimittainen, jossa se jätetään huomiotta. Standardi ei sano asiaa kovin selvästi, mutta ilmeinen tarkoitus on, että sanoittaisessa aakkostuksessa tyhjämerkin ajatellaan edeltävän kaikkia muita merkkejä.
Esimerkiksi ”kevyt sinko” ja ”kevytpaino” ovat sanoittaisessa aakkostuksessa tässä järjestyksessä, koska tyhjämerkin ajatellaan olevan muita merkkejä ennen, joten merkkijono ”kevyt ” edeltää merkkijonoa ”kevytp”. Ehkäpä luonnollisin tapa ajatella sanoittaista aakkostusta on se, että etsittäessä ilmaisua siten aakkostetusta luettelosta haetaan ensin ensimmäinen sana ja vasta sitten ruvetaan kiinnittämään huomiota muihin sanoihin. Kirjaimittaisessa aakkostuksessa järjestys on ”kevytpaino” ja ”kevyt sinko”, koska jälkimmäinen aakkostetaan ikään kuin se olisi kirjoitettu ”kevytsinko”.
Standardi suosittelee sanoittaista aakkostustapaa, ja lisää: ”Jos tästä poiketaan, se on ilmaistava luettelon tai hakemiston käyttöohjeessa.” Lisäksi sukunimissä on aina noudatettava sanoittaista aakkostusta. Tämähän lienee selvää; haluamme, että kaikki Virta-nimiset ihmiset ovat listassa ennen Virtanen-nimisiä. Kirjaimittainen aakkostushan merkitsisi esim. järjestystä ”Virta, Jukka”, ”Virtanen, Jukka”, ”Virta, Paavo”! Mutta monet eivät varmaankaan muutoin pidä sanoittaista aakkostusta luonnollisena ja ilmeisenä periaatteena, etenkään siksi, että yhteen tai erikseen kirjoittamisessa on suurta horjuvuutta. Mistä luettelon käyttäjä etukäteen tietää, onko siinä kirjoitettu ”kevytsinko” vai ”kevyt sinko”? Niinpä minusta olisikin hyvä aina ilmaista luettelon käyttöohjeessa, kumpaa aakkostustapaa on noudatettu, ja selventää asiaa esimerkillä. Toki aivan pienet luettelot eivät mitään käyttöohjetta tarvitse; jos lista mahtuu yhdelle sivulle, niin eiköhän siitä näe tarpeeksi helposti, mitä se sisältää.
Standardi toteaa, että sanakirjoissa noudatetaan yleensä kirjaimittaista aakkostusta. Se lisää: ”Tämä helpottaa sanaliittojen löytämistä, jos ei tiedä, kirjoitetaanko ne yhdyssanoiksi vai ei.”
Edellä kuvatusta periaatteesta jättää tarkkeet huomiotta aakkostuksessa
on muutama poikkeus silloin, kun aineiston kieli on suomi tai ruotsi:
ü ja ű (u, jossa on kaksoisakuutti; unkarissa käytetty) aakkostetaan kuten y (eikä kuten u)
õ ja ő (o, jossa on kaksoisakuutti; unkarissa käytetty)
aakkostetaan kuten ö (eikä kuten o).
Eräät latinalaiseen aakkostoon (ilmaisun laajassa merkityksessä)
kuuluvat merkit käsitellään aakkostuksessa seuraavasti:
ų kuten ö
ę kuten ä, jos aineisto on suomen- tai ruotsinkielinen, muutoin ae
œ (oe-ligatuuri; ranskassa käytetty) kuten oe
ß kuten ss
đ (d, jossa on poikkiviiva; saamessa käytetty) ja š kuten d
ž kuten th, jos aineisto on suomen- tai ruotsinkielinen (muuten erillinen kirjain z:n jälkeen)
ŋ (äng-merkki, ”n jossa on jalka oikealla”;
äng-äänteen merkkinä saamessa käytetty) kuten n.
Muut kuin latinalaiset kirjaimet aakkostetaan latinalaisten kirjainten jälkeen, kirjaimistot keskenään niiden suomenkielisen nimen mukaan ja kunkin kirjaimiston sisällä ”yleisesti hyväksyttyyn” järjestykseen. Täten siis latinalaiset kirjaimet tulevat ensin, sitten esimerkiksi arabialaiset, kreikkalaiset ja kyrilliset. (Jos esim. venäläinen nimi kirjoitetaan translitteroituna, se tietenkin aakkostetaan kuten muutkin latinalaisin kirjaimin kirjoitetut ilmaisut.)
Monikirjaimistoinen aineisto voidaan standardin mukaan kuitenkin aakkostaa myös ENV 13170:n mukaan. ”ENV” tarkoittaa eurooppalaista esistandardia. Kyseinen ENV määrittelee ns. European Ordering Rules -säännöt (ks. EOR-luonnosta).
Hakemistoon otetaan usein ilmaisuja, joissa on muitakin merkkejä kuin kirjaimia. Niitä voi sisältyä esimerkiksi tuotteiden nimiin. Esimerkiksi ohjelmointikielen käsikirjan hakemistoon halutaan ehkä ottaa erikoismerkkejä kuten % ja # omiksi hakusanoikseen, jos niillä on kielessä jokin erityinen merkitys.
Numerot aakkostetaan ennen kirjaimia. Numerojonot aakkostetaan numeerisen järjestyksen mukaan, lukuina, esim. ”9”, ”10”, eikä merkkijonoina. Desimaali- ja murtoluvuille on erityissääntöjä. Myös roomalaiset numerot aakkostetaan lukuarvonsa mukaan, esim. ”V”, ”IX”.
Muut merkit jätetään yleensä huomiotta. Tämä koskee sellaisiakin merkkejä, jotka vastaavat sanoja, kuten & ja %, samoin kuin yhdysmerkkiä, lyhenteisiin kuuluvaa pistettä jne. Esimerkiksi ”F/E” aakkostetaan siis kuten ”FE”. Erikoismerkit voidaan kuitenkin ottaa huomioon neljännellä lajittelutasolla.
Huomattakoon kuitenkin, että sananvälit ovat merkitseviä sanoittaisessa (siis suositellussa) aakkostuksessa. Vaikka esim. lyhenteen ”fil. kand.” pisteet jätetään huomiotta, se käsitellään sanoittaisessa aakkostuksessa kuten ”fil kand” (ja vain kirjaimittaisessa kuten ”filkand”). Sananvälien käytön horjuvuuden takia tästä voi seurata ongelmia. Esimerkiksi ”f.o.b.” sijoittuu sanoittaisessa aakkostuksessa aika eri tavalla kuin ”f. o. b.”.
Lisäksi on erikoissääntö, jonka mukaan ajatusviiva otetaan huomioon kuten sananväli. Se siis otetaan huomioon sanoittaisessa aakkostuksessa, kirjaimittaisessa ei. Tästäkin johtuu ongelmia sen takia, että usein ajatusviivan tilalle kirjoitetaan yhdysmerkki, vieläpä jättämättä tyhjää väliä sen ympärille.
Standardissa on lisäksi seuraavia asioita koskevia lisäsääntöjä, jotka merkitsevät poikkeuksia yleisistä säännöistä:
Erityisen hankalia ovat sukunimien etuliitteet. Niistä osa luetaan osaksi sukunimeä, osaa ei, eikä tässä ole mitään selvää sääntöä. Standardin aiemmassa versiossa oli aiheesta opastava taulukko, jonka sisältö oli seuraava:
Kieli | Etuliitteet, jotka luetaan sukunimeen | Etuliitteet, joita ei lueta sukunimeen |
---|---|---|
englanti | A’, Ab, Ap, D’, De, Fitz, M’, Mac, Mc, O’, Van | - |
espanja | la, las, los, San, Santa, Santo | de, de la, de las, de los, del |
hollanti | ver | de, den, der, ‘t, ten, ter, thor, van, van den, van der, vander, van’t |
italia | d’, dagli, dai, dal, dalla, dalle, de, de’, degli, dei, del’, della, delle, di, la, San, Santo | de, de’, degli, dei, de li (ennen 1800-lukua eläneiden aatelisten henkilöiden nimissä) |
portugali | Santo, Sćo | d’, da, das, de, do, dos |
ranska | des, du, l’, la, le, les, Saint, Sainte | d’, de |
ruotsi | d’, de, du | af, van, von, von der |
saksa | am, auf’m, aus’m, im, vom, zum, zur | de, von, von dem, von den, von der, zu, zu dem, zu den, zu der |
Menettely on paitsi mielivaltainen myös vaikeasti muistettava, koska eri kielten osalta noudatetaan erilaisia periaatteita. Esimerkiksi ranskan osalta käytäntö on selitettävissä ja muistettavissa sellaisena, että pelkästä prepositiosta koostuva etuliite käsitellään nimestä erillisenä, kun taas etuliitteen ja artikkelin yhdistelmästä muodostunut sana (esim. du < de + le) tai artikkeli (esim. la) käsitetään nimeen kiinteästi kuuluvaksi. Mutta muiden kielten osalta menettelyt ovat toisenlaiset.
Standardin nykyisessä versiossa on etuliitteiden ja artikkelien käsittelyä entisestään mutkistettu. Tämä johtuu siitä, että kirjastoalalla on pitkään noudatettu aakkostusta, joka pyrkii noudattamaan eri kielten ja kulttuurien käytännöt tällaisissa asioissa, ja kun niistä on kertynyt lisää tietoa, on tullut myös lisää sääntojä.
Kansalliskirjaston verkkosivuilta ovat vapaasti saatavilla Standardin SFS 4600 liitedokumentit, jotka käsittelevät artikkelien ja etuliitteiden vaikutusta aakkostukseen.
Sukunimiä sisältävässä aakkostetussa luettelossa on aina syytä kertoa, miten etuliitteelliset nimet on aakkostettu, jos niitä esiintyy. Tosin jos niitä on vain muutamia, on ajateltavissa, että ne otetaan luetteloon sekä etuliitteen mukaan että ilman sitä aakkostettuina siten, että toinen esiintymistä viittaa toiseen (esimerkiksi ”de Gaulle ks. Gaulle, de”).
Aakkostussäännöt ovat siis suhteellisen mutkikkaat, ja lisäksi niiden niiden toteuttaminen ohjelmoinnissa on huomattavan hankalaa. Yleisessä tapauksessa jouduttaisiin oikeastaan tekemään tekstin semanttinen analyysi! Esimerkiksi merkkijonoa ”II” on käsiteltävä eri yhteyksissä eri tavoin sen mukaan, onko kyseessä lukua 2 tarkoittava roomalainen numero vai kaksikirjaiminen lyhenne jostakin. Vastaavasti esim. merkkijono ”en” voi olla asiayhteyden mukaan ruotsin kielen artikkeli, joka on jätettävä huomiotta, tai ruotsin kielen lukusana tai jotain ihan muuta.
Käytännössä joudutaankin soveltamaan yksinkertaistettuja algoritmeja ja ”käsin” korjaamaan joitakin yksityiskohtia. Usein on suotavaa ottaa esimerkiksi hakemistoon sama ilmaisu kahteen tai useampaan paikkaan silloin, kun eri aakkostustavat sijoittaisivat sen aivan eri kohtiin, tai liittää hakemistoon lyhyt selostus aakkostusperusteista.
Kokonaisuudessaan SFS 4600 on sopimaton automaattiseen aakkostukseen, mutta sitä voidaan käyttää puoliautomaattisesti: aineisto aakkostetaan ohjelmalla ja sen jälkeen se tarkistetaan ja korjataan ihmistyönä. Tämä saattaa sopia esimerkiks nimiluetteloihin, teosluetteloihin, sanastoihin yms.
Standardia voidaan pitää monelta osin epäonnistuneena, eikä sitä sellaisenaan juurikaan noudateta kirjastoalan ulkopuolella, paitsi sattumalta – nimittäin silloin, kun aakkostettava aineisto on niin yksinkertainen, ettei aakkostuksessa synny mitään ongelmia. Standardin noudattamista kuitenkin suositellaan mm. Kielitoimiston oikeinkirjoitusoppaassa ja Kielitoimiston nimioppaassa. Jälkimmäisessä itsessään ei kuitenkaan noudateta sitä. Ks. sivua Kielitoimiston oikeinkirjoitusoppaan ja Kielitoimiston nimioppaan virheitä.