Aakkostuksella on merkitystä lähinnä järjestettäessä tietoja luetteloiksi, joista on voitava helposti hakea tietoja silmäilemällä. Aakkostamisen merkitys on vähentynyt, kun tietotekniikka on tehnyt yhtä useammissa tilanteissa mahdolliseksi hakea tietoja suoraan hakutoiminnoilla eikä luetteloita selaamalla.
Aakkostaminen on silti usein tarpeen. Sen oikeellisuudella saattaa olla huomattavakin merkitys esimerkiksi silloin, kun kokouksen osallistujista pitää tehdä aakkosellinen lista. Myös painetun kirjan aakkosellisella hakemistolla on suuri merkitys. Hakemisto on usein tarpeen myös e-kirjassa, koska hyvin tehdyssä hakemistossa on viittaukset tärkeimpiin kohtiin, joissa kukin hakusana esiintyy.
Eri kielissä ja eri yhteyksissä on käytössä erilaisia aakkostustapoja. Esimerkiksi ö-kirjain on suomen kielessä erillinen kirjain aakkoston lopussa, kun taas saksassa se rinnastetaan aakkostuksessa o-kirjaimeen ja erotetaan siitä vain niissä harvoissa tapauksissa, joissa niiden ero on kahden sanan ainoa ero. Turkin kielessä taas ö on aakkostuksessa erillinen kirjain kuten suomessa, mutta sijoitetaan o:n jälkeen.
Vaikka suomen kielen perusaakkosten järjestys on varsin vakiintunut, on yksityiskohdissa ongelmia ja eroavuuksia. Lisäksi vieraiden kirjainten, numeroiden, välimerkkien ja erikoismerkkien huomioon ottamisessa on suuriakin eroja aakkostustavoissa.
Seuraavassa kuvaillaan tärkeimpiä aakkostussäännöstöjä. Tarkempia tietoja on artikkelissa Lajittelun aakkoset (Tietolinja 2/2020).
Aakkostamista koskeva kansallinen standardi SFS 4600 on melko huonosti tunnettu, ja sitä noudatetaan lähinnä vain kirjastoalalla. Kuvaavaa on, että Kielitoimiston nimiopas kyllä suosittelee standardin mukaista aakkostusta, mutta ei itse noudata sitä.
Luonteeltaan SFS 4600 on lähinnä nimien kuten henkilönnimien, paikannimien ja teosten nimien aakkostamisen standardi. Seuraavassa kuvataan sen pääkohdat. Lisätietoja siitä on sivulla Aakkostus Suomessa.
Standardin uusin painos SFS 4600:2022 määrittelee kaksi aakkostustapaa:
Muutoksena aiempaan on, että kummassakin aakkostustavassa kaksois-v w käsitetään erilliseksi kirjaimeksi, joten esimerkiksi kaikki w:llä alkavat sanat aakkostuvat viimeisen v:llä alkavan sanan jälkeen.
Useimmat tarkemerkit (diakriittiset merkit), kuten akuutti aksentti, jätetään huomiotta. Esim. é käsitellään siis aakkostuksessa kuten e. Sääntö koskee myös š- ja ž-kirjainta. Kuitenkin suomen- tai ruotsinkielisen aineiston aakkostuksessa merkit å, ä ja ö kuuluvat vakiintuneille paikoilleen. Lisäksi ü ja ű aakkostetaan kuten y, ja kirjaimet õ ja ő aakkostetaan kuten ö.
Ihmisten nimet aakkostetaan yleensä siten, että ensisijainen aakkostus on sukunimen mukaan, ja toissijaisesti otetaan huomioon etunimet. Muussa aakkostuksessa on käytössä kaksi vaihtoehtoista periaatetta silloin, kun aakkostettavat tiedot koostuvat useista sanoista:
Kansallinen standardi suosittelee ensisijaisesti sanoittaista aakkostusta. Käytännön hankaluutena siinä on, että lukija ei aina tiedä, kirjoitetaanko hänen etsimänsä ilmaisu yhteen vai erikseen. Lisäksi se johtaa usein järjestykseen, joka voi tuntua oudolta:
Kirjaimittaista aakkostusta käytettäessä olisi järjestys esimerkissä päinvastainen eli aakkostettaisiin ikään kuin kirjoitusasu olisi ”Suomenympäristökeskus”.
Standardin mukaan muut merkit kuin kirjaimet jätetään yleensä huomiotta.
Tähän on kuitenkin seuraavat poikkeukset:
Ihmisten sukunimien etuliitteet tuottavat usein ongelmia aakkostuksessa. Niitä koskeva standardin osa on sekava ja epäjohdonmukainen, eikä lukijoiden voi olettaa tuntevan sitä. Toisaalta ongelma ei käytännössä useinkaan ole suuri, koska esimerkiksi von Fieandtit ovat varmaankin tottuneet etsimään nimeään sekä V-kirjaimen että F-kirjaimen kohdalta.
Sääntöjen mukaan jätetään useimmat meille tutut etuliitteet, kuten ruotsin ”af”, ranskan ”de”, hollannin ”van der” ja saksan ”von”, huomiotta aakkostuksessa, eli esim. von Fieandt tulee aakkostaa F-kirjaimen kohdalle. Sen sijaan esimerkiksi brittiläisten nimien alussa oleva ”O’” (esim. ”O’Connor”) käsitetään osaksi itse nimeä (ja heittomerkki jätetään huomiotta aakkostuksessa).
Nykyaikainen ajattelu aakkostusasioissa perustuu tasoittaisuuteen:
Ajattelutapa etenee siis päinvastaiseen suuntaan kuin esimerkiksi standardissa SFS 4600, joka määrittelee vain kansallisesti tärkeimpien merkkien järjestyksen ja täydentää sitä lisäsäännöillä. Periaatteessa ero on vain muodollinen, mutta käytännössä SFS 4600 käsittelee merkkejä sitä epämääräisemmin ja huolimattomammin, mitä enemmän mennään vanhan perusmerkistömme ulkopuolelle.
Unicode-aakkostussäännöt (Unicode Collation Algorithm) määrittelevät merkkien ja merkkijonojen järjestyksen tavalla, joka ei ota huomioon merkityksiä eikä merkkien muodostamia yhdistelmiä. Niiden mukaan esimerkiksi merkkijono 100 on ennen merkkijonoa 99, koska merkki 1 on ennen merkkiä 9.
Merkkien perusjärjestys Unicode-aakkostussäännöissä voidaan yksinkertaistaen kuvata näin:
Unicode-aakkosjärjestyksestä on melko havainnollisia taulukoita Unicode-konsortion sivustossa Collation Charts. Se käyttää melko vaikeaa käsitteistöä, mutta sen taulukoita voi usein hyödyntää ilman syvällistä ymmärtämistä. Esimerkiksi kohdista Punctuation ja General-Symbol voi tarkistaa erikoismerkkien keskinäisen järjestyksen, jos joutuu käsin lajittelemaan aineistoa, jossa on tietotekniikan tms. erikoismerkkejä (esimerkiksi `^_ jne.).
Tietokoneohjelmien (esimerkiksi Excel ja Word) lajittelutoimintojen tekemä aakkostus voi riippua siitä, mikä on määritelty aineiston kieleksi, eikä se välttämättä vastaa täysin mitään standardia.
Kansainvälinen standardi ISO/IEC 14651 määrittelee Unicoden aakkosjärjestykseen perustuvan tavan ”räätälöidä” erilaisia aakkostustapoja eri kielten ja kulttuurien tarpeisiin. Sen pohjalta on laadittu eurooppalainen standardi EN 13710. Sen mukaan numerot aakkostetaan kaikkien kirjainten jälkeen.
Eurooppalaisen standardin mukaan ä ja å käsitetään tällöin a:n tarkkeellisiksi muodoiksi ja ö o:n tarkkeelliseksi muodoksi. Tämä on Unicoden aakkosjärjestyksen mukaista ja vastaa Euroopan kielissä tavallisinta käytäntöä, mutta on tietysti suomen ja ruotsin kieleen soveltumaton. Se on tarkoitettu toisaalta monikielisen aineiston aakkostamiseen, toisaalta kielikohtaisten aakkostusten määrittelemisen pohjaksi.
Eurooppalaisen standardin suomalainen versio SFS-EN 13710 sisältää lyhyen, mutta tärkeän liitteen, jonka mukaan suomalainen perinne otetaan huomioon seuraavina poikkeamina kansainvälisistä standardeista:
Aakkostus on ensisijaisesti kirjaimittaista, mutta myös sanoittain aakkostaminen on mahdollista. Lukuja ym. koskevat erikoissäännöt puuttuvat, joten luvut aakkostetaan merkkijonoina (esim. 100, 2, 2200, 23) eikä lukuarvon mukaan.
Seuraava esimerkki sisältää ilmauksia SFS-EN 13710:n mukaisessa aakkosjärjestyksessä.