Kun puhutaan latinalaisesta aakkostosta, tarkoitetaan useinkin englannin kielen perusaakkostoa a:sta z:aan. Siihen kuitenkin sisältyy w, joka on varsinaiselle latinalaiselle aakkostolle vieras. Kirjainten i ja j erottaminen toisistaan on keskiajan keksintöä, samoin u:n ja v:n erottaminen. Lisäksi latinan klassisella kaudella, Ciceron ja Caesarin aikana käytetty aakkosto sisälsi sekin laajennuksia alkuperäiseen latinalaiseen aakkostoon.
Aluksi latinan aakkosto sisälsi vain seuraavat kirjaimet: A, B, C, D, E, F, H, I, K, L, M, N, O, P, Q, R, S, T, V, X. Myöhemmin otettiin käyttöön C:stä kehitetty G sekä lisättiin aakkosten loppuun kreikasta lainatut, aluksi vain kreikkalaisissa lainasanoissa käytetyt Y ja Z. Vasta keskiajalla siis syntyivät J ja U. Tätä kehitystä on tarkemmin kuvattu eri kirjainten historioissa jäljempänä.
Kun latinalaisella aakkostolla ruvettiin kirjoittamaan erilaisia kieliä, jouduttiin vaikeuksiin, koska monissa kielissä on enemmän olennaisesti erilaisia äänteitä kuin latinalaisessa aakkostossa on kirjaimia. Lisäksi ei olisi ollut järkevää käyttää latinalaisia kirjaimia tarkoittamaan aivan eri äänteitä kuin latinassa.
Esimerkiksi suomen ä- ja ö-äänne puuttuvat latinasta. Olisiko ollut järkevää merkitä niitä vaikkapa kirjaimilla Q ja Z, joille ei ole suomen kirjoittamisessa muuten tarvetta? Tämä olisi ollut luonnotonta niiden mielestä, jotka olivat oppineet näille kirjaimille merkitykset muista kielistä.
Latinasta puuttuvien äänteiden merkitsemiseen ruvettiin usein käyttämään kahden, jopa kolmen kirjaimen yhdistelmiä. Tätä ilmiötä tarkastellaan tarkemmin jäljempänä. Lisäkirjainten kannalta olennaista on, että kirjainpari saattoi sulautua yhdeksi kirjaimeksi.
Esimerkiksi ”ae”, jota käytettiin ä-äänteen merkkinä, saatettiin kirjoittaa ”æ”, jolloin syntyi yhä käytössä oleva ns. tanskalainen ä. Hiukan toisenlainen kehitys johti ä-kirjaimeen, kun a‑kirjaimen päälle ruvettiin kirjoittamaan pieni e-kirjain, jonka muoto vähitellen kehittyi jonkinlaiseksi viivaksi (kuten käsialakirjoituksen ä:ssä, joka muistuttaa ã-kirjainta) tai kahdeksi pisteeksi. Kahta pistettä käyttävä muoto vakiinnutettiin sitten painettujen ja koneella kirjoitettujen tekstien oikeaksi ä:n muodoksi.
Lisäkirjaimia on syntynyt muillakin tavoilla. Esimerkiksi islannissa käytetty thorn-kirjain þ on otettu riimukirjoituksesta, jota käsitellään jäljempänä.
Foneettisen eli ääntämisenmukaisen kirjoituksen tarpeisiin (ks. kohtaa 2.10 Foneettinen kirjoitus) on kehitetty suuri joukko lisäkirjaimia melko mielivaltaisella peruskirjainten muuntelulla. Usein kyse on ollut sananmukaisesti kääntelystä: esimerkiksi ə-kirjain, joka on ns. švaa-vokaalin merkki, muodostettiin pyöräyttämällä e-kirjain ympäri. Vaikka foneettinen kirjoitus alun perin kehitettiin tieteellisen tutkimuksen tarpeisiin, sen merkkejä ruvettiin käyttämään myös kielten normaaleissa kirjoitusjärjestelmissä. Olihan luonnollista, että kun kielten asiantuntija kehitti kirjoitusjärjestelmän esimerkiksi kielelle, jossa on švaa-vokaali, hänen mieleensä tuli käyttää hänelle tuttua ə-kirjainta.
Latinalaisen aakkoston tärkeimpiä lisäkirjaimia käsitellään yksityiskohtaisesti luvussa 5.
Tarke eli diakriittinen merkki tarkoittaa kirjaimeen liitettyä pientä lisäosaa, esimerkiksi aksenttia é-kirjaimessa tai pisteitä ü-kirjaimessa. Tarke voi vaikuttaa kirjaimen ääntämykseen monin eri tavoin eri kielissä. Joissakin kielissä tarkkeita käytetään myös erottamaan toisistaan sanoja, jotka muuten äännetään ja kirjoitetaan samoin. Esimerkiksi italiassa sana e tarkoittaa ’ja’, kun taas samoin ääntyvä è tarkoittaa ’on’.
Tarkkeen merkitys riippuu kirjaimesta ja kielestä. Esimerkiksi akuutti aksentti vokaalin päällä (esim. á) osoittaa useissa kielissä vokaalin painolliseksi, mutta mm. unkarissa se osoittaa vokaalin pitkäksi, vaikuttamatta painoon.
Tarkkeiden käyttöönoton perussyyt ovat samantapaiset kuin edellisessä kohdassa kuvatut lisäkirjainten synnyn perusteet. Itse asiassa lisäkirjaimen ja tarkkeellisen kirjaimen välinen ero on osittain aivan sopimuksenvarainen. Me suomalaiset varmaankin pidämme ä- ja ö-kirjaimia ihan kunnon kirjaimina, joita käytämme muiden kirjainten tavoin. Kansainvälisten merkistöstandardien käsitteistön mukaan ne kuitenkin koostuvat peruskirjaimesta a tai o ja siihen liittyvästä tarkkeesta, jota kutsutaan suomessa nimellä treema, englannissa nimellä dieresis (tai diaeresis). Tässä mielessä kyse on samantyyppisistä merkeistä kuin esimerkiksi treema-e ë ja treema-i ï.
Tarkkeet ovat osittain varsin vanhaa perua. Jo vanhan ajan latinassa käytettiin melko usein eräänlaista akuutin tapaista tarketta vokaalin päällä osoittamassa, että vokaali ääntyy pitkänä. Tämä tarke jäi kuitenkin pois käytöstä.
Tarkkeista käytetään usein nimitystä aksentti, joka on kuitenkin epätarkka, koska se voi tarkoittaa kaikkia tarkkeita, joitakin tarkkeita tai erityisesti akuuttia (= akuutti aksentti).
Tavallisimmat tarkkeet, joita tarvitaan suomen kieltä kirjoitettaessa joko kielen varsinaisissa sanoissa tai vieraissa nimissä, on esitetty seuraavassa taulukossa. Nämä ovat ne tarkkeet, jotka voi tuottaa vanhalla suomalaisella tietokonenäppäimistöllä.
tarkkeen nimi |
tarke |
käyttöesimerkki |
tarkkeen merkitys esimerkkisanassa |
---|---|---|---|
akuutti |
´ |
Linné |
Osoittaa vokaalin painolliseksi |
gravis |
` |
à la carte |
Erottaa sanan à sanasta a |
hattu |
ˇ |
šakki |
Osoittaa, että kyseessä on suhu-s |
sedilji |
¸ |
garçon |
Ilmoittaa, että c äännetään s:nä eikä k:na |
sirkumfleksi |
̂ |
Rhône |
Perinteinen kirjoitusasu |
tilde |
˜ |
Buñuel |
Osoittaa n:n palatalisoituneeksi (”nj”) |
treema |
¨ |
Noël |
Osoittaa, että e kuuluu eri tavuun |
Näitä ja muita tarkkeita käsitellään yksityiskohtaisesti luvussa 4, ja luvussa 6 kuvaillaan tarkkeellisten merkkien käyttöä eri kielissä.
Kahden kirjaimen yhdistelmät ovat usein saaneet erikoismerkityksen. Monissa kielessä CH-yhdistelmän äännearvo on aivan toinen kuin C:n ja H:n äännearvot, esimerkiksi ”tš” tai ”k”. Yhdistelmä saattaa kehittyä niin omaleimaiseksi, että kielen puhujat kokevat sen erilliseksi kirjaimeksi, digrafiksi.
Tämän kehityksen taustalla on osittain äänteellisiä muutoksia, joiden takia kahden äänteen yhdistelmästä kehittyi yksi äänne. Kielen kirjoitusjärjestelmää kehitettäessä on myös saatettu tietoisesti ottaa kahden kirjaimen yhdistelmä erikoiskäyttöön. Usein mallina on tällöin ollut jokin olemassa oleva kirjoitusjärjestelmä. Tämä on ollut tavallista myös siirtokirjoitusjärjestelmiä kehitettäessä. Esimerkiksi SH on varsin tavallinen suhu-s:n (š) merkki, vaikka sitä ei voi kovin luontevasti selittää s- ja h-äänteestä kehittyneeksi.
Suomen kielen tapa merkitä pitkää vokaalia kahdella vokaalimerkillä, esimerkiksi AA, voidaan sekin tulkita digrafiksi. Nykykielen kannalta digrafi on myös NG, jota käsitellään N-kirjaimen historiassa. Lisäksi on hyvin tavallista käyttää kirjainten Š ja Ž sijasta digrafeja SH ja ZH.
Joissakin kielissä on myös kolmen kirjaimen yhdistelmiä, trigrafeja, joilla on erikoismerkitys. Tunnetun lienee saksan SCH, joka tarkoittaa suhu-s:ää.
Suomalainen aakkosto on omaksuttu ruotsin kielestä, ja sitä voisi kutsua jopa suomalais-ruotsalaiseksi aakkostoksi. Syynä oli tietysti se, että Suomi kuului Ruotsiin ja ruotsin kieli oli laajassa käytössä Suomessakin silloin, kun suomea vasta ruvettiin kirjoittamaan. Onneksi ruotsin kielen kirjoitusjärjestelmä sopi melko hyvin suomenkin kirjoittamiseen. Ruotsissa oli esimerkiksi valmiina kirjaimet ä ja ö, tosin aluksi erimuotoisina kuin nykyisin: pisteiden tilalla oli a:n tai o:n yläpuolella oleva pieni e-kirjain.
Aluksi suomen kirjoittaminen oli kuitenkin epäjohdonmukaista ja haparoivaa, kuten eri kirjainten tarinoista ilmenee. Erityisesti pitkien vokaalien ja kaksoiskonsonanttien merkitsemisessä oli aluksi suurta vaihtelua, koska ruotsin järjestelmä ei tarjonnut suomeen sopivaa käytäntöä.
Suomalaisen aakkoston sanotaan virallisesti olevan seuraava:
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, Š, T, U, V, W, X, Y, Z, Ž, Å, Ä, Ö.
Monet eivät kuitenkaan koe Š:ää ja Ž:aa suomalaisiksi aakkosiksi, ja yleisesti ne korvataan SH:lla ja ZH:lla.
Suomalainen aakkosto on pikemminkin perinteellinen kirjainten kokoelma ja aakkosjärjestys kuin varsinaisesti suomen kielen aakkosto. Kirjaimet C, Q, W, X ja Å ovat suomen kielen kannalta vieraita kirjaimia: ne esiintyvät vain vieraissa nimissä, niiden johdoksissa ja sitaattilainoissa. Ne siis eivät oikeastaan kuulu suomeen sen enempää kuin esimerkiksi latinalaisen aakkoston lisäkirjaimet Þ, Œ ja ß, paitsi että C, Q, W, X ja Å ovat mm. kouluopetuksen, näppäimistöjen, meille tärkeiden vieraiden kielten ja perinteen takia tutumpia. Z on rajatapaus: sekin on lähinnä vieras kirjain, mutta se on säilytetty joissakin lainasanoissa.
Suomen kielessä yleensä mukautetaan lainasanojen kirjoitusasu suomen kirjoitusjärjestelmään niin, että käytetään vain varsinaista suomen aakkostoa, johon C, Q, W ja Å eivät siis kuulu. Samalla korvataan monia digrafeja ääntämyksen mukaisilla kirjaimilla. Aihetta käsitellään tarkemmin eri kirjainten tarinoissa, mutta seuraavassa on tiivistelmätaulukko kirjainten ja kirjainyhdistelmien mukauttamisesta latinasta ja kreikasta peräisin olevissa lainasanoissa.
Vieras |
Oma |
Esimerkkisana englannissa |
Esimerkkisana suomessa |
---|---|---|---|
ae (yleensä) |
e |
anaemic, anæmic, anemic |
aneeminen |
ae (joskus) |
ae |
anaerobic |
anaerobinen |
c (e:n t. i:n edellä) |
s |
cent |
sentti |
c (muutoin) |
k |
calligraphy |
kalligrafia |
ch |
k |
chromatic |
kromaattinen |
oe (yleensä) |
e |
oestrogen, œstrogen, estrogen |
estrogeeni |
oe (joskus) |
oe |
poetics |
poetiikka |
ph |
f |
phobia |
fobia |
qu |
kv |
quartal |
kvartaali |
rh |
r |
rhinitis |
riniitti |
sc (sanan alussa) |
sk |
scientism |
skientismi |
sc (e:n t. i:n edellä) |
s |
descendent |
desendentti |
th |
t |
thesaurus |
tesaurus |
x |
ks |
fixation |
fiksaatio |
z (yleensä) |
ts |
paleozoic |
paleotsooinen |
z (joskus) |
z |
zootomy |
zootomia |