Tämä teos on kertomus latinalaisten aakkosten A, B, C... synnystä, kehityksestä ja käytöstä.
© 2010–2024 Jukka K. KorpelaTämän kirjan yksi tarkoitus on viihdyttää älyllisesti lukijaa, jota yleisesti kiinnostavat kielet ja merkit. Miksi kirjaimet ovat sen näköisiä kuin ovat, mistä Ä sai pisteensä ja mitä ovat ã, č ja þ? Jokaisella kirjaimella on tarinansa, usein yllättävän monipolvinen ja ehkä monihaarainenkin.
Kirjoituksen syntyä käsitellään monissa kirjoissa, myös suomenkielisissä. Tämä kirja kertoo eri merkkien omia tarinoita kuten kunkin kirjaimen alkuperän ja kehittymisen nykyisiin muotoihin ja käyttötarkoituksiin. Mukana on toki myös lyhyt esitys kirjoituksen historiasta yleisesti.
Kirjalla on myös käytännöllisempi puolensa. Se kertoo pääpiirteissään, mitä erilaisia tarkkeita ja lisämerkkejä latinalaisessa kirjaimistossa esiintyy ja miten niitä kirjoitetaan. Jos joudut kirjoittamaan vieraan nimen, jossa on ĕ-kirjain, osaatko kirjoittaa sen helposti ja osaatko kirjoittaa oikean merkin eikä ě-kirjainta? Osaatko päätellä englanninkielisestä tekstistä, että outo nimi on siinä kirjoitettu toisin kuin alkuperäiskielessä? Kirja antaa tällaisista asioista runsaasti käytännön ohjeita.
Vieraiden nimien oikeinkirjoitukseen kiinnitetään lisääntyvää huomiota. Erityisesti tämä koskee eurooppalaisia kieliä: meidän tulisi osata kirjoittaa muiden EU-maiden paikkojen, ihmisten ja organisaatioiden nimet tarkasti oikein.
Kirjasta on hyötyä myös kielenopettajille ja monien vieraiden kielten opiskelijoille. Kirja auttaa ymmärtämään merkkien käyttöä muissa kielissä. Ja kukapa ei opiskelisi kieliä ainakin jossain määrin? Jopa englannin kielessä käytetään usein muitakin kuin peruskirjaimia a:sta z:aan: fiancé, rôle, archæology.
Kirjassa myös kuvataan (kohdassa 2.10 Foneettinen kirjoitus) melko laajasti ääntämisohjeiden järjestelmä, IPA, jota Suomessa yleisesti käytetään kielten oppikirjoissa ja sanakirjoissa – usein hyvin suppeasti selostettuna.
Osa kirjan sisällöstä on otettu mukaan myöhempään teokseeni Vierasnimikirja, joka käsittelee vieraiden nimien kirjoittamista ja sisältää muun muassa laajan luettelon niin sanotuista sovinnaisnimistä (esimerkiksi Baijeri, ei saksan mukaan Bayern eikä englannin mukaan Bavaria).
Tätä teosta kutsutaan tässä kirjaksi, koska se on rakenteeltaan kirja jakautuen lukuihin, alalukuihin jne. ja sopii luettavaksi järjestelmällisesti alusta loppuun.
Kirjan voi lukea myös kahdesti: ensin viihteellisinä tarinoina siitä, mitä kaikkea kirjaimille on sattunut, ja sitten käytännöllisenä ohjeena kirjainten käyttöön eri kielissä ja merkintätavoissa. Tarinat tuovat ohjeille taustaa ja auttavat ymmärtämään ja muistamaan monia kirjoitussääntöjä.
Jotta kirjaa voisi käyttää myös hakuteoksena, on monet tärkeät asiat mainittu useaan kertaan eri luvuissa. Esimerkiksi erikoismerkkien käyttöä eri kielissä on käsitelty sekä merkkien kuvauksissa että kielikohtaisissa tarkasteluissa.
Tämä kirja on kirjoitettu alun perin Word-ohjelmalla ja julkistettu vuosina 2010–2011 Word-ohjelmasta tuotettuna PDF-tiedostona. Viimeinen PDF-versio (219 sivua; 13.1.2011) on edelleen saatavilla, mutta PDF-versiota ei enää päivitetä.
Kirja on v. 2018 muunnettu HTML-muotoon Calibre-ohjelmalla ja julkistettu 19.12.2018 osiin jaettuna verkkosivustona osoitteessa https://jkorpela.fi/kirjaimet/. Muuntamisen yhteydessä tehtiin perustarkistus, mutta ei puututtu rakenneratkaisuihin eikä siihen, että mukana on aiheita, joita tekijä on nyttemmin käsitellyt tarkemmin ja ehkä paremmin muissa yhteyksissä. Linkkejä sellaisiin aineistoihin on kuitenkin lisätty. Kirjaa ei kehitetä aktiivisesti, mutta korjauksia tai lisäyksiä saatetaan tehdä.
Kirjaimistomme juuret ovat Lähi-idässä, jossa jokin seemiläistä kieltä puhuva kansa kehitti kirjaimiston lähes neljätuhatta vuotta sitten, joskus vuoden 1900 eKr. tietämissä. Sen alkujuuret ovat ilmeisesti osittain egyptiläisissä hieroglyfeissä, mutta muinaisseemiläinen kirjaimisto oli silti erikoislaatuinen keksintö – maailmanhistorian tärkeimpiä. Seemiläisiä kieliä ovat nykyisin puhutuista kielistä muun muassa arabia ja heprea.
Aiemmin oli käytetty sanamerkkejä, jotka olivat alkujaan merkitystään esittäviä kuvia. Niistä oli kehittynyt tavumerkkejä ja osittain kirjainmerkkejäkin. Sanaa saatettiin käyttää sanan alussa olevan äänteen merkkinä etenkin silloin, kun piti kirjoittaa erisnimiä ja käsitteellisiä sanoja, joiden esittäminen kuvin ei oikein onnistunut. Tämä on verrattavissa siihen, että käyttäisimme vaikkapa kalaa esittävää kuvaa k-äänteen merkkinä, aaltoviivaa a-äänteen merkkinä ja niin edelleen.
Muinaisseemiläiselle kirjaimistolle oli kuitenkin luonteenomaista se, että se käytti vain äännettä tarkoittavia merkkejä, kirjainmerkkejä. Oli vain yksi tapa kirjoittaa sana, sen sijaan, että voisi käyttää kirjain-, tavu- ja sanamerkkejä erilaisina yhdistelminä. Yksinkertaisuus teki kirjaimistosta helposti opittavan ja johdonmukaisen. Tämän ansiosta myös muut kansat saattoivat omaksua sen ja muokata sitä niin, että se sopi eri kielten kirjoittamiseen.
Seemiläinen kirjaimisto levisi eri kansojen käyttöön, ja siitä kehittyi monia muunnelmia. Aluksi sitä käytettiin vain seemiläisten kielten kirjoittamiseen, myöhemmin myös muiden, jolloin siihen tarvittiin muutoksia.
Heprealainen aakkosto, jota käytetään heprean ja jiddišin (juutalaissaksan) kirjoittamiseen, alkaa kirjaimilla alef א, bet ב ja gimel ג, jotka ovat suhteellisen lähellä alkuperäisiä muotoja. Isompia muutoksia on tapahtunut arabialaisessa aakkostossa, jota käytetään arabian, persian ja useiden muiden kielten kirjoittamiseen. Arabialaiset aakkoset ovat kehittyneet kauniiseen käsin kirjoittamiseen sopiviksi, ja painotekstissäkin kirjaimet yleensä liittyvät toisiinsa kuten käsialakirjoituksessa. Tämän takia kirjaimista on erilaisia muotoja, joita käytetään tarkkojen sääntöjen mukaan. Arabialaisten kirjainten ns. itsenäisiä muotoja, joita käytetään mainittaessa kirjain erikseen, ovat esimerkiksi seuraavat: alif ا, bāʾ ب ja jīm ج. Viimeksi mainittu vastaa gimeliä ja on latinalaisen C:n ja G:n etäinen sukulainen. Esimerkiksi bāʾ-kirjaimen muut muodot ovat ﺑ (sanan alussa), ﺒ (sanan sisällä) ja ﺐ (sanan lopussa).
Seemiläisen kirjaimiston yhdestä muunnelmasta, foinikialaisesta aakkostosta, kehitettiin mm. kreikkalainen aakkosto, josta taas meidän tuntemamme kirjaimet ovat peräisin. Foinikialaisen aakkoston merkitys johtui siitä, että se levisi laajalle Välimeren alueella foinikialaisten kauppiaiden ja siirtokuntien kautta. Vaikka foinikialaisten merkit poikkesivat monin tavoin varhemmista muodoista, tässä kirjassa käytetään vanhasta seemiläisestä aakkostosta foinikialaisia nimiä (erään merkintätavan mukaan) ja muotoja: alf 𐤀, bet 𐤁, gaml 𐤂 ym.
Seemiläisestä kirjaimistosta kehittyneitä ovat myös useimmat muut maailman kirjoitusjärjestelmät. Tätä ei useinkaan voi päätellä suoraan merkkien nykyisistä muodoista. Esimerkiksi armenialaiset kirjaimet (Ա, Բ, Գ…) näyttävät hyvin erilaisilta kuin seemiläiset alkumuotonsa. Vanhoista teksteistä voidaan kuitenkin päätellä, miten merkit ovat kehittyneet.
Maailman kirjoitusjärjestelmät ovat kehittyneet lähinnä viidestä perusjärjestelmästä: sumerilaisesta nuolenpääkirjoituksesta, egyptiläisistä hieroglyfeistä, Etelä-Amerikan mayojen kirjoituksesta, kiinalaisista kirjoitusmerkeistä ja muinaisseemiläisistä kirjaimista. Muinaisseemiläinen kirjoitus siis muodostaa perustan useimmille nykyisille järjestelmille, kun taas kiinalaisia merkkejä eri muodoissaan käytetään melko harvojen mutta puhujamääriltään osittain hyvinkin suurten kielten kirjoittamiseen.
Vähittäin kehittyneiden kirjoitusjärjestelmien lisäksi on olemassa joitakin erikseen kehitettyjä järjestelmiä. Useimmat niistä ovat jääneet kehittäjiensä omaan käyttöön tai enintään pienen piirin harrastukseksi. Laajaan käyttöön tuli kuitenkin korean kieltä varten kehitetty hangul-järjestelmä, jolle ei voida osoittaa mitään selvää esikuvaa.
Kirjainmerkit ovat usein muunnelleet paljonkin, mutta kirjoitettujen tekstien merkityksen lisääntyessä alkoivat kirjainten muodot vakioitua. Lisäksi vaikka kirjainten muodoissa on edelleen vaihtelua, myös pelkän vaihtelun tuomiseksi esimerkiksi painoteksteihin, on itse kirjaimisto, kirjainten valikoima, hidas muuttumaan. Sama koskee sanojen kirjoitusasua, sillä kirjoitetun kielen syntymisen jälkeen alkaa kirjakieli yleensä eriytyä puhekielestä. Ääntämys muuttuu, kirjoitusasu ei, jolloin kirjoituksen ja ääntämyksen suhde voi muodostua yhtä mutkikkaaksi kuin englannissa – tai aikanaan mutkikkaammaksikin.
Onkin tärkeää huomata, että useimpia kirjoitusjärjestelmiä ei ole suunniteltu. Poikkeuksia muodostavat lähinnä uudella ajalla kehitetyt järjestelmät, jotka esimerkiksi lähetyssaarnaaja tai kielentutkija on luonut jonkin aiemmin kirjoittamattoman kielen tarpeisiin. Useimmat järjestelmät ovat kehittyneet vähitellen, ja siksi niissä on epäjohdonmukaisuuksia. Harvat kirjoituksen piirteet voidaan osoittaa yhden miehen tai työryhmän kehittämiksi. Kun kieltä ruvetaan kirjoittamaan, otetaan yleensä pohjaksi toisen kielen järjestelmä, johon tehdään välttämättömiltä tuntuvia muutoksia. Myöhemmin pienetkin uudistukset kohtaavat usein kovaa vastarintaa. Suomen kieli on oikeastaan poikkeus tästä, koska alkuperäistä, Agricolan kehittämää kirjoitusjärjestelmää uudistettiin myöhemmin vaiheittain yhä johdonmukaisemmaksi.
Myös kreikkalaiset kehittivät oman aakkostonsa, joka perustui seemiläisen aakkoston foinikialaiseen muunnelmaan. Kirjainten muodot muuttuivat eri tavoilla, osittain äännearvotkin. Lisäksi kreikkalaiset kehittivät kolme lisäkirjainta, fii Φ, khii Χ ja psii Ψ, merkeiksi konsonanteille, joille ei ollut merkkejä. Niiden alkuperä on epäselvä ja kiistanalainen. Joka tapauksessa ne lisättiin merkistön loppuun yhdessä oomegan Ω kanssa.
Vielä suurempi ongelma oli, että seemiläisessä kirjaimistossa oli vain konsonanttimerkit. Konsonanttikirjoitus sopi melko hyvin seemiläisten kielten luonteeseen, koska vokaalit eivät yleensä muuta sanan perusmerkitystä, vaan niillä osoitetaan mm. kieliopillisia suhteita. Esimerkiksi konsonanttiyhdistelmä, joka vastaa latinalaisia kirjaimia ”ktb”, esiintyy kirjoittamista ja sen tuotteita (kuten kirjoja) tarkoittavissa sanoissa. Vokaaleilla täsmennetään merkitystä, mutta vokaalit ovat yleensä kieltä osaavan pääteltävissä lause- ja asiayhteydestä. Muinaisseemiläiseen kirjoitukseen perustuvassa arabialaisessa ja heprealaisessa kirjoituksessa ei edelleenkään merkitä lyhyitä vokaaleita kuin erikoistapauksissa. Sen sijaan pitkät vokaalit merkitään konsonanttikirjaimista kehittyneillä merkeillä.
Kreikan kielessä vokaaleilla on toisenlainen merkitys. Vokaalin vaihtaminen toiseksi muuttaa usein sanan merkityksen kokonaan kuten suomessakin, jossa ”kala”, ”kela”, ”kulu” ja ”kilo” ovat aivan eri sanoja. Niinpä kreikkalaiset joutuivat kehittämään merkit myös vokaaleille. Vokaaleita ei voinut ostaa, mutta ei niitä aivan tyhjästäkään keksitty.
Tyypillinen on kreikan aakkosten ensimmäisen kirjaimen alfan (A, α) tarina. Tällä kirjaimella on kreikassa suunnilleen sama äännearvo kuin esimerkiksi suomessa latinalaisella A-kirjaimella, joka on alfan suora seuraaja. Alfa kuitenkin kehittyi muinaisseemiläisestä alf-kirjaimesta, joka ei suinkaan tarkoittanut vokaalia, vaan konsonanttia, eräänlaista kurkkuäännettä. Koska tätä konsonanttia ei kreikassa esiinny, sen merkki otettiin uusiokäyttöön. Tähän mahdollisesti vaikutti se, että mainittu konsonantti esiintyy seemiläisissä kielissä usein sanan alussa niin, että sitä seuraa a-äänne.
Muissa seemiläisestä kirjoituksesta kehittyneissä kielissä on vokaalien merkitsemisen ongelma saatettu ratkaista muilla tavoin. Eräs tapa on liittää konsonanttikirjaimeen jokin pieni lisämerkki osoittamaan, mikä vokaali sen jälkeen on äännettävä.
Kun jotakin aakkostoa on ruvettu käyttämään aiemmin kirjoittamattoman kielen kirjoittamiseen, on usein muulloinkin törmätty siihen, että kielessä on äänteitä, joihin aakkoset eivät sellaisinaan sovellu. Tällöin on joko annettu kirjaimille uusia äännearvoja tai kehitetty kokonaan uusia merkkejä, yleensä entisten pohjalta.
Vokaalimerkkien käyttöönotto merkitsi siirtymistä aakkoskirjoitukseen sanan varsinaisessa merkityksessä. Maailman kirjoitusjärjestelmät voidaan jakaa seuraaviin suuriin pääryhmiin:
Erilaisia kirjoitusjärjestelmiä ei tässä kirjassa käsitellä enempää. Edellä esitetty luonnehdinta kuitenkin auttanee hahmottamaan meille tutun aakkoskirjoituksen asemaa laajemmassa kokonaisuudessa. Kaikessa monimuotoisuudessaan se on vain yksi monista mahdollisuuksista.
Kreikkalaisesta kirjaimistosta kehittyivät Italiassa etruskin kielen aakkoset, joista taas latinalaiset aakkoset pääosin muodostuivat. Etruskin kielen ohella puhuttiin nykyisessä Italiassa monia muitakin kieliä, ennen kuin latina syrjäytti ne. Niitä kirjoitettiin samantapaisella aakkostolla kuin etruskia, ja niiden kirjaimistoista käytetään yhteisnimitystä muinaisitaalinen aakkosto (Old Italic Alphabet). Niissä kirjainten muodot ovat paljolti kreikan (ja latinan) aakkosten peilikuvia; tämä heijastaa sitä, että kirjoitussuunta oli oikealta vasemmalle.
Myöhemmin kreikkalaisen kirjaimiston pohjalta kehitettiin kyrilliset aakkoset, joita käytetään muun muassa venäjän kirjoittamiseen. Kyrilliseen kirjaimistoon otettiin kyllä aineksia myös heprealaisesta kirjaimistosta. Esimerkiksi suhu-s:lle, joka ei sisälly kreikan äänteisiin, muodostettiin merkiksi kirjain Ш heprealaisesta suhu-s:n merkistä.
Latinalainen aakkosto alkaa A, B, C, D, kreikkalainen A, B, Γ, Δ ja kyrillinen A, Б, B, Г. Niissä on siis paljon yhtäläisyyksiä, jopa aivan samanlaisia kirjaimia, mutta myös paljon eroja. Monet yhtäläisyydet ovat pettäviä. Esimerkiksi kyrillinen B ei tarkoita b-äännettä vaan v-äännettä, ja kreikkalainen P on rhoo-kirjain, joka on r-äänteen merkki. Paljolti juuri tällaisten ilmiöiden takia merkistöstandardeissa tulkitaan myös esimerkiksi latinalainen A, kreikkalainen A (alfa) ja kyrillinen A eri merkeiksi, joiden sisäiset esitysmuodot ovat erilaiset. Johdonmukaisuuden vuoksi siis keskenään täysin samannäköisetkin aakkoset tulkitaan eri merkeiksi, jos ne kuuluvat kokonaan eri kirjoitusjärjestelmiin.
Seuraava taulukko kuvaa yksinkertaistetusti eräiden kirjainten kehitystä. Mukana on vain joitakin kirjainten perusmuotoja. Todellisuudessa kirjainten muodot vaihtelivat suuresti kunkin aakkoston sisälläkin. Viimeisessä sarakkeessa mainitut kyrilliset kirjaimet eivät siis ole kehittyneet latinalaisista vaan suoraan kreikkalaisista. Foinikialaisten kirjainten nimet ovat Unicode-standardin mukaiset merkkien nimet, kreikkalaisten kirjainten taas suomalaiset nimet.
Foinik. |
Kreikkal. |
Etr. |
Latinal. |
Kyrillinen |
|
---|---|---|---|---|---|
𐤀 alf |
Α |
alfa |
𐌀 |
A |
А |
𐤁 bet |
Β |
beeta |
𐌁 |
B |
Б, В |
𐤂 gaml |
Γ |
gamma |
𐌂 |
C (G) |
Г |
𐤃 delt |
Δ |
delta |
𐌃 |
D |
Д |
𐤄 he |
Ε |
epsilon |
𐌄 |
E |
Е |
𐤆 zai |
Ζ |
zeeta |
𐌆 |
Z |
З |
𐤇 het |
Η |
eeta |
𐌇 |
H |
|
𐤈 tet |
Θ |
theeta |
𐌈 |
|
|
𐤉 yod |
Ι |
ioota |
𐌉 |
I (J) |
И |
𐤊 kaf |
Κ |
kappa |
𐌊 |
K |
К |
𐤋 lamd |
Λ |
lambda |
𐌋 |
L |
Л |
𐤌 mem |
Μ |
myy |
𐌌 |
M |
М |
𐤍 nun |
Ν |
nyy |
𐌍 |
N |
Н |
𐤎 semk |
Ξ |
ksii |
𐌎 |
|
|
𐤏 ain |
Ο |
omikron |
𐌏 |
O |
О |
𐤐 pe |
Π |
pii |
𐌐 |
P |
П |
𐤑 sade |
|
|
𐌑 |
|
|
𐤒 qof |
|
|
𐌒 |
Q |
|
𐤓 rosh |
Ρ |
rhoo |
𐌓 |
R |
Р |
𐤔 shin |
Σ |
sigma |
𐌔 |
S |
С, Ш (Щ) |
𐤕 tau |
Τ |
tau |
𐌕 |
T |
Т |
𐤅 wau |
Υ |
ypsilon |
𐌖, 𐌅 |
Y, V (U), F |
У |
|
Φ |
fii |
𐌘 |
|
Ф |
|
Χ |
khii |
𐌙 |
X |
Х |
|
Ψ |
psii |
|
|
|
|
Ω |
oomega |
|
|
|
Kreikkalaiset vaihtoivat kirjoitussuunnan. Muinaisseemiläisillä aakkosilla kirjoitettiin oikealta vasemmalle, kuten hepreaa ja arabiaa yhä kirjoitetaan. Kreikkalaisetkin käyttivät aluksi tätä tapaa, mutta siirtyivät vasemmalta oikealla kirjoittamiseen, kokeiltuaan välillä myös ns. kyntökirjoitusta, jossa joka toinen rivi kirjoitetaan oikealta vasemmalle ja joka toinen vasemmalta oikealle.
Suunnan vaihtaminen vaikutti myös kirjainten muotoihin. Usein muoto, jossa jonkinlaiset sakarat osoittivat vasemmalle, siis kirjoitussuuntaan, vaihtui peilikuvakseen, jotta sakarat edelleen osoittaisivat kirjoitussuuntaan.
Kirjoitussuunta on tavallaan mitätön tekninen yksityiskohta, mutta sillä on yllättävän laaja vaikutus siihen, miten koemme asioita. Koska kirjoitamme vasemmalta oikealle, ajattelemme automaattisesti, että tapahtumien kulkua kuvaavat kaaviotkin luetaan niin. Seuraavassa on erikokoisia kirjaimia, ja jos meidän pitäisi kuvata, mitä ne esittävät, niin sanoisimme varmaan jotain kirjainten koon kasvamisesta. Arabialaiseen kirjoitukseen tottunut varmaankin puhuisi pienenemisestä.
o o o o o
Kasvaako vai pieneneekö?
Kun puhutaan latinalaisesta aakkostosta, tarkoitetaan useinkin englannin kielen perusaakkostoa a:sta z:aan. Siihen kuitenkin sisältyy w, joka on varsinaiselle latinalaiselle aakkostolle vieras. Kirjainten i ja j erottaminen toisistaan on keskiajan keksintöä, samoin u:n ja v:n erottaminen. Lisäksi latinan klassisella kaudella, Ciceron ja Caesarin aikana käytetty aakkosto sisälsi sekin laajennuksia alkuperäiseen latinalaiseen aakkostoon.
Aluksi latinan aakkosto sisälsi vain seuraavat kirjaimet: A, B, C, D, E, F, H, I, K, L, M, N, O, P, Q, R, S, T, V, X. Myöhemmin otettiin käyttöön C:stä kehitetty G sekä lisättiin aakkosten loppuun kreikasta lainatut, aluksi vain kreikkalaisissa lainasanoissa käytetyt Y ja Z. Vasta keskiajalla siis syntyivät J ja U. Tätä kehitystä on tarkemmin kuvattu eri kirjainten historioissa jäljempänä.
Kun latinalaisella aakkostolla ruvettiin kirjoittamaan erilaisia kieliä, jouduttiin vaikeuksiin, koska monissa kielissä on enemmän olennaisesti erilaisia äänteitä kuin latinalaisessa aakkostossa on kirjaimia. Lisäksi ei olisi ollut järkevää käyttää latinalaisia kirjaimia tarkoittamaan aivan eri äänteitä kuin latinassa.
Esimerkiksi suomen ä- ja ö-äänne puuttuvat latinasta. Olisiko ollut järkevää merkitä niitä vaikkapa kirjaimilla Q ja Z, joille ei ole suomen kirjoittamisessa muuten tarvetta? Tämä olisi ollut luonnotonta niiden mielestä, jotka olivat oppineet näille kirjaimille merkitykset muista kielistä.
Latinasta puuttuvien äänteiden merkitsemiseen ruvettiin usein käyttämään kahden, jopa kolmen kirjaimen yhdistelmiä. Tätä ilmiötä tarkastellaan tarkemmin jäljempänä. Lisäkirjainten kannalta olennaista on, että kirjainpari saattoi sulautua yhdeksi kirjaimeksi.
Esimerkiksi ”ae”, jota käytettiin ä-äänteen merkkinä, saatettiin kirjoittaa ”æ”, jolloin syntyi yhä käytössä oleva ns. tanskalainen ä. Hiukan toisenlainen kehitys johti ä-kirjaimeen, kun a‑kirjaimen päälle ruvettiin kirjoittamaan pieni e-kirjain, jonka muoto vähitellen kehittyi jonkinlaiseksi viivaksi (kuten käsialakirjoituksen ä:ssä, joka muistuttaa ã-kirjainta) tai kahdeksi pisteeksi. Kahta pistettä käyttävä muoto vakiinnutettiin sitten painettujen ja koneella kirjoitettujen tekstien oikeaksi ä:n muodoksi.
Lisäkirjaimia on syntynyt muillakin tavoilla. Esimerkiksi islannissa käytetty thorn-kirjain þ on otettu riimukirjoituksesta, jota käsitellään jäljempänä.
Foneettisen eli ääntämisenmukaisen kirjoituksen tarpeisiin (ks. kohtaa 2.10 Foneettinen kirjoitus) on kehitetty suuri joukko lisäkirjaimia melko mielivaltaisella peruskirjainten muuntelulla. Usein kyse on ollut sananmukaisesti kääntelystä: esimerkiksi ə-kirjain, joka on ns. švaa-vokaalin merkki, muodostettiin pyöräyttämällä e-kirjain ympäri. Vaikka foneettinen kirjoitus alun perin kehitettiin tieteellisen tutkimuksen tarpeisiin, sen merkkejä ruvettiin käyttämään myös kielten normaaleissa kirjoitusjärjestelmissä. Olihan luonnollista, että kun kielten asiantuntija kehitti kirjoitusjärjestelmän esimerkiksi kielelle, jossa on švaa-vokaali, hänen mieleensä tuli käyttää hänelle tuttua ə-kirjainta.
Latinalaisen aakkoston tärkeimpiä lisäkirjaimia käsitellään yksityiskohtaisesti luvussa 5.
Tarke eli diakriittinen merkki tarkoittaa kirjaimeen liitettyä pientä lisäosaa, esimerkiksi aksenttia é-kirjaimessa tai pisteitä ü-kirjaimessa. Tarke voi vaikuttaa kirjaimen ääntämykseen monin eri tavoin eri kielissä. Joissakin kielissä tarkkeita käytetään myös erottamaan toisistaan sanoja, jotka muuten äännetään ja kirjoitetaan samoin. Esimerkiksi italiassa sana e tarkoittaa ’ja’, kun taas samoin ääntyvä è tarkoittaa ’on’.
Tarkkeen merkitys riippuu kirjaimesta ja kielestä. Esimerkiksi akuutti aksentti vokaalin päällä (esim. á) osoittaa useissa kielissä vokaalin painolliseksi, mutta mm. unkarissa se osoittaa vokaalin pitkäksi, vaikuttamatta painoon.
Tarkkeiden käyttöönoton perussyyt ovat samantapaiset kuin edellisessä kohdassa kuvatut lisäkirjainten synnyn perusteet. Itse asiassa lisäkirjaimen ja tarkkeellisen kirjaimen välinen ero on osittain aivan sopimuksenvarainen. Me suomalaiset varmaankin pidämme ä- ja ö-kirjaimia ihan kunnon kirjaimina, joita käytämme muiden kirjainten tavoin. Kansainvälisten merkistöstandardien käsitteistön mukaan ne kuitenkin koostuvat peruskirjaimesta a tai o ja siihen liittyvästä tarkkeesta, jota kutsutaan suomessa nimellä treema, englannissa nimellä dieresis (tai diaeresis). Tässä mielessä kyse on samantyyppisistä merkeistä kuin esimerkiksi treema-e ë ja treema-i ï.
Tarkkeet ovat osittain varsin vanhaa perua. Jo vanhan ajan latinassa käytettiin melko usein eräänlaista akuutin tapaista tarketta vokaalin päällä osoittamassa, että vokaali ääntyy pitkänä. Tämä tarke jäi kuitenkin pois käytöstä.
Tarkkeista käytetään usein nimitystä aksentti, joka on kuitenkin epätarkka, koska se voi tarkoittaa kaikkia tarkkeita, joitakin tarkkeita tai erityisesti akuuttia (= akuutti aksentti).
Tavallisimmat tarkkeet, joita tarvitaan suomen kieltä kirjoitettaessa joko kielen varsinaisissa sanoissa tai vieraissa nimissä, on esitetty seuraavassa taulukossa. Nämä ovat ne tarkkeet, jotka voi tuottaa vanhalla suomalaisella tietokonenäppäimistöllä.
tarkkeen nimi |
tarke |
käyttöesimerkki |
tarkkeen merkitys esimerkkisanassa |
---|---|---|---|
akuutti |
´ |
Linné |
Osoittaa vokaalin painolliseksi |
gravis |
` |
à la carte |
Erottaa sanan à sanasta a |
hattu |
ˇ |
šakki |
Osoittaa, että kyseessä on suhu-s |
sedilji |
¸ |
garçon |
Ilmoittaa, että c äännetään s:nä eikä k:na |
sirkumfleksi |
̂ |
Rhône |
Perinteinen kirjoitusasu |
tilde |
˜ |
Buñuel |
Osoittaa n:n palatalisoituneeksi (”nj”) |
treema |
¨ |
Noël |
Osoittaa, että e kuuluu eri tavuun |
Näitä ja muita tarkkeita käsitellään yksityiskohtaisesti luvussa 4, ja luvussa 6 kuvaillaan tarkkeellisten merkkien käyttöä eri kielissä.
Kahden kirjaimen yhdistelmät ovat usein saaneet erikoismerkityksen. Monissa kielessä CH-yhdistelmän äännearvo on aivan toinen kuin C:n ja H:n äännearvot, esimerkiksi ”tš” tai ”k”. Yhdistelmä saattaa kehittyä niin omaleimaiseksi, että kielen puhujat kokevat sen erilliseksi kirjaimeksi, digrafiksi.
Tämän kehityksen taustalla on osittain äänteellisiä muutoksia, joiden takia kahden äänteen yhdistelmästä kehittyi yksi äänne. Kielen kirjoitusjärjestelmää kehitettäessä on myös saatettu tietoisesti ottaa kahden kirjaimen yhdistelmä erikoiskäyttöön. Usein mallina on tällöin ollut jokin olemassa oleva kirjoitusjärjestelmä. Tämä on ollut tavallista myös siirtokirjoitusjärjestelmiä kehitettäessä. Esimerkiksi SH on varsin tavallinen suhu-s:n (š) merkki, vaikka sitä ei voi kovin luontevasti selittää s- ja h-äänteestä kehittyneeksi.
Suomen kielen tapa merkitä pitkää vokaalia kahdella vokaalimerkillä, esimerkiksi AA, voidaan sekin tulkita digrafiksi. Nykykielen kannalta digrafi on myös NG, jota käsitellään N-kirjaimen historiassa. Lisäksi on hyvin tavallista käyttää kirjainten Š ja Ž sijasta digrafeja SH ja ZH.
Joissakin kielissä on myös kolmen kirjaimen yhdistelmiä, trigrafeja, joilla on erikoismerkitys. Tunnetun lienee saksan SCH, joka tarkoittaa suhu-s:ää.
Suomalainen aakkosto on omaksuttu ruotsin kielestä, ja sitä voisi kutsua jopa suomalais-ruotsalaiseksi aakkostoksi. Syynä oli tietysti se, että Suomi kuului Ruotsiin ja ruotsin kieli oli laajassa käytössä Suomessakin silloin, kun suomea vasta ruvettiin kirjoittamaan. Onneksi ruotsin kielen kirjoitusjärjestelmä sopi melko hyvin suomenkin kirjoittamiseen. Ruotsissa oli esimerkiksi valmiina kirjaimet ä ja ö, tosin aluksi erimuotoisina kuin nykyisin: pisteiden tilalla oli a:n tai o:n yläpuolella oleva pieni e-kirjain.
Aluksi suomen kirjoittaminen oli kuitenkin epäjohdonmukaista ja haparoivaa, kuten eri kirjainten tarinoista ilmenee. Erityisesti pitkien vokaalien ja kaksoiskonsonanttien merkitsemisessä oli aluksi suurta vaihtelua, koska ruotsin järjestelmä ei tarjonnut suomeen sopivaa käytäntöä.
Suomalaisen aakkoston sanotaan virallisesti olevan seuraava:
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, Š, T, U, V, W, X, Y, Z, Ž, Å, Ä, Ö.
Monet eivät kuitenkaan koe Š:ää ja Ž:aa suomalaisiksi aakkosiksi, ja yleisesti ne korvataan SH:lla ja ZH:lla.
Suomalainen aakkosto on pikemminkin perinteellinen kirjainten kokoelma ja aakkosjärjestys kuin varsinaisesti suomen kielen aakkosto. Kirjaimet C, Q, W, X ja Å ovat suomen kielen kannalta vieraita kirjaimia: ne esiintyvät vain vieraissa nimissä, niiden johdoksissa ja sitaattilainoissa. Ne siis eivät oikeastaan kuulu suomeen sen enempää kuin esimerkiksi latinalaisen aakkoston lisäkirjaimet Þ, Œ ja ß, paitsi että C, Q, W, X ja Å ovat mm. kouluopetuksen, näppäimistöjen, meille tärkeiden vieraiden kielten ja perinteen takia tutumpia. Z on rajatapaus: sekin on lähinnä vieras kirjain, mutta se on säilytetty joissakin lainasanoissa.
Suomen kielessä yleensä mukautetaan lainasanojen kirjoitusasu suomen kirjoitusjärjestelmään niin, että käytetään vain varsinaista suomen aakkostoa, johon C, Q, W ja Å eivät siis kuulu. Samalla korvataan monia digrafeja ääntämyksen mukaisilla kirjaimilla. Aihetta käsitellään tarkemmin eri kirjainten tarinoissa, mutta seuraavassa on tiivistelmätaulukko kirjainten ja kirjainyhdistelmien mukauttamisesta latinasta ja kreikasta peräisin olevissa lainasanoissa.
Vieras |
Oma |
Esimerkkisana englannissa |
Esimerkkisana suomessa |
---|---|---|---|
ae (yleensä) |
e |
anaemic, anæmic, anemic |
aneeminen |
ae (joskus) |
ae |
anaerobic |
anaerobinen |
c (e:n t. i:n edellä) |
s |
cent |
sentti |
c (muutoin) |
k |
calligraphy |
kalligrafia |
ch |
k |
chromatic |
kromaattinen |
oe (yleensä) |
e |
oestrogen, œstrogen, estrogen |
estrogeeni |
oe (joskus) |
oe |
poetics |
poetiikka |
ph |
f |
phobia |
fobia |
qu |
kv |
quartal |
kvartaali |
rh |
r |
rhinitis |
riniitti |
sc (sanan alussa) |
sk |
scientism |
skientismi |
sc (e:n t. i:n edellä) |
s |
descendent |
desendentti |
th |
t |
thesaurus |
tesaurus |
x |
ks |
fixation |
fiksaatio |
z (yleensä) |
ts |
paleozoic |
paleotsooinen |
z (joskus) |
z |
zootomy |
zootomia |
Riimukirjaimiksi, englanniksi runic letters, kutsutaan germaanisten kansojen keskuudessa vanhalta ajalta uuden ajan alkuun käytettyjä erikoislaatuisia kirjaimia. Monet nykyajan ihmiset tuntevat ne parhaiten fantasiakirjallisuudesta kuten Taru sormusten herrasta, jossa riimukirjaimia tai niitä muistuttavia kirjaimia käytetään luomaan keskiaikaista vaikutelmaa.
Vanhin riimukirjaimisto tuli käyttöön 1. vuosisadalla jKr., ja monet germaanikansat omaksuivat sen. Se tunnetaan nimellä futhark kuuden ensimmäisen kirjaimensa ᚠᚢᚦᚨᚱᚲ latinalaisten vastineiden mukaan (merkkiä ᚦ vastaa th), ja siihen kuului 24 kirjainta. Sen alkuperä on epäselvä. Siihen on saattanut vaikuttaa sekä latinalainen että muinaisitaalinen aakkosto. Muuan futharkin erikoisuus on oma merkki äng-äänteelle, ᛜ.
Futhark hävisi pääosin käytöstä 800-luvulla, mutta 600- ja 700-luvulla oli alkanut kehittyä toinen riimukirjoituksen tyyppi. Sitä käyttivät skandinaaviset kansat aina uuden ajan alkuun asti, ja siitä kehittyi useita muotoja, joista tunnetuin on 16-merkkinen tanskalainen riimukirjoitus.
Britteinsaarille saapuneet germaanit, anglit ja saksit, toivat mukaan futharkin mutta kehittivät sitä omaan suuntaansa, josta käytetään nimitystä futhorc. Toisin kuin skandinaavien keskuudessa, riimukirjainten määrä ei vähentynyt vaan päinvastoin kasvoi aina 32 merkkiin asti. Ne väistyivät latinalaisten kirjainten tieltä todennäköisesti 900-luvulla.
Riimukirjainten harrastaja voi nykyisin kirjoittaa niitä kotitietokoneellaan, koska eri riimukirjaimistojen merkit on otettu mukaan Unicode-merkistöön (lohkoon Runic, U+16A0…U+16FF) ja koska saatavilla on muutamia fontteja, joihin ne sisältyvät (mm. Code2000 ja Quivira).
Riimukirjoitus ei juurikaan ole vaikuttanut nykyisin käytettyihin kirjoitusjärjestelmiin. Siitä kuitenkin on lainattu thorn-kirjain þ latinalaisen aakkoston lisäkirjaimeksi mm. islannin kirjoittamiseen. Myös eth-kirjaimen ð on arveltu olevan peräisin riimukirjoituksesta, samoin yogh-merkin ȝ, joka kuului muinais- ja keskienglannin kirjoittamiseen käytettyyn latinalaiseen aakkostoon.
Edellä kerrottiin lyhyesti kreikkalaisen aakkoston synnystä ja vaikutuksesta muihin aakkostoihin. Luvussa 3 kuvataan lähinnä latinalaisten kirjainten tarinoita , mutta sivutaan monin tavoin myös kreikkalaisia kirjaimia. Tässä käsitellään kreikan aakkostoa kokonaisuutena.
Seuraavaan taulukkoon on koottu yleiskatsaus kreikkalaisiin kirjaimiin. Taulukko on mukana osittain sen takia, että kreikkalaisten kirjainten suomenkieliset nimet kirjoitetaan hyvin usein väärin jopa hakuteoksissa. Mukaan ei ole otettu käytöstä poistuneita kirjaimia, jotka esiintyvät vain hyvin vanhoissa teksteissä ja lukumerkkeinä; niistä on tietoja Katerina Sarrin sivustossa Greek language and alphabet.
|
Kirjaimen nimi |
Ääntämys (IPA) |
Siirtokirj. |
||||
---|---|---|---|---|---|---|---|
|
Kreik. |
Suom. |
Engl. |
Klass. |
Nyk. |
Klass. |
Nyk. |
Α α |
ἄλφα |
alfa |
alpha |
[a], [aː] |
[a] |
a |
|
Β β |
βῆτα |
beeta |
beta |
[b] |
[v] |
b |
v |
Γ γ |
γάμμα |
gamma |
gamma |
[g] |
[ɣ],[ʝ] |
g, n |
|
Δ δ |
δέλτα |
delta |
delta |
[d] |
[ð] |
d |
|
Ε ε |
ἒ ψιλόν |
epsilon |
epsilon |
[e] |
e |
||
Ζ ζ |
ζῆτα |
zeeta |
zeta |
[dz] |
[z] |
z |
|
Η η |
ἦτα |
eeta |
eta |
[ɛː] |
[i] |
ē |
i |
Θ θ |
θῆτα |
theeta |
theta |
[tʰ] |
[θ] |
th |
|
Ι ι |
ἰῶτα |
ioota |
iota |
[i], [iː] |
[i], [j] |
i |
|
Κ κ |
κάππα |
kappa |
kappa |
[k] |
k |
||
Λ λ |
λάμβδα |
lambda |
lambda |
[l] |
l |
||
Μ μ |
μῦ |
myy |
mu |
[m] |
m |
||
Ν ν |
νῦ |
nyy |
nu |
[n] |
n |
||
Ξ ξ |
ξῖ |
ksii |
xi |
[ks] |
ks |
||
Ο ο |
ὂ μικρόν |
omikron |
omicron |
[o] |
o |
||
Π π |
πῖ |
pii |
pi |
[p] |
p |
||
Ρ ρ |
ῥῶ |
rhoo |
rho |
[r] |
r |
||
Σ σ ς |
σῖγμα |
sigma |
sigma |
[s] |
s |
||
Τ τ |
ταῦ |
tau |
tau |
[t] |
t |
||
Υ υ |
ὓ ψιλόν |
ypsilon |
upsilon |
[y], [yː] |
[i] |
y, u |
i |
Φ φ |
φῖ |
fii |
phi |
[pʰ] |
[f] |
f |
|
Χ χ |
χῖ |
khii |
chi |
[kʰ] |
[x] |
kh |
h |
Ψ ψ |
ψῖ |
psii |
psi |
[ps] |
|
ps |
|
Ω ω |
ὦ μέγα |
oomega |
omega |
[ɔː] |
[o] |
ō |
o |
Taulukon sarakkeiden selitykset:
Luvussa 6 selostetaan tarkemmin kreikan kirjoittamista latinalaisin kirjaimin.
Nykykreikan kirjoituksessa käytetään aakkosten lisäksi akuuttia aksenttia painomerkkinä vokaalimerkin päällä (esimerkiksi ά) tai joissakin tapauksissa versaalikirjaimen vasemmalla puolella (esimerkiksi Ά). Käytetty akuutti aksentti saattaa olla muodoltaan hiukan erityyppinen kuin latinalaisten kirjainten yhteydessä käytetty, mutta se tulkitaan merkistöstandardeissa samaksi tarkkeeksi. Siitä käytetään kuitenkin usein omaa nimitystä, joka viittaa sen merkitykseen kreikassa, nimittäin painoa tarkoittavaa kreikan sanaa tonos.
Muinaiskreikkaa kirjoitettaessa käytetään akuutin aksentin lisäksi kahta muuta painomerkkiä sekä eräitä muitakin lisämerkkejä. Tämä kuitenkin perustuu lähinnä vasta bysanttilaisella ajalla omaksuttuun käytäntöön, jonka tarkoituksena oli osoittaa sanojen ääntämys tarkemmin. Kreikkaa kirjoitettiin alun perin pelkillä versaalikirjaimilla ilman tarkkeita tai muita lisämerkkejä, välimerkkejä tai sananvälejä.
Kreikkalaisia kirjaimia käytetään monien erikoisalojen merkinnöissä. Kyseessä ovat yleensä kansainväliset merkintätavat, joita käytetään siitä riippumatta, millä aakkostolla teksti muutoin on kirjoitettu. Taustalla on se, että nykyaikaisen tieteen ja tekniikan alkuaikoina lukeneisto vielä melko laajasti osasi kreikkaa, joten oli luonnollista ”lainata” kreikan aakkostosta merkkejä, kun tavalliset aakkoset eivät tuntuneet riittävän. Muita aakkostoja on harvemmin käytetty samaan tarkoitukseen, joskin matematiikassa käytetään jonkin verran heprealaisia kirjaimia erikoissymboleina.
Usein kyseessä on eräänlainen numerointi. Esimerkiksi tähdistöjen suurimmat tähdet on nimetty niin, että alfalla merkitään kirkkainta tähteä, beetalla toiseksi kirkkainta jne. Joskus jopa numeroidussa luetelmassa käytetään kreikkalaisia kirjaimia. Kemiassa kreikkalaisia kirjaimia käytetään mm. erottamaan samantyyppisten yhdisteiden eri muunnelmat. Tällöin ei kyseessä useinkaan ole erityisestä järjestyksestä, vaan kreikkalaiset kirjaimet toimivat vain eräänlaisina nimilappuina, samaan tapaan kuin latinalaiset kirjaimet usein (esim. A-vitamiini). Esimerkiksi eräät säteilyn lajit on nimetty alfa-, beeta- ja gammasäteilyksi melko mielivaltaisesti. Joskus taas kreikkalainen kirjain on lyhenne jostakin sanasta. Tällöin käytetään usein versaalikirjainta, esimerkiksi isoa oomegaa Ω erään yksikön (ohmin) tunnuksena.
Vähemmän mielivaltaista on tähtien nimeäminen niin, että tähdistön (tähtikuvion) kirkkain tähti on alfatähti, toiseksi kirkkain beetatähti jne. Tällaiset nimet kirjoitetaan mikäli mahdollista niin, että kreikkalaisen kirjaimen perässä on tähdistön latinankielinen nimi genetiivissä. Esimerkiksi α Centauri on Kentaurin tähdistön kirkkain tähti. Kirkkaus tarkoittaa tällöin suhteellista kirkkautta Maasta katsottuna.
Esimerkkejä:
Kuten esimerkeistä näkyy, yhdyssanan osana oleva kreikkalainen kirjain tulkitaan erikoismerkiksi, joten se erotetaan sanan muusta osasta yhdysmerkillä. Erikoismerkkinä sitä on syytä kohdella myös sikäli, että sen asu ei muutu, vaikka se sijaitsee virkkeen alussa, mitä kyllä on hyvä välttää. Jos nimittäin kreikkalainen kirjain kirjoitettaisiin versaalilla, sen tunnistettavuus häviäisi ja merkityskin voisi muuttua. Esimerkiksi α-kirjainta vastaava versaalikirjain Α ei käytännössä ole erotettavissa latinalaisesta versaali-A:sta. Seuraavassa esimerkissä on hiukan huonosti muotoiltu ilmaus ja parempi vaihtoehto:
Yleiskielisessä tekstissä ei kreikkalaisia kirjaimia yleensä kannata käyttää, vaan niiden tilalla käytetään kirjainten nimiä alfa, beeta jne. Esimerkiksi kemiallisen yhdisteen nimi ”α-tokoferoli” esiintyy tässä asussa yleensä vain tieteellisessä esityksessä. Käytännön hoitotyössä yms. kirjoitetaan ”alfatokoferoli”. Huomaa, että tällöin ei yleensä sanaan kirjoiteta yhdysmerkkiä, koska mikään sääntö ei sitä vaadi.
Jos kreikkalaisia kirjaimia käytetään, niitä on syytä käyttää johdonmukaisesti: keskenään samanlaiset ilmaukset kirjoitetaan samalla tavalla. Seuraavanlainen esitys sisältää tyylirikon, joka voi myös vaikeuttaa asian ymmärtämistä: ”Atomiytimen hajotessa syntyy α- ja β-säteilyn lisäksi lyhytaaltoista ja läpitunkevaa gammasäteilyä.” Jos kerran alfa- ja beetasäteilystä kirjoitetaan kreikkalaisin kirjaimin, pitäisi yhtenäisyyden vuoksi kirjoittaa γ-säteilystä.
Kreikkalaisia kirjaimia siis käytetään yleensä vain erikoisalojen teksteissä. Ne saattavat vierailla yleiskielessä, mutta jos sana yleistyy, niin kirjoitusasu muuttuu: kreikkalainen kirjain korvataan sanalla. Näin joudutaan usein menettelemään erikoisalojen teksteissäkin, koska kreikkalaiset kirjaimet eivät aina ole käytettävissä. Tällöin on syytä olla huolellinen, koska kreikkalaisten kirjainten nimet esiintyvät usein virheellisissä asuissa jopa standardeissa ja käsikirjoissa.
Esimerkkejä:
Kirjoitusasu ”omega” on etenkin sellaisissa muoti-ilmaisuissa kuin ”omega-3-rasvahapot” hyvin yleinen. Tähän on vaikuttanut Omega-sanan yleisyys erisnimenä mm. tuotenimissä. Nykyisin asu ”omega” on virallisesti sallittu.
Mikro-merkki µ on erillinen symboli – eri merkki kuin kreikkalainen myy-kirjain μ, vaikka onkin siitä kehittynyt ja usein lähes tai täysin samannäköinen. Mikro-merkkiä käytetään mittayksiköiden etuliitteen tunnuksena. Esimerkiksi µm tarkoittaa mikrometriä eli metrin miljoonasosaa eli millimetrin tuhannesosaa.
On varottava käyttämästä kaksois-s-kirjainta ß beetan (β) tilalla. Vaikka nämä merkit joissakin fonteissa muistuttavat toisiaan, ne ovat aivan eri merkkejä. Kaksois-s esiintyy vain saksan kielessä. Sitä melko usein käytetään beetan sijasta, koska se kuuluu Latin-1-merkistöön.
Kyrilliset aakkoset, venäjäksi kirillitsa, ovat suomalaisille tutuimmat venäjän kielestä. Niitä käytetään myös useiden muiden slaavilaisten ja ei-slaavilaisten kielten kirjoittamiseen.
Kyrilliset aakkoset muistuttavat useassa suhteessa enemmän kreikkalaisia kuin latinalaisia aakkosia. Syynä on se, että ne on kehitetty lähinnä kreikkalaisista versaalikirjaimista. Mukaan otettiin joitakin merkkejä heprean aakkosista ja keksittyjä lisäyksiä.
Kyrilliset aakkoset ovat saaneet nimensä munkki Kyrilloksesta, mutta Kyrillos ei kehittänyt niitä. Sen sijaan Kyrillos ja hänen veljensä Methodios ehkä kehittivät 860-luvun tienoilla niin sanotut glagoliittiset aakkoset eli glagolitsan. Kyrilliset aakkoset ovat tavallaan glagoliittisille aakkosille rinnakkainen joskin myöhemmin, 950-luvulla, kehitetty kirjaimisto. Kummankin aakkoston alkuperä on kuitenkin epäselvä ja kiistanalainen.
Seuraava taulukko kuvaa nykyvenäjässä käytetyt kyrilliset kirjaimet ja niiden siirtokirjoitusvastineet. Muissa kyrillistä aakkostoa käyttävissä kielissä saattaa merkistö olla osittain erilainen, ja myös siirtokirjoitusvastineissa voi olla eroa (ks. lukua 6).
a |
Аа |
a |
|
|
be (bee) |
Бб |
b |
|
|
ve (vee) |
Вв |
v |
|
|
ghe (gee) |
Гг |
g |
|
|
de (dee) |
Дд |
d |
|
|
ie (je) |
Ее |
e |
|
e konsonantin jälkeen, muuten je |
zhe (žee) |
Жж |
ž |
|
(zh) |
ze (zee) |
Зз |
z |
|
|
i |
Ии |
i |
|
i, pehmeän merkin jäljessä ji |
short i (lyhyt i) |
Йй |
j |
|
i tai j tai ei mitään |
ka (kaa) |
Кк |
k |
|
|
el |
Лл |
l |
|
|
em |
Мм |
m |
|
|
en |
Нн |
n |
|
|
o |
Оо |
o |
|
|
pe (pee) |
Пп |
p |
|
|
er |
Рр |
r |
|
|
es |
Сс |
s |
|
|
te (tee) |
Тт |
t |
|
|
u |
Уу |
u |
|
|
ef |
Фф |
f |
|
|
ha (haa) |
Хх |
h |
|
|
tse (tsee) |
Цц |
c |
|
ts |
che (tšee) |
Чч |
č |
|
tš (tsh) |
sha (šaa) |
Шш |
š |
|
š (sh) |
shcha (štšaa) |
Щщ |
ŝ |
šč |
štš (shtsh) |
hard sign (kova merkki) |
Ъъ |
ʺ |
|
ei mitään |
yeru (taka-i) |
Ыы |
y |
|
|
soft sign (pehmeä merkki) |
Ьь |
ʹ |
|
ei mitään |
e (käännetty e) |
Ээ |
è |
|
e |
yu (ju) |
Юю |
û |
ju |
ju |
ya (ja) |
Яя |
â |
ja |
ja |
io (jo) |
ё |
ë |
|
jo tai o (tai je tai e) |
Taulukon sarakkeiden selitykset:
Etenkin suomalaisen standardin mukainen siirtokirjoitusvastine antaa suomalaiselle yleensä oikeansuuntaisen käsityksen kirjaimen äännearvosta, mutta vastaavuuteen on monia poikkeuksia. Kyseisessä siirtokirjoituksessa on seuraavat erikoisuudet:
Merkit on taulukossa esitetty venäjän aakkosjärjestyksen mukaan. Tämä järjestys perustuu alkujaan kreikan aakkosjärjestykseen, mutta mm. kreikan aakkosiin perustumattomat kirjaimet ш ja щ on sijoitettu aakkoston loppupuolelle. Merkki ш lainattiin heprean aakkostosta (shin-kirjain), ja щ kehitettiin sen muunnelmaksi.
Kyrillisten kirjainten käsin kirjoitetut muodot poikkeavat edellä käytetyistä painokirjainten muodoista paljonkin esimerkiksi г:n ja т:n osalta. Oikein tehdyissä fonteissa kursivoitujen kirjainten muodot ovat samantapaisia kuin käsin kirjoitettaessa Seuraavassa on esitetty venäjän aakkoset ensin tavallisella fontilla, sitten saman fontin kursiivimuunnelmalla:
Merkin käsite on tietotekniikassa keskeinen ja osittain erilainen kuin yleiskielessä. Tässä esitetään yleiskatsaus aiheeseen. Huomattavasti perusteellisempi esitys on kirjassani Unicode Explained (O’Reilly, 2006).
Merkki, englanniksi character, on kirjoituksen alkeisosanen. Merkkejä ovat muun muassa kirjaimet, numerot, välimerkit ja erikoismerkit kuten pykälän merkki (§) mutta myös esimerkiksi tavu- ja sanamerkit, joita käytetään monissa kirjoitusjärjestelmissä. Mukana on jonkin verran myös kuvasymbolin luonteisia merkkejä kuten korttipakan maiden symbolit (♠♣♥♦). Peruslähtökohtana on kuitenkin, että kyse on kirjoituksessa (tekstissä) käytettävistä merkeistä; piirros- ja muut kuvat ovat eri juttu.
Tietokoneilla tehtävässä tekstien käsittelyssä on kyse merkkien kirjoittamisen ja tallentamisen ohella myös merkkijonojen monenlaisesta käsittelystä, kuten lajittelusta, hakutoiminnoista ja tekstin automaattisesta muokkaamisesta annettujen sääntöjen mukaan. Tätä varten on merkkien sisäisen esitysmuodon vastattava abstraktin merkin ideaa: abstrakti merkki on merkin muoto ja tarkoitus, erotettuina sen ulkoasun vaihtelusta. Jos esimerkiksi merkin tallennusmuoto vastaisi aina sen yhtä erityistä ulkoasua eli olisi ikään kuin merkin kuva, olisivat useimmat toimenpiteet erittäin hankalia.
Merkin erityisen ulkoasun käsittely on kyllä joissakin tilanteissa tarpeen. Esimerkiksi tekstin lukemisessa paperista tietokoneen muistiin erityisellä laitteella, skannerilla, ja sitä tukevalla ohjelmistolla on kyse juuri siitä. Siinä pyritään tunnistamaan, mitä abstraktia merkkiä kukin paperilla oleva kuvio edustaa, ja tallentamaan tieto tästä. Tämän jälkeen voidaan teksti esimerkiksi tallentaa tietokantaan, josta tehdään hakuja tehokkaasti. Alkuperäinen tekstin ulkoasu saatetaan kyllä haluta myös säilyttää, mutta ihmisten katseltavaksi, ei juurikaan tietokoneella käsiteltäväksi.
Merkin erityistä ulkoasua kutsutaan glyyfiksi (englanniksi glyph). Tätä sanaa käyttävät enimmäkseen vain merkistökysymysten asiantuntijat. Sana fontti, joka tarkoittaa glyyfien kokoelmaa, on yleisemmin tunnettu; sen asemesta käytetään etenkin kirjapainoalalla sanaa kirjasinleikkaus tai kirjainleikkaus. Esimerkiksi Arial-fontin tai muun groteskifontinl-kirjain (pieni äl) on aika erinäköinen kuin Courier New -fontin tai muun tasalevyisen fontinl-kirjain. Ne ovat kuitenkin vain saman merkin eri glyyfejä. Niiden esitykset merkkinä tietokoneessa ovat samat; tieto fontista tallentuu erikseen, eri ohjelmissa ja tiedostomuodoissa eri tavoin.
Viime kädessä on määrittelykysymys, milloin kyseessä on kaksi eri merkkiä ja milloin saman merkin kaksi eri ulkoasua. Joskus ratkaisut voivat tuntua mielivaltaisilta. Merkistösopimuksissa on esimerkiksi määritelty, että dollarin merkissä $ voi olla yksi tai kaksi pystyviivaa. Sen sijaan punnan merkissä £ on olennaista, että siinä on vain yksi poikkiviiva; vastaava merkki, jossa on kaksi poikkiviivaa, tulkitaan eri merkiksi, liiran merkiksi (₤); Turkin rahayksikön merkki on saman teeman muunnelma, mutta sekin on (v:sta 2012) koodattu omaksi merkikseen Turkin liira (₺). Omalla tavallaan mielivaltainen on sekin ratkaisu, että meille tuttu latinalainen A-kirjain tulkitaan eri merkiksi kuin venäjässä käytetty kyrillinen A tai kreikassa käytetty iso alfa-kirjain, vaikka kaikki kolme yleensä ovat ulkoasultaan samoja tai hyvin samanlaisia ja ovat lisäksi historiallisesti samaa alkuperää.
Tieto siitä, mikä abstrakti merkki on kyseessä, joudutaan koodaamaan jollakin tapaa. Tämä perustetaan johonkin merkistösopimukseen, joka määrittelee joukon abstrakteja merkkejä, joilla on nimet, numerot ja jonkinlainen muodon kuvaus. Muoto kuvataan yleensä esittämällä merkin jokin tyypillinen ulkoasu kuvana; lukijan oletetaan ymmärtävän, että tarkoitetaan yleistä muotoa, ei erityistä ulkoasua. Joskus on tarpeen selventää sanallisesti, mikä kuuluu muotoon olennaisena osana ja missä asioissa on vaihtelua.
Merkin koodinumero on olennainen siksi, että numeerinen esitys on käytännössä välttämätön tietokoneissa. Koodinumero on aina suhteellinen, suhteessa johonkin merkistösopimukseen. Epäselvyyksiä ei synny, kunhan tekstitiedoston mukana kulkee aina tieto siitä, minkä merkistösopimuksen mukaan se tulee tulkita.
Käytännön syistä vanhimmat merkistösopimukset olivat varsin suppeita. Edelleenkin käytetään vielä erittäin laajasti niin sanottuja kahdeksanbittisiä merkistöjä, joissa koodinumerot ovat välillä 0:sta 255:een. Kyseisissä sopimuksissa eivät edes ole käytössä kaikki 256 koodinumeroa eli merkkipaikkaa (merkkipositiota), vaan eräistä teknisistä syistä osa on varattu niin sanotuille ohjauskoodeille tai jätetty käyttämättä. Ohjauskoodeilla voidaan saada aikaan mm. rivinvaihtoja.
Nimitys ”kahdeksanbittinen” johtuu siitä, että tämän lukualueen luvut ovat esitettävissä kahdeksalla binaarinumerolla eli bitillä. Kahdeksan bitin ryhmää kutsutaan usein nimellä oktetti ja vielä useammin (mutta epätäsmällisimmin) nimellä tavu, englanniksi byte. Oktetti on useimmissa nykyisissä tietokoneissa datan käsittelyn perusyksikkö.
Yksi tapa havainnollistaa merkkien koodaamisen ideaa on ajatella, että merkistösopimusta vastaa kirjasinlaatikosto, jossa on yhtä monta laatikkoa kuin käytössä on koodinumeroita. Kussakin laatikossa on kirjasimia yhden merkin painamiseen. Kun tietokone tulostaa tekstiä, jossa merkit siis on esitetty koodinumeroilla, niin numero ohjaa koneen ottamaan kirjasimen sitä vastaavasta laatikosta. Vaihtamalla kaikki kirjasimet jonkin toisen kirjasintyylin (leikkauksen) mukaisiksi saadaan aikaan, että sama teksti tulostuu erinäköisenä.
Suomessa nykyisin yleisimmin käytetyt merkistösopimukset ovat windows-1252 ja iso-8859-1 sekä jäljempänä kuvattava UTF-8. Iso-8859-1 tunnetaan yleisesti nimellä ISO Latin 1; virallisesti sen nimi on suomeksi ”latinalaisaakkosto 1”. Se on laajasti käytössä muuallakin, missä käytetään länsi- ja pohjoiseurooppalaisia kieliä, joita varten se on suunniteltu.
Windows-1252 eli Windows Latin 1 on Microsoft-yhtiön Windows-järjestelmissä käytetty merkistö, joka sisältää iso-8859-1:n merkkien lisäksi muutamia erikoismerkkejä, mm. ajatusviivat, sijoitettuina paikkoihin (koodinumeroille), jotka on iso-8859-1:ssä varattu ohjauskoodeille. Tästä seuraa, että Windows-järjestelmässä kirjoitettu tekstitiedosto ei suinkaan aina näy oikein muunlaisissa järjestelmissä; käyttäjän on osattava varoa käyttämästä kyseisiä lisämerkkejä tai muokattava tiedostoa ennen sen lähettämistä toisenlaiseen järjestelmään.
Iso-8859-1 sisältää osajoukkonaan vanhan ja edelleen hyvin laajasti käytetyn, alkujaan amerikkalaisen Ascii-merkistön. Ascii on seitsenbittinen eli siinä koodinumerot ovat välillä 0:sta 127:ään. Toisin päin sanottuna iso-8859-1 on yksi Asciin laajennus kahdeksanbittiseksi. Muita laajennuksia on hyvin paljon, ja niitä on tehty eri kielten ja kirjoitusjärjestelmien tarpeisiin.
Unicode on merkistösopimus, joka alkujaan suunniteltiin 16-bittiseksi mutta laajennettiin 32-bittiseksi. Tämä merkitsee, että käytettävissä on ”tilaa”, siis koodinumeroita, ihan riittävästi kaikkiin tarpeisiin. Kuitenkin alkuperäinen 16-bittisyys ilmenee käytännössä siinä, että 16 bitillä esitettävissä olevien koodinumeroiden alue, 0:sta 32 767:een, on erikoisasemassa. Sitä kutsutaan nimellä Basic Multilingual Plane (BMP), ja siihen kuuluvat useimmat yleisesti käytetyt merkit. Alue on kuitenkin liian ahdas, sillä esimerkiksi kiinan kirjoitusmerkeistä siihen mahtuu vain osa.
Unicoden ohella puhutaan myös ISO 10646 -merkistöstä. Alkujaan kyseessä oli kaksi erillistä hanketta laajan merkistön määrittelemiseksi, mutta sittemmin ne on yhdenmukaistettu keskenään, vaikka niitä edelleen ylläpidetään kahtena erillisenä standardina. Unicode-standardi sisältää kuitenkin enemmän kannanottoja merkkien merkitykseen ja käyttöön. On tavallisempaa puhua Unicodesta kuin ISO 10646:sta, muuan muassa siksi, että nimi ”Unicode” on sujuvampi.
Unicode-sopimuksen mukaisessa tekstin esitysmuodossa yksinkertaisin tapa olisi esittää kukin merkki tasan 32 bitin jonona. Tämä tarkoittaisi, että esimerkiksi suomenkielinen tekstitiedosto olisi neljä kertaa niin iso kuin sama teksti iso-8859-1:n mukaisessa koodauksessa. Tähän ei useinkaan ole varaa, vaikka tietojenkäsittelytehon hinta koko ajan laskeekin. Niinpä käytetään erilaisia esityskoodauksia, joista tavallisin tunnetaan nimellä UTF-8. Sitä käytettäessä esimerkiksi englanninkielinen teksti vie vain saman verran tilaa kuin iso-8859-1:n mukaan koodattuna; suomenkielinenkin vie vain jonkin verran enemmän. Muita Unicoden esityskoodauksia ovat UCS-2 ja UTF-7. Tällaiset koodaukset on erotettava siitä perustavammanlaatuisesta koodauksesta, jossa merkit esitetään koodinumeroilla. Abstraktia merkkiä vastaava koodinumero on luonteeltaan matemaattinen luku, joka voidaan esittää erilaisilla tavoilla, esimerkiksi ”42”, ”0x28”, ”XLII” tai ”neljäkymmentäkaksi”. Esityskoodauksessa on kyse jostakin erityisestä tavasta esittää luvut tietokoneiden sisäisessä esitysmuodossa ja niiden välisessä datansiirrossa.
Unicode-standardi on vapaasti luettavissa osoitteen www.unicode.org kautta.
Unicoden merkistöstä käytetään myös nimitystä Universal Character Set (UCS), jolle on käytetty suomennosta yleismerkistö. Sopivampi nimi olisi kuitenkin universaalimerkistö, koska yleis-alun voidaan luulla viittaavan siihen, että kyse olisi yleisimmin käytetyistä merkeistä.
Monet nykyaikaiset tietokonejärjestelmät käyttävät sisäisesti Unicodea, vaikka niissä käytettävät ohjelmat eivät ehkä vielä tuekaan kuin vanhoja, suppeita merkistöjä. Hyvin usein tilanne onkin turhauttava: jotta esimerkiksi saataisiin jokin erikoismerkki paperille, on hyvin monen ohjelman toimittava oikein. Yksikin vanha ohjelma matkan varrella riittää rikkomaan toimivuuden. Onkin leikillisesti mutta realistisesti sanottu, että julkaistaessa juttua, joka käsittelee merkistöongelmia, aina menee jotain pieleen tavalla, joka havainnollistaa kyseisiä ongelmia.
Toisaalta järjestelmällä, joka itsessään ei tue Unicodea, voidaan usein tuottaa ja käsitellä Unicode-merkkejä. Ehkä tunnetuin esimerkki tätä nykyä on Webissä julkaiseminen. Vaikka käyttämäsi tietokonejärjestelmän mikään osa ei osaisi kuin iso-8859-1-merkistön (tai vaikka vain Ascii-merkistön), voit silti sisällyttää Web-sivuillesi minkä tahansa Unicode-merkin esittämällä sen HTML-merkkauksessa muodossa &#luku;, missä luku on merkin koodinumero Unicodessa. Esimerkiksi pieni hattu-s (š) voidaan esittää muodossa š. Eri asia on, että Web-selaimet eivät aina osaa näyttää kaikkia Unicode-merkkejä, lähinnä fonttien rajoittuneisuuden takia.
Unicodea käytetään yleisesti erilaisten merkistösopimusten välisissä muunnoksissa. Jos on tehtävä ohjelma, joka tuntee esimerkiksi 20 erilaista merkistösopimusta, niin kaikkien niiden välisten muunnosten suora toteuttaminen vaatisi 380 (20 × 19) eri muunnostaulukkoa tai muunnosrutiinia. Jos sen sijaan yksi merkistösopimuksista on Unicode ja kaikki muunnokset tehdään sen kautta, riittää 38 muunnostaulukkoa tai -rutiinia, eli 19 muunnosta muista sopimuksista Unicodeen ja saman verran toiseen suuntaan.
Olennaista tässä on tietenkin se, että Unicode-merkistöön sisältyvät muiden merkistöjen kaikki merkit. Tämä mahdollistaa myös sen, että Unicodea käytetään perustana, kun halutaan tehdä merkistösopimuksia, määritellä miten eri merkkejä käsitellään eri tilanteissa tai vain puhua eri merkeistä. Esimerkiksi uuden kahdeksanbittisen merkistön määrittelemiseksi riittää, että laaditaan taulukko, joka kuvaa vastaavuuden sen koodinumeroiden ja Unicode-koodinumeroiden välillä. Periaatteessa merkkejä ei tällöin tarvitse edes mainita nimeltä saati esittää näkyvässä muodossa!
Unicode onkin laajasti käytössä referenssipohjana, aivan siitä riippumatta, mikä merkkien koodaus on käytössä. Merkkeihin viitattaessa käytetään usein merkintätapaa U+nnnn, missä nnnn on merkin koodinumero Unicodessa heksadesimaalisena eli 16-kantaisessa lukujärjestelmässä. Tässä järjestelmässä käytetään numeroiden 0–9 lisäksi kirjaimia A–F numeroina, jotka tarkoittavat lukuja 10–15. Heksadesimaalisesta järjestelmästä kerrotaan jäljempänä A:n tarinassa, mutta käytännössä merkintöjä nnnn voi pitää koodeina, joiden sisäistä rakennetta ei tarvitse ymmärtää.
Unicode-merkkeihin viitataan usein vain koodinumeroilla, esimerkiksi 2039. Alkuosa ”U+” ei ole mitenkään välttämätön, mutta sillä voidaan ilmaista havainnollisesti, että kyseessä on Unicode-koodinumero eikä esimerkiksi luku tavanomaisessa mielessä tai jokin muu koodi. (Merkinnän ”U+” taustaa käsitellään U:n tarinassa.)
On tietysti hyvin teknistä, mutta samalla tiivistä ja täsmällistä, puhua vaikkapa merkistä U+2039 (jonka nimi Unicodessa on epäkäytännöllisen pitkä: single left-pointing angle quotation mark). Itse asiassa sellainen menettely on usein ainoa tarpeeksi täsmällinen tapa, koska nimet vaihtelevat (jopa Unicoden eri versioiden välillä) ja koska pelkkä merkin ulkoasun kuvaus johtaa helposti harhaan. Esimerkiksi äsken mainittu merkki (‹) saattaa joissakin ilmentymissään kovasti muistuttaa pienikokoista pienemmyysmerkkiä (<).
Merkkien kirjoittamista tietokoneella käsitellään laajahkosti tämän kirjan luvussa 7. Tässä esitetään vain lyhyt yleiskatsaus muutamiin tavallisiin menetelmiin. Käyttöympäristöksi oletetaan tässä tavanomainen henkilökohtainen tietokone, jossa on Windows-käyttöjärjestelmä, ja normaali suomalainen näppäimistö.
Tavallisessa tietokoneen näppäimistössä on omat näppäimet vain suhteellisen pienelle määrälle merkkejä. Yleisesti tunnettua on, että vaihto- eli shift-näppäimen avulla voidaan säätää sitä, tuottaako kirjainnäppäin gemenakirjaimen (”pienen kirjaimen”) kuten ”a” vai versaalikirjaimen (”ison kirjaimen”) kuten ”A”. Hiukan ristiriitaista on, että näppäimiin on yleensä merkitty (kaiverrettu tai maalattu) versaalikirjaimet, vaikka perustilassa näppäin tuottaa gemenakirjaimen. Vaihtonäppäimen avulla voidaan myös saada aikaan useita erikoismerkkejä kuten numeronäppäinten rivin näppäimistä huutomerkin (!), pystyn lainausmerkin ("), ristikkomerkin (#) jne.
Hiukan vähemmän tunnettua on, että välilyöntinäppäimen oikealla puolella olevaa AltGr-näppäintä (ei Alt-näppäintä, joka on vasemmalla puolella) voidaan käyttää samaan tapaan. Kun painetaan AltGr-näppäin alas ja – sitä alhaalla pitäen – näpäytetään E-näppäintä, syntyy euron merkki €. (Jos näin ei käy, kyseessä saattaa olla vanha tietokone, johon ei ole tehty ns. europäivitystä.) Tällaista näppäilyä merkitään eri ohjeissa ja oppaissa eri tavoilla varsin kirjavasti: AltGr(e), AltGr+e, AltGr-e, Alt Gr E, ALT GR e jne. Tässä kirjassa lisätään kirjavuutta: käytämme merkintää AltGr(e). Näin voidaan esittää asiat yksiselitteisemmin. Merkintä ”AltGr(” voidaan lukea ”paina AltGr-näppäin alas äläkä päästä sitä ylös, ennen kuin saat luvan”, ja merkintä ”)” luetaan tällöin ”nyt saat päästää ylös sen näppäimen, jonka viimeksi painoit alhaalla pidettäväksi”. Merkintä ”e” tarkoittaa tällöin yksinkertaisesti E-näppäimen painamista.
AltGr-näppäimellä voidaan tuottaa seuraavat merkit:
Laajennetussa näppäimistöasettelussa, ns. suomalaisessa kansainvälisessä näppäimistöasettelussa, josta kerrotaan luvussa 7, voi AltGr-näppäimen avulla tuottaa monia muitakin merkkejä. Esimerkiksi ajatusviiva ”–” tuotetaan yhdistelmällä AltGr(-).
Lisäksi eri tietokoneohjelmissa on hyvinkin monia erilaisia tapoja kirjoittaa sellaisia merkkejä, joita ei löydy suoraan näppäimistöstä. Tällainen on esimerkiksi Windowsin Merkistö-ohjelma (Character Map), jonka avulla voidaan tekstiin lisätä mikä tahansa kirjoitusmerkki. On myös erillisiä apuohjelmia tällaisiin tarkoituksiin.
Tarkenäppäimet merkittyinä.
Tarkkeiden kirjoittaminen on usein helppoa, kunhan opettelee yksinkertaisen periaatteen. Tavallisessa suomalaisessa näppäimistössä on kirjainnäppäimistön oikeassa yläreunassa kaksi erikoisnäppäintä, joita englanniksi kutsutaan nimellä dead key. Suomen kieleen suositellaan niille nimeä tarkenäppäin. Ylemmässä tarkenäppäimessä on akuutti aksentti ”´” ja gravisaksentti ”`”. Alemmassa taas on treema ”¨”, tilde ”~” ja sirkumfleksi ”^”. Jos näille näppäimille halutaan antaa omat nimet, niin aksenttinäppäin ja treemanäppäin lienevät sopivia.
Esimerkiksi ”á” kirjoitetaan näpäyttämällä ensin ylempää tarkenäppäintä, sitten a-näppäintä. Vasta tällöin tulee näkyviin jotain, nimittäin á-kirjain. Nimi dead key ’kuollut näppäin’ viittaakin siihen, että tarkenäppäin ei yksinään vielä tee mitään. Vastaavasti merkki ”à” kirjoitetaan siten, että ensin näpäytetään tarkenäppäintä niin, että vaihtonäppäintä pidetään alhaalla, sitten näpäytetään a-näppäintä.
Tildeä (aaltoviivaa) ”~” lisättäessä tarvitaan apuna AltGr-näppäintä, kuten voidaan päätellä tilde-symbolin sijainnista näppäinhatussa. Esimerkiksi Õ:n kirjoittaminen voidaan kuvata näin: AltGr(¨) vaihto(o). – Jos halutaan kirjoittaa tilde ”~” itsenäisenä merkkinä eikä kirjaimen päälle tarkkeeksi, se kirjoitetaan ikään kuin välilyöntiin liittyväksi merkiksi: AltGr(¨) välilyönti.
Näillä tavoilla voidaan kirjoittaa useimmat länsi- ja pohjoiseurooppalaisissa kielissä tarvittavat kirjainten lisämerkit, tarkemmin sanoen seuraavat kirjaimet: àáäâã èéëê ìíïî ñ òóöôõ ùúüû ýÿ sekä vastaavat versaalikirjaimet (paitsi Ÿ).
Menetelmä tarkkeellisten kirjainten kirjoittamiseen toimii kaikissa tavallisissa tilanteissa Windows-ympäristössä (ja usein muuallakin). Vanhaa ja yhä normaalisti käytettävää suomalaista näppäimistöasettelua käytettäessä sillä voidaan kuitenkin kirjoittaa vain sellaisia tarkkeellisia kirjaimia, jotka kuuluvat Latin-1-merkistöön. Esimerkiksi akuutin saaminen c:n päälle (ć) vaatii toisen menettelyn, esimerkiksi laajennetun näppäimistöasettelun (suomalainen monikielinen näppäimistö).
Kirjaintemme alkumuodot olivat A, B, C jne. Muodot a, b, c jne. kehittyivät vasta keskiajalla ennen muuta kirjoittamisen nopeuttamiseksi. Niiden katsotaan syntyneen varsinaisesti Kaarle Suuren valtakunnassa 800-luvulla ns. karolingisina minuskeleina, mutta niillä oli esikuvia monissa vanhemmissa kirjoitusmuodoissa.
Vanhat muodot jäivät käyttöön niiden rinnalla mutta saivat erikoistehtäviä kuten käytön virkkeen alussa, erisnimen alussa ja korostettavassa sanassa. On luonnollista, että hitaammin kirjoitettavat muodot A, B, C jne. saivat erikoiskäytön, kun taas yksinkertaistuneita muotoja käytettiin tekstin kirjainten tavallisina muotoina. Muodoissa A, B, C jne. näkyy vielä paljon vanhojen piirtokirjoitusten tyyliä, joka antaa niille juhlavamman ja virallisemman ilmeen.
Samantapainen kehitys on tapahtunut myös kreikkalaisessa ja kyrillisessä aakkostossa. Koska kuitenkin kyse oli eri tahoilla tapahtuneista ilmiöistä, tulokset eivät suinkaan ole kaikilta osin samanlaiset. Esimerkiksi latinalaisesta A:sta kehittyi a, mutta aivan samannäköisestä kreikkalaisesta A:sta (alfasta) α.
Versaalin ja gemenan ero on vain muutamissa kirjoitusjärjestelmissä, joskin niihin kuuluvat meille tuttu latinalainen sekä kreikkalainen ja kyrillinen. Sen sijaan esimerkiksi arabialaisessa ja thai-kielen aakkostossa ei tällaista eroa ole.
Versaali on siis vanhempi kirjainten laji. Gemena kehitettiin vasta keskiajalla kirjoituksen nopeuttamiseksi, ja siitä tuli yleinen, tavallinen laji. Gemena-nimitys johtuu tästä; vertaa saksan sanaan gemein ’yhteinen; yleinen; tavallinen’. Versaali jäi tällöin erikoiskäyttöön.
Näistä kirjainten muodoista käytetään monia erilaisia nimityksiä eri yhteyksissä:
Kirjainten A, B, C jne. nimitys |
Kirjainten a, b, c jne. nimitys |
Käyttöyhteys |
---|---|---|
iso kirjain |
pieni kirjain |
yleiskieli |
suuraakkonen |
pienaakkonen |
kielenhuolto |
versaali |
gemena |
kirjapainoala |
majuskeli |
minuskeli |
historia |
uppercase letter |
lowercase letter |
englannin kieli |
capital letter |
small letter |
Unicode-standardi |
Usein käytetään kirjaimista A, B, C jne. myös nimitystä pölkkykirjaimet. Tämä viittaa etenkin aikaan, jolloin kansakoulussa opeteltiin ensin huolellisesti nämä kirjainten muodot ja niiden piirtäminen ja vasta myöhemmin gemenakirjaimet ja käsialakirjoitus. Nykyisin opetellaan jo varhaisessa vaiheessa lukemaan myös gemenalla kirjoitettuja sanoja, jopa tunnistamaan sanoja niiden hahmon perusteella, vaikka kirjaimia ei varsinaisesti vielä osatakaan.
Tässä kirjassa käytetään nimityksiä versaali ja gemena niiden täsmällisyyden takia. ”Iso kirjain” ja ”pieni kirjain” ovat usein ongelmallisia, koska ne voidaan ymmärtää myös kirjaimen fyysistä kokoa tarkoittaviksi. Esimerkiksi lause ”kirjoita otsikot isoilla kirjaimilla” on kaksiselitteinen, koska se voi viitata joko versaaliin tai isokokoisiin merkkeihin. Lisäksi ”iso kirjain” ei aina ole isompi kuin vastaava ”pieni kirjain” samassa fontissa. Esimerkiksi islannissa käytetty thorn-kirjain on ”pienenä” (gemenana: þ) usein isokokoisempi kuin ”isona” (versaalina: Þ).
Englanninkieliset nimitykset perustuvat siihen, että vanhassa kirjapainotekniikassa käytettiin irtokirjasimia, joilla teksti ladottiin. Versaalit olivat ylemmässä (upper) ja gemenat alemmassa (lower) laatikossa (case).
Versaalikirjaimet ovat yleensä keskenään samankorkuisia. Tätä korkeutta kutsutaan versaalikorkeudeksi. Jotkin versaalikirjaimet, tavallisimmin Q mutta joskus myös J tai Y, saattavat ulottua kirjainten perusrivin alle, jolloin ne ovat versaalikorkeutta korkeampia.
Gemenakirjaimet ovat keskenään erikorkuisia. Pienintä gemenoiden korkeutta, joka on mm. a:n, s:n ja x:n korkeus, sanotaan x-korkeudeksi. Sen suhde versaalikorkeuteen on erisuuruinen eri fonteissa ja fontin keskeisimpiä ominaisuuksia. Kirjoissa perinteisesti käytetyissä fonteissa x-korkeus on ehkä noin 50 % versaalikorkeudesta, kun taas monissa tietokonefonteissa (esimerkiksi Verdana) x-korkeus on jopa 75–80 % versaalikorkeudesta, jolloin kirjaimet näyttävät keskimäärin paljon isommilta.
Monissa gemenakirjaimissa on x-korkeuden yläpuolella ulottuvia osia, yläulokkeita, tai peruslinjan alle ulottuvia osia, alaulokkeita. Typografiassa niistä on perinteisesti käytetty nimityksiä yläpidennys ja alapidennys. Yläuloke on kirjaimissa b, d, f, h, k, l ja t, alauloke kirjaimissa g, j, p ja q, joissakin fonteissa myös z:ssa. Suomen kielen missään kirjaimessa ei ole sekä ylä- että alauloketta, mutta islannin kielen thorn-kirjaimessa þ on.
Usein syntyy sekaannuksia siitä, että versaalin käyttöä on monenlaista. Versaalia käytetään
Versaalin eri käyttötavat häiritsevät osittain toisiaan. Erityisesti versaalin käyttö kunnioituksen osoittamiseen aiheuttaa sen, että usein käytetään versaalialkuista kirjoitusasua varmuuden vuoksi, siis jotta ilmaisua vain ei pidettäisi epäkunnioittavana.
Versaalin käytön säännöt ovat osittain erilaiset eri kielissä. Saksassa kirjoitetaan kaikki substantiivit versaalialkuisina. Englannissakin versaalin käyttö on laajempaa kuin suomessa: versaalialkuisina kirjoitetaan otsikoissa kaikki sanat paitsi prepositiot ja artikkelit (esimerkiksi On the Origin of Species) ja tavallisessa tekstissäkin mm. kuukausien ja juhlien nimet sekä erisnimien johdokset (esimerkiksi May, Christmas, American, suomeksi toukokuu, joulu, amerikkalainen). Englannin mukaista käytäntöä esiintyy myös huolimattomassa suomeksi kirjoittamisessa.
Kapiteeli (englanniksi small caps) tarkoittaa gemenakirjaimen esittämistä versaalikirjaimen muotoisena mutta pienempänä. Kapiteelia käytetään erityisesti henkilönnimien esittämiseen muusta tekstistä poikkeavasti sekä korostus- tai tyylikeinona. Kapiteelilla esitetty nimi erottuu melko hyvin mutta ei häiritsevästi. Kapiteelin runsas käyttö tekee tekstistä kuitenkin levottoman ja vaikeasti luettavan.
Aito kapiteeli koostuu fontin suunnittelijan erikseen tekemistä kapiteelimuodoista. Ne ovat tyypillisesti noin x-korkeuden korkuisia. Ne eroavat versaaleista paitsi kooltaan myös muotojen yksityiskohdilta, koska versaalin jotkin piirteet (esimerkiksi A-kirjaimen muoto) eivät toimi kovin hyvin pienennettyinä. Aito kapiteeli on nykyisin melko harvinaista, ja sitä voi tuottaa vain ottamalla merkit kapiteelifontista tai – eräissä kehittyneissä fonttitekniikoissa – ohjaamalla ohjelman valitsemaan fontin sisältämistä vaihtoehtoisista ulkoasuista kapiteeliversio. Kapiteelifontit on usein ostettava erikseen, sikäli kuin niitä on edes saatavilla.
Valekapiteeli tarkoittaa versaalikirjaimista pienentämällä muodostettua kirjaimen esitystä. Kun esimerkiksi Word-ohjelmassa valitaan sana tai muu teksti, annetaan komento Muotoile → Fontti ja rastitaan (Tehosteet-otsikon alla oleva) kohta Kapiteelit, muuttuu valittu teksti valekapiteeliksi. Valekapiteeliksi muutettaessa versaalikirjaimet eivät muutu, mutta gemenakirjaimet muuttuvat käytössä olevan fontin pienemmän version versaalikirjaimiksi. Esimerkiksi 12 pisteen fonttia käytettäessä valekapiteelit saattavat olla 9,5 pisteen versaalia.
Useimmista fonteista ei ole kapiteeliversiota, mutta esimerkiksi vapaassa jakelussa olevan Linux Libertine -fonttiin sellainen kuuluu. Seuraava tekstiesimerkki on Alegreya Sans ‑nimisen Google-fonttiryhmän fonteilla, ensin tavallisen fontin valekapiteelina, sitten kapiteelifontin (Alegreya Sans SC) aidolla kapiteelilla. Tästä näkyy, että aidossa kapiteelissa kirjainten viivanpaksuus on tasainen (tai vaihtelee vain vähän), kun taas valekapiteelin pienennetyissä kirjaimissa pienentäminen myös ohentaa viivoja.
Logoissa ja muissa tyyliä tavoittelevissa teksteissä käytetään nykyisin melko usein gemena- ja versaalimuotojen sekoittamista toisiinsa, esimerkiksi eSPOO. Menettelyn teho perustuu paljolti sen poikkeavuuteen, ja siksi teho on heikentynyt, kun menettely on yleistynyt. Tässä on tavallaan kyse tavallisen fontin ja kapiteelin sekoittamisesta sanan sisällä, joskin käytännössä esimerkiksi logo suunnitellaan yleensä ”käsin”.
Fraktuura ymmärretään joskus kirjoitusjärjestelmäksi, mutta lähinnä kysymys on fonttien luokasta. Fraktuurafonteissa kirjaimet, varsinkin versaalit, ovat koristeellisempia kuin mihin olemme nykyisin tottuneet. Lisäksi ne ovat usein paksuviivaisia, mistä johtuu fraktuuran englanninkielinen nimitys blackletter. Englannin kielessäkin käytetään kyllä sanaa Fraktur, mutta se tarkoittaa yleensä vain yhtä fraktuuran alalajia. Oikeastaan fraktuurafontit ovat goottilaisten fonttien alalaji, mutta Suomessa yleensä kaikkia goottilaisia fontteja kutsutaan fraktuuraksi.
Seuraavassa on tekstiä eräällä fraktuurafontilla (UnifrakturMaguntia): Olipa kerran kolme pientä porſasta.
Fraktuurafontit koetaan vanhanaikaisen, ”goottilaisen” näköisiksi, varmaan paljolti siksi, että niitä käytettiin aiemmin kirjoissa ja niistä nykyisin on luovuttu. Mielikuvissa fraktuura usein yhdistetään myös saksalaisuuteen. Esimerkiksi Asterix-sarjakuvien puhekuplissa gootit – jotka edustavat saksalaisia – puhuvat fraktuuraa. Se saatetaan lisäksi yhdistää natsismiin. Natsit jonkin aikaa suosivatkin fraktuuraa ”saksalaisena” kirjoitustapana, mutta myöhemmin he ryhtyivät vastustamaan sitä.
Fraktuuraa sanotaan usein vaikealukuiseksi, mutta tämä johtuu lähinnä siitä, ettemme ole tottuneet siihen. Sitä oppii pienellä harjoittelulla lukemaan aika hyvin, joskin versaalikirjaimet aiheuttavat ongelmia, ja joihinkin fraktuuran erikoisuuksiin kuten k:n muotoon ja kahdenlaisiin s-kirjaimiin vie aikansa. Omana aikanaan fraktuuraa pidettiin luonnollisena ja helppona, ja siirtymistä siitä nykyisiin kirjainmuotoihin vastustettiin myös luettavuusperusteilla.
Yksinkertaisemmat fontit syrjäyttivät fraktuuran pääosin jo 1800-luvun lopulla ja 1900-luvun alussa. Sanomalehtien otsikoissa fraktuuraa käytettiin vielä 1920-luvulla, ja kansakoulun lukukirjassa oli muutamia fraktuuralla kirjoitettuja kappaleita 1930-luvulle asti.
Omana aikanaan fraktuura ei tuottanut luettavuusongelmia sen enempää kuin nykyisetkään kirjainten muodot. Siirtyminen fraktuurasta antiikvaan eli nykyisiin muotoihin tuotti aikanaan huomattavia ongelmia sekä latojille että lukijoille. Antiikva tarkoittaa varsinaisesti ns. päätteellisiä kirjaimia, joissa kirjainten viivat yleensä päättyvät pieniin poikkiviivoihin. Toinen nykyaikaisten kirjainmuotojen perustyyppi on groteski, josta pääteviivat puuttuvat ja joka tämän takia usein näyttää vielä pelkistetymmältä kuin antiikva.
Vaikka fraktuurassa onkin lähinnä kyse vain fonteista, siihen liittyy joitakin kirjoitusjärjestelmän erikoisuuksia. Ensinnäkin fraktuurassa on kaksi erilaista gemena-s:ää, joita käytetään määrättyjen sääntöjen mukaan. Merkkien koodauksen tasolla niistä toinen on tavallinen s:mme ja toinen on ns. pitkä s eli ſ (U+017F), joka sisältyy joihinkin muihinkin fontteihin kuin fraktuurafontteihin. Pitkä s muistuttaa monen nykylukijan mielestä hämäävästi f-kirjainta. Monille tuttu vitsi on tuotenimen Siſu (Sisu) lausuminen ”Gifu”. Toisaalta pitkä s muistuttaa matemaattista integraalimerkkiä ∫, joka on kuitenkin aivan eri symboli. (Tosin niillä on yhteys: integraalimerkin muodosti matemaatikko Leibniz sanan summa alkukirjaimena käytetystä pitkästä s:stä, koska integraali on eräänlaisen summan raja-arvo.)
Erilaisten s-kirjainten säännöt olivat osittain erilaisia kielissä ja saattoivat muutenkin vaihdella. Agricola käytti meidän tavallisena s:nä pitämäämme kirjainta lähinnä vain sanan lopussa, muutoin pitkää s:ää. Myöhemmin pitkää s:ää käytettiin suomessa yleensä tavun alussa (esimerkiksi ſuſi, mutta jos, misſä), joskin tällöin sovellettu tavujako poikkesi osittain nykyisestä. Aiheesta on hiukan lisää S-kirjaimen tarinassa.
Agricolan Uuden testamentin suomennoksen (Se Wsi Testamenti) kannessa olevassa teoksen nimessä molemmat gemena-s:t ovat pitkiä ässiä, vaikka jälkimmäinen ei ole tavun alussa. W-kirjaimen käyttö pitkän u:n merkkinä (uu) on käytetyn, melko epäjohdonmukaisen kirjoitusjärjestelmän ominaisuus. Huomaa myös yhdysmerkin muoto.
Fraktuurassa v-kirjain on yleensä muodoltaan kaksinkertainen ja näyttää meistä kaksois-v:ltä w. Tosin fraktuurassa esiintyy joskus myös yksinkertainen v-kirjain. Kun fraktuurasta oli siirrytty nykyaikaisempiin fontteihin, saatettiin niissä käyttää w-kirjainta v-kirjaimen sijasta suomen kielessäkin. Käytäntö saattoi jatkua pitkäänkin. Tästä johtuvat joidenkin nimiasujen w-kirjaimet, esimerkiksi Warkaus, Wiipuri, Wirtanen.
Fraktuurassa yhdysmerkki on erityyppinen kuin nykyaikaisissa fonteissa ja muistuttaa hiukan kallellaan olevaa yhtäläisyysmerkkiä (=). Tätä perua on, että joissakin nykyisissäkin fonteissa yhdysmerkki on hiukan kalteva.
Fraktuuran kirjoittaminen onnistuu tavallisella kotitietokoneellakin, kunhan lataa ja asentaa siihen jonkin fraktuurafontin, kuten Bertholdr Mainzer Fraktur tai UnifrakturMaguntia. Verkkosivuilla voi käyttää Google-fonttia UnifrakturMaguntia.
Tekstin voi kirjoittaa normaalisti ja sitten muuttaa fraktuuraksi vaihtamalla sen fontin. Edellä mainittu kahden erilaisen s:n käyttö on kuitenkin hoidettava erikseen. Yleensä fraktuurafontissa pitkä s (ſ) on Unicode-merkkiä U+017F vastaavassa paikassa, ja sen voi kirjoittaa esimerkiksi toiminnon Lisää → Merkki avulla.
Jos käytät UnifrakturMaguntiaa verkkosivulla ns.
upotettavana fonttina, lisää tähän käytettävään koodiin parametri
subset=all seuraavasti:
<link href="https://fonts.googleapis.com/css?family=UnifrakturMaguntia&subset=all" rel="stylesheet">
Muutoin mm. pitkä s ei ole käytettävissä.
Nykyisin koristelutarkoituksessa käytetyt fraktuuraa muistuttavat fontit eivät aina ole aitoa fraktuuraa, vaan muodoiltaan yksinkertaisempia, ja niistä saattaa jopa puuttua pitkä s. Lisäksi tekstin kirjoittaja ei useinkaan osaa käyttää pitkää s:ää, vaikka se fontissa olisikin.
Siirtokirjoituksella tarkoitetaan tässä kirjoituksen siirtämistä kirjoitusjärjestelmästä toiseen, esimerkiksi kyrillisestä latinalaiseen kirjaimistoon. Suomalaisesta näkökulmasta kiinnostavimpia ovat yleensä sellaiset siirtokirjoitukset, joissa muunnetaan latinalaiseen aakkostoon.
Siirtokirjoitus voidaan jakaa kahteen päätyyppiin:
Vastaavat verbit ovat translitteroida ja transkriboida.
Esimerkiksi venäjänkielisen tekstin kirjoittaminen latinalaisin kirjaimin jonkin yleisesti käytetyn järjestelmän mukaan on translitteraatiota. Sen sijaan kiinalaisin kirjoitusmerkein kirjoitettujen nimien tai tekstin kirjoittaminen latinalaisin kirjaimin tai nykykreikan kirjoittaminen latinalaisin kirjaimin ääntämyksen mukaan on transkriptiota.
Tavallisimmin siirtokirjoitetaan yksittäisiä sanoja, etenkin paikkojen, henkilöiden ym. nimiä. Etenkin tieteellisissä julkaisuissa siirtokirjoitetaan myös mm. kirjojen ja muiden teosten nimiä, kielitieteessä myös esimerkkisanoja ja -lauseitakin.
Siirtokirjoitukseen liittyvä sanasto on vakiintumatonta. Joskus transkriptio esiintyy yläkäsitteenä ja translitteraatio sen erikoistapauksena, mutta useimmiten transkriptiolla tarkoitetaan sellaista siirtokirjoitusta, joka ei ole translitteraatiota. Käytännössä silloin ei yleensä ole mitään syytä käyttää muuta periaatetta kuin ääntämyksenmukaisen esityksen tavoittelu.
Käytännössä translitteraatioksi kutsutaan yleisesti myös transkriptiota. Näiden käsitteiden pitäminen erossa onkin usein tarpeetonta. Siksi olisikin luonnollista, että yläkäsitteelle annetaan suomalaisperäinen nimi, kun taas alakäsitteille voidaan säilyttää kansainväliset nimitykset. Tarkkaan ottaen edellä esitetyt määritelmät merkitsevät transkriptio-sanan rajaamista ahtaammin kuin yleensä on tehty, ja translitteraatio ja transkriptio ovat siirtokirjoituksen alakäsitteitä, joiden lisäksi voi periaatteessa olla muunkinlaista siirtokirjoitusta. Käytännössä voikin esiintyä niiden välimuotoja.
Tavallisessa tekstissä siirtokirjoitus on lähinnä tapa kirjoittaa nimiä, joiden alkuperäinen kirjoitusasu noudattaa jotakin aivan toista kirjoitusjärjestelmää. Olisi outoa mainita suomenkielisessä tekstissä esimerkiksi nimi Ющенко kirjoitettuna kyrillisin kirjaimin, joten yleensä käytetään jotakin siirtokirjoitettua muotoa, kuten Juštšenko, Jushtshenko tai Ûŝenko. Tälle on helppo esittää useita erityyppisiä perusteluja:
Niinpä sanat, joiden alkuperäinen kirjoitusasu ei perustu latinalaiseen aakkostoon, siirtokirjoitetaan suomenkielisessä tekstissä lähes aina. Poikkeuksen muodostavat lähinnä tieteelliset, etenkin kielitieteelliset julkaisut ja tietysti kielten oppikirjat ja vastaavat.
Siirtokirjoitukseen liittyy kuitenkin useita ongelmia. Ensinnäkin siirtokirjoitusjärjestelmiä on hyvin monia, eikä lukija useinkaan voi tietää, mitä järjestelmää on käytetty. Esimerkiksi nimen etsiminen hakemistosta, tietokannasta tai asiakirjasta voi olla hyvin vaikeaa, jos se esiintyy siirtokirjoitetussa muodossa ja tiedon etsijä ehkä tuntee nimen vain jossakin muussa siirtokirjoitetussa muodossa.
Siirtokirjoitus saattaa hukata informaatiota niin, että tarkkaa alkuperäistä asua ei voi päätellä siirtokirjoitetusta asusta. Tämä koskee etenkin transkriptioita mutta myös useimpia yleisesti käytettyjä translitterointeja.
Tekstien kääntämisessä siirtokirjoitetut asut ovat erittäin ongelmallisia. Esimerkiksi englanninkielisen tekstin kääntäjän on vaikea varmistua siitä, mitä siirtokirjoitustapaa on käytetty venäläisissä, kreikkalaisissa ym. nimissä. Niinpä hänen on usein erittäin vaikea selvittää, mikä olisi oikea kirjoitusasu esimerkiksi suomenkieliseen tekstiin, vaikka hän tuntisikin tarkoin suomalaiset siirtokirjoitusmenetelmät. Nämä vaikeudet ovat erittäin suuria käännettäessä uutissähkeitä ja muita käyttötekstejä, joiden käännösten on valmistuttava nopeasti ja joihin yleensä ei liity selityksiä.
Siirtokirjoitus ei välttämättä kerro lukijalle, miten sana ääntyy. Siirtokirjoitusjärjestelmä ei ehkä ole äänteenmukainen, ja vaikka se olisikin, lukija ei välttämättä tunne järjestelmää. Harva suomalainen osaa lukea esimerkiksi pīnyīnillä kirjoitettua kiinaa edes siinä määrin oikein, kuin on mahdollista sille, joka tuntee pīnyīn-järjestelmän. (Tämän kirjan luvussa 6 on tästä suuntaa-antavia ohjeita.)
Toisaalta sama koskee myös vieraskielisiä sanoja yleisesti. Vaikka kirjoitusjärjestelmä olisi tuttu, ei kirjoituksen ja ääntämyksen vastaavuutta yleensä tunneta kovinkaan hyvin. Esimerkiksi sanomalehdestä luetun nimen ja televisiosta kuullun nimen vastaavuus pitää usein oppia erikseen. Tosin käytännössä nimet luetaan virallisissakin yhteyksissä ”niin kuin kirjoitetaan” eli oman kielen sääntöjen mukaan. Tulos on usein varsin kaukana alkuperäisestä.
Siirtokirjoituksessa pyritään yleensä siihen, että kirjoitusasu jotenkin kuvastaisi ääntämystä lukijalle tuttujen sääntöjen mukaan. Esimerkiksi kreikkalainen kirjain myy μ, joka normaalisti tarkoittaa m-äännettä, korvataan siirtokirjoituksessa latinalaiseen merkistöön äänteellisesti vastaavalla merkillä eli m-kirjaimella. Kirjoituksen ja ääntämyksen vastaavuus on kuitenkin usein mutkikas ja eri kielissä erilainen, joten joudutaan monenlaisiin ongelmiin.
Translitteraatiota suunniteltaessa pyritään valitsemaan kullekin merkille vastine sen mukaan, mitä äänteitä kirjaimet eri järjestelmissä tyypillisesti tarkoittavat. Tässä mielessä translitteraatiokin pyrkii äännevastaavuuteen. Järjestelmä ei kuitenkaan voi olla yleispätevä, koska esimerkiksi latinalaiset merkit ääntyvät eri kielissä eri tavoin.
Käytännössä otetaan kansainvälisissä translitteraatiojärjestelmissä huomioon ennen muuta kirjoituksen ja ääntämyksen vastaavuus englannin kielessä, joten esimerkiksi y-kirjain on tyypillisesti sellaisen kirjaimen vastineena, joka ääntyy j-äänteenä. Tämä koskee lähinnä konsonantteja. Vokaalien merkintä translitteraatiossa noudattaa lähinnä latinan tai italian ääntämystä, joka taas on vokaalien osalta melko samanlainen kuin suomessa.
Koska vastaavuus on kirjaimittainen, ei tulos voi olla sen paremmin ääntämystä kuvastava kuin alkuperäinen kirjoitusasu. Jos alkuperäisessä kirjoitusasussa esimerkiksi on kirjaimia, joita ei äännetä, niille tulevat vastineet translitteroituunkin asuun.
Puhtaimmillaan translitteraatio määrittelee yksinkertaisen vastaavuuden, jossa kirjoitusjärjestelmän jokainen merkki korvataan toisen kirjoitusjärjestelmän yhdellä ja aina samalla merkillä, eikä samaa merkkiä käytetä kahden eri merkin vastineena. Tällöin translitteroidusta tekstistä voi yksikäsitteisesti ja automaattisesti päätellä alkuperäisen kirjoitusasun, eli siirtokirjoitus on täysin reversiibeli. Toisaalta translitteroidun tekstin oikea lukutapa ei käytännössä vastaa minkään kielen järjestelmää vaan ainakin joidenkin merkkien äännearvot on opeteltava erikseen. Periaatteessa oikea lukeminen edellyttää tällöin sitä, että lukija tuntee sekä kyseessä olevan kielen kirjoitusjärjestelmän (merkkien äännearvot poikkeuksineen) että translitteraatiokaavan. Tällainen siirtokirjoitustapa on esimerkiksi standardin ISO 9:1995 mukainen kyrillisen merkistön translitterointi latinalaiseen merkistöön. Jotta translitteraatio olisi saatu puhtaaksi, on jouduttu ottamaan käyttöön tarkkeita.
Useimmat translitteraatiojärjestelmät sisältävät edellä mainituista periaatteista poikkeavia menettelyjä. Usein käytetään yhden kirjaimen vastineena kahden, kolmen tai jopa useamman kirjaimen yhdistelmää (esim. schtsch). Tällöin ei translitteroidusta asusta aina voi päätellä alkuperäistä. Esimerkiksi kyrillisten kirjainten suomalainen translitteraatio käyttää erään kyrillisen merkin (ц) vastineena yhdistelmää ”ts”, mutta tämä yhdistelmä voi edustaa myös kahta peräkkäistä kyrillistä merkkiä (т ja с).
Transkriptio puolestaan puhtaimmillaan esittää sanojen äänneasun joidenkin kirjoitussääntöjen mukaan niin tarkasti kuin mahdollista. Tieteellisissä tarkoituksissa voidaan käyttää foneettista merkistöä kuten IPA- tai UPA-merkistöä, mutta käytännössä tyydytään paljon karkeampaan esitystapaan. Lisäksi esimerkiksi pīnyīn-järjestelmässä ei ole pyrittykään siihen, että yhdellä merkillä olisi aina sama äännearvo, vaan ääntämys riippuu esiintymisyhteydestä. Tällaiseen päädytään helposti varsinkin, jos ei haluta käyttää muita kuin latinalaisen merkistön vanhoja perusmerkkejä a–z ilman tarkkeita.
Siirtokirjoituksesta on useita kansainvälisiä standardeja, joissa monissa käytetään lukuisia tarkkeita. Sellaisia menetelmiä käytetään lähinnä tieteessä. Lehdistössä, yleistajuisessa kirjallisuudessa ym. käytetään erilaisia muita menetelmiä, yleensä sellaisia, joissa ei käytetä lainkaan tarkkeita.
Seuraavista siirtokirjoitusjärjestelmistä on Suomessa tehty kansallinen standardi:
Standardit koskevat käytännössä siirtokirjoitusta suomenkielisessä tekstissä. Ruotsin kielessä käytetyt menettely esimerkiksi kyrillisten kirjainten translitteroinnissa ovat osittain varsin erilaiset.
Muita tärkeitä siirtokirjoituksen järjestelmiä ovat kiinan transkriptio, jossa on Suomessakin nykyisin pitkälti siirrytty pīnyīn-järjestelmään, ja japanin transkriptio, jossa kansainvälisen Hepburnin järjestelmän kanssa vielä jossain määrin kilpailee suomalainen, ääntämystä suomen mukaan jäljittelevä järjestelmä (esim. Fujiyama ∼ Fudžijama).
Terho Itkosen Uusi kieliopas esittää seuraavat suuntaviivat muiden kielten siirtokirjoitukselle:
Useiden Afrikan ja Aasian maiden nimien latinalaistamiseksi on kansainvälisessä käytössä englannin mukainen kirjoitusjärjestelmä. Tällaisia maita ovat Afrikassa Etiopia, Aasiassa Bangladesh, Burma eli Myanmar, Intia, Iran, Koreat, Nepal, Pakistan, Sri Lanka ja Thaimaa. Ranskan mukainen järjestelmä taas on tavanomainen Kambodžan ja Laosin nimiä latinalaistettaessa. – – Näitä kansainvälisessä käytössä olevia järjestelmiä voidaan käyttää suomessakin, vaikka ne eivät meikäläisen oikeinkirjoituksen kannalta ole kaikilta kohdin suinkaan ihanteellisia.
Järjestelmiä on osittain kuvattu edellä (kreikkalaisen ja kyrillisen aakkoston osalta). Osittain niitä kuvataan kielikohtaisesti luvussa 6.
On epäselvää, mitä siirtokirjoitusmenetelmiä olisi pidettävänä suositeltavimpana, kun kirjoitetaan suomeksi. Ks. koosteen Suomen kielen normien muutoksia kohtaa Siirtokirjoitus.
Siirtokirjoitusta ei sovelleta sellaisiin nimiin, joista on käytössä suomen kieleen vakiintunut muoto. Esimerkiksi vakiintunutta nimeä Moskova ei siis korvata venäjänkielisestä asusta Москва translitteroidulla asulla Moskva. Muita esimerkkejä ovat Ateena, Jerusalem ja Kairo. Tämä mainitaan siirtokirjoitusta koskevissa standardeissakin, joskaan niissä ei yksilöidä, mitkä nimet katsotaan vakiintuneiksi. Osittain vakiintuneisuus on kiistanalaista.
Foneettinen eli ääntämyksenmukainen kirjoitus tarkoittaa kirjoitusjärjestelmää, joka pyrkii kuvaamaan ääntämystä yksiselitteisesti ja riittävän tarkasti. Puhtaasti foneettisessa järjestelmässä kutakin äännettä merkitään omalla merkillään, aina samalla. Tästä usein poiketaan käytännön syistä niin, että joitakin äänteitä merkitään merkkiyhdistelmillä; tällainenkin järjestelmä voi olla riittävän yksiselitteinen.
Useimpien kielten kirjoitusjärjestelmät poikkeavat foneettisesta, mikä enemmän, mikä vähemmän. Suomen kirjoitusjärjestelmä on suhteellisen lähellä foneettista, mutta mekin kirjoitamme kunpa vaikka sanomme kumpa ja anna se vaikka sanomme annas se jne.
Mikään kirjoitus ei voi kuvata ääntämyksen kaikkia vivahteita ja yksityiskohtia. Esimerkiksi ääntämisohjeissa käytetty foneettinen kirjoitus on kielentutkimuksen kannalta varsin karkeaa ja ylimalkaista, mutta täyttää oman tehtävänsä. Periaate yksi äänne – yksi kirjain muuttuu ongelmalliseksi, kun huomataan, että äänteen käsite on epäselvä.
Esimerkiksi suomen kielen sanoissa hera ja herätä ääntyvät e:llä merkityt äänteet varsin eri tavoin. Sanojen muut vokaalit vaikuttavat siihen, miten etisenä (suun etuosassa) e ääntyy. Niinpä sanassa hera äännämme e:n lähinnä suun keskiosassa, sanassa herätä taas etuosassa, suunnilleen yhtä edessä kuin e. Kumpaakin äännettä – ja muita ”e:n muunnelmia” – merkitään kuitenkin samalla kirjaimella. Tarvetta erotteluun ei ole, koska suomessa ei ole sanoja, joissa ero olisi erotteleva (distinktiivinen) eli ainoa ero kahden sanan välillä. Tämä ilmaistaan myös sanomalla, että nämä erilaiset e-äänteet edustavat samaa foneemia, josta käytetään merkintää /e/.
Suomen kielen e-kirjaimen ääntämisessä on muutakin vaihtelua. Erityisesti r:n edellä ja ä-äänteiden yhteydessä (esimerkiksi sanassa herätä, vastakohtana ääntämykselle esimerkiksi sanassa ei) se saattaa ääntyä avoimempana kuin muutoin. Tämä tarkoittaa, että suu ja ennen muuta ääntämisväylä, jossa ilmavirta kulkee, on hiukan avonaisempi. Tälläkään erolla ei ole distinktiivistä merkitystä suomen kielessä.
Suljetumman ja avoimemman e:n välinen ero on kuitenkin monissa kielissä olennainen ja erotteleva, vaikka sitä ei useinkaan osoiteta kirjoituksessa ainakaan järjestelmällisellä tavalla. Esimerkiksi ranskan sanat lé ja lait ovat kirjoitusasultaan varsin erilaiset, mutta ääntämyksessä erona on vain e-vokaalin avoimuusaste. Tämä tuottaa kielenopiskelijoille usein suuria vaikeuksia. Niihin auttavat ääntämismerkinnät, joissa merkitään esimerkiksi suljetumpaa e:tä tavallisella e:llä ja avoimempaa e:tä kirjaimella ɛ. Esimerkiksi edellä mainittujen ranskan sanojen ääntämykset foneettisella IPA-kirjoituksella esitettyinä ovat [le] ja [lɛ].
IPA (International Phonetic Alphabet) on foneettinen aakkosto ja kirjoitustapa, jota käytetään kielitieteessä, kielenopetuksessa ym. Siitä on muutamia hiukan erilaisia versioita, koska IPAa on historiansa aikana jossain määrin muutettu. Tuorein versio on vuodelta 2015. IPA on kuvattu sitä ylläpitävän järjestön International Phonetic Association (lyhennettynä myös IPA) verkkosivuilla.
Suomessa monet IPA-merkinnät ovat suhteellisen tunnettuja, vaikka sen nimeä ei yleensä tiedetä. Kielten oppikirjoissa, sanakirjoissa, kieliopeissa ja tietosanakirjojen ääntämisohjeissa käytetään nimittäin yleisesti IPAa, joskin usein yksinkertaistettuna ja ehkä muokattunakin. IPAn hyvästä tuntemisesta on siis paljon apua, kun opiskellaan vieraita kieliä tai yritetään lausua vieraita nimiä oikein. Tosin hakuteosten ääntämisohjeissa on valitettavan paljon virheitä mm. siksi, että käytetyt erikoismerkit ovat tuottaneet ongelmia latojille ja ladontajärjestelmille. IPAa käyttää myös wikipohjainen verkkosanakirja Wiktionary, ja Wikipediassa ääntämistiedot (joita siinä on varsin hajanaisesti) on yleensä esitetty IPAlla.
Seuraavassa on englannin sanan international erään ääntämyksen (brittienglannin mukainen ”virallinen” ääntämys) kuvaus IPA-merkein:
IPA käyttää tuttujen kirjainten a–z lisäksi monenlaisia tarkkeita (diakriittisiä merkkejä) ja lisämerkkejä kuten suhuässää tarkoittava ʃ ja epämääräistä (neutraalia) vokaalia tarkoittava ə.
IPAssa on paljon merkkejä, jotka on muodostettu muuntamalla latinalaisia tai muita kirjaimia. Esimerkiksi ɑ-merkki on alkuperältään vain a-kirjaimen fonttimuunnelma, mutta IPAssa sille on annettu erityinen merkitys ja se tulkitaan omaksi merkikseen. Tällaisista syistä johtuu, että IPA-tekstin sisällä ei tulisi vaihtaa fonttia eikä käyttää kursivointia, lihavointia tms.
Ääntämismerkintä on tapana kirjoittaa hakasulkeisiin etenkin, jos se esitetään sanan normaalin kirjoitusasun jäljessä. Esimerkki: international [ɪntəˈnæʃənəl]. Myös vinoviivoja käytetään, mutta periaatteessa vinoviivojen väliin kirjoitetaan vain foneemit. Voidaan siis puhua esimerkiksi suomen kielen /s/-foneemista, kun taas [s] tarkoittaa tietynlaista äännettä riippumatta siitä, mikä on sen asema jonkin kielen äännejärjestelmässä.
Suomen kielen useimpia äänteitä merkitään IPAssa samoilla kirjaimilla kuin suomen kirjoitusjärjestelmässä. Poikkeukset ovat:
IPAssa kirjoitetaan kaikki ääntämyksen mukaisesti. Esimerkiksi sydämen kirjoitetaan [sydæmmen] ja onpa kirjoitetaan [ompɑ].
IPAssa sanan pääpaino osoitetaan painollista tavua edeltävällä ˈ-merkillä, joka on Unicodessa U+02C8 (modifier letter vertical line). Koska tämä merkki puuttuu monista fonteista, sen tilalla käytetään usein Ascii-merkistön heittomerkkiä ' (U+0027), joka on varsin samannäköinen. Esimerkiksi englannin sanan about ääntämys on IPAssa [əˈbaut], jossa painomerkki siis ei liity edeltävään vokaaliin vaan seuraavaan tavuun. Monissa muissa ääntämismerkinnöissä käytetään painomerkkinä akuuttia aksenttia, joka kirjoitetaan painollisen tavun vokaalin jälkeen erillisenä merkkinä ´ (U+00B4), esimerkiksi əba´ut, tai vokaalin päälle, esimerkiksi əbáut.
Sanan sivupaino voidaan IPAssa osoittaa merkillä ˌ (U+02CC, modifier letter low vertical line). Sivupainollisuus on usein ääntämyksen vivahde ja tulkintakysymys. Esimerkiksi sanassa international voidaan tulkita olevan sivupaino ensimmäisellä tavulla, jolloin IPA-merkintä sanalle on [ˌɪntəˈnæʃənəl].
Vokaalin pituus, joka suomessa osoitetaan kahdentamalla kirjain (esim. pitkää e:tä merkitään ee:llä) merkitään IPAssa merkillä ː, joka kirjoitetaan vokaalin jälkeen. Tämä merkki (U+02D0, modifier letter triangular colon), puuttuu useimmista fonteista, ja siksi sen tilalla käytetään usein kaksoispistettä (:). Kaksoiskonsonantteja ei IPAa käytettäessä yleensä käsitetä pitkiksi konsonanteiksi vaan konsonanttiyhdistelmiksi. Niinpä suomen sana luukku kirjoitetaan [luːkku] tai (harvinaisemman tulkinnan mukaan) [luːkːu]. Tavallisempaan kirjoitustapaan varmaankin vaikuttaa se, että suomea kirjoitettaessa ja opetettaessa tulkitaan kaksoiskonsonantin osien kuuluvan eri tavuihin (luuk-ku).
Monet äänteiden erot, joita ei osoiteta eri kielten normaaleissa kirjoitusjärjestelmissä, ilmaistaan IPAssa käyttämällä kokonaan eri merkkejä. Edellä mainittu ovat e:n ja ɛ:n ero on tästä yksi esimerkki. Siinä, kuten monissa muissakin tapauksissa, latinalainen peruskirjain on käytössä IPAssakin, mutta sen ohella on sitä jossain määrin muistuttava merkki, joka tarkoittaa samantapaista mutta erilaista äännettä. IPAn kirjaimet ovat gemenakirjaimia, mutta jotkin on johdettu latinalaisten merkkien versaalimuodoista, esimerkiksi ʀ, joka tarkoittaa ”ranskalaista r:ää”.
IPAssa on myös koko joukko erilaisia tarkkeita ja lisämerkkejä, joilla voidaan osoittaa ääntämisen hienompia vivahteita ja erikoisäänteitä osittain hyvinkin tarkasti. Ääntämisohjeissa yms. tavallisimpia niistä ovat ns. aspiraation merkki ʰ (U+02B0, superscript letter small h, korvataan usein yläindeksityylillä esitetyllä h-kirjaimella), ja ns. palatalisaation merkki ʲ (U+02B2, superscipt letter small j). Aiheesta kerrotaan lisää kirjainten H ja J tarinoissa.
Seuraava taulukko esittää IPAn perusvokaalit. Taulukossa vasemmalta oikealle mentäessä siirrytään etuvokaaleista takavokaaleihin. Ylhäältä alas mentäessä taas siirrytään suppeista (suljetuista) vokaaleista väljiin (avoimiin). Kussakin solussa eli laatikossa voi olla lavea eli illabiaalinen vokaali tai (sulkeissa) pyöreä eli labiaalinen vokaali tai molemmat. Erona on se, että pyöreää vokaalia äännettäessä huulet ovat pyöristyneet.
|
tiukat |
höllät |
keskivokaalit |
höllät |
tiukat |
suppea |
i (y) |
ɪ (ʏ) |
ɨ (ʉ) |
(ʊ) |
ɯ (u) |
puolisuppea |
e (ø) |
|
|
|
ɤ (o) |
|
|
|
ə (ɵ) |
|
|
puoliväljä |
ɛ (œ) |
|
|
|
ʌ (ɔ) |
|
æ |
|
ɐ |
|
|
väljä |
a (Œ) |
|
|
|
ɑ (ɒ) |
Vokaalien luokittelusta huomattakoon vielä:
Etuvokaaleiksi sanotaan vokaaleja, jotka tuotetaan suuontelon etuosassa siten, että kielen kärki on noussut hiukan perusasemaansa ylemmäs. Takavokaalit taas tuotetaan suun takaosassa siten, että kielen takaosa nousee ylös. Keskivokaalit ovat välimuotoja eli tuotetaan suun keskiosassa. Suomen kielessä etu- ja takavokaalien ero on olennainen ns. vokaalisoinnun takia, ja niiden pitämistä erillään auttaa se, että suomessa ei ole keskivokaaleita.
Tiukat vokaalit tuotetaan jäntevämmällä äänne-elinten käytöllä kuin vastaavat höllät vokaalit. Esimerkiksi englannin sanojen beat ja bit olennaisin ero ääntämyksessä on tiukan ja höllän vokaalin ero, vaikka suomalainen usein kuuleekin sen enemmänkin pitkän ja lyhyen vokaalin erona. Käytännössä höllät vokaalit ovat myös hiukan vähemmän suppeita kuin vastaavat tiukat vokaalit.
Suppea ja väljä (aiemmin usein: suljettu ja avoin) vokaalin määritteinä kuvaavat sitä, miten ahdas tai laaja ääntämisväylä. Tämä tarkoittaa sitä väylää, jota kautta ilma kulkee ja joka jää kielen ja kitalaen väliin. Esimerkiksi suomen i:n ja e:n olennaisin ero on siinä, että i:tä lausuttaessa ääntämisväylä on ahtaampi, suppeampi.
Taulukossa mainitut vokaalit ovat tarkemmin kuvattuina seuraavat. Toisessa sarakkeessa on Unicode-koodinumero.
|
Unicode |
Selityksiä, esimerkkejä |
---|---|---|
i |
U+0069 |
suomen i-äänne |
y |
U+0079 |
suomen y-äänne |
ɪ |
U+026A |
englannin ”lyhyt i” esim. sanassa bit |
ʏ |
U+028F |
y ruotsin sanassa fylla ja ü saksan sanassa fünf |
ɨ |
U+0268 |
venäjän ”taka-i” (oik. keski-i, kyrillinen ы, translitteroidaan y:llä) |
ʉ |
U+0289 |
ruotsin u |
ʊ |
U+028A |
englannin ”lyhyt u” esim. sanassa full |
ɯ |
U+026F |
turkin ”taka-i” (kirjoitetaan ı) |
u |
U+0075 |
suomen u |
ɤ |
U+0264 |
(tulkinnanvaraisesti) viron õ (kuten o mutta ilman huulien pyöristystä) |
o |
U+006F |
suomen o |
ə |
U+0259 |
švaa-vokaali, neutraalivokaali, esim. a englannin sanassa about |
ɵ |
U+0275 |
edellistä vastaava pyöreä (labiaalinen) vokaali |
ɛ |
U+025B |
”avoin e” esim. ruotsin sanassa väg ja ranskan sanassa mais |
œ |
U+0153 |
”avoin ö” esim. ruotsin sanassa höst ja ranskan sanassa fleur |
ʌ |
U+028C |
kuten u brittienglannissa sanassa cup |
ɔ |
U+0254 |
”avoin o” esim. brittienglannissa sanassa not |
æ |
U+00E6 |
suomen ä |
ɐ |
U+0250 |
hiukan epäselvän a:n kaltainen, esim. usein r:n ääntämys saksassa |
Œ |
U+0152 |
”hyvin avoin ö” esim. ruotsin sanassa dörr |
a |
U+0061 |
ä:tä lähellä oleva mutta ”avoimempi”, esim. ruotsin sanassa kall |
ɑ |
U+0251 |
suomen a |
ɒ |
U+0252 |
kuten a huulet pyöristettyinä, esim. unkarin lyhyt a |
Seuraava taulukko esittää tärkeimmät IPAn peruskonsonantit. Jako vaakariveille on tehty ääntämistavan mukaan, jako pystyriveille taas ääntämispaikan mukaan. Kussakin solussa voi olla äänteen soinniton ja soinnillinen muunnelma; soinnillinen on sulkeissa.
|
bilab. |
labiod. |
dent. |
alv. |
postalv. |
retr. |
palat. |
vel. |
uvul. |
far. |
glott. |
klusiili |
p (b) |
|
t (d) |
ʈ (ɖ) |
c (ɟ) |
k (ɡ) |
q (ɢ) |
|
ʔ |
||
nasaali |
(m) |
(ɱ) |
(n) |
(ɳ) |
(ɲ) |
(ŋ) |
(ɴ) |
|
|
||
tremul. |
(ʙ) |
|
(r) |
|
|
|
(ʀ) |
|
|
||
yksitär. |
|
|
(ɾ) |
(ɽ) |
|
|
|
|
|
||
frikatiivi |
ɸ (β) |
f (v) |
θ (ð) |
s (z) |
ʃ (ʒ) |
ʂ (ʐ) |
ç (ʝ) |
x (ɣ) |
χ (ʁ) |
ħ (ʕ) |
h (ɦ) |
approks. |
|
(ʋ) |
(ɹ) |
(ɻ) |
(j) |
(ɰ) |
|
|
|
||
lat. appr. |
|
|
(l) |
(ɭ) |
(λ) |
(ʟ) |
|
|
|
Taulukossa mainitut konsonantit ovat tarkemmin kuvattuina seuraavat. Toisessa sarakkeessa on Unicode-koodinumero.
| Unicode |
Selityksiä, esimerkkejä |
---|---|---|
p |
U+0070 |
bilabiaalinen (huulilla äännettävä) klusiili (umpiäänne, sulkeuma-äänne), kuten suomen p |
b |
U+0062 |
edellisen soinnillinen vastine, kuten b englannin sanassa big |
t |
U+0074 |
lähinnä alveolaarinen klusiili, so. kielenkärki ja hammasvalli muodostavat sulkeuman |
d |
U+0064 |
edellisen soinnillinen vastine, kielenkärki yleensä kuitenkin taempana |
ʈ |
U+0288 |
t, jota äännettäessä kielen kärki on kääntynyt taaksepäin, esim. rt riikinruotsin sanassa kort |
ɖ |
U+0256 |
edellistä vastaava soinnillinen äänne, esim. rd riikinruotsin sanassa hård |
c |
U+0063 |
palataaliklusiili, hiukan kuin tj:n ja kj:n yhdistelmä, esim. ty unkarin sanassa kutya |
ɟ |
U+025F |
edellisen soinnillinen vastine, hiukan kuin ”dj”, esim. gy unkarilaisessa nimessä Nagy |
k |
U+006B |
velaarinen (kitapurjeella eli pehmeällä kitalaella äännettävä) klusiili, kuten suomen k |
ɡ |
U+0261 |
edellisen soinnillinen vastine, kuten g englannin sanassa good |
q |
U+0071 |
uvulaarinen (kitakielekkeellä äännettävä) klusiili, esim. arabiassa q nimessä Qatar |
ɢ |
U+0262 |
edellisen soinnillinen vastine |
ʔ |
U+0294 |
glottaaliklusiili (kurkunpääsulkeuma); esim. anna olla saattaa ääntyä [ɑnnɑʔ ʔollɑ] |
m |
U+006D |
bilabiaalinen nasaali (nenä-äänne), kuten suomen m |
ɱ |
U+0271 |
labiodentaali eli alahuulen ja hampaiden avulla äännettävä, esim. usein n sanassa info |
n |
U+006E |
dentaalinen nasaali, kuten suomen n |
ɳ |
U+0273 |
retrofleksinen nasaali: kielenkärki kaartuu taaksepäin; esim. rn riikinruotsin sanassa barn |
ɲ |
U+0272 |
palataalinen eli kitalakea vasten ääntyvä nasaali, hiukan kuten nj, esim. espanjan ñ |
ŋ |
U+014B |
äng-äänne, esim. suomessa n sanassa kenkä |
ɴ |
U+0274 |
uvulaarinen nasaali, t.s. kurkunpää sulkee ilmavirran niin, että se ohjautuu pääosin nenään |
ʙ |
U+0299 |
bilabiaalinen tremulantti eli täryäänne, ”huulien päristys”, kuten lausuttaessa ”ptruu!” |
r |
U+0072 |
tavallinen r, täry-r, kuten suomessa |
ʀ |
U+0280 |
kurkunpäässä ääntyvä täry-r, ”ranskalainen r” |
ɾ |
U+027E |
yksitäryinen r, ”kevyt-r”, kuten usein amerikanenglannissa |
ɽ |
U+027D |
yksitäryinen retrofleksinen r, siis ”kevyt-r”, jossa kielenkärki kaartuu taaksepäin |
ɸ |
U+0278 |
frikatiivi eli spirantti eli hankausäänne, joka tuotetaan huulilla, ”huuli-f” |
β |
U+03B2 |
edellisen soinnillinen vastine, esim. b espanjan sanassa saber |
f |
U+0066 |
alahuulella ja ylähampailla tuotettava hankausäänne, kuten englannin f |
v |
U+0076 |
edellisen soinnillinen vastine, kuten englannin v |
θ |
U+03B8 |
soinniton dentaalispirantti, kuten englannin soinniton th (esim. sanassa think) |
ð |
U+00F0 |
soinnillinen dentaalispirantti, kuten englannin soinnillinen th (esim. sanassa the) |
s |
U+0073 |
soinniton sibilantti, esim. s englannin sanassa see ja (varauksin) suomen s |
z |
U+007A |
soinnillinen sibilantti, esim. englannin z sanassa zero |
ʃ |
U+0283 |
suhu-s, suomen oikeinkirjoituksen š, englannin sh |
ʒ |
U+0292 |
soinnillinen suhu-s, suomen oikeinkirjoituksen ž, ranskan j |
ʂ |
U+0282 |
retrofleksinen s-mäinen äänne, esim. rs riikinruotsin sanassa kors |
ʐ |
U+0290 |
edellisen soinnillinen vastine |
ç |
U+00E7 |
palataalinen frikatiivi, t.s. kielen ja kitalaen välissä voimakas hankaus, saksan ”ich-äänne” |
ʝ |
U+029D |
edellisen soinnillinen vastine |
x |
U+0078 |
velaarinen frikatiivi: kielen ja kitapurjeen välissä voimakas hankaus, saksan ”ach-äänne” |
ɣ |
U+0263 |
edellisen soinnillinen vastine, esim. g espanjan sanassa pagar |
χ |
U+03C7 |
kitakielekkeellä äännettävä hankausäänne, esim. j:llä merkitty äänne espanjassa |
ʁ |
U+0281 |
edellisen soinnillinen vastine, ”hankaus-r”, ranskalaisen r:n yksi yleinen vaihtoehto |
ħ |
U+0127 |
faryngaalinen, nielussa ääntyvä hankausäänne, esiintyy mm. arabiassa |
ʕ |
U+0295 |
edellisen soinnillinen vastine, myös arabiassa |
h |
U+0068 |
glottaalinen eli kurkunpäässä ääntyvä hankausäänne, suomen h |
ɦ |
U+0266 |
edellisen soinnillinen vastine, usein suomen vokaalienvälinen h (esim. sanassa viha) |
ʋ |
U+028B |
approksimantti eli lähestymä-äänne, jossa alahuuli lähestyy, mutta ei kosketa hampaita; suomen v:n tavallisin ääntämys |
ɹ |
U+0279 |
eräänlainen r, jossa kielen kärki vain lähestyy hammasvallia, esim. amerikanenglannissa |
ɻ |
U+027B |
retrofleksinen approksimantti, s.o. kielen kärki kaartuu taaksepäin ja lähenee kitalakea |
j |
U+006A |
palataalinen approksimantti, suomen j |
ɰ |
U+0270 |
velaarinen approksimantti, s.o. kieli lähestyy kitapurjetta eli pehmeää kitalakea |
l |
U+006C |
lateraalinen approksimantti (ilma virtaa kielen sivuitse), dentaalisena, suomen l |
ɭ |
U+026D |
retrofleksinen l-äänne, esim. riikinruotsin rl |
λ |
U+03BB |
palataalinen lateraalinen approksimantti, hiukan kuin lj, esim. espanjan ll |
ʟ |
U+029F |
velaarinen lateraalinen approksimantti |
Jotkin IPA-merkeistä ovat kreikkalaisia kirjaimia (esimerkiksi lambda λ), jotkin taas kreikkalaisista kirjaimista muodostettuja, mutta Unicodeen erikseen koodattuja merkkejä (esimerkiksi ”latinalainen gamma” ɣ, joka tulkitaan eri merkiksi kuin kreikkalainen gamma γ). Tässä ei ole mitään selvästi hahmotettavissa olevaa logiikkaa.
Usein – osittain myös tässä esityksessä – käytetään yleisnimitystä dentaali (hammasäänne) äänteistä, jotka voidaan tarkemmin jakaa varsinaisiin dentaaleihin (kieli koskettaa tai lähenee ylähampaiden takaosaa), alveolaareihin (kieli on yhteydessä ylähampaiden yllä olevaan hammasvalliin) ja postalveolaareihin (kieli koskettaa hammasvalliakin taempana olevaa kitalaen osaa). Kaavioon on merkitty esimerkiksi t ja d laajassa mielessä dentaalisiksi, koska niiden ääntämys voi vaihdella laajalla alueella. Käytännössä esimerkiksi suomen t on yleensä selvästi dentaalinen suppeassa mielessä ja d sen sijaan alveolaarinen.
Taulukossa käytetyn kaavion ulkopuolelle jäävät mm. seuraavat äänteet:
w (U+0077), soinnillinen labiaalis-velaarinen approksimantti, siis äänne, jossa huulet lähestyvät toisiaan mutta eivät sulkeudu ja kieli on lähellä kitalakea; esimerkiksi englannin w:llä merkitty äänne
ʍ (U+028D), edellistä muistuttava soinniton frikatiivi eli hankausäänne (siis soinniton labiaalis-velaarinen frikatiivi), hiukan kuin wh; eräiden ääntämistapojen mukaan englannin wh:llä merkitty äänne
ɥ (U+0077), soinnillinen labiaalis-palataalinen approksimantti, siis äänne, jossa huulet lähestyvät toisiaan ja samalla kieli lähestyy kitalakea, jolloin syntyy y-mäinen vaikutelma; esimerkiksi ranskan sanan huit alussa.
Sekä perusvokaaleihin että -konsonantteihin voidaan liittää tarkkeita, jotka kuvaavat ääntämyksen yksityiskohtia. Tarke tulee perusmerkin ylle, alle tai oikeaan yläkulmaan. Seuraavassa esitetään eräitä IPAn tarkkeita, jotka ovat suomalaisesta näkökulmasta tärkeitä, koska niillä voidaan kuvata Suomessa usein opiskeltujen kielten äänneilmiöitä. Tarkkeet esitetään esimerkkikirjaimeen, nimittäin vokaaliin a tai konsonanttiin t tai d, liittyvinä:
Tavunraja voidaan haluttaessa osoittaa IPAssa pisteellä. Esimerkiksi suomen sanan luen kaksitavuinen ääntämys voidaan merkitä [lu.en] Toisaalta voidaan vokaalin alle merkityllä ylöspäin osoittavalla kaarella (combining inverted breve below, U+032F) osoittaa, että vokaali muodostaa diftongin viereisen vokaalin kanssa eli vokaalien välissä ei ole tavunrajaa. Esimerkiksi suomen sanan luen kaksi eri ääntämystä, kaksitavuinen ja yksitavuinen, voidaan osoittaa merkinnöillä [lu.en] ja [lue̯n].
Konsonantin alla olevalla pienellä pystyviivalla (combining vertical line below, U+0329) voidaan osoittaa, että konsonantti on tavuamuodostava (syllabic) eli hoitaa vokaalin tehtävää. Esimerkiksi englannin sanan certain ääntämys amerikkalaisen ”standardiääntämyksen” (General American) mukaan kirjoitetaan [sɹ̩tʔn̩], joten siinä ei ole yhtään varsinaista vokaalia, vaan siinä eräänlainen r (approksimantti-r) ja n – jotka ovat luonteeltaan melko lähellä vokaaleja – toimivat tavuamuodostavina.
Lisätietoja IPAsta on IPA-järjestön International Phonetic Association sivustossa, jossa on mm. IPA-merkistön täydellinen kuvaus. Sivulla The International Phonetic Alphabet in Unicode kuvataan IPAn suhdetta Unicodeen, ja sivulla Easily confused phonetic symbols kuvataan eräitä helposti toisiinsa sekoitettavia IPA-merkkejä, kuten θ ja ɵ.
Palatalisaatio eli palatalisoituminen eli palataalistuminen tarkoittaa konsonantin ääntymistä niin, että kielen keskiosa on lähellä kitalakea (latinaksi palatum). Ilmiö esiintyy muun muassa virossa, venäjässä ja osassa suomen murteita. Esimerkiksi suomen yleiskielen sanan susi vastineena voi murteessa olla [susʲ], josta siis puuttuu loppu-i ja toinen s on palatalisoitunut.
Palatalisaatiosta on kielitieteessä käytetty sanaa liudennus, mutta nykyisin sanan merkitys on hämärtynyt: liudentuminen tarkoittaa yleensä heikentymistä, huonontumista tms. Sellaisesta palatalisaatiossa ei suinkaan ole kyse, vaan ääntämyksessä on pikemminkin jotain lisää.
Palatalisaatiossa tai palataalisuudessa on tavallaan useita eri asteita, joita voidaan merkitä seuraavasti (esimerkkiäänteenä l-äänne):
– lj jossa l ja j ääntyvät erikseen ja kielen asento muuttuu ääntämisen aikana, vaikka j jonkin verran palatalisoikin l:ää. Esimerkiksi suomen sanassa vilja.
– lʲ jossa l ääntyy selvästi palatalisoituneena eikä erillistä j:tä äänny. Esimerkiksi l (л) venäjän sanassa jesli (если).
– λ jossa ääntyy palataalinen äänne, jossa kieli on hyvin lähellä kitalakea ja joka muutoin muistuttaa l:ää. Näin ääntyy mm. ll usein espanjan ääntämyksessä (esim. sanassa paella) ja lh portugalissa; tosin espanjan ll ääntyy murteissa muillakin tavoin, kuten j-äänteenä.
Edellä mainituista tyypeistä viimeinen, palataaliset konsonantit, muodostavat oman ryhmänsä, jota yhdistää ääntämispaikka (kitalaki) ja jotka saattavat merkittävästi poiketa ääntämistavaltaan samoista palatalisoituneista konsonanteista. Esimerkiksi palataaliklusiili [c] on tavallaan sekä palatalisoituneen t:n että palatalisoituneen k:n täysin palataalinen vastine.
Käytännössä erilaisten palataalisuuksien merkintä on kirjavaa. Lisäksi palatalisoituneen ja palataalisen äänteen ero on osittain tulkintakysymys. Esimerkiksi italian sanan aglio ’valkosipuli’ ääntämystä saatetaan kuvata [aljo], [alʲo] tai (oikeimmin) [aλo], osittain senkin mukaan, mitä merkkejä pystytään käyttämään tai millaisia merkintöjä lukijan oletetaan ymmärtävän.
IPA-merkistö sisältää paljon sellaisia merkkejä, joita ei ole useimmissa fonteissa ja joiden kirjoittaminen tietokoneella on hankalaa. Tämän takia IPAsta on kehitetty muunnelmia, joissa tullaan toimeen paljon suppeammalla merkistöllä, yleensä Ascii-merkeillä. Tällaisia muunnelmia on useita, mm. eräillä Internetin kieliaiheisilla keskustelufoorumeilla – joilla merkistö täytyy yleensä rajoittaa Asciihin – käytetty IPA-Ascii, joka on kuvattu määrittelyssä Representing IPA phonetics in ASCII.
Esimerkiksi edellä mainittu sanan international ääntämyksen IPA-kuvaus ɪntəˈnæʃənəl on IPA-Asciilla kirjoitettuna Int@'n&Sn@n@l.
Suomensukuisten kielten tutkimuksessa on pitkään käytetty erityistä suomalais-ugrilaista tarkekirjoitusta (SUT), joka sopii erityisesti näiden kielten ääntämyksen kuvaamiseen ja joka on muodostunut tieteenalan perinteeksi. Siitä on käytetty myös englanninkielistä nimitystä Fenno-Ugrian Phonetic Alphabet ja lyhennettä FUPA.
SUT on osittain lähempänä suomen kirjoitusjärjestelmää kuin IPA. Muun muassa ä, ö, š ja ž tarkoittavat samoja äänteitä kuin suomen kirjoituksessa. Mukana on myös muista aakkostoista otettuja kirjaimia, osittain vähän erikoisella tavalla. Äng-äännettä merkitään eetalla (η), soinnillista dentaalispiranttia (IPA: ð) deltalla (δ), ja soinnittoman dentaalispirantin merkkinä (IPAssa theeta θ) on theetan erityisestä kirjoitusasusta muodostettu theetasymboli ϑ (U+03D1).
Nyttemmin tämä tarkekirjoitusjärjestelmä on kuvailtu myös nykyisen tietotekniikan käsitteitä käyttäen eli määritellen merkkien Unicode-arvot. Tämä työ on vielä osittain kesken, vaikka valtaosa merkeistä on jo määritelty Unicodessa. Tässä yhteydessä on myös, tavallaan poliittisista syistä, siirrytty käyttämään nimitystä uralilainen tarkekirjoitus, englanniksi Uralian Phonetic Alphabet, lyhennettynä UPA. Uralilaisiin kieliin luetaan suomalais-ugrilaisten kielten lisäksi joitakin niiden etäisiä sukukieliä, joiden puhujamäärä on pieni, mutta kielihistoriallinen merkitys huomattava.
UPAa käytetään paitsi suomalais-ugrilaisten kielten tutkimuksessa ja kielitieteellisessä opetuksessa myös yleistajuisiksi tarkoitetuissa kirjoituksissa suomesta ja sukukielistä. Silloin yleensä kirjassa selostetaan siinä käytetyt merkinnät, koska niitä ei voi olettaa yleisölle tutuiksi.
UPA käyttää vielä enemmän tarkkeita kuin IPA. UPA-tekstissä saattaa olla esimerkiksi kaksi tarketta merkin alla ja kaksi sen yläpuolella. UPAn kirjoittaminen tietokoneella onkin hankalaa, ellei käytettävissä ole ohjelmaa, jossa UPAn erityisvaatimukset on otettu huomioon. Yhtä ratkaisua kuvailee verkkosivu Suomalais-ugrilainen tarkekirjoitus (SUT) ja näppäimistöasettelu sille
Englanninkielisessä maailmassa ääntämisohjeet esitetään – ainakin yleistajuisiksi tarkoitetuissa teoksissa – useimmiten kirjoittamalla sanan ääntämys käyttämällä kirjaimia ja kirjainyhdistelmiä, joilla ajatellaan olevan ”tyypilliset” englannin mukaiset äännearvot. Esimerkiksi suhuässä merkitään yleensä yhdistelmällä ”sh”, ja yhdistelmällä ”ee” saatetaan merkitä suppeaa (ja pitkää) i-vokaalia kuten englannin sanoissa see, feed jne.
Tällaiset merkintätavat ovat englantia äidinkielenään puhuville helpommin ymmärrettävissä kuin IPA, mutta kovinkaan tarkkaan ja varmaan ääntämyksen esittämiseen niillä ei päästä. Lisäksi käytössä on hyvin monia erilaisia järjestelmiä. Jos englanninkielisessä teoksessa on ääntämismerkintöjä, on syytä katsoa merkintätapojen selitykset, sillä on hyvin mahdollista, että kyseessä on kirjan kirjoittajan tai kustantajan ikioma järjestelmä.
Lisäksi englanninkielisessä maailmassa käytetään myös foneettisia järjestelmiä, joissa ääntämystä kuvataan osittain tarkkeiden ja lisämerkkien avulla. Seuraavassa on esimerkkinä tästä Merriam-Webster-sanakirjan (laaja yksikielinen englannin sanakirja) verkkoversion www.m-w.com ääntämismerkintöjen selitysten keskeinen osa:
\&\ as a and u in abut |
\&\ as e in kitten |
\&r\ as ur/er in further |
\a\ as a in ash |
\A\ as a in ace |
\ä\ as o in mop |
\au\ as ou in out |
\ch\ as ch in chin |
\e\ as e in bet |
\E\ as ea in easy |
\g\ as g in go |
\i\ as i in hit |
\I\ as i in ice |
\j\ as j in job |
\[ng]\ as ng in sing |
\O\ as o in go |
\o\ as aw in law |
\oi\ as oy in boy |
\th\ as th in thin |
\th\ as th in the |
\ü\ as oo in loot |
\u\ as oo in foot |
\y\ as y in yet |
\zh\ as si in vision |
Merriam-Websterin järjestelmässä siis käytetään tarkkeellisia merkkejä ä ja ü, joilla on aivan eri merkitys kuin suomessa. Lisäksi siinä käytetään &-merkkiä & sekä tavallisena että yläindeksityylillä kirjoitettuna (&), hakasulkeita [ ] ja alleviivausta sekä gemenan ja versaalin eroa. Järjestelmä on sekavan tuntuinen mutta sen opetelleille käytännöllinen.
Esimerkiksi international-sanan ääntämyksen Merriam-Webster esittää seuraavasti: "in-t&r-'nash-n&l, -'na-sh&-n&l. Tässä yhdysmerkit osoittavat tavurakenteen, ' osoittaa seuraavan tavun pääpainolliseksi ja " sivupainolliseksi. Ääntämyksestä siis kuvataan kaksi vaihtoehtoa. Amerikkalaisen ääntämyksen mukaisesti on r-kirjain osoitettu ääntyväksi, r-kirjaimella merkityksi; se kuitenkin on eri äänne kuin suomen r, kuten R-kirjaimen tarinassa kerrotaan.
Aakkostemme järjestys A, B, C jne. perustuu muinaisseemiläisen aakkoston järjestykseen, mutta monia muutoksia on tapahtunut. Muinaisseemiläisen järjestyksen alkuperä jää historian hämäriin.
Kun roomalaiset omaksuivat kreikkalaisilta Y:n ja Z:n lisättäviksi vanhaan aakkostoonsa, he lisäsivät nämä aakkoston loppuun, X:n jälkeen. Samanlaisesta syystä ruotsalais-suomalaiseen aakkostoon on lisätty uudet merkit loppuun: Å, Ä ja Ö. Kuitenkin noin sata vuotta sitten, kun suomen aakkostoon lisättiin Š ja Ž, ne koettiin siinä määrin vain S:n ja Z:n muunnelmiksi, että ne tulkittiin aakkostuksessa niitä vastaaviksi. (Tosin Nykysuomen sanakirjassa aakkostettiin Š ja Ž omina kirjaiminaan, mutta menettelystä luovuttiin sitten.) Vastaavasti esimerkiksi saksan aakkostuksessa käsitetään Ä, Ö ja Ü vain A:n, O:n ja U:n muunnelmiksi.
Aakkosjärjestyksellä on useita merkityksiä:
Nimien tai muiden tietojen laittaminen aakkosjärjestykseen helpottaa tiedon löytämistä. Tämä tietysti edellyttää, että tietojen lukija tuntee käytetyn aakkostuksen. Aakkostuksen merkitys tiedon löytämisessä on vähentynyt, kun on siirrytty digitaalisiin aineistoihin, joista tietoa voi etsiä hakutoiminnoilla. Esimerkiksi kirjan hakemistossa aakkostus on kuitenkin edelleen olennaista.
Kirjaimiston opettamisessa ja oppimisessa aakkosjärjestys on hyödyllinen apuneuvo.
Kun kirjaimilla on jokin järjestys, niitä voidaan käyttää lukujen tavoin asioiden numerointiin. Tällainen käyttö on hyvin vanhaa. Muinaiset kreikkalaiset jopa käyttivät kirjaimia numeroina; heillä ei siis ollut mitään erillisiä numeromerkkejä.
Aakkosjärjestys on kielikohtainen. Esimerkiksi latinalaista aakkostoa käyttävissä kielissä on yleensä sama perusjärjestys, mutta lisäkirjaimet on usein sijoitettu eri paikkoihin. Tarkkeellisten kirjainten käsittely vaihtelee.
Joissakin kielissä käsitellään joitakin kahden kirjaimen yhdistelmiä (digrafeja) aakkostuksessa yhtenä kirjaimena. Esimerkiksi espanjassa käsiteltiin aiemmin ch:ta ja ll:ää kumpaakin yhtenä kirjaimena, niin että esimerkiksi ch-alkuiset sanat tulivat aakkostuksessa kaikkien muiden c-alkuisten sanojen jälkeen. Vuonna 1994 espanjan kielen akatemioiden yhteiselin kuitenkin päätti luopua tästä käytännöstä.
Aakkosjärjestys on muutenkin muuttuvainen asia. Samassa kielessäkin saattaa olla eri aakkostusperiaatteita eri aikoina ja jopa samaan aikaan. Puhelinluetteloissa saatetaan soveltaa eri järjestystä kuin muualla.
Lisäksi monikieliset aineistot tuovat omia ongelmiaan. Esimerkiksi puhelinluettelossa on yleensä erikielisiä nimiä, joissa voi esiintyä myös maan valtakielelle vieraita kirjaimia. Tällöin voidaan ehkä soveltaa valtakielen aakkostusta sopivasti täydennettynä ja muunnettuna.
Vahvasti monikielinen aineisto, kuten kansainvälisen kokouksen osallistujaluettelo, voi vaatia erilaista lähestymistapaa. Jotta aakkostus olisi kaikkien mahdollisimman hyvin ymmärrettävissä, sen tulisi olla mahdollisimman neutraali. Tätä varten on Unicode-konsortio kehittänyt yleismaailmallisen aakkosjärjestyksen, ns. DUCET-aakkostuksen, joka kattaa koko Unicode-merkistön. Sen haittana on kuitenkin se, ettei se ole kenenkään helposti hallittavissa. Se soveltuu käytettäväksi lähinnä silloin, kun on pakko aakkostaa vahvasti monikielinen aineisto johonkin tunnettuun järjestykseen.
Tässä selostetaan pääkohtia suomalaisesta standardista SFS 4600:2000, Aakkostaminen ja siihen liittyvä ryhmittely. Standardi on kuitenkin osittain varsin epäkäytännöllinen ja poikkeaa eräistä kansainvälisistä aakkostusstandardeista. Niinpä siitä on usein syytä poiketa eri syistä. Poikkeamista tulisi mainita luettelon selityksissä, vaikka useimmat ihmiset eivät selityksiä luekaan.
Nykyajan kielenoppaan kohdassa Aakkosjärjestys on uudempi ja laajempi esitys aakkostuksesta.
Suomalainen standardi määrittelee seuraavat periaatteet:
Syynä w:n käsittämiseen vain v:n muunnelmaksi lienee lähinnä se, että suomen kielessä w on ollut vanhastaan käytössä v-äänteen merkkinä, kuten W:n tarinassa tarkemmin kerrotaan. Vaikka 1900-luvulla v vakiintui, jäi w-kirjain moniin nimiin. Siltä kannalta on luonnollista esimerkiksi puhelinluettelossa aakkostaa Virtanen ja Wirtanen samoin. Toisaalta jos esimerkiksi amerikkalainen etsii nimeä suomalaisesta puhelinluettelosta, hän tuskin osaa ennalta odottaa, että v:llä ja w:llä alkavat sanat ovat sekaisin. Suuntaus onkin kohti w:n aakkostamista erikseen. Tätä voidaan muodollisestikin perustella sillä, että miltei mikä tahansa luettelo on ymmärrettävissä ”monikieliseksi”. Se, miten w on aakkostettu, on usein hyvä joka tapauksessa mainita erikseen luettelon käyttöohjeessa.
Jos kahden ilmaisun ainoa ero on se, että toisessa on kirjaimeen liittyvä tarke ja toisessa ei, aakkostetaan ensin se, jossa tarketta ei ole. Esimerkiksi Linden aakkostetaan ennen sanaa Lindén (mutta Lindén, A. ennen nimeä Linden, B.) ja sakki ennen sanaa šakki.
Edellä kuvatusta periaatteesta jättää tarkkeet huomiotta aakkostuksessa on muutama poikkeus:
Eräät latinalaiseen aakkostoon (ilmaisun laajassa merkityksessä) kuuluvat merkit käsitellään aakkostuksessa seuraavasti:
– ŋ (äng-kirjain) kuten n.
Ns. Kotoistus-hankkeessa on määritelty osittain tästä poikkeava aakkostus, jonka mukaiset määrittely on sisällytetty kansainväliseen CLDR-tietokantaan, joten se toimii uusien tietoteknisten ratkaisujen pohjana. Tämän aakkostuksen mukaan ű aakkostetaan kuten u, õ, ő ja œ kuten o, ß kuten s, w kuten v, æ kuten ä, ð erillisenä merkkinä d:n jälkeen ja þ erillisenä merkkinä ö:n jälkeen. Lisäksi ǥ aakkostetaan kuten g ja ŧ kuten t.
Olemassa olevat tietokoneohjelmien lajittelutoiminnot soveltavat usein suomen kielelle kokonaan vieraita aakkostusperiaatteita. Tietokoneohjelman tuottama aakkosellinen lista tulisikin tarkistaa etenkin siltä osin, ovatko ä ja ö oikeilla paikoillaan ja onko w:tä käsitelty halutulla tavalla.
Muut kuin latinalaiset kirjaimet aakkostetaan standardin mukaan latinalaisten kirjainten jälkeen, kirjaimistot keskenään niiden suomenkielisen nimen mukaan ja kunkin kirjaimiston sisällä ”yleisesti hyväksyttyyn” järjestykseen. Täten siis latinalaiset kirjaimet tulevat ensin, sitten esim. arabialaiset, kreikkalaiset ja kyrilliset. (Jos esim. venäläinen nimi kirjoitetaan translitteroituna, se tietenkin aakkostetaan kuten muutkin latinalaisin kirjaimin kirjoitetut ilmaisut.) Tältä osin standardi on erittäin epäkäytännöllinen. Jos joudutaan aakkostamaan aineistoa, jossa on käytetty eri kirjoitusjärjestelmiä, kannattaa yleensä käyttää jotain kansainvälistä aakkostusta. Kotoistus-hankkeessa määritelty aakkostus noudattaa muiden kuin latinalaisten merkkien osalta DUCET-aakkostusta.
Jo varhain on kirjaimille annettu nimiä, jotta niistä voisi puhua esimerkiksi lukemisen ja kirjoittamisen opetuksessa tai ilmoitettaessa suullisesti jonkin nimen kirjoitusasu, kun siitä on epäselvyyttä. Kun kirjain mainitaan tekstissä, kirjoitetaan yleensä kirjain sellaisenaan (esimerkiksi sanan lopussa on n), mutta se luetaan kirjaimen nimeä käyttäen (sanan lopussa on än t. ännä). Joskus kirjaimen nimi kirjoitetaankin sanana, varsinkin arkisessa puheessa: Hän piirteli ässiä ’S-kirjaimia’. Kirjaimen nimeä käytetään myös vastaavan äänteen nimenä: Hänellä on ärrävika ’r-vika, vaikeus r-äänteen tuottamisessa’.
Vanhin käytäntö on ilmeisesti ollut, että kirjaimen nimenä on ollut se sana, jonka merkistä kirjain on kehittynyt sanan alkuäänteen merkiksi. Niinpä kun jonkin muinaisen seemiläisen kielen taloa tarkoittavasta sanasta bet kehittyi b-äänteen merkki, tästä merkistä käytettiin nimeä bet. Kun kreikkalaiset lainasivat tämän merkin, he lainasivat sen nimen joskin antoivat sille kreikkaan sovitetun muodon bēta. Arabialaisten ja heprealaisten kirjainten nimet ovat peräisin muinaisseemiläisistä nimistä.
Myöhemmin kirjainten alkuperä hämärtyi. Niiden muodot muuttuivat niin, että alkuperäinen merkitys ei juuri ollut tunnistettavissa. Lisäksi kirjainten ja niiden nimien lainauduttua ei-seemiläisiin kieliin nimillä ei yleensä ollut mitään yhteyttä kielen sanastoon. Niinpä kirjaimille alkoi kehittyä nimiä, jotka perustuivat vain niiden äännearvoihin, ei historiaan.
Vokaalien osalta on varsin luonnollinen ja yleinen käytäntö se, että vokaali itsessään, yleensä selvyyden vuoksi puolipitkäksi tai pitkäksi äännettynä, on oma nimensä. Sanomme aa, ee jne. Samoin sanoivat jo muinaiset roomalaiset.
Jonkin kielen kannalta vierailla vokaalikirjaimilla on kuitenkin muunkinlaisia nimiä, usein alkuperään viittaavia. Varsin usein Y-kirjaimen nimi eri kielissä tarkoittaa kreikkalaista I:tä, esimerkiksi espanjassa i griega. Mekin puhumme Å:sta ruotsalaisena o:na ja Ü:stä saksalaisena y:nä.
Konsonanttia ei voi ainakaan helposti lausua sellaisenaan, joten mukaan otettiin jokin vokaali avuksi. Roomalaiset käyttivät klusiileja (umpiäänteitä) tarkoittavien kirjainten nimissä pitkää e-äännettä klusiilin jäljessä. Niinpä kirjainten B, C, D, G, P ja T nimet olivat (suomalaisittain kirjoitettuina) bee, kee, dee, gee, pee ja tee. Koska klusiilille on ominaista äänne-elinten sulkeuma, joka laukeaa, oli luonnollista, että apuvokaalia käytettiin sen jäljessä eikä edellä. Vokaalin pituus johtui latinan sanojen äännerakenteesta: latinassa ei ollut sanaa, joka koostuisi vain konsonantista ja lyhyestä vokaalista. Epäselvempää on, miksi käytettiin juuri e:tä, mutta joka tapauksessa näiden kirjainten nimet ovat säilyneet nykysuomeen asti. Tosin C:n nimi on muuttunut muotoon see niiden äänteenmuutosten takia, joista kerrotaan C:n tarinassa. – Englannin kielessä pitkä e on yleisesti muuttunut pitkäksi i:ksi, joten esimerkiksi BBC luetaan (suomalaisittain kirjoitettuna) bii bii sii.
Kuitenkin K ja Q, jotka olivat k-äänteen merkkejä C:n ohella, saivat nimet kaa ja kuu, koska K:ta käytettiin A:n edellä ja Q:ta O:n ja U:n, myöhemmin vain U:n edellä (ks. C:n tarinaa). Koska kirjaimet ääntyivät samoin, piti nimet erottaa toisistaan käyttämällä eri vokaaleita. Nimi kaa on säilynyt mm. saksassa ja K:ta vastaavan kyrillisen merkin nimessä. Kirjaimen H alkuperäinen nimi oli haa, kenties K:n nimen vaikutuksesta. Nimien muuttuminen muotoihin koo ja hoo johtunee ruotsissa tapahtuneesta äänteenmuutoksesta, jossa pitkä a-vokaali muuttui o:ksi (vrt. Å:n tarinaan).
Kun V tuli käyttöön U:sta erillisenä kirjaimena, konsonantin merkkinä, se sai nimen vee klusiilien nimien mallin mukaan. Sen sijaan J-kirjaimen nimeksi tuli jii. Se perustuu I-kirjaimen nimeen. Koska varsin pitkään J oli vain I:n muunnelma, jota käytettiin silloin, kun oli luettava j, oli luonnollista käyttää I:n nimeä niin, että alkuun lisättiin j-äänne.
Kirjaimet F, L, M, N, R ja S eivät aiheuta ääntämisväylän sulkeutumista, ja ne voidaan lausua itsenäisinäkin ainakin pidentämällä niitä (ff, ll jne.), joskin vaivoin. Ääntämisen helpottamiseksi lisättiin alkuun e-vokaali. Sen voi ajatella syntyneen siten, että yrittäessään sanoa f tai ff ihminen luonnostaan vetää kunnolla henkeä ja päästää ilmaa ulos ennen f-äänteen muodostamista. Tällöin jo syntyy eräänlainen vokaali. Nimet ef, el, em, en, er ja es ovat säilyneet useimmissa latinalaista kirjaimistoa käyttävissä kielissä, ja äännearvoltaan vastaavilla kyrillisillä kirjaimilla (Ф, Л, М, Н, Р, С) on samat nimet.
Suomessakin käytetään usein nimiä ef jne., mutta niitä saatetaan pitää hienosteluna. Kansanomaiset nimet ovat tyyppiä äf tai äffä. Tämän taustalla on ehkä se, että ruotsin kielessä äännettiin näissä nimissä väljä, ä:tä muistuttava e tai kenties jopa ä. Useimpien muiden kielten mukainen e:llinen ääntämys alkoi yleistyä suomessa 1900-luvun alkupuolella, kenties siksi, että yhä suurempi osa väestöstä oppi vieraita kieliä. Toisaalta se alkoi väistyä 1960-luvulta alkaen, kun ruvettiin opettamaan ä:llistä ääntämystä suomalaisempana. Suomalaisemmuus on siis kovin suhteellista, mutta ä:llisiä muotoja voi suosia niiden perinteisyyden takia. Tosin joissakin yhteyksissä e:llinen asu sopii selvästi paremmin vokaalisointuun. Esimerkiksi USA on helpompi lukea uu es aa kuin uu äs aa.
Sellaisesta nimestä kuin äf päädyttiin asuun äffä, kun konsonantti selvyyden vuoksi lausuttiin vahvana ja pitkänä ja loppuun lisättiin ääntämisen helpottamiseksi vokaali, joka on sama kuin nimen alussa. Loppu-ä säilyi silloinkin, kun siirryttiin e-alkuisiin muotoihin: effä.
X-kirjain sai latinassa nimen eks edellä mainittujen kirjainten mallin mukaan. Niiden tavoin senkin nimi päätyi suomessa muotoon äks tai äksä.
Z-kirjaimelle, joka ei alkujaan kuulunut latinan aakkostoon, lainattiin nimi kreikasta. Nimi kirjoitettiin zēta, mutta z:n ääntämys on kiistanalainen (ks. Z:n tarinaa). Joka tapauksessa siihen perustuu suomalainen nimi, joka on tset tai tseta tai (etenkin aiemmin) set tai seta.
Eri kirjainten tarinoissa kerrotaan myös niiden nimien erikoisuuksista. Niistä käytännössä ongelmallisin on se, että W-kirjain luetaan suomessa yleensä samoin kuin V, siis vee. Vain WWW:n alkuaikoina saattoi kuulla radiosta tarkan mutta kovin kömpelön lukutavan kaksoisvee kaksoisvee kaksoisvee. Ongelma syntyy siitä, että kun sana kuullaan kirjaimittain luettuna, ei aina ole suinkaan selvää, miten vee pitäisi tulkita.
Suomen kielen varsinaiseen kirjoitusjärjestelmään kuulumattomien kirjainten nimet ovat yleensä lainasanoja. Ne ovat usein melko vakiintumattomia. Monikaan, jolle islannin kirjaimet þ ja ð ovat jossain määrin tuttuja, ei tunne niiden nimiä thorn ja eth. Tällaisten nimen äänneasukin vaihtelee.
Tarkkeellisten kirjainten kuten é nimiä käsitellään erikseen tarkkeiden yhteydessä. Nämäkin nimet ovat vakiintumattomia, mutta luontevin nimeämistapa koostuu kirjoituksessa tarkkeen nimestä ja peruskirjaimesta yhdyssanaksi yhdistettyinä, esimerkiksi akuutti-e. Tällöin tietysti peruskirjain luetaan edellä kuvattuun tapaan (esim. ee).
Alkukirjainlyhenne, joka on muodostettu vieraan kielen sanoista, luetaan suomea puhuttaessa yleensä lausumalla kirjainten suomenkieliset nimet. Vaikka lyhenne FTP on peräisin englannin sanoista, se luetaan äf tee pee eikä ef tii pii.
Tosin muutamat harvat lyhenteet kuten BBC on totuttu lukemaan englannin mukaan (bii bii sii). Joissakin tapauksissa lukutavat kilpailevat keskenään: CIA luetaan yleensä see ii aa, mutta ääntämys sii ai ei on myös melko tavallinen.
Joskus ruotsinkielisen ilmauksen lyhenne kuten LO luetaan ruotsin mukaan (el uu). Muiden kielten osalta vastaava – esimerkiksi venäjänkielisen nimen lyhenteen KGB lukeminen kaa gee bee – on harvinaisempaa ja koetaan helposti keikaroinniksi.
Kirjaimille on annettu myös ns. foneettisia nimiä, joita käytetään, kun sana luetaan ääneen kirjain kirjaimelta esimerkiksi puhelimessa tai radioviestinnässä. Englannin kielessä käytetään nimitystä phonetic alphabet, mutta kyse ei ole mistään IPAan verrattavasta aakkostosta vaan tavallisten aakkosten nimistä. Koska esimerkiksi tavalliset nimet pee, tee ja vee eroavat toisistaan vain alkuäänteeltään, ne ovat hankalia silloin, kun pitää kertoa sanan tarkka kirjoitusasu huonoissa kuuluvuusoloissa. Tämän takia ruvettiin käyttämään kirjaimen nimenä jotakin tunnettua sanaa, joka alkaa tällä kirjaimella.
Kansainvälisesti tunnetuin on ns. Alpha Bravo -nimistö, joka on kehitetty englanninkielisessä maailmassa: Alpha Bravo Charlie Delta Echo Foxtrot Golf Hotel India Juliet Kilo Lima Mike November Oscar Papa Quebec Romeo Sierra Tango Uniform Victor Whiskey Xray Yankee Zulu. Siitä on jonkin verran toisistaan poikkeavia muunnelmia. Suomessa käytetyin nimistö on: Aarne Bertta Celsius Daavid Eemeli Faarao Gideon Heikki Iivari Jussi Kalle Lauri Matti Niilo Otto Paavo Kuu (= Q) Risto Sakari Tyyne Urho Vihtori Viski (= W) Äksä Yrjö Tseta (= Z) Åke Äiti Öljy.
Tässä luvussa kerrotaan ns. tavallisen suomalaisen kirjaimiston A–Ö kirjainten historiasta. Mukana on 31 kirjainta, koska mukana ovat myös Š ja Ž. Tarkkeellisia kirjaimia kuten É käsitellään seuraavassa luvussa, latinalaisen kirjaimiston lisäkirjaimia kuten Þ ja Ŋ sitä seuraavassa.
A-kirjain on peräisin kreikan aakkosten alfa-kirjaimesta ja versaalikirjaimena itse asiassa täsmälleen samannäköinen kuin se. Sen sijaan gemenakirjaimissa muodot ovat eriytyneet: meidän ”pientä a:tamme” vastaa kreikkalainen ”pieni alfa” α. Tämä johtuu siitä, että gemena-a ja gemena-alfa ovat kehittyneet eri tahoilla toisistaan riippumatta.
Alfa puolestaan on peräisin muinaisseemiläisestä alf-kirjaimesta 𐤀, jonka nykyisin käytössä olevia seuraajia ovat heprean alef א ja arabian alif ا. Heprean alef on käytössä myös matematiikan erikoissymbolina, joka tarkoittaa ”pienintä ääretöntä lukumäärää”.
Alef-kirjain on kehittynyt sarvekasta häränpäätä esittävästä kuvasta, joka luultavasti toimi aluksi härkää tarkoittavana sanamerkkinä, myöhemmin kirjainmerkkinä, joka esitti härkää tarkoittavan sanan ensimmäistä merkkiä. Hyvällä mielikuvituksella voi A:mme muodossa vielä nähdä härän. Etenkin jos A:n kääntää ylösalaisin, mikä on lähempänä alkuperäistä tilannetta, voi kolmion nähdä härän päänä ja haarat sarvina.
A-kirjaimen alkumuotoja
Kyrillisen kirjaimiston ensimmäinen kirjain eli kyrillinen A on aivan samannäköinen kuin meidän A:mme. Myös gemena-a on samannäköinen kuin latinalainen a.
Muinaisseemiläisessä kielessä, jonka aakkostosta A:mme polveutuu, ei alef ollut a-äänteen eikä minkään muunkaan vokaalin merkki. Kirjoitus oli konsonanttikirjoitusta, ja alef-kirjain esitti härkää tarkoittavan sanan ʔalef alkukonsonanttia. Tässä on symbolilla ʔ merkitty ns. glottaaliklusiilia eli kurkunpäässä, tarkemmin sanoen ääniraossa (latinaksi glottis), ääntyvää katkoäännettä. Sitä lausuttaessa ilmavirta keuhkoista katkeaa kuten klusiilia k, p tai t äännettäessä, mutta eri kohdassa. Myös heprean sana alef ja arabian sana alif ääntyvät konsonanttialkuisina, vaikka konsonanttia ei merkitäkään näkyviin yleiskielisessä siirtokirjoituksessa.
Suomen kielessäkin saattaa esiintyä glottaaliklusiili. Esimerkiksi huudahdus Anna olla! saattaa ääntyä niin, että ensimmäisen sanan lopussa ja toisen sanan alussa on glottaaliklusiili. Tällöin kyseinen konsonantti siis esiintyy kaksoiskonsonanttina, koska sanojen välissä ei ole taukoa, ja ääntämystä voidaan merkitä näin: [annaʔ ʔolla] Ilmiö esiintyy vain joissakin murteissa. Käytännössä se liittyy ns. loppukahdennukseen, mutta usein esiintyvä väite, jonka mukaan loppukahdennuksessa tai joidenkin sanojen lopussa yleisesti esiintyisi glottaaliklusiili, on perätön. Esimerkiksi huudahdus Anna pois! ääntyy joko ilman mitään loppukahdennuksen tapaistakaan (joissakin murteissa, yleiskielen säännöistä poiketen) tai niin, että kahdentuvana konsonanttina on p: [annap pois].
Glottaaliklusiilin foneettinen merkki IPA-järjestelmässä on edellä käytetty kysymysmerkkiä muistuttava symboli: [ʔ]. Symbolia ʾ käytetään joissakin tarkan siirtokirjoituksen järjestelmissä alef-kirjaimen vastineena. Käytännössä glottaaliklusiilia usein merkitään muillakin tavoin, esimerkiksi heittomerkillä ’. Tämä on ollut omiaan luomaan mielikuvaa, jonka mukaan kyseessä olisi vain ”pois heittynyt” äänne tai jotain muuta epämääräistä eikä aito konsonantti, joka on täysin rinnastettavissa esimerkiksi k-äänteeseen.
Kun kreikkalaiset omaksuivat seemiläisen kirjaimiston ja muokkasivat sitä, heillä ei ollut käyttöä glottaaliklusiin merkille. Tokkopa he edes tunnistivat sananalkuista glottaaliklusiilia kovin selvästi äänteeksi. He kuulivat kirjaimen nimen alef niin, että se alkaa a-vokaalilla. Kreikassa vokaalien merkitseminen on paljon tärkeämpää kuin seemiläisissä kielissä, joten alfasta tuli a-äänteen merkki. Tähän saattoi vaikuttaa se, että ehkä jo tuolloin seemiläisissä kielissä joskus käytettiin alefia vokaalin merkkinä, nimittäin pitkän a-vokaalin.
Gemena-a poikkeaa versaali-A:n muodosta melkoisesti. Voimme kuvitella, miten A:n muoto nopeassa kirjoittamisessa pyöristyy ja alaosa supistuu, jolloin päädytään suunnilleen muotoon ɑ, josta taas päästään muotoon a, kun silmukkaa pienennetään ja oikealta vedetään kaari sen ylle.
Joka tapauksessa gemena-a:lla on kaksi olennaisesti erilaista perusmuotoa, joista muoto a esiintyy fonteissa perusmuotona, muoto a taas kursiivifonteissa. (Edellä esimerkkeinä esitetyt muodot ovat fontista Alegreya Sans.)
Monissa nykyisissä ns. groteskeissa (pääteviivattomissa) fonteissa a:n perusmuoto säilyy kursiivissakin. Esimerkkinä tästä on Roboto-fontin a-kirjaimen kursiiviversio a. Lisäksi on fontteja, joista ei ole lainkaan kursiivia, vaan niillä kirjoitetun tekstin kursivointi voi tuottaa ns. valekursiivia eli ohjelmallisesti kallistettua kursiivia, jolloin a:n perusmuoto säilyy samana. Joka tapauksessa gemena-a:han kannattaa kiinnittää erityistä huomiota, kun vertailee fontteja.
Toisaalta a:n tällaisten muotojen erosta on tavallaan kehitetty myös merkkitason ero. Joissakin merkintätavoissa ja myös Unicode-merkistössä käytetään nimittäin a:sta kehitettyä erillistä kirjainta ɑ (U+0251), jolle on annettu nimi latinalainen alfa sen alfaa (α) muistuttavan muodon takia.
Latinassa A-kirjaimen ääntämys oli samanlainen kuin suomessa nykyisin. Samantapainen ääntämys on tavallinen monessa muussakin kielessä, mutta äänteen laadussa on vaihtelua. Kahta tyypillistä muunnelmaa merkitään foneettisessa IPA-kirjoituksessa gemena-a:lla, [a], toista taas latinalaisella alfalla, [ɑ]. Suomen a-äänne on itse asiassa lähempänä jälkimmäistä, joten esimerkiksi suomen sana haara pitäisi IPA-kirjoituksella merkitä [hɑːrɑ].
Suomen a, siis [ɑ], on takaisempi kuin monissa kielissä esiintyvä [a]. Tämä on sikäli ymmärrettävää, että suomessa a:n ja ä:n eli foneettisesti merkittynä [ɑ]:n ja [æ]:n ero on olennainen. Siksi a äännetään selvästi takana, ä selvästi edessä. Äänteet [a] ja [æ] ovat aika lähellä toisiaan eivätkä kovin hyvin viihtyisi samassa kielessä, jos niiden eron pitäisi olla merkitsevä. Ne ovat molemmat etuvokaaleja mutta [æ] on jonkin verran suppeampi eli kielen ja kitalaen välinen ääntämisväylä on kapeampana.
Esimerkiksi ranskan kielessä on periaatteessa erikseen [a] ja erikseen [ɑ], mutta ne ovat paljolti sekoittuneet toisiinsa, lähinnä niin, että [a] on yleistynyt.
Unkarin kielessä a-kirjain tarkoittaa labiaalivokaalia. Sitä äännettäessä siis huulet ovat pyöristyneet (kuten o:ta ja u:ta lausuttaessa), ja se voidaan kuvata lähinnä avoimeksi o:ksi, foneettisena merkkinä [ɔ]. Sen sijaan unkarin kielen aksentillinen á tarkoittaa pitkää etistä a-äännettä [aː].
Englannin kielessä a-kirjaimella on tunnetusti monia äännearvoja. Diftongiääntämys [ei] esimerkiksi sanassa hate johtuu siitä, että muinaisenglannissa a-kirjain tällaisissa sanoissa tarkoitti pitkää a-vokaalia. Myöhemmin tämän vokaalin ääntämys muuttui mainituksi diftongiksi, mutta kirjoitusasua ei muutettu. Englannin sanassa hat a-kirjain taas edusti lyhyttä vokaalia, jonka ääntämys ei vastaavalla tavalla muuttunut, vaan siitä muodostui suomen ä-äännettä vastaava, foneettisena merkkinä [æ]. Kolmas tavallinen a:n ääntämys on ns. neutraalivokaali eli švaa, foneettisena merkkinä [ə].
Englannissa ei ole suoranaisesti suomen a:ta vastaavaa äännettä. Lähimmäs tulee pitkä a sentapaisten sanojen kuin father ”virallisessa” brittiääntämyksessä.
Kirjaimia on varhaisista ajoista alkaen käytetty myös numerointiin. Muinaisilla kreikkalaisilla ei muita numeromerkkejä ollutkaan kuin kirjaimet. Nykyisin pitäisimme sellaista käytäntöä hankalana muun muassa siksi, että kirjainten jonosta ei aina näkisi, milloin se pitääkin tulkita luvuksi.
Käytämme kuitenkin edelleen yleisesti kirjaimia järjestyslukujen tehtävissä. Kirjan luvut kyllä yleensä numeroidaan, mutta liitteissä käytetään usein kirjaimia numeroiden sijasta: liite A, liite B jne. Yhdysvalloissa kirjaimia A:sta F:ään käytetään kouluarvosanoina siten, että A on paras eli vastaa suomalaista arvosanaa 10.
Selvästä numerokäytöstä on kyse heksadesimaalisessa eli 16-kantaisessa lukujärjestelmässä, joka on tietotekniikassa hyvin yleinen. Tällöin numeromerkeillä 0:sta 9:ään on tavalliset merkityksensä, ja kirjaimia A:sta F:ään käytetään merkitsemään lukuja 10:stä 15:een. Kun kymmenjärjestelmässä numerot tarkoittavat lopusta lukien ykkösiä, kymmeniä, satoja, tuhansia jne. eli 10:n potensseja, niin heksadesimaalijärjestelmässä ne on vastaavasti ajateltava kerrotuiksi luvuilla 1, 16, 16×16, 16×16×16 jne. Esimerkiksi heksadesimaalinen esitys 2B7 tarkoittaa samaa kuin kymmenjärjestelmän mukainen lauseke 2×16×16 + 11×16 + 7 = 695.
Kirjaimia käytetään usein numeroinnin apumerkkeinä. Lain pykälillä on numerot, esimerkiksi 5 § ja 6 §, mutta jos lakia muutettaessa pitää lisätä pykälien väliin uusia pykäliä, otetaan kirjaimet avuksi: 5 a §, 5 b § jne. Näin vältetään vanhojen pykälien uudelleennumerointi. Samaa menettelyä käytetään muissakin yhteyksissä esimerkiksi. Esimerkiksi jonkin tuotemallin numero 42 parannettu versio voidaan nimetä 42a:ksi jne.
Kirjaimia käytetään usein monitasoisessa jaotuksessa, jotta vältettäisiin liiallinen numeroiden esiintyminen. Esimerkiksi luetelman kohdat numeroidaan 1, 2 jne. mutta alakohdat a, b jne. ja niiden alakohdat ehkä taas 1, 2 jne. Kerrostalojen raput voitaisiin numeroida, mutta kun taloon jo viitataan numerolla, käytetään rappujen numerointiin kirjaimia.
Sävelten niminä käytetään kirjaimia a:sta g:hen, osassa Eurooppaa (mm. Suomessa) h:hon. Alkujaan kyse on eräänlaisesta järjestysnumeroinnista, mutta tätä on hämärtänyt mm. se, että sävelasteikkojen perussäveleksi on otettu c. Lisäksi kirjaimet toistuvat oktaavin vaihtuessa. Sävelten kirjainnimiin perustuvat myös sävellajien nimet kuten C-duuri ja a-molli.
Sävelten kirjainnimiin perustuvat myös nuottiavaimet, jotka ovat alkujaan kirjainten koristeellisia muotoja. Esimerkiksi G-avain 𝄞 on kehitetty voimakkaasti tyylitellystä G-kirjaimesta. Nuottiavaimet on jopa määritelty Unicode-merkeiksi, esimerkiksi G-avain on U+1D11E, mutta käytännössä niitä kirjoitetaan yleensä erityisillä nuottienkirjoitusohjelmilla, ei tekstinkäsittelyohjelmilla. Syynä tähän on myös se, että vain harvat fontit sisältävät näitä merkkejä.
Siitä, että A tai alfa tarkoittaa ensimmäistä jonkin järjestyksen mukaan, on lyhyt matka siihen, että se tarkoittaa parasta tai hienointa. Tällöin ei välttämättä ajatella mitään erityistä järjestystä, johon jotkin kohteet olisi pantu, vaan yleistä laadukkuutta. Usein kuitenkin A:n vastakohtana on B niin, että ”kaiken” ajatellaan jakautuvan A- ja B-luokkaan, esimerkiksi A- ja B-kansalaisiin.
Parhaimmuudesta johtajuuden mielessä on kyse silloin, kun puhutaan susilaumaan alfauroksesta ja alfanaaraasta. Käytännössä tarkoitetaan lauman johtajaurosta ja sitä naarasta, jonka kanssa se parittelee. Ne ovat yleensä lauman ainoat lisääntyvät yksilöt.
Mielikuvaa siitä, että A tarkoittaa parasta, on käytetty hyväksi ja toisaalta hämärretty sellaisessa melko yleisessä käytännössä, että usealla A:lla tarkoitetaan jotain vielä parempaa kuin A:lla. Niinpä esimerkiksi luottoluokituksessa AAA on paras, AA toiseksi paras ja A vasta kolmas. – Eri alkuperää on AA järjestön nimen lyhenteenä. Se johtuu englannin sanoista Alcoholics Anonymous ’nimettömät alkoholistit’.
Toisaalta ei ole mitään yleistä sääntöä tai lakia, jonka mukaan luokituksessa A, B, C jne. A olisi aina paras, B toiseksi paras jne. Ensinnäkin kirjaimia voidaan käyttää ikään kuin niminä, kuten seuraavassa kohdassa kuvataan. Toiseksi luokitus saattaa kyllä merkitä erityistä järjestystä, mutta esimerkiksi kalojen fileointiluokituksessa A-leikkaus tarkoittaa vähintä käsittelyä (ja A-leikattu file on ruotoisinta ja halvinta), B-leikkaus pitemmälle menevää jne.
Kirjaimia käytetään myös asioiden nimeämiseen ilman, että kirjainten aakkosjärjestystä vastaa mikään erityinen asioiden tärkeys- tai muu järjestys. Esimerkiksi eräät veriryhmät on nimetty kirjaimilla A, B ja O. Kirjaimia käytetään myös rinnakkaisten koululuokkien nimeämiseen, esimerkiksi 7A, 7B ja 7C (kirjoitettuna myös tyyliin 7 A, 7.A tai 7. A, aiemmin myös VII A). Tosin voidaan sanoa, että varsin usein aakkosjärjestys ilmaisee jotain järjestystä, mutta ehkä vain sitä järjestystä, jossa kohteille on annettu nimet. Esimerkiksi vitamiinien nimitykset A-vitamiini, B-vitamiinit jne. kuvastavat vain nimeämisjärjestystä, ei esimerkiksi tärkeyttä taikka kemiallisen rakenteiden suhteita.
Vastaavaan nimeämiseen käytetään usein myös kreikkalaisia kirjaimia tai niiden nimiä, kuten kohdassa 2.4 kerrottiin.
”Kaiken A ja O” tarkoittaa kaikkein tärkeintä ja olennaisinta, mutta miksi? Taustalla on kreikankielinen ilmaus, joka puhuu alfasta ja oomegasta eli kreikkalaisen aakkoston ensimmäisestä ja viimeisestä kirjaimesta. Alfaa vastaa A, ja oomega lausutaan pitkänä o:na, joten ruvettiin puhumaan A:sta ja O:sta, vaikka meidän olisi loogisempaa puhua A:sta ja Ö:stä – kuten nykyisin joskus puhutaankin (ks. kohtaa ”A ja Ö”, ”Ä ja Ö”).
Puhe kaiken A:sta ja O:sta on levinnyt yleiseen käyttöön Raamatusta: ”Minä olen A ja O, ensimmäinen ja viimeinen, alku ja loppu.” (Ilmestyskirja 22:13.) Kreikankielisessä alkutekstissä on ”το α και το ω”, ’alfa ja oomega’; joissakin versioissa kirjainten tilalla on niiden nimet. Luther käänsi sen epäloogisesti ”das A und das O”, ja suomennoksissa on noudatettu samaa linjaa. (Sen sijaan esimerkiksi englanninnoksissa on yleensä alpha ja omega.) Ilmauksen merkityskin on sittemmin muuttunut, ja ”A ja O” tarkoittaa yleensä vain keskeisintä, asian ydintä.
Suomen kieleen on lainattu ranskasta pikkusana à, jota käytetään sekä vaihteluvälien merkinnöissä, esimerkiksi 5 à 10 ’viidestä kymmeneen, 5–10’, että yksikköhintaa ilmoitettaessa, esimerkiksi 5 kg à 8 € ’viisi kilogrammaa, kukin (hinnaltaan) kahdeksan euroa’. Näissä merkityksissä à-sanan ja sitä myötä à-kirjaimen jopa voisi sanoa kotiutuneen suomen kieleen. Sana à on tavallaan lainattu suomeen prepositioksi, josta on hyötyä silloin, kun suomen mukainen taivutuspäätteiden käyttö olisi hankalaa. Esimerkiksi ilmauksen 28–31 lukutapa kahdeksastakymmenestä kolmeenkymmeneen yhteen on hankala, joten usein kirjoitetaan 28 à 31, jossa luvut luetaan perusmuodossaan. Tosin nykyisin on luvallista lukea ajatusviiva ”–” myös sanana viiva.
Sana à esiintyy selvemmin sitaattilainana (vieraan kielen sanana, jota käytetään sellaisenaan) esimerkiksi ilmauksissa à la carte ’ruokalistalta, tilauksesta’ ja à la maison ’talon tapaan’. Ranskan kielessä à on hyvin monikäyttöinen prepositio, joka vastaa mm. suomen sanoja (postpositioita) luo, kohti, lähelle, sisään, luona, lähellä, sisällä.
Erittäin usein à kirjoitetaan virheellisesti á, siis käyttäen akuuttia eikä gravista (ks. lukua 4). Syynä lienee lähinnä se, että suomalaisessa näppäimistössä on ns. tarkenäppäin, johon on kaiverrettu akuutti (´) ja gravis (`) ja jonka painaminen tuottaa seuraavaksi kirjoitettavaan kirjaimeen akuutin. Graviksen tuottaminen vaatii lisäksi vaihto- eli shift-näppäimen käyttämistä.
Espanjan kielessä käytetään merkkejä ª (U+00AA) ja º (U+00BA) numeroin kirjoitettujen lukujen yhteydessä osoittamaan ne järjestysluvuiksi. Merkkiä ª käytetään, jos lukusana on kieliopillisesti feminiinisukuinen (a-loppuinen), ja merkkiä º, jos se on maskuliinisukuinen (o-loppuinen). Esimerkiksi 2ª = segunda ja 2º = segundo tarkoittavat ’toinen’ ja vastaavat suomen kielen merkintää ”2.”. Merkeissä ª ja º on joissakin fonteissa alleviivaus kirjaimen alla (ª, º). Jälkimmäistä ei pidä sekoittaa asteen merkkiin °, jossa ei koskaan ole alleviivausta.
Näiden merkkien nimet ovat maskuliinisen järjestysluvun merkki ja feminiinisen järjestysluvun merkki. Jotkut käyttävät niitä myös muissa kielissä kuin espanjassa. Koska merkit ovat muodoltaan yläindeksi-a ja yläindeksi-o, niitä saatetaan käyttää väljemminkin edustamassa (sananlopun) a:ta tai o:ta, esimerkiksi portugalissa lyhenteessä Sr.ª = senhora ’rouva’ (vrt. Sr. = senhor ’herra’). Maskuliinisen järjestysluvun merkkiä º ei pidä sekoittaa asteen merkkiin ° (U+00B0); nämä merkit ovat joissakin fonteissa aivan samannäköiset, joissakin aivan erilaiset.
Tässä kirjassa kerrotaan kunkin kirjaimen tarinan lopuksi kirjaimen käytöstä symbolina eli tunnuksena, joka edustaa jotain asiaa tai käsitettä ja jota käytetään sanan tavoin. Tämän lisäksi kirjaimia käytetään laajasti lyhenteinä, etenkin monikirjaimisen lyhenteen osana (esimerkiksi ASP, alv) mutta myös erillisenä, jolloin siihen usein liittyy lyhentämistä osoittava piste. Esimerkiksi ”A.” voi ihmisen etunimen paikalla tarkoittaa mitä tahansa A-alkuista. Lyhennekäyttöä ei tässä kirjassa juuri käsitellä mm. siksi, että yksikirjaimisilla lyhenteillä on usein hyvin monia merkityksiä.
Yksikirjaimisen tunnuksen ja lyhenteen ero on joskus tulkinnanvarainen. Tyypillistä tunnukselle on, että käyttö on melko vakiintunutta, usein erikseen (esimerkiksi standardissa) määriteltyä ja tavallisesti kielestä riippumatonta – vaikka tunnus alkujaan yleensä onkin jonkin kielen jonkin sanan lyhenne. Tunnuksissa versaalin ja gemenan ero on yleensä merkitsevä: esimerkiksi fysiikassa A ja a ovat aivan eri mittayksiköiden tunnuksia.
Sähköopissa A tarkoittaa ampeeria, sähkövirran voimakkuuden yksikköä, jonka nimi johtuu ranskalaisesta matemaatikosta ja fyysikosta A. M. Ampèresta. Se esiintyy esimerkiksi sulakkeissa: ”16 A” tarkoittaa, että sulake kestää 16 ampeerin virran. Usein käytetään myös tunnusta mA, joka tarkoittaa milliampeeria eli ampeerin tuhannesosaa.
Mittayksikön tunnuksena a tarkoittaa aaria eli sataa neliömetriä (100 m²). Sitä käytetään lähinnä puutarhojen ja pienten peltojen tms. pinta-alojen ilmoittamiseen. Joissakin yhteyksissä a on vuoden tunnus, jonka tarkka merkitys vaihtelee.
Geometriassa ja fysiikassa A (kursivoituna) tarkoittaa pinta-alaa. Tämä merkitys, kuten myös a-tunnuksen merkitys ’aari’ ja sana aari, johtuu latinan sanasta area ’alue’.
Mittayksikön etuliitteen tunnuksena a tarkoittaa etuliitettä atto-, joka merkitsee kertomista luvulla 1018. Toisin sanottuna se tarkoittaa jakamista triljoonalla. Esimerkiksi attosekunti (as) on täten sekunnin triljoonasosa. Nimi johtuu tanskan sanasta atten ’18’ (vrt. ruotsin sanaan aderton).
Fysiikan merkintäsopimusten mukaan tulee suureiden tunnukset kirjoittaa kursiivilla aina, kun kursiivin käyttö on mahdollista, siis esimerkiksi pinta-alan tunnus ”A”. Sen sijaan suureiden arvojen ilmaisemiseen käytettyjen yksiköiden ja etuliitteiden tunnuksia, esimerkiksi ”a” (aari) ja ”m²” (neliömetri) ei koskaan saa kursivoida. Tämä vaatii huolellisuutta, mutta se auttaa lukijaa nopeasti hahmottamaan, onko kyse suureesta vai yksiköstä.
Pelikorttien merkinnöissä A tarkoittaa ässää. Tämä johtuu englannin sanasta ace. Ässä on useimmissa korttipeleissä joko maansa korkein tai maansa pienin kortti, jos korteilla on arvojärjestys.
Paperikokojen merkinnät A0, A1 jne. perustuvat yhtenäiseen järjestelmään, jossa lähtökohtana on A0-koko, joka vastaa määrätynlaista suorakulmiota, jonka pinta-ala on yksi neliömetri. Koko A1 saadaan leikkaamalla A0-kokoinen suorakulmio kahtia jne. Kuitenkin paperikokojen mitat pyöristetään täysiksi millimetreiksi. Tutuin koko on A4, joka on 210 mm × 297 mm. Kirjain A tarkoittaa tässä vain ensimmäistä (ja käytännössä tavallisinta) paperikokosarjaa.
Ylioppilastutkinnon ja yliopistollisen pro gradu -tutkielman arvosanana A tai a tarkoittaa alinta hyväksyttävää arvosanaa. Lisäksi se tarkoitti ennen oppiaineen alinta yliopistollisen oppimäärää. Nämä merkitykset eivät johdu siitä, että A on ensimmäinen kirjain, vaan kyseessä on lyhenne latinan sanalle approbatur ’hyväksytään’. Usein käytetään puhekielenomaista nimitystä appro.
Kirjaimista on usein kehitetty uusia symboleita esimerkiksi siten, että kirjaimen jollekin erityiselle ulkoasulle on annettu oma merkityksensä ja se on määritelty erilliseksi merkiksi. Tällainen on esimerkiksi aiemmin mainittu ääntämismerkinnöissä käytetty ɑ. Vaikka sen nimeksi on annettu latinalainen alfa, se on käytännössä muodostettu a-kirjaimen toisesta perusmuodosta (kursiivimuodosta).
Nykyisin useimmille jo tuttu @-merkki näyttää lähinnä ympyröidyltä a:lta. Se kuitenkin lienee saanut alkunsa latinan prepositiosta ad, joka ruvettiin kirjoittamaan niin, että d:n pystyviiva kaartui taaksepäin ja d muutoin sulautui a:han. Alkuperäksi on selitetty myös ranskan à ja englannin at, ja joka tapauksessa englanninkielinen nimi on at sign. Epävirallisesti merkkiä on kutsuttu mm. nimellä kissanhäntä. Viralliseksi suomenkieliseksi nimeksi päätettiin v. 1997 ät-merkki.
Symbolin luomisen yhteydessä on merkkiä saatettu muuntaa monellakin tavalla. Logiikassa ja matematiikassa käytetään yleisesti kaikki-merkkiä eli kaikkikvanttoria eli universaalikvanttoria ∀, joka on muodostettu ylösalaisin käännetystä A-kirjaimesta. Se johtuu englannin sanasta all ’kaikki’. Kaikki-merkkiä käytetään seuraavantapaisissa tiiviissä merkintätavoissa: (∀x∊ℕ)(∀y∊ℕ)(x + y = y+x).
Ympyrässä oleva A, Ⓐ, on käytössä anarkismin symbolina. Anarkismilla tarkoitetaan tällöin erilaisia poliittisia suuntauksia, jotka vastustavat järjestäytynyttä hallitusvaltaa.
B-kirjain on peräisin kreikan aakkosten beeta-kirjaimesta ja versaalikirjaimena itse asiassa täsmälleen samannäköinen kuin se. Sen sijaan gemenakirjaimissa meidän ”pientä b:tämme” vastaa kreikkalainen ”pieni beeta” β. Gemena-b on syntynyt siten, että versaali-B:stä jätettiin ylempi silmukka pois kirjoittamisen nopeuttamiseksi.
Beeta puolestaan peräisin muinaisseemiläisestä bet-kirjaimesta 𐤁, jonka nykyisin käytössä olevia seuraajia ovat heprean bet ב ja arabian beh ب. Meidän B:mme perusteella voisi kuvitella alkumuodoksi kaksihuoneisen talon pohjapiirroksen, mutta todennäköisesti bet-kirjain on kehittynyt merkistä, joka esitti yhden huoneen taloa, jossa on oviaukko. Kreikkalaiset lisäsivät toisen kaaren, ehkä symmetrian vuoksi. Taloa tarkoittavat seemiläiset sanat esiintyvät monissa nimissä kuten Beetlehem (Betlehem), joka tarkoittaa ’leivän talo’.
B-kirjaimen yksi alku, oviaukollinen talo.
Kyrillisessä kirjaimistossa on kaksi kirjainta, jotka muistuttavat meidän B:tämme: aakkoston toinen kirjain bee Б (gemenana б), joka yleensä ääntyy kuten B, ja kolmas kirjain vee B (gemenana в), joka siis on versaalina aivan samannäköinen kuin B – mutta ääntyy yleensä v-äänteenä. Molemmat ovat kehittyneet beetasta.
B-kirjaimen alkuperäinen äännearvo on p-äännettä vastaava soinnillinen konsonantti, ”pehmeä pee”. Tämä tarkoittaa selvästi soinnillista äännettä kuten esimerkiksi englannissa ja ruotsissa, ei sellaista yleensä lähes p:n kaltaista äännettä kuin vaikkapa suomen sanassa banaani.
Suomalaiset kyllä usein luulevan lausuvansa ”pehmeän peen” ainakin kun puhuvat huolitellusti. Usein myös huomautetaan kärkevästi, kun esimerkiksi televisiossa puhutaan Pelkiasta tai Palkkanista eikä Belgiasta tai Balkanista. Tutkimuksissa on kuitenkin todettu, että suomalaiset enimmäkseen ääntävät b:n aika lailla samoin kuin p:n. Useimmat kyllä osaavat ääntää selvästi soinnillisen ”pehmeän peen”, mutta se vaatii yleensä tietoista ponnistusta ainakin suomea puhuttaessa.
Joissakin kirjoitusjärjestelmissä B-kirjain tarkoittaa äännettä, joka on b-äänteen kaltainen mutta soinniton. Sitä merkitään foneettisesti b:llä, jonka alla on ympyrä soinnittomuuden merkiksi: [b̥]. Ääntämiselinten asento on siis sama kuin b:tä äännettäessä, mutta äänihuulet eivät värise.
Tällainen äänne esiintyy muun muassa viron kielessä, jossa sitä merkitään B:llä. Se esiintyy myös kiinan kielessä, jossa se eroaa selvästi p-äänteestä, joka on aspiroitunut. Kirjoitettaessa kiinaa latinalaisin kirjaimin pīnyīn-järjestelmän mukaan käytetään näille äänteille kirjaimia B ja P. Kiinankielisten nimien B:n voi siis lukea lähes p-äänteenä ja P:n selvästi aspiroituneena, jopa melkein ”ph”.
Sellaisissakin kielissä, joissa B-kirjain normaalisti tarkoittaa b-äännettä, se saattaa joissakin tilanteissa tarkoittaa p-äännettä. Slaavilaisissa kielissä normaalisti b-äännettä tarkoittava kirjain (latinalainen b tai kyrillinen б) ääntyy yleensä p-äänteenä sanan lopussa ja soinnittoman konsonantin edellä. Latinassa kirjoitettiin BS ja BT mutta äännettiin [ps] ja [pt], ja saksassa sananloppuinen B ääntyy [p].
Soinnillisen ja soinnittoman äänteen, kuten [b]:n ja [p]:n, välinen ero on periaatteessa siinä, että lausuttaessa soinnillista äännettä kurkunpäässä olevat äänihuulet värisevät. Sointi siis syntyy kaukana sieltä, missä muu äänteenmuodostus yleensä tapahtuu. Yleensä emme ajattele koko asiaa, vaan lausumme äänteet oppimallamme tavalla. Tästä toisaalta seuraa, että emme kiinnitä huomiota siihen, miten soinnillisina lausumme esimerkiksi b:n, d:n ja g:n.
Soinnillisen ja soinnittoman konsonantin ero voidaan kuitenkin kuvata myös niin, että soinnillinen on ”pehmeä” ja soinniton on ”kova”. Niinhän teemme esimerkiksi puhuessamme b:stä ”pehmeänä peenä”. Joissakin kuvauksissa pehmeys ja kovuus jopa esitetään ensisijaisena erona. Tämä tuntuu oudolta, kun ajattelemme, että soinnillisessa on jotakin enemmän (nimittäin äänihuulten synnyttämä sointi). Selitys on, että ääntämykseen vaikuttavat monet muutkin seikat. ”Kova” konsonantti voidaan lausua pontevammin, ilmavirta selvemmin katkaisten, hiukan eri ääntämispaikassa ja aspiroituneenakin. Tästä syntyy ”kovuuden” vaikutelma.
Suomen kielessä b-kirjain esiintyy nykyisin vain uudehkoissa lainasanoissa, ja lisäksi se siis usein ääntyy samoin tai lähes samoin kuin p. Suomessa ei varsinaisesti ole p:n ja b:n vastakohtaa ääntämyksessä. Soinnillisuuden aste vaihtelee liukuvasti. Tosin joissakin tapauksissa näyttäisi siltä, että b:n ja p:n ero on ainoa sanoja toisistaan erottava asia, esimerkiksi bussi – pussi. Käytännössä nämä sanat kuitenkin ääntyvät suunnilleen samoin, ja kuulija tulkitsee kuulemansa enemmänkin asiayhteyden perusteella kuin konsonantin soinnillisuuden mukaan.
Meidän ei tarvitse nolostua siitä, että emme juuri tee eroa p:n ja b:n välillä kielessämme. Useimpia vieraita kieliä käytettäessä tähän eroon tietysti pitää kiinnittää erityistä huomiota. Emme kuitenkaan ole ongelman kanssa yksin. Jo muinaisten etruskien kielestä puuttui b. Se puuttuu oikeastaan myös maailman puhutuimmasta kielestä, sillä kiinan kielen ”b” on soinniton. Arabiassa taas on b-äänne mutta ei p-äännettä. Niinpä englantia muutoin mainiosti puhuvakin arabi saattaa lausua sanan ”example” ikään kuin se kirjoitettaisiin ”examble”.
Vanhassa kirjasuomessa käytettiin b:tä myös omaperäisissä sanoissa etenkin yhteyksissä, joissa p on äänneympäristönsä takia ainakin hiukan soinnillinen, esimerkiksi parembi (= parempi). Mistään varsinaisesta b-äänteestä ei kuitenkaan ollut kyse.
B-kirjaimella merkitty äänne on usein muuntunut toiseksi ilman, että kirjoitusasua olisi muutettu. Varsin tavallista on v-äänteeksi muuttuminen. Esimerkiksi espanjan kielessä B ja V ääntyvät samalla tavalla, joka riippuu sijainnista sanassa, ei siitä, kumpaa kirjainta on käytetty. Tällainen kehitys on ollut ainakin aluillaan jo antiikin aikana. Kerrotaan jopa, että silloin olisi nykyisen Espanjan alueella asuvista sanottu ilkeähkösti: felices populi quibus vivere est bibere, ’onnellisia ovat ihmiset, joille elämä (= vivere) on juomista (= bibere)’.
Englannin kielen sana alphabet tarkoittaa aakkostoa ja johtuu kahden ensimmäisen kreikkalaisen aakkosen nimestä (englanniksi alpha ja beta). Suomen kieleen tätä sanaa ei ole lainattu, vaan käytämme kotoisempaa sanaa. Harvinaisena sivistyssanana on kuitenkin analfabeetti, joka tarkoittaa luku- ja kirjoitustaidotonta ja jossa alkuosa an- on kielteinen etuliite.
Kuten A-kirjaimen tarinassa mainittiin, kirjaimilla ilmaistaan usein myös laatuluokkia. Erityisesti puhutaan usein ”B-luokan elokuvista” tai muista B-luokan asioista, vaikka ei ajatella mitään A-luokkaa eikä muitakaan luokkia. Tällöin määritteellä ”B-luokan” on oikeastaan vain merkitys ’huono’, mutta sävy ei välttämättä ole yhtä kielteinen.
Tietotekniikassa B tarkoittaa ns. tavua (englanniksi byte) eli käytännössä 8 bitin yksikköä, b taas bittiä (bit). Varsin usein ne sekoittuvat toisiinsa etenkin niin, että b:tä käytetään myös B:n merkityksessä. Näitä tunnuksia käytetään yleensä etuliitteiden kanssa, esimerkiksi kb = kilobitti, MB = megatavu.
Fysiikassa B on belin tunnus. Belin sijasta käytetään yleensä sen kymmeneosaa desibeliä (dB). Beli ja desibeli mielletään yleisesti (havaitun, koetun) äänenvoimakkuuden yksiköiksi, mutta varsinaisesti beli on yksikkö, joka ilmaisee kahden suureen suhdetta tai erityisesti suureen suhdetta annettuun perusarvoon logaritmiasteikolla. Belin nimi johtuu Alexander Bellin sukunimestä.
Ydinfysiikassa ja suurenergiafysiikassa b on käytössä barn-nimisen yksikön tunnuksena. Barn on hyvin pieni, atomiydinten kokoluokkaa oleva pinta-alan yksikkö: 1 b = 10−28 m² = 100 fm².
Ylioppilastutkinnon ja pro gradu -tutkielman arvosanana B tai b tarkoittaa toiseksi alinta hyväksyttävää arvosanaa. Tämä ei johdu siitä, että B on toinen kirjain, vaan kyseessä on latinan ilmauksen lubenter approbatur ’mieluisasti hyväksytään’ lyhenne. Lyhenteeksi otettiin sanan lubenter toinen konsonantti, koska lyhenne L oli jo varattu ylimmälle arvosanalle laudatur.
Šakkipelin merkinnöissä englannin kielessä B tarkoittaa lähettiä. Se johtuu sanasta bishop ’piispa’.
Gemena-b:tä käytetään musiikissa melko usein alennusmerkin ♭ (U+266D, englanniksi flat sign, ranskaksi bémol) korvikkeena ulkoasun samanlaisuuden takia. Sellaisissa tilanteissa myös ylennysmerkki ♯ (U+266F, sharp sign) yleensä korvataan helpommin tuotettavalla merkillä # (ristikkomerkki). Alennusmerkki lienee alkujaan kehitetty tyylitellystä b-kirjaimesta.
C-kirjain on peräisin kreikan aakkosten gamma-kirjaimesta Γ, joka kreikassa tarkoitti yleensä g-äännettä. C:n voi kuvitella syntyneen siten, että Γ-merkki kiertyi hiukan eri asentoon ja sen kulma pyöristyi. Kreikassa myöhemmin kehittynyt gemena-gamma on hiukan samantyylinen kuin gemena-g: γ.
Gamma puolestaan peräisin muinaisseemiläisestä gaml-kirjaimesta 𐤂, jonka nykyisin käytössä olevia seuraajia ovat heprean gimel ג ja arabian jīm ج. Kirjainten nimet muistuttavat kamelia tarkoittavaa sanaa. On luonnollista ajatella, että merkin alkumuoto on ollut kamelia (yksikyttyräistäamelia eli dromedaaria) esittävä tyylitelty kuva, ehkä vain kamelin kyttyrää esittävä murtoviiva. Toisaalta alkumuodoksi on esitetty myös kaarevan tai kulmikkaan heittokepin – eräänlaisen bumerangin – kuva. Tällöin ehkä kirjain on myöhemmin saanut kameliin viittaavan nimen, kun sen muoto on tulkittu uudelleen.
Kyrillisessä kirjaimistossa on neljäntenä aakkosena kirjain, joka versaalina on täysin gamman näköinen ja gemenana pienennetty versaali: г. Se ääntyy yleensä g-äänteenä. Kyrillisessä aakkostossa on kyllä aivan meidän C:mme näköinen kirjain, mutta se on eri alkuperää ja ääntyy s:nä (ks. S:n tarinaa) .
Latinassa C oli aluksi – ja keisariajalle asti – aina k- tai g-äänteen merkki. Tämä johtuu siitä, että roomalaiset eivät oppineet kirjaimia suoraan kreikkalaisilta, vaan etruskien kautta. Koska etruskin kielessä ei ollut g-äännettä, etruskit käyttivät gammaa vastaavan soinnittoman äänteen eli k-äänteen merkkinä.
Taustalla oli ehkä se, että etruskin kielessä oli erityyppisiä k-äänteitä, joita varten he käyttivät kolmea eri kirjainta, jotka vastaavat meidän C:tämme, K:tamme ja Q:tamme. Niinpä roomalaisetkin käyttivät varhaisina aikoina C:tä vastaavaa, gammasta kehittynyttä kirjainta E:n, I:n ja konsonantin edessä, K:ta vastaavaa (kappa) A:n edessä ja Q:ta vastaavaa (koppa-kirjaimesta kehittynyttä) O:n ja U:n edessä. Suomen kielessäkin voi havaita k-äänteen olevan hiukan erilainen eri vokaalien edessä, mutta etruskit kokivat erot niin suuriksi, että he käyttivät eri kirjaimia.
Roomalaiset yksinkertaistivat melko pian järjestelmää niin, että rupesivat käyttämään C:tä myös A:n ja O:n edessä – ja myös U:n edessä useissa tilanteissa. Q jäi käyttöön U:n (oikeastaan V:n) edellä, ja QU-yhdistelmä hyvin mahdollisesti ääntyikin erityisellä tavalla, kuten Q:n tarinassa kerrotaan. Lisäksi K jäi käyttöön muutamiin harvoihin sanoihin ja niiden lyhenteisiin: Kalendae (Kal.), Kaeso (K.), Karthago.
Roomalaiset siis omaksuivat C:n k:n merkiksi, mutta he käyttivät sitä myös g:n merkkinä, koska latinassa tätä äännettä piti jollakin merkitä. G:n tarinassa kerrotaan, miten tämä kahtalaisuus purettiin.
Latinassa C oli siis alun perin aina k-äänteen merkki. Vanhan ajan lopulla k-äänne alkoi kuitenkin etuvokaalien e ja i (ja y) edellä kehittyä niin sanotuksi affrikaataksi, jota voidaan karkeasti kuvata yhdistelmällä tš ja tarkemmin foneettisesti merkinnällä [ʧ]. Tämä tarkoittaa äännettä, joka alkaa kuten t-äänne niin, että kieli sulkee ilmavirran tietyllä tavalla, mutta jatkuu niin, että yksinkertaisen avautumisen sijasta sulkeuma ikään kuin laukeaa sihahtaen. Tarkemmin sanoen kieli laskeutuu mutta muodostaa vielä kapean aukon, jolloin syntyy suhu-s:n kaltainen ”laukeama”. Tällainen ääntämys on säilynyt italiassa, ja sitä noudatetaan muun muassa latinankielisessä kirkkolaulussa.
Ranskalaisella kielialueella mainittu affrikaatta kehittyi edelleen s-äänteeksi, ja tällainen ääntämys levisi myös muun muassa englantiin ja ruotsiin. Tätä perua on se, että suomalaiset usein lähes automaattisesti ääntävät c:n s-äänteeksi e:n, i:n ja y:n edellä, esimerkiksi sanoissa Centrum, cis ja cygnus. Latinan opetuksessa ruvettiin kuitenkin myöhemmin ”kikeroimaan” eli lausumaan vanhan (klassisen) latinan mukaisesti c kaikissa asemissa k-äänteenä. Niinpä sana civis luetaan milloin [kivis], milloin [sivis].
Espanjassa affrikaatasta kehittyi soinniton dentaalispirantti [θ] eli sama kuin englannin th:lla merkitty äänne esimerkiksi sanassa tooth. Myöhemmin tästä puolestaan kehittyi yleisesti [s], joka on vallitseva amerikanespanjassa ja laajalti Espanjan alueellakin, joskin spiranttiääntämystä voidaan edelleen pitää huoliteltuun espanjanespanjan yleiskieleen kuuluvana. Mutta tilatessaan Espanjassa olutta, espanjaksi cerveza, voi siis huoleti aloittaa s-äänteellä.
Saksalaisella kielialueella affrikaatta [ʧ] kehittyi toisella tavalla, affrikaataksi [ʦ] tai konsonanttipariksi [ts]. (Näiden ero on suomalaisen korvissa pieni tai olematon, mutta ne ovat periaatteellisesti eri asioita.) Saksan kielessä ruvettiin myöhemmin usein merkitsemään näin syntynyttä äännettä tai yhdistelmää z-kirjaimella. Niinpä latinan sanasta centrum tuli saksan sana Zentrum.
C:lle saksalaisella kielialueelle kehittynyt merkitys siirtyi niihin slaavilaisiin kieliin, joita kirjoitetaan latinalaisin kirjaimin, kuten puolaan, tšekkiin, slovakkiin ja kroaattiin.
Suomea puhuttaessa on tapana lukea vieraissa nimissä e:n, i:n tai y:n edellä oleva c s-äänteenä, koska tällainen lukutapa on vallitseva ruotsissa, johon se on tullut ranskassa. Lukutapa siis on joissakin vieraissa nimissä väärä. Lisäksi siitä poiketaan antiikin aikaan kuuluvissa latinalaisissa nimissä, jotka luetaan klassillisen ääntämyksen mukaan. Esimerkiksi henkilönnimi Cicero lausutaan k:llisena [kikero] (tai vielä klassisemmin [kikeroː]), kun taas siitä kehittynyt kirjapainotermi (erään fonttikoon nimi) cicero lausutaan s:llisenä [sisero].
Edellä kuvattu k-äänteen muuttuminen e:n, i:n ja y:n edellä tapahtui lähes kaikkialla, missä latina oli käytössä eri muodoissaan. Kuitenkin Sardiniassa puhutussa sardin kielessä k säilyi osittain näissä asemissa.
Muutoksesta seurasi, että kun latinasta kehittyneitä romaanisia kieliä – italia, espanja, katalaani, portugali, ranska, provensaali, romania ym. – ruvettiin kirjoittamaan, niissä c-kirjain e:n, i:n ja y:n edellä tarkoitti eri äänteitä eri kielissä. Kirjoitusasu nimittäin otettiin yleensä latinasta.
Toisaalta äänteenmuutosten takia, toisaalta lainasanoissa näihin kieliin tuli kuitenkin sanoja, joissa on k-äänne e:n, i:n tai y:n edellä. Niiden kirjoittaminen oli ongelmallista. Osittain otettiin k-kirjain taas käyttöön, mutta yleisemmäksi muodostui qu-yhdistelmän käyttö siellä, missä sen äännearvoksi oli muodostunut pelkkä k-äänne (ks. Q-kirjaimen tarinaa). Niinpä esimerkiksi meidän kioski-sanaamme vastaava sana kirjoitetaan espanjassa quiosco. Sen sijaan italiassa qu-yhdistelmän ääntämys ei ollut samalla tavalla yksinkertaistunut, eikä siitä haluttu irrottaa pelkkää q:ta k:n merkiksi, koska muinaisista ajoista oli totuttu kirjoittamaan q vain u:n edelle. Niinpä muodostettiin ch-yhdistelmä k-äänteen merkiksi. Italiassa h-kirjain ei äänny, mutta yhdistelmissä che ja chi se sopivasti erottaa c:n e:stä tai i:stä. Niinpä kioski-sanaa vastaa italiassa chiosco. Taustalla oli varmaan sekin, että latinassa ch oli ollut aspiroituneen tai aspiroitumattoman k:n merkkinä.
Yhdistelmä ch siis on usein käytössä k-äänteen merkkinä. Toisaalta esimerkiksi espanjassa se muodostui affrikaatan [ʧ] merkiksi, ja englannissakin tämä on ch:n normaali ääntämys. Sen sijaan ranskassa ch tarkoittaa suhu-s:ää [ʃ].
Tämä monimuotoisuus (tai sekavuus) tavallaan jatkaa latinan oikeinkirjoituksen perinteitä. On nimittäin päätelty, että latinassa ruvettiin alun perin käyttämään yhdistelmiä CH, PH ja TH kreikkalaisissa lainasanoissa tarkoittamaan aspiroituneita konsonantteja [kʰ], [pʰ] ja [tʰ], jotka muutoin olivat latinalle vieraita. (Aspiraatiosta ks. H:n tarinaa.) Näillä yhdistelmillä korvattiin kreikkalaiset kirjaimet Χ (khii), Φ (fii) ja Θ (theeta), jotka olivat mainittujen aspiroituneiden konsonanttien merkkejä. Latinan vanhimmissa kreikkalaisissa lainasanoissa ne oli korvattu C:llä, P:llä ja T:llä; siksi esimerkiksi purppura on latinaksi purpura, vaikka kreikassa oli porfyra (πορφύρα). (Suomessa käytetyn kreikan translitteraation f ja kirjaimen nimi fii heijastaa myöhempää kehitystä, jossa äännearvoksi muodostui f.)
Todennäköisesti kyseiset aspiroituneet äänteet esiintyvät vain huolitellussa kaupunkilaisääntämyksessä. Toisaalta tällainen ääntämys ilmeisesti kuulosti hienolta, koska se ja sen mukainen kirjoitustapa levisi myös joihinkin vanhoihin latinan sanoihin, kuten pulcher. Myöhemmin aspiroitunut ääntämys katosi, kuitenkin niin, että aspiroitunut p korvautui f:llä eikä p:llä, ja näin ph:sta tuli f:n merkki.
Vanhassa kirjasuomessa c-kirjainta käytettiin paljon, lähinnä k:n merkkinä. Agricola merkitsi k:ta yleensä c:llä takavokaalin (a, o tai u) edellä, mutta hän käytti myös yhdistelmiä ch ja ck k:n merkkinä. Kaksois-k:n hän yleensä merkitsi ck:lla. Käytäntö jatkui – hiukan järjestelmällisempänä – vuoden 1642 raamatunsuomennoksessa. Vasta 1700-luvun jälkipuoliskolla siirryttiin käyttämään aina k-kirjainta k-äänteen merkkinä. Tätä käytäntöä, joka varmaankin omana aikanaan vaikutti aluksi oudolta, vakiinnutti erityisesti vuoden 1776 raamatunsuomennos.
Joissakin lainasanoissa oli sanan alussa c-kirjain s:n merkkinä e:n tai i:n edessä, lainanantajakielen mukaisesti, esimerkiksi cedri ’seetri’.
Nykysuomessa c esiintyy oikeastaan vain sitaattilainoissa ja vieraissa nimissä. Varsinaisissa lainasanoissa c on yleensä korvattu ääntämyksen mukaan k:lla tai s:llä. Sitaattilainoissa ja nimissä c-kirjain ääntyy periaatteessa alkuperäiskielen järjestelmän mukaan. Käytännössä suomalaisilla on melko vahva taipumus lukea c kuten ruotsissa (ja englannissa), ellei ole varmaa tietoa muusta ääntämyksestä. Tällöin c äännetään k:na paitsi e:n, i:n ja y:n edellä s:nä.
Sitaattilainan ja varsinaisen (suomeen mukautuneen) lainasanan raja on häilyvä. Periaatteessa sitaattilaina on vieraasta kielestä sellaisenaan otettu sana, jonka kirjoitusasu ja ääntämys ovat vieraan kielen mukaiset ja jonka käyttöala on suppea, usein ammattikieli. Esimerkki: caballero [kaβaˈλero]. Varsinainen lainasana taas on ääntämykseltään mukautunut suomeen ainakin sikäli, että siinä on vain suomen äänteitä (vierasperäiset äänteet b, g, f, š ja ž mukaan lukien) ja kirjoitusasu on ääntämyksen mukainen suomen järjestelmän mukaan. Esimerkki: kavaljeeri. Käytännössä on monenlaisia välimuotoja. Sitaattilainoja ei juuri lausuta tarkasti alkukielen mukaan vaan suomeen mukautettuina. Esimerkiksi Nykysuomen sivistyssanakirjassa sana caballero on merkitty sitaattilainaksi mutta sen ääntämisohjeena on [kavaljē´ro], jota IPAssa vastaisi lähinnä [kɑvɑˈljeːro]. Se on siis jo melko lähellä sanan kavaljeeri ääntämystä. Lisäksi monet sitaattilainoina kirjoitettavat sanat, kuten cowboy, ovat muodostuneet yleiskielen sanoiksi eivätkä siis ole käyttöalaltaan suppeita.
Aiemmin esitettyä voidaankin tarkentaa seuraavasti: C-kirjain esiintyy suomenkielisessä tekstissä vain vieraissa nimissä, sitaattilainoissa sekä sitaattilainan ja varsinaisen lainasanan välimuodoissa. Sama koskee kirjaimia Q, W, X, Z ja Å. Tilanne on sikäli muuttuvainen, että uudet lainat varsinkin englannista tuovat sanoja, joissa on C, ja toisaalta kieleen kotiutuvissa sanoissa C saattaa muuttua ääntämyksen mukaisesti K:ksi tai S:ksi.
C-loppuiset sanat ovat taivutuksessa hankalia, koska c ääntyy k:na, jonka olisi luontevaa olla astevaihtelussa. Kaksoiskonsonantin merkitseminen cc:llä olisi hiukan outoa: aerobic : aerobicin : aerobiccia : aerobicciin. Virallisia suosituksia lienee tulkittava niin, että tällaisiin muotoihin kirjoitetaan vain yksi c vaikka äännetäänkin kk: aerobiciin jne. Ongelman voi välttää käyttämällä suomalaistettua muotoa aerobic t. aerobikki : aerobikin : aerobikkia : aerobikkiin jne. Verbijohdoksissa tilanne on vielä selvempi: aerobikata : aerobikkaan on sujuvampaa kuin aerobicata : aerobiccaan tai aerobicaan.
C-kirjaimesta on käytössä useita tarkkeellisia muunnelmia. Ääntämykseen tarkkeet vaikuttavat olennaisesti, mm. seuraavasti:
Sedilji eli koukkumainen tarke kirjaimen alla voi esiintyä muissakin kirjaimissa kuin sedilji-c:ssä ç, mutta suomalainen tuntee sen parhaiten yleensä juuri ranskan ç:stä, esimerkiksi sanasta garçon, Alkujaan sedilji oli kirjaimen alle kirjoitettu pieni z-kirjain, ja sen nimikin johtuu tästä: zedilla tarkoitti pienois-z:aa. Ranskassa ruvettiin kirjoittamaan tällainen merkki c:n alle merkiksi siitä, että c ääntyy s-äänteenä, vaikka seuraava merkki ei ole etuvokaali (e, i, y) vaan takavokaali (a, o, u).
Aakkosten kolmea ensimmäistä kirjainta ABC käytetään usein kuvaamaan aakkostoa kokonaisuutena ja toisaalta alkeita, perusteita, esimerkiksi EU-tiedon ABC. Taustalla on ajatus, että lukutaito on osaamisen perusta ja aakkosten tunteminen, joka alkaa A:sta, B:stä ja C:stä, on siten tiedon perustusta tai alkeita.
Niinpä ensimmäinen suomenkielinen aapinen eli lukemisen oppikirja ja samalla ensimmäinen suomenkielinen kirja oli nimeltään Abckiria (fraktuuralla: Abckiria) eli nykyisen oikeinkirjoituksen mukaan kirjoitettuna ABC-kirja. Tämän vuonna 1543 julkaistun ensimmäisen aapisen nimestä on myös sana aapinen peräisin. Nimi lausuttiin aabeeseekirja tai arkisemmin aapeeseekirja, josta nopeassa puheessa tuli aapeskirja. Siitä päädyttiin jostain syystä muotoon aapiskirja, jonka alkuosa ruvettiin ymmärtämään – aluksi ehkä leikillisesti – sanan aapinen yhdyssanamuodoksi samaan tapaan, kuin esimerkiksi sanan entisaika alkuosa on sanan entinen yhdyssanamuoto.
Kun markkinoille tuli magnetofoneihin eli nykykielellä nauhureihin tai nauhasoittimiin sopivia nauhakasetteja, niitä ruvettiin suomessa kutsumaan nimellä C-kasetti. Tässä C on vain lyhenne, sillä englannin kielen ilmaus on Compact Cassette.
Myöhemmin kun ruvettiin yleisesti käyttämään toisentyyppistä tallennuslaitetta, englanniksi Compact Disk, sille ei annettukaan suomessa nimeä C-levy. Sen sijaan käytetään lyhennettä CD tai cd itsenäisesti tai yhdyssanan alkuosana: CD-levy, jossa siis tavallaan kahteen kertaan sanotaan, että kyseessä on levy.
Tähän vaikutti ehkä osaltaan se, että C-levy oli jo vakiintunut nimitys tyypillisen mikrotietokoneen kovalevylle. DOS-käyttöjärjestelmässä annettiin laitteille kirjaintunnuksia siten, että levykeasema on A, toiselle levykeasemalle on varattu B ja kovalevylle – jota varhaisissa koneissa ei ollut tai joka hankittiin erikseen – vasta C-kirjain. Tämä käytäntö on säilytetty Windows-järjestelmissä, vaikka A-levyn ja varsinkin B-levyn merkitys on käynyt vähäiseksi.
C-kirjaimella sellaisenaan on useita symbolimerkityksiä, kuten seuraavat:
Varsin usein pelkkää C-kirjainta käytetään celsiusasteen merkkinä, vaikka oikea tunnus on °C (asteen merkki ja C-kirjain), esimerkiksi 5 °C, joka luetaan ”viisi celsiusastetta” tai arkikielessä yleensä lyhyemmin ”viisi astetta”.
Pelkkä C on erään ohjelmointikielen nimi, jolle ei ole parempaa selitystä kuin että kieli kehitettiin B-nimisen kielen seuraajaksi. C:stä on kehitetty muita, nykyisin yleisempiä kieliä kuten C++ ja C# (luetaan englanniksi C sharp, koska ristikkomerkin # ajatellaan edustavan ylennysmerkkiä ♯ ja koska musiikissa sharp tarkoittaa puolen sävelaskeleen ylennystä).
C-kirjaimesta on muokkaamalla kehitetty joukko erikoismerkkejä. Tunnetuin niistä on sentin tunnus ¢. Sitä tulisi käyttää vain dollarin sadasosan merkkinä. Sille tuskin on tarvetta suomen kielessä. Englannin kielessä sitä käytetään luvun jäljessä ilman väliä, esimerkiksi 75¢.
Matematiikassa käytetään C:stä kehitettyä symbolia ℂ (U+2102) kompleksilukujen joukon merkkinä.
C-kirjaimesta on kehitetty tekijänoikeusmerkki ©, joka koostuu ympyrän sisällä olevasta C-kirjaimesta. C johtuu englannin sanasta copyright ’tekijänoikeus’. Aiemmin ©-merkillä oli oikeudellinen erityismerkitys, koska tekijänoikeussuojan saaminen teokselle edellytti monissa maissa sitä, että teoksessa on määrämuotoinen tekijänoikeusilmoitus. Nykyisin tällaiset muotovaatimukset on kansainvälisissä sopimuksissa kielletty. Silti tekijänoikeusilmoitukset usein kirjoitetaan vanhan kaavan mukaan, esimerkiksi seuraavasti: © 2007 Jukka K. Korpela.
©-merkin tilalla on usein käytetty merkintää (C) tai (c). Tämä on useimmiten tarpeetonta, koska ©-merkki kuuluu ISO Latin 1 -merkistöön ja on siis käytännössä yleensä käytettävissä kaikkialla, missä voi käyttää ä:tä ja ö:tä.
D-kirjain on peräisin kreikan aakkosten delta-kirjaimesta Δ. Merkin muoto oli pitkään jonkinlainen kolmio, mutta latinan kirjoitusjärjestelmässä yksi kulma pyöristyi.
Sana ”delta” tarkoittaa yhä myös joen (etenkin Niilin) suistoaluetta. Kreikkalainen Δ muistuttaa muodoltaan suistoa, kun ajatellaan joen virtaavan ylhäältä ja sitten jakautuvan moniksi sivuhaaroiksi. Kreikan gemena-deltasta δ tällainen viitteellisyys on kadonnut.
Suistoaluetta tarkoittava delta-sanan merkitys on kuitenkin ilmeisesti syntynyt vasta kreikassa kirjaimen muodon perusteella. Kreikan delta on peräisin muinaisseemiläisestä delt-kirjaimesta 𐤃, jonka seuraajia ovat arabian dal د ja heprean dalet ד. Alkuperäinen muoto lienee ollut kolmiomainen, ja se oli ehkä kehittynyt ovea tarkoittavasta kuvasta (ehkä sellaisesta, joka esittää teltan kolmiomaista oviaukkoa) tai yksinkertaistumalla kalan kuvasta.
Kyrillisessä kirjaimistossa D:n vastineena on delta-kirjaimesta kehittynyt dee Д (д). Sen voidaan ajatella syntyneen niin, että Δ:n yläosaa on levennetty ja alaosaan on lisätty koristeellisuutta.
Kielissä, joissa esiintyy D-kirjain, se yleensä tarkoittaa äännettä, joka on t-äänteen tapainen mutta soinnillinen. Se ei kuitenkaan ole kovin tarkka vastine, sillä t:tä äännettäessä kielen kärki yleensä koskettaa yläetuhampaita, kun taas d:tä äännettäessä kielen kärki kaartuu selvästi taaksepäin ja koskettaa hampaiden yläpuolella olevaa ns. hammasvallia.
Esimerkiksi viron kielessä D:llä merkitty äänne on luonnehdittavissa d:n ja t:n välimuodoksi; tarkemmin sanoen ääntämispaikka on suunnilleen sama kuin suomen d:ssä, mutta soinnillisuus puuttuu. Muutoinkin D saattaa eri kielissä tarkoittaa soinnitonta äännettä. Kyseessä on usein samanlainen ilmiö kuin B-kirjaimen tarinassa kerrottu: D tarkoittaa soinnitonta , mutta aspiroitumatonta konsonanttia, T taas vahvasti aspiroitunutta.
Suomen yleiskielen äännejärjestelmään kyllä kuuluu melko selvästi soinnillinen d, kuten jäljempänä kuvataan. Se kuitenkin esiintyy omaperäisissä sanoissa lähes yksinomaan t:n astevaihteluparina, esimerkiksi latu : ladun. Lähes kaikissa murteissa d:n tilalla on kuitenkin jokin muu äänne – tai ei mitään äännettä.
Vierasperäisissä sanoissa esiintyvä d-kirjain ei sekään ole aivan täysin kotiutunut suomeen, vaan se saatetaan lausua t-äänteenä. Demokratia saattaa kansanmiehen suussa saada muodon temokratia. Tällainen puhetapa lienee kuitenkin väistymässä muun muassa siksi, että yleiskielen opetus ja käyttö koulussa sekä vieraiden kielten oppiminen on tehnyt d-äänteen tutuksi.
Sellaisissakin kielissä, joissa D-kirjain normaalisti tarkoittaa d-äännettä, se saattaa joissakin tilanteissa tarkoittaa d-äännettä. Slaavilaisissa kielissä normaalisti d-äännettä tarkoittava kirjain (latinalainen d tai kyrillinen д) ääntyy yleensä t-äänteenä sanan lopussa ja soinnittoman konsonantin edellä. Esimerkiksi venäjän sana водка on siirtokirjoitettuna vodka mutta lausutaan [vɔtkə]. Myös saksassa sananloppuinen D ääntyy [t].
D-kirjain ja -äänne tulivat suomen kieleen oikeastaan vahingossa. Yleiskieleen vakiinnutettiin t:n astevaihteluvastineeksi ensin kirjoitukseen ja sitten ääntämykseen vaihtoehto, joka ei ollut minkään murteen kannalla.
Yksinäiskonsonanttien astevaihtelu oli aiemmin oletettavasti säännöllistä: k ∼ ɣ, p ∼ β, t ∼ ð. Tässä on merkitty IPA-merkeillä äänteitä, joita ei esiinny nykysuomessa. Ne olivat todennäköisesti eräänlaisia soinnillisia hankausäänteitä; esimerkiksi ð oli samanlainen kuin th:lla merkitty äänne englannin sanassa the. Vielä Mikael Agricolan (n. 1510 – 1557) aikana ääntämys oli laajalti tällainen, ja hän tarkoitti merkinnöillä gh (tai g), b ja dh (tai d) yleensä äänteitä ɣ, β ja ð. Kun hän kirjoitti lughun ja taidhat, hän siis tarkoitti äänneasuja [luɣun] ja [taiðat]; näistä ovat syntyneet nykysuomen sanat luvun ja taidat.
Tässä käytetty äänteen merkki ð on IPA-järjestelmän mukainen. Monissa suomen kieltä kuvaavissa teksteissä sen sijasta käytetään delta-kirjainta δ, ja tällöin ð-kirjain voidaan varata toiseen merkitykseen: yksitäryisen r:n merkiksi.
Myöhemmin ääntämys muuttui suomen eri murteissa eri tavoilla. Erityisesti ð-äänne muuttui monissa läntisissä murteissa r- tai l-äänteeksi, kun taas itäisissä murteissa se yleensä katosi tai muuttui j:n tai v:n tapaiseksi siirtymä-äänteeksi Sana taidat esiintyy murteissa mm. muodoissa tairat, tailat, taiat ja taijat. (Tosin vanha ääntämys taiðat säilyi joillakin alueilla pitkäänkin.) Kirjakielessä kuitenkin säilytettiin vanha kirjoitusasu, ja sitä yhtenäistettiin: aiemmin oli käytetty yleensä dh:ta, joskus d:tä, mutta käytäntö yhtenäistettiin d:n kannalle. Yhtenäistämiseen vaikutti erityisesti vuoden 1642 raamatunsuomennoksen d-kanta.
Mahdollisesti Agricola käytti enimmäkseen dh:ta eikä d:tä siksi, että hän tunnisti ð-äänteen erilaiseksi vaikkakin hiukan samantapaiseksi kuin se d-äänne, jonka hän tunsi ruotsista, saksasta ja latinasta ja joka saattoi esiintyä myös ruotsista lainatuissa sanoissa suomen länsimurteissa. Kirjoitusasun muuttaminen hämärsi tätä eroa, ja kun ð-äänne oli kadonnut tai alkanut kadota, ruvettiin d-kirjain lukemaan d-äänteenä.
Tosin pienellä murrealueella länsirannikolla oli ð-äänne ilmeisesti kehittynyt d-äänteeksi, varmaankin osittain siksi, että murteessa jo oli d-äänne ruotsalaisperäisissä lainasanoissa. Yleiskielessä tapahtunut kehitys siis kuitenkin selittynee muilla syillä.
Vaikka 1800-luvulla tehtiin useita ehdotuksia d:n poistamisesta suomesta, monet merkittävät kielimiehet puolustivat d:n säilyttämistä. Yksi syy tähän oli varmaankin se, että hyviä vaihtoehtoja ei ollut. Mikä tahansa muu vaihtoehto olisi merkinnyt jonkin murteen kannalle asettumista ja olisi siksi kohdannut voimakasta vastustusta muiden murteiden kannattajilta – tuona murteiden taistelun aikana. Tosin ehdotettiin sellaistakin, että kirjoitetaan d mutta jokainen lausuu sen oman murteensa mukaan.
Yleiskieleen d-äänne ja -kirjain ovat nykyisin juurtuneet vahvasti. Osittain tähän vaikuttaa se, että t:n astevaihtelun muut vaihtoehdot ovat niin leimallisesti murteellisuuksia. Sanoitpa pyyrän tai pyyvän, sinut tunnistetaan murteenpuhujaksi; niinpä julkisessa esiintymisessä sanotaan pyydän, ellei erityisesti haluta puhua murretta.
Nykysuomessa d-kirjain ja -äänne esiintyy kolmenlaisissa tapauksissa:
Monissa kielissä on tapahtunut äänteenmuutos, joka on tavallaan vastakkainen edellä kuvatulle erikoiselle muutokselle ð → d suomen kielessä. Muun muassa tanskassa, espanjassa, portugalissa ja nykykreikassa on d:llä (tai kreikan δ:lla) merkitty äänne useissa tapauksissa kehittynyt ð-äänteeksi. Nykykreikassa tämä koskee d-äännettä yleisesti, kun taas espanjassa d:n ääntämys riippuu äänteellisestä ympäristöstä: se ääntyy d:nä tai ð:nä tai jää (usein sanan lopussa) kokonaan ääntymättä. Esimerkiksi nimi Madrid lausutaan espanjassa [maðˈrið] tai usein vain [maðˈri].
D-kirjaimesta on joukko tarkkeellisia muunnelmia, joista tavallisin on hattu-d. Erikoista on, että gemenana se näyttää d:ltä, jonka oikealla puolella on heittomerkki: ď. Versaalissa siinä on normaali hattu: Ď. Olisi tietysti mahdollista kutsua ď-kirjainta muulla nimellä kuin hattu-d:ksi, mutta käytetty nimitys kuvastaa sen ja vastaavan versaalikirjaimen vastaavuutta.
Poikkiviiva-d đ (Đ) on käytössä mm. kroatian kielessä. Kuten tarkkeiden esittelyssä luvussa 2 mainittiin, poikkiviivaa ei käsitetä tarkkeeksi, vaikka se on alkuperältään tarkkeisiin rinnastuva.
Eth ð (Ð) on mm. islannissa käytetty kirjain, joka tarkoittaa ð-äännettä. Se on historiallisesti samaa alkuperää kuin d-kirjain mutta käsitetään siitä täysin erilliseksi kirjaimeksi. Tosin ð on käytännön syistä tai tietämättömyyden takia usein korvattu d:llä mm. Suomessa kirjoitettaessa islantilaisia nimiä.
Hämmennystä ja sekaannuksia aiheuttaa, että poikkiviiva-d ja eth ovat käytännössä samannäköiset versaaleina vaikka varsin erilaiset gemenana. Samannäköisyydestä huolimatta ne ovat eri merkkejä, ja tällä on merkitystä mm. tietokoneohjelmien hakutoiminnoissa. Nimiä kirjoitettaessa on siis usein olennaista, kummasta Ð-merkistä on kyse. Yleensä tämä on pääteltävissä, jos tiedetään, mitä kieltä nimi on,
Matematiikassa käytetään usein d- tai D-kirjainta osoittamassa jonkinlaista erotusta eli differenssiä. Tämä johtuu latinan sanasta differentia ’ero, eroavuus, erotus’. Esimerkiksi merkintää df(x)/dx saatetaan käyttää f(x):n derivaatasta, joka on epämuodollisesti sanottuna ”äärettömän pienten erotusten osamäärä”, tarkemmin sanoen erotusten osamäärän raja-arvo.
Matematiikassa ja varsinkin fysiikassa käytetään myös d:n kreikkalaista vastinetta deltaa, tavallisesti versaalina (Δ), osoittamaan erotusta. Esimerkiksi ΔT tarkoittaa lämpötilan (suureen merkki: T) kahden arvon erotusta, käytännössä esimerkiksi lämpötilan muutosta tai kahden kappaleen lämpötilojen eroa. Käytäntö on levinnyt myös joidenkin ammattialojen puhekieleen: puhutaan esimerkiksi ”delta teestä”.
D-kirjaimella sellaisenaan on useita symbolimerkityksiä, kuten seuraavat:
E-kirjain on peräisin kreikan aakkosten epsilon-kirjaimesta ja versaalikirjaimena itse asiassa täsmälleen samannäköinen kuin se. Sen sijaan gemenakirjaimissa muodot ovat eriytyneet: meidän ”pientä e:tämme” vastaa kreikkalainen ”pieni epsilon” ε. Kumpikin näistä kirjaimista on syntynyt samasta versaalimuodosta mutta eri tavalla: toisaalta yläsakaroiden yhdistyessä ja muodon pyöristyessä sen jälkeen, toisaalta koko kirjaimen muotojen pyöristyessä.
Epsilonin nimi oli varhaisimpina aikoina ”e”; siihen myöhemmin lisätty jälkiosa tarkoittaa ’pelkkää’ ja viittasi alkujaan ehkä lyhyeen e-äänteeseen pitkän, eetalla (η) merkityn vastakohtana. Epsilonia käytetään nykyisin mm. matematiikassa merkitsemään ”mielivaltaisen pientä” suuretta. Epsilonista kehittynyt mutta siitä erillinen merkki on joukko-opin symboli ∈, joka tarkoittaa joukkoon kuulumista (”a ∈ A” luetaan ”a kuuluu joukkoon X”).
Epsilon puolestaan on kehittynyt muinaisseemiläisestä he-kirjaimesta 𐤄, jonka seuraajia ovat heprean he ה ja arabian hāʾ ح. He-kirjain oli, kuten alef-kirjainkin, konsonantin (h-äänteen) eikä vokaalin merkki, mutta kreikkalaiset ottivat sen e-äännettä tarkoittamaan, ikään kuin unohtaen kirjaimen nimen alussa olleen konsonantin. Kreikkalaiset eivät merkinneet h-äännettä ennen kuin myöhemmin, kun sen merkiksi kehitettiin eräänlainen tarke.
Epsilonin alkumuoto on ilmeisesti ollut ihmistä kädet pystyssä esittävä kuva. Myöhemmin muoto pelkistyi ja kuva kiertyi niin, että käsiä ja päätä esittävät viivat osoittivat joko vasemmalle tai oikealle. Venäjässä käytettyyn kyrilliseen kirjaimistoon on niistä kehittynyt kaksi erilaista kirjainta, Э ja Е. Niistä jälkimmäinen, nimeltään je, on sekä gemenana että versaalina täysin latinalaisen e:n näköinen. Nimensä mukaisesti se tarkoittaa joko äänneyhdistelmää je tai (konsonantin jäljessä) sellaista e:tä, jota edeltävä konsonantti on palatalisoitunut. Sen sijaan Э, suomenkieliseltä nimeltään käännetty e, vastaa äännearvoltaan yleensä melko tarkkaan meidän e:tämme.
On päätelty, että kreikkalaiset omaksuivat he-kirjaimen muodossa, joka oli suunnilleen meidän E:mme peilikuva eli jossa sakarat osoittivat vasemmalle. Kun kreikan kirjoitussuunta muuttui nykyisenkaltaiseksi (vasemmalta oikealle), sakarat ruvettiin piirtämään kirjoituksen suuntaan eli oikealle.
E:llä merkitään eri kielissä hyvinkin erilaisia äänteitä. Painottomana e saattaa ääntyä esimerkiksi švaa-vokaalina, ja esimerkiksi englannissa ja ranskassa sananloppuinen e jää yleensä kokonaan ääntymättä. Painollisenakin e ääntyy vaihtelevasti, ja monissa kielissä on olennainen ero esimerkiksi väljähkön (”avoimen”) ja tiukahkon (”suljetun”) e:n välillä. Eroa ei useinkaan osoiteta kirjoituksessa (esimerkiksi italiassa), mutta ranskassa ero osittain osoitetaan tarkkeilla.
Väljähköä e:tä äännettäessä suu ja ennen muuta ääntämiskanava – se, josta ilma virtaa ulos – on melko avoin. Tätä äännettä merkitään foneettisessa IPA-kirjoituksessa merkillä [ɛ], joka muistuttaa epsilonia ja on siitä kehitetty mutta määritellään erilliseksi merkiksi (small letter open e, U+025B). Suomalaisen korvissa väljähkö e kuulostaa usein lähes ä-äänteeltä. Se on tuttu monista ruotsin sanoista, sillä ruotsissa etenkin r-äänteen edellä e-kirjain ääntyy avoimena e:nä.
Vaikka suomen e yleensä kuvataan etuvokaaliksi, sen ääntämispaikka vaihtelee äänneympäristön mukaan melko paljon. Esimerkiksi sanassa kera se takavokaalin a vaikutuksesta ääntyy taempana kuin sanassa kerä. Vaihtelusta huolimatta e:tä voidaan foneettisesti pitää etuvokaalina, mutta vokaalisoinnun kannalta se (samoin kuin i) on ”neutraalinen”: se voi esiintyä sekä etu- että takavokaalisessa sanassa. Tämä ilmenee edellä mainituista esimerkeistäkin. Jos sanan vartalossa esiintyy vain vokaaleja e ja i, etuvokaalisuus hallitsee: vesi : vedessä, helmi : helmiä jne. Erikoisuutena esiintyy sekataivutusta, jossa osa muodoista on etuvokaalisia, osa takavokaalisia: meri : meressä : merta.
Monissa kielissä e:n ja muun vokaalikirjaimen yhdistelmä usein esittää äännettä, joka poikkeaa kummankin kirjaimen perusäännearvosta. Esimerkiksi englannissa ea edustaa tiukkaa ja pitkähköä i-äännettä.
Sananloppuinen e jää yleensä ääntymättä mm. englannissa ja ranskassa. Ranskassa kuitenkin sananloppuinen é ääntyy, joten akuutti on tällöin eräänlainen ääntyvyyden merkki.
Varsin usein e-kirjaimeen liittyy jonkinlainen tarke. Suomessakin esiintyy paljon ruotsalaisperäisiä sukunimiä, joissa on akuutti-e é. Akuutti osoittaa tällöin vokaalin painolliseksi (ja pitkähköksi). Usein samasta nimestä on käytössä sekä tarkkeeton että tarkkeellinen muunnelma, yleensä ilman ääntämyseroa, esimerkiksi Linden ja Lindén. Ruotsin kielessä é-kirjain esiintyy myös kielen varsinaisessa kirjoitusjärjestelmässä yleisnimissäkin, esimerkiksi sanassa idé.
Ranskassa taas akuutti-e é ääntyy aina suljettuna, gravis-e è ja sirkumfleksi-e ê taas avoimena. Unkarin kielessä é tarkoittaa pitkää suppeaa e:tä, tarkkeeton e taas lyhyttä avointa e:tä. Tarkkeiden merkitys on siis varsin kielikohtaista. Tarkkeita käsitellään luvussa 4 ja kielikohtaisesti luvussa 7.
E-kirjaimella sellaisenaan on useita symbolimerkityksiä kuten seuraavat:
Tietotekniikkaan liittyvissä muoti-ilmauksissa esiintyy usein alussa e-kirjain lyhenteen tai tunnuksen tapaisena, esimerkiksi e-asiointi tai eAsiointi. Näin matkitaan englannin kielen käytäntöä, jossa käytetään esimerkiksi ilmauksia e-mail (tai email, Email tms.) ja eBusiness, jolloin e-kirjain on periaatteessa lyhenne sanasta electronic ’elektroninen, elektroniikkaa käyttävä’. Kielitoimisto ei suosita suomen kieleen e-ilmauksia vaan sellaisia kuin sähköinen asiointi tai verkkoasiointi.
E:stä on kehitetty erilaisia erikoissymboleita, jotka tulkitaan omiksi merkeikseen, mm. seuraavat:
Euron merkki € (20AC), jonka tilalla Suomessa usein käytetään e-kirjainta. Euron merkin ajateltiin ensin olevan muodoltaan täysin kiinteä, kuvasymbolin kaltainen. Myöhemmin tajuttiin, että typografisista syistä se täytyy voida mukauttaa kunkin fontin luonteeseen. Tämän jälkeenkin monet pitävät euron merkin muotoa huonona, jopa rumana, mikä on yksi syy Suomessa melko yleiseen €:n korvaamiseen e:llä.
Arviomerkki ℮ (estimated sign, U+212E), vanhalta nimeltään EEC sign. Merkki on muodoltaan gemena-e:n kaltainen, mutta isompi ja paksuviivaisempi. Sitä käytetään Euroopassa tavaroiden paikkauksissa ilmoittamassa, että sisällön määrä ilmoitetaan määrätyt normit täyttävällä tarkkuudella. Esimerkiksi merkintä ℮ 0,75 L ilmoittaa, että sisällön määrä on 0,75 litraa siten, että todellinen määrä saa poiketa tästä vain direktiivin 76/211/EY salliman määrän.
Olemassaolo- eli eksistenssikvanttori eli olemassaolomerkki ∃ (there exists, U+2203) tarkoittaa logiikanssa ja matematiikan lausekkeissa olemassaoloa. Muodoltaan se on E:n peilikuva ja johtuu englannin sanasta exists ’on olemassa’.
Muinaiset roomalaiset omaksuivat F-kirjaimen etruskien kautta sellaisesta kirjoitetun kreikan muodosta, jossa oli digamma-niminen kirjain Ϝ v-äänteen merkkinä. Nimi tarkoittaa kaksoisgammaa ja johtuu kirjaimen muodosta, joka muistutti gammaa (Γ), jonka poikkiviiva on kahdennettu. Digamma ja v-äänne esiintyivät joissakin kreikan murteissa, mutta katosivat myöhemmin. (Nykykreikassa on taas v-äänne, mutta se on kehittynyt b- tai u-äänteestä ja sitä merkitään siksi beetalla β tai ypsilonilla υ.)
Koska roomalaisilla oli jo V-kirjain v-äänteen merkkinä, he rupesivat käyttämään digamman vastinetta F:ää läheisen äänteen f:n (v:n soinnittoman vastineen) merkkinä.
Kyrilliseen kirjaimistoon ei digamma päätynyt, vaan siinä f-äänteen merkkinä on kreikan fiistä Φ muodostettu kyrillinen ef Ф. Taustalla on se, että fiin ääntämys, joka oli alkujaan aspiroitunut p, oli kehittynyt f:ksi niihin aikoihin, kun kyrillinen aakkosto kehitettiin.
Keskiajalla kehittyi F:n gemenamuunnelma f, kun nopeassa kirjoituksessa F:n vasen yläkulma pyöristyi.
Sekä digamma Ϝ että ypsilon Υ olivat kehittyneet muinaisseemiläisestä wau-kirjaimesta 𐤅, joka oli alkujaan vain puolivokaalin [w] (= englannin kielen w) merkki mutta kehittyi myöhemmin myös pitkän u:n merkiksi. Kreikasta [w] puuttui, mutta kreikkalaiset käyttivät digammaa konsonantin [v] merkkinä ja ypsilonia vokaalien [u] ja [y] merkkeinä.
Wau-kirjaimen alkuperäinen muoto esitti ehkä nuijaa tai koukkupäistä keppiä. Wau-sanan merkityksen on päätelty olleen ’koukku’. Wau-kirjaimesta ovat kehittyneet heprean vav ו ja arabian waw و.
Äännearvoltaan f on useimmissa kielissä soinniton hankausäänne, joka syntyy, kun ilma kulkee alahuulen ja yläetuhampaiden väliin muodostetusta kapeasta raosta. Vastaava soinnillinen äänne on v-äänne, joka tosin suomessa usein ääntyy ilman selvää hankausta, kuten V-kirjaimen tarinassa kerrotaan.
F-äännettä merkitään monissa kielissä usein ph:lla. Tämän taustaa selitettiin C:n tarinassa kohdassa CH:n monet merkitykset. Suomen kieleen ph ei koskaan päässyt asettumaan. Sen sijaan moniin muihin kieliin se tuntuu juurtuneen niin, että ehdotukset korvata se f:llä ovat herättäneet voimakasta vastarintaa. Yleensä ph esiintyy f:n merkkinä vain kreikasta peräisin olevissa tai muinaiskreikan kautta kulkeneissa sanoissa, kuten englannin philosophy, triumph ja pharaoh.
Suomen kielessä f:ää käytetään fiin vastineena kirjoitettaessa sekä vanhan että uuden kreikan sanoja. Muissa kielissä sen sijaan saatetaan fiin tilalla käyttää ph:ta. Koska näin tehtiin myös latinassa, saattaa antiikin aikaisissa nimissä esiintyä vaihtelua kuten Sapfo ∼ Sappho.
F-kirjainta ja f-äännettä ei esiinny suomen omaperäisissä sanoissa, mutta vieraista äänteistä f-äänne on useiden arvioiden mukaan parhaiten sopeutunut suomen kieleen. Sen sanotaan jopa olevan lähellä äännejärjestelmämme ydintä. Tämä on ehkä kuitenkin liioittelua. Monelle suomalaiselle f-äänne tuottaa vaikeuksia, ja he lausuvat sen tilalla yleensä v-äänteen. Tämä saattaa heijastua vieraiden kieltenkin puhumiseen, jossa se häiritsee paljon enemmän kuin Forssan sanominen Vorssaksi.
Vanhoissa lainasanoissa f-äänne on yleensä muuttunut v-äänteeksi tai vokaalien välissä hv-yhdistelmäksi. Useimmiten tämä näkyy kirjoitusasussakin. Ruotsin far-sanaa vastaa suomen vaari, joskin merkitys on muuttunut, ja biff-sanasta on tullut pihvi.
Uudemmissa lainasanoissa on horjuntaa, koska useimmiten kirjoitetaan vielä asfaltti vaikka tavallisesti lausutaan asvaltti. Sivistyssanoiksi koetuissa sanoissa f-kirjain todennäköisesti säilyy: edelleen kirjoitetaan filosofia, ja näin pyritään lausumaankin; vain leikillisesti sanotaan vilosohvia.
Kirjainyhdistelmä fi on usein hiukan ikävän näköinen, koska f-kirjaimen kaari melkein osuu i-kirjaimen pisteeseen. Tämä tietysti riippuu fontista. Ongelman ratkaisemiseksi kehitettiin jo varhain ligatuureja eli kahden tai useammin kirjaimen ”yhteen valettuja” yhdistelmiä. Tällainen yhdistelmä suunniteltiin sellaiseksi, että kirjainten liittymä toisiinsa oli hallittua ja tyylikästä. Saatettiin esimerkiksi kaartaa f:n kaari ja paksuntaa sen päätä niin, että se muodostaa i:n pisteen. Lisäksi f:n poikkiviiva ja i:n ylempi pääteviiva voitiin suunnitella yhdeksi yhtenäiseksi viivaksi.
Ennen tietokoneaikaa kyse oli todella yhteen valetuista kirjaimista. Kirjapainoissa käytettiin metallisia kirjasimia, joissa olevat kohokuviot painoivat jäljen paperiin. Ligatuuri fi toteutettiin yhdellä kirjasimella. Käsinladonnan aikana piti tietysti latojan huomata ottaa laatikosta tällainen kirjasin silloin, kun tekstissä oli peräkkäin f ja i.
Useimmissa fonteissa esimerkiksi ligatuurin fi ja peräkkäin olevan f:n ja i:n ero on varsin pieni. Moni lukija ei asiaa lainkaan huomaa. Ligatuurien on tarkoituskin olla huomaamattomia. Silloinkaan, kun niitä ei käytetä, lukija ei yleensä tiedosta mitään ongelmaa fi-yhdistelmässä, mutta tekstin kokonaisvaikutelma ehkä hiukan häiriytyy jollakin epämääräisellä tavalla.
Ligatuureja käytetään joskus joissakin muissakin yhteyksissä. Jopa st-yhdistelmä saatetaan sitoa ligatuuriksi. Yleensä rajoitutetaan kuitenkin f:n ja i:n tai l:n yhdistelmiin. Jos f:ää edeltää toinen f, se yleensä otetaan mukaan ligatuuriin.
Koska f on melko harvinainen suomenkielisessä tekstissä, ei ligatuureilla ole suomessa niin suurta merkitystä kuin esimerkiksi englannissa. Niinpä on saattanut syntyä jopa sellainen käsitys, ettei niitä lainkaan käytettäisi suomessa. Kirjapainotasoisessa ladonnassa ne kuitenkin kuuluvat asiaan silloin harvoin, kun niitä tarvitaan.
Tietotekniikan aikana kirjasinta vastaa fonttiin kuuluva merkin esitys, glyyfi. Ligatuurien käyttö voi tapahtua automaattisesti siten, että ladontaohjelma toteuttaa tietyt merkkiyhdistelmät ligatuuriglyyfeillä, tai se voi vaatia ohjelman käyttäjän toimenpiteitä.
Tekstinkäsittelyssäkin on usein mahdollista käyttää ligatuureja esimerkiksi siten, että ligatuuri esitetään yhtenä merkkinä. Unicode-merkistöön on nimittäin otettu omat koodit eräille ligatuureille: fi (U+FB01), fl (U+FB02), ffi (U+FB03) ja ffl (U+FB04).
Tässä käsitelty ligatuurin käsite on erotettava sellaisista ”ligatuureista” kuin æ ja œ. Syntytapa on sama, mutta esimerkiksi æ:lle on varhain kehittynyt oma erityinen merkityksensä ja esimerkiksi tanskalaiset kokevat sen erityiseksi kirjaimeksi, ei kahden kirjaimen yhdistelmäksi. (Ks. ae-kirjaimen kuvausta luvussa 5.) Asioita hämärtää se, että sama yhdistelmä saattaa yhdenlaisessa käytössä olla erillinen kirjain, toisessa vain ulkoasusyistä käytetty ligatuuri.
Fysiikassa erilaisilla f-kirjaimilla on vakiintuneita merkityksiä:
Yhdysvalloissa käytettyyn lämpötila-asteikkoon, Fahrenheitin asteikkoon, liittyy tunnus °F, joka koostuu asteen merkistä ja F-kirjaimesta. Käytännön syistä sen sijasta kirjoitetaan usein pelkkä F. Tunnus °F luetaan suomessa ”fahrenheitaste”.
Matematiikassa f-kirjainta käytetään, tavallisesti kursivoituna (f), hyvin usein funktion yleisenä merkkinä. Tämä johtuu tietysti sanan funktio alkukirjaimesta. Kun tarvitaan useita funktion yleisiä merkkejä, käytetään tavallisesti f:n jälkeisiä kirjaimia g ja h, mutta tarpeiden lisääntyessä otetaan yleensä käyttöön alaindeksit (f1, f2 jne.) ja joissakin yhteyksissä versaalit (F ym.).
Alkujaan latinassa käytettiin C-kirjainta myös g-äänteen merkkinä. Kuten C:n tarinassa kerrottiin, asian voisi oikeastaan sanoa toisin päin: C-kirjain kehittyi kreikan gammasta (Γ), joka tarkoitti g-äännettä, mutta sitä ruvettiin käyttämään myös k-äänteen merkkinä joissakin tilanteissa.
Myöhemmin tilanne koettiin hiukan ongelmalliseksi, ja g-äänteelle kehitettiin vuoden 4. tai 3. vuosisadalla eKr. oma merkkinsä lisäämällä C:hen pieni lisäviiva. Lisäviiva saatettiin muodostaa jatkamalla C:n alakaarta suorana ylös, mutta selvempi vaikutus saatiin, kun viiva vedettiin vasemmalle. Uudistuksessa C-kirjain jäi vain k-äänteen merkiksi.
Uudistuksen isä oli historioitsija Plutarkhoksen mukaan opettaja Spurius Carvilius Ruga. On mahdollista, että G:n kehitti jo Appius Claudius Caecus (n. 340 – 273 eKr.), joka tunnetaan nykyisin parhaiten Via Appian rakennuttajana.
Olisi ollut luonnollista sijoittaa G aakkostoon heti C:n jälkeen, mutta jostain syystä se sijoitettiin myöhempään kohtaan. Kenties koettiin, että kreikan aakkostossa olleen zeeta-kirjaimen Ζ paikka oli jäänyt vapaaksi, koska zeetalla ei vielä silloin ollut vastinetta latinassa. (Myöhemmin zeeta lainattiin latinan aakkostoon, sen loppuun, kuten Z:n tarinassa kerrotaan.)
Latinan vanha kirjoitustapa, jossa C oli myös g-äänteen merkki, näkyy vielä etunimien lyhenteissä C. = Gaius ja Cn. = Gnaeus. Roomalaiset käyttivät vain pientä määrää erilaisia etunimiä, ja nimen muut osat olivat julkisessa elämässä tärkeämpiä kuin etunimet. Siksi etunimistä kirjoitettiin vain alkukirjaimet. Piirtokirjoituksissa esimerkiksi Julius Caesar esiintyy muodossa IMP·C·IVLIVS·CAESAR·DIVVS, joka luetaan ”imperator Gaius Iulius Caesar divus”, ’imperaattori (= ylipäällikkö) Gaius Julius Caesar, jumala(inen)’.
Versaali-G:stä kehitettiin keskiajalla gemena-g, joka esiintyy eri muodoissa, jotka kaikki poikkeavat versaalimuodosta melkoisesti. Kehityksessä oli useita vaiheita, mutta se voidaan lyhyesti kuvata seuraavasti: G:n kirjoittamisen aloituspiste (ylhäällä oikealla) siirtyi alemmas, ja toisaalta lopussa, G:n koukun kohdalla, liike pyöristyi ja toisaalta jatkui; näin syntyi kaksi toisiaan koskettavaa, sulkeutuvaa kaarta.
Gemena-g:n muoto vaihtelee paljon fontin mukaan. Vanhoissa kirjapainofonteissa on yleensä, kaksisilmukkainen muoto, monissa uusissa fonteissa pelkistetympi yksisilmukkainen. Muutamissa fonteissa on molemmat muodot siten, että valinta niiden välillä tehdään OpenType-fonttitekniikalla.
Cambrian ja Arialin g (samassa fonttikoossa).
Kyrillinen gee, joka on latinalaisen g:n äänteellinen vastine, on säilyttänyt kreikkalaisen gamman muodon: Γ. Kyrillinen gemena-gee on saman merkin pienennetty muoto: г.
Kyrillinen gee ei kuitenkaan aina äänny meidän g-äänteemme tavoin. Esimerkiksi venäjässä yleisissä sananlopuissa -ого ja -его se vääntyy v-äänteenä. Tämän takia nämä loput usein siirtokirjoitetaan -ovo ja -evo, vaikka oikea menettely on kirjaimittainen: -ogo ja -ego.
Monissa venäjän ääntämistavoissa kyrillisen geen ääntämys vastaa suomen h-äännettä. Tämä selittää esimerkiksi sellaiset venäjässä aiemmin käytetyt kirjoitusasut kuin Гельсингфорс, joka on ruotsinkielinen nimi Helsingfors venäläisittäin kirjoitettuna. Lisäksi venäjässä korvataan esimerkiksi saksalaisten nimien h-äänne geellä, esimerkiksi Гитлер ’Hitler’. Ymmärrettävästikin syntyy virheitä, jos tällaiset nimet siirretään latinalaiseen kirjaimistoon yleisten translitteraatiosääntöjen mukaan: gee korvautuu g:llä.
Latinassa G-kirjain oli normaalisti g-äänteen eli soinnillisen velaariklusiilin merkki. Tämä äänne on lähinnä k:n soinnillinen vastine, joskin ääntämiskohta on g:ssä hiukan taaempana.
IPA-merkistössä g-äänteen suositeltu merkki on [ɡ] (U+0261, Latin small letter script g), jossa alas ulottuva osa on kaari eikä muodosta silmukkaa kuten tavallisen g-kirjaimen alaosa useissa fonteissa muodostaa. Tavallisen g-kirjaimen käyttökin on kuitenkin sallittua.
Sellaisissakin kielissä, joissa G-kirjain normaalisti tarkoittaa g-äännettä, se saattaa joissakin tilanteissa tarkoittaa k-äännettä. Slaavilaisissa kielissä voi normaalisti g-äännettä tarkoittava kirjain (latinalainen g tai kyrillinen г) ääntyä k-äänteenä sanan lopussa ja soinnittoman konsonantin edellä. Myös saksassa sananloppuinen G ääntyy [k] eli esimerkiksi yleinen sananloppu -burg ääntyy [burk].
Suomessa g-kirjain esiintyy toisaalta yhdistelmässä ng niin sanotun äng-äänteen merkkinä, jota käsitellään jäljempänä, ja toisaalta periaatteessa g-äänteen merkkinä nuorehkoissa lainasanoissa. Murteille g-äänne on vieras, lukuun ottamatta joitakin läntisimpiä ja itäisimpiä murteita, joihin ruotsi tai venäjä on vaikuttanut. Niissäkin g käytännössä ääntyy usein pikemminkin soinnittomana g:nä (kuten virossa) kuin varsinaisena soinnillisena g:nä.
Kuten b ja osittain d:kin, g ääntyy suomessa usein vain osittain soinnillisena, kuten b:n tarinassa kerrottiin. Se saattaa siis olla lähellä k-äännettä. Käytännössä g usein luetaan jopa täysin samanlaisena kuin k: gorilla lausutaan kuten korilla. Julkisesti esiintyviltä kuten uutistenlukijoilta saatetaan kiivaastikin vaatia huoliteltua g:n ääntämistä, mutta tavallisessa puheessa gramma ääntyy suunnilleen kuten kramma.
Tämä taipumus kannattaa ottaa huomioon vieraita kieliä opiskeltaessa. Suomea puhuttaessa ei synny suuriakaan ongelmia siitä, ettei tee selvää eroa k:n ja g:n välillä, mutta englannissa, ruotsissa ja useimmissa muissa kielissä ero on olennainen. Ero tehdään ääntämällä g selvästi soinnillisena ja toisaalta monissa kielissä, kuten englannissa, ääntämällä k-äänne aspiroituneena, jopa niin, että se kuulostaa lähes kh:lta.
Vanhoissa kirjoitetun suomen muodoissa käytettiin yleisesti gh-yhdistelmää ja joskus g-kirjainta tavallisissa suomen sanoissa. Kirjoitettiin esimerkiksi lughun tai lugun eikä luvun, jalghan eikä jalan jne. Todennäköisesti kyseessä ei kuitenkaan ollut g-äänne, vaan senaikaisessa kielessä käytetty hankausäänne eli frikatiivi, jonka foneettinen IPA-merkki on [ɣ].
[ɣ] muistuttaa g:tä, mutta kielen takaosa ei kosketa kitalakea niin, että ilmavirta kokonaan katkeaa vaan vain lähestyy sitä, muodostaen ahtauman, jolloin kuuluu hankausta muistuttava äänne. Esimerkiksi espanjan kielessä g-kirjain ääntyy tällaisena äänteenä, ”pehmeänä g:nä”, monissa äänteellisissä yhteyksissä, esimerkiksi sanoissa lago, Málaga ja peligro.
Suomen kirjakielen synnyn aikoihin k:n astevaihtelu oli ilmeisesti vielä melko yksinkertaista siten, että k:n heikon asteen vastineena oli [ɣ]. Myöhemmin tapahtui äänteellisiä muutoksia, joissa [ɣ] korvautui muilla äänteillä (v:llä tai j:llä) tai katosi kokonaan. Kirjoitusasua muutettiin vastaavasti. Niinpä k:n astevaihtelussa on nykyisin monia tapauksia: luku : luvun, kulkea : kuljen, jalka : jalan, koko : koon.
Muutokset johtivat eri murteissa osittain erilaisiin tuloksiin. Niinpä lännessä sanotaan härjät, idässä härät. Yleiskieleen vakiinnutettiin joihinkin sanatyyppeihin läntinen, joihinkin itäinen kanta.
Kehitys oli siis toisentyyppinen kuin D:n tapauksessa, jossa lähtötilanne oli samantapainen. Miksei gh:ta tai g:tä ruvettu lukemaan g-äänteenä samaan tapaan kuin dh tai d ruvettiin lukemaan d-äänteenä? Kenties syynä on se, että d-äänne mahtui suomen äännejärjestelmään paremmin, koska t- ja d-äänteellä on melko selvä ero muutenkin kuin soinnillisuudessa. Lausuttaessa d:tä kielen kärki on selvästi taaksepäin taipunut sen sijaan, että se koskettaisi hampaita. Sen sijaan k- ja g-äänteen ero on lähinnä vain soinnillisuudessa, ja sellainen ero suomalaisen oli vaikea tehdä.
Suomessa ng-yhdistelmä on yleensä nk:n vastine astevaihtelussa, esimerkiksi kenkä : kengän, ja tarkoittaa kaksois-äng-äännettä. Tässäkin yhteydessä g on alkujaan ollut [ɣ]-äänteen merkki, mutta g säilyi kirjoitusasussa, koska äng-äänteellä ei ole omaa merkkiään. Aiheesta kerrotaan lisää N:n tarinassa.
Kirjainyhdistelmä GN ääntyy eri kielissä eri tavoin, osittain saman kielenkin eri sanoissa eri tavoilla. Latinassa se (ja varhaisempi CN) ääntyi mahdollisesti aluksi kirjaimittain, [gn]. Tutkijat pitävät kuitenkin todennäköisempänä, että klassisessa latinassa ääntämys oli sellainen, että g ääntyi äng-äänteenä: [ŋn]. Latinan tytärkielissä ja latinasta sanoja lainanneissa kielissä ääntämys yleensä muuttui, mutta ruotsissa ja sen vaikutuksesta suomessakin ääntämys on yleensä [ŋn]. Tämän mukainen ääntämys on säilynyt monissa kielissä ja päätynyt ruotsin kautta suomeenkin.
Muun muassa englannissa GN luetaankirjaimittain. Sen vaikutuksesta tapa on yleistynyt suomeenkin. Siksi signaali voi ääntyä [siŋnɑːli] tai [signɑːli]. Sanan alussa (esim. gneissi, gnu) GN ääntyy suomessa aina [gn] eikä [n] kuten englannissa.
Toisaalta esimerkiksi italiassa ja ranskassa ääntämykseksi kehittyi palataalistunut n eli [ɲ], jota voidaan karkeasti kuvata yhdistelmällä ”nj” (ks. N-kirjaimen tarinaa).
Latinasta kehittyneissä kielissä on usein tapahtunut äänteenmuutoksia tilanteissa, joissa g-äänne oli etuvokaalin (e, i tai y). Tämä on verrattavissa C-kirjaimen tarinaan melko pitkälle. C:llä merkitty k-äänne kehittyi aluksi affrikaataksi [ʧ] (ääntyy kuten englannin ch, suunnilleen kuin suomen tš), kun taas G:llä merkitty k:n soinnillinen vastine kehittyi vastaavaksi soinnilliseksi affrikaataksi [ʤ] (ääntyy kuten englannin j, suunnilleen kuin suomen dž). Muutos ei ilmeisesti kuitenkaan tapahtunut yhtä laajasti ja johdonmukaisesti, ja myös jatkossa on eroja.
Mm. italiassa ja romaniassa affrikaattaääntämys säilyi, kun taas ranskassa se yksinkertaistui soinnilliseksi suhu-s:ksi [ʒ] (ž). Espanjassa ja portugalissa taas kehitys johti samaan hankausäänteeseen kuin j-äänteen kehitys: [χ] (soinniton kitakielekkeellä tuotettava hankausäänne). Saksan kielen latinalaisperäisissä lainasanoissa taas g ääntyy g-äänteenä myös e:n ja i:n edellä, ehkä osittain kirjoitusasun vaikutuksesta, osittain taas siksi, että latinan alkuperäinen g:n ääntämys säilyi joillakin alueilla.
Englannin kielessä g-kirjaimen ääntämys etuvokaalin edellä on melko kirjavaa, koska kirjain on eri sanoissa eri alkuperää. Latinasta tai kreikasta peräisin olevissa sanoissa (esim. general, geology, magic) g ääntyy e:n, i:n ja y:n edellä yleensä edellä mainittuna affrikaattana, siis samoin kuin englannin j. Sen sijaan englannin vanhemmassa, germaanisessa sanastossa (esim. get, give) g on yleensä g-äänteen merkki myös e:n ja i:n edellä.
Myös muualla kuin etuvokaalien edellä on g:n ääntämys saattanut muuttua. Espanjassa ja katalaanissa g on useissa asemissa a:n, o:n, u:n ja konsonanttien edellä kehittynyt spirantiksi [ɣ]. Sitä sanotaan joskus pehmeäksi g:ksi, ja hiukan pehmeän vaikutelman se antaakin, koska toisin kuin g:ssä, ilman kulku ei katkea vaan vain muuttuu hankaavaksi. Nimitys ”pehmeä g” on kuitenkin ongelmallinen, koska sillä usein tarkoitetaan edellä mainittuja ääntämyksiä etuvokaalin edellä.
Fysiikassa G-kirjaimella on eräitä symbolimerkityksiä:
Tunnusten symbolit g ja G johtuvat uuslatinan sanasta gravitatio ’painovoima’. Arkikielessä puhutaan usein niin ja niin monen g:n kiihtyvyydestä tai voimasta; varsin usein tällöin g kirjoitetaan ilman kursivointia ja ehkä versaalilla (g, G). Tällöin tarkoitetaan, että kiihtyvän liikkeen – kuten lentokoneen liikkeellelähdössä tai putoamisessa – liikkuvassa esineessä olevaan kohteeseen (yleensä ihmiseen) kohdistama voima on niin-ja-niin monta kertaa niin suuri kuin g.
G-pisteeksi kutsutaan naisen emättimen etupuolella sijaitsevaa kohtaa, jonka on päätelty vaikuttavan seksuaaliseen kiihottumiseen. Alkuperäinen nimitys oli ”Gräfenbergin piste”. Vaikka Ernest Gräfenberg julkaisi asiaa koskevan tutkimuksensa jo vuonna 1950, ajatus G-pisteestä tuli yleisempään tietoisuuteen melko hitaasti.
Versaali-H on muodoltaan samanlainen kuin kreikan versaali-eeta, joka tarkoitti muinaiskreikassa pitkää e-äännettä ja on nykykreikassa kehittynyt lyhyeksi i:ksi.. Kreikassa eeta tarkoitti ilmeisesti vaihtelevasti tavua hee (h ja pitkä e), konsonanttia h ja pitkää e-vokaalia. Kirjaimen nimikin oli ilmeisesti alkujaan heeta. Näistä merkityksistä kuitenkin vain konsonanttimerkitys lainautui kreikasta etruskeille ja näiltä edelleen roomalaisille.
Gemena-h syntyi keskiajalla, kun kirjoituksen nopeuttamiseksi jätettiin yksi viivoista pois ja kulmaa pyöristettiin. Eetasta kehitetty gemenakirjain puolestaan on melko erinäköinen, ja sen voi ajatella syntyneen, kun yläviivat jätettiin pois ja oikeaa alaviivaa pidennettiin: η.
Kyrillisessä kirjaimistossa H:lla ei ole vastinetta. Siinä tosin on aivan versaali-H:n näköinen merkki (Н, gemenana н), mutta se on samaa alkuperää kuin N-kirjain ja toimii n-äänteen merkkinä. Toisaalta niissä kyrillisin aakkosin kirjoitetuissa kielissä, joissa on h-äänne, sille on kehitetty kirjain muulta pohjalta, esimerkiksi ukrainassa Г.
Suomalaisessa venäjän siirtokirjoituksessa taas h-kirjain vastaa kyrillistä Х-kirjainta, jonka äännearvo on [x] (velaarinen frikatiivi). Toisaalta kuin suomen sanoja kirjoitetaan venäjässä, käytetään suomen ja monen muun kielen h:n vastineena milloin Х-kirjainta, milloin Г-kirjainta. Suoraa äännevastinetta ei ole, ja voidaan tulkita eri tavoin, mikä on lähin vastine. Niinpä Helsingin nimi on nykyvenäjäksi Хельсинки, mutta vanhemmassa kielessä esiintyy yleisesti ruotsinkielisestä Helsingfors-nimestä muodostettu Гельсингфорс.
Kreikan eeta oli kehittynyt seemiläisestä het-kirjaimesta 𐤇, jonka nimi mahdollisesti tarkoitti aitaa. Versaali-eetassa (ja sen kaltaisessa latinalaisessa H:ssa) voi vielä hyvin kuvitella olevan aidan muotoa. Het tarkoitti kurkkuäännettä (nieluntauksessa ääntyvää hankausäännettä), kuten sen seuraajat heprean het ח ja arabian hāʾ ح,
Kreikassa eeta vähitellen vakiintui tarkoittamaan pelkkää pitkää e-vokaalia. Tämän yksinkertaistumisen hinta oli, että h-äänne jäi ilman merkkiä. Sille saatiin merkki ikään kuin pilkkomalla H vasempaan ja oikeaan puoliskoon ja muokkaamalla näistä ns. spiritus-merkit. Niitä kutsutaan perinteisesti latinankielisillä nimillä spiritus asper ’vahva henkäys’ ja spiritus lenis ’heikko henkäys’, joista ensin mainittu oli h-äänteen merkki ja toinen ilmeisesti vailla äännearvoa; sitä ehkä ruvettiin käyttämään vain selvyyden vuoksi. Nykykreikankieliset nimet ovat dasia ja psili.
Spiritus asper (῾), siis h:n merkki, muistuttaa käännettyä heittomerkkiä, spiritus lenis (᾿) taas heittomerkkiä. Vokaalialkuiseen sanaan kirjoitettiin vanhassa kreikassa aina – spiritusmerkkien tultua käyttöön – jompikumpi niistä. Se kirjoitettiin gemenavokaalin päälle (esim. ὡ, ὠ), versaalivokaalin vasemmalle puolelle (esim. Ὡ, Ὠ). Spiritus asper kirjoitettiin myös sananalkuisen rhoo-kirjaimen yhteyteen (ῥ, Ῥ); ks. R:n tarinaa.
Spiritus-merkkejä käytettiin pitkään uudelle ajalle asti, vaikka niillä ei enää ollut mitään merkitystä ääntämyksessä, kun h-äänne hävisi kreikasta. Vasta 1970-luvulla nykykreikan kirjoitusjärjestelmän uudistuksessa luovuttiin spiritusmerkeistä.
Latinassa H-kirjain oli periaatteessa äännearvoltaan samanlainen kuin suomen h, siis laryngaalinen frikatiivi eli kurkunpäässä (tai hiukan edempänä) muodostettava hankausäänne. Käytännössä se ääntyi varmaankin usein melko heikosti ja saattoi hävitäkin ainakin maaseutumurteissa. Sama ilmiö on toistunut usein myöhemminkin monissa kielissä: h on herkkä katoamaan. Onhan suomestakin monista muodoista kadonnut vokaalienvälinen h (esimerkiksi kalahan → kalaan). Englannin kielessä on muutamia tavallisia sanoja kuten honour, joissa h on säilytetty kirjoitusasussa mutta hävinnyt puheesta. Tämä johtuu siitä, että sana on lainautunut ranskasta, jossa tällainen tilanne on normaali.
H:n häviämistaipumus heijastui jossain määrin myös latinan kirjoitukseen. Esimerkiksi hiekkaa tarkoittava sana kirjoitettiin milloin harena, milloin arena, kunnes tähän sanaan vakiintui h:ton asu. Useimmissa tapauksissa h säilyi kirjoitusasussa, ja tällöin se saattoi puheesta kadottuaan myös palata ainakin sivistyneeseen ääntämykseen, joka yritti noudattaa kirjoitusta.
Latinasta kehittyneissä romaanisissa kielissä h-äänne yleensä katosi, mutta kirjoituksessa silti usein säilyi h-kirjain. Esimerkiksi latinan sanan homo (oikeastaan sen akkusatiivimuodon hominem) ’ihminen’ seuraajat romaanisissa kielissä ovat melko erilaisia, kuten ranskan homme, espanjan hombre, portugalin homem ja italian uomo, ja siis usein alkavat kirjoitettuina h:lla, mutta missään niistä ei ole ääntyvää h:ta. Toisaalta h:lle tuli uudenlaista käyttöä kirjoituksen apumerkkinä, kuten jäljempänä kuvataan.
Yhdenlaista ääntämisen heikkoutta ehkä kuvastaa sekin, että suomessa sananalkuinen h ei useinkaan kahdennu sellaisessa puheessa, jossa muutoin sananalkuinen konsonantti kahdentuu eräissä tilanteissa (ns. loppukahdennus). Lause mene pois lausutaan monissa murteissa ja myös normienmukaisessa yleiskielessä menep pois, mutta lauseen mene heti ääntämys meneh heti on harvinaisempi.
Ranskan kielessä ei ole h-äännettä eikä h-kirjain vaikuta ääntämykseen, paitsi että yhdistelmällä ch on erikoismerkitys. Kirjoitusasussa on kuitenkin yleensä säilytetty latinasta tai muusta kielestä peräisin oleva h, vaikka kirjoitusasu olisi muuten muuttunut paljonkin; esimerkiksi latinan sanasta hora ’tunti’ on ranskassa päädytty sanaan heure.
Ranskassa kuitenkin erotetaan toisistaan h muet ’mykkä h’ ja h aspiré ’henkäistävä h’ sanan alussa, vaikka kummassakaan tapauksessa h ei äänny. Koska h aspiré, joka esiintyy yleensä germaanisista kielistä peräisin olevissa sanoissa, esimerkiksi hareng ’silli’, ääntyi ranskan kielen aiemmassa vaiheessa, se vaikuttaa vielä sanojen yhdistelmissä. Niinpä esimerkiksi prepositiosta de ei vokaali katoa sen edellä, vaan kirjoitetaan esimerkiksi de hareng. Sen sijaan h muet esiintyy yleensä latinasta tai kreikasta peräisin olevissa sanoissa ja hävisi ääntämyksestä jo ennen kuin ranska muodostui omaksi kielekseen. Niinpä sillä alkava sana käyttäytyy täysin vokaalialkuisen sanan tavoin, ja esimerkiksi prepositio yhdistyy sen kanssa: d’heure.
Loogista olisi käsitellä esimerkiksi suomalaisia h-alkuisia nimiä ranskassa niin, että niiden alussa on h aspiré. Onhan niissä h-kirjain todella ääntyvä ainakin jos noudatetaan suomen ääntämystä. Kuitenkin useimmiten kirjoitetaan esimerkiksi d’Helsinki eikä loogisemmin de Helsinki.
Monissa kielissä vokaalin jälkeinen h sanan lopussa tai konsonantin edellä ei äänny vaan vain osoittaa edeltävän vokaalin pitkäksi, esimerkiksi saksan sanoissa Kuh ja Sahne. Tällainen käytäntö on osittain syntynyt siitä, että sanassa on aiemmin ollut h-äänne, mutta se on heikentynyt ja kadonnut samalla kun vokaali on pidentynyt. Syynä on kuitenkin voinut olla myös se, että h-äänne on suhteellisen heikko ja sillä on siten voitu merkitä myös ”kuvitteellista konsonanttia”, joka ilmenee vain vokaalin pidentymisenä.
Käytäntö ei kuitenkaan ole järjestelmällinen. Usein tällaista h:ta käytetään myös silloin, kun vokaali muutenkin voidaan päätellä pitkäksi kielen kirjoitusjärjestelmän mukaan. Kirjoitusasuun saattaa jäädä h varsinkin nimiin tai h saatetaan jopa lisätä nimeen, jotta se näyttäisi vanhemmalta ja hienommalta. Näin on nimestä Stål saatettu tehdä Ståhl.
Englannin kielessä käytetään usein sananloppuista h:ta vastaavassa tarkoituksessa, esimerkiksi hurrah. Tällöin h osoittaa ennen muuta sitä, että loppuvokaali ääntyy täytenä vokaalina eikä lyhyenä švaa-vokaalina (foneettinen merkki [ə]) kuten yleensä. Toissijaisesti se usein osoittaa myös vokaalin pitkäksi. Kun englanninkielisessä tekstissä esiintyy esimerkiksi nimiä, jotka ovat peräisin muuta kuin latinalaista aakkostoa käyttävästä kielestä, on suomennettaessa erikseen selvitettävä, kuuluuko loppu-h todella nimeen vai onko se vain englanninmukainen kirjoitustapa.
Yleensä h-äänne kuvataan soinnittomaksi. Siitä on myös soinnillinen muunnelma, joka suomessa esiintyy etenkin vokaalien välissä (esimerkiksi sanassa vaha) ja jota tarkassa foneettisessa kirjoituksessa merkitään IPAssa merkillä [ɦ]. Käytännössä esiintyy myös erilaisia välimuotoja.
Suomalaiset käyttävät usein hh-yhdistelmää silloin, kun vieraan sanan alkuperäisessä muodossa on esimerkiksi saksan ch:lla merkitty ach- tai ich-äänne taikka jokin muu h:ta hiukan muistuttava äänne, ”kova h” tai ”vahva h”. Esimerkiksi Aachen äännetään lähinnä Aahhen, München kai lähinnä Mynhhen tai Mynjhhen jne. Vastaavasti venäläinen nimi Saharov saatetaan lausua suunnilleen Saahharov. Nämä ovat suomenkielisessä puheessa aivan hyväksyttäviä tapoja, mutta niitä ei pidä luulla saksan, venäjän ja muiden kielten mukaisiksi.
Sananloppuinen h-äänne on kyllä täysin mahdollinen, kuten vaikkapa suomen huudahdussana huhhuh osoittaa, mutta kovin tavallinen se ei maailman kielissä ole. Useimmiten sananloppuinen h-kirjain on ääntymätön, joskin se saattaa osoittaa edellisen vokaalin pitkäksi (kuten saksassa) tai vain osoittaa, että vokaali ääntyy (kielessä, jossa sananloppuinen vokaali on usein mykkä).
Suomen kielen taivutukselle sananloppuinen h tuottaa ongelmia, sillä jos sitä ei äännetä, on taivutuspäätteen kirjoittaminen hankalaa. Periaatteessa tulisi kirjoittaa heittomerkki h:n ja päätteen väliin ja pääte tulisi kirjoittaa ääntämyksen mukaisesti. Tähän perustuu muun muassa kielenhuollon suosittama nimen Aceh [ɑʧe] taivutus: Aceh’n : Aceh’ssa : Acheh’een. Niin ei kyllä kirjoiteta, eikä suosituksella liene mitään mahdollisuuksia päästä käyttöön. Yleisesti h-loppuiset sanat taivutetaan niin, että h ääntyy, vaikka se ei alkukielessä ääntyisikään, esimerkiksi Savannahissa eikä Savannah’ssa, Sarahin eikä Sarah’n. Käytännössä loppu-h usein ääntyy perusmuodossakin.
Toisaalta sananloppuinen h johtuu melko usein englanninkielisten kirjoitusasujen tunkeutumisesta suomen kieleen. Esimerkiksi arabiasta peräisin olevissa sanoissa ei loppu-h aina kuulu sanan oikeaan suomalaiseen kirjoitusasuun vaan johtuu vain siitä, että kääntäjät ovat käyttäneet englanninmukaista asua, jossa h osoittaa lähinnä loppuvokaalin pituutta. Esimerkiksi sanaan ajatollah kuuluu loppu-h, mutta mullah on virheellinen asu; oikea on mulla.
Konsonantin jäljessä oleva h osoittaa usein jonkinasteista aspiraatiota. Tällä tarkoitetaan konsonantin ääntämyksen ”laukeamista” niin, että ilmavirta syöksyy nopeasti ulospäin, mikä saatetaan kuulla h-maisena henkäyksenä. Esimerkiksi kun th-yhdistelmä ääntyy tällä tavoin aspiroituneena t:nä, sitä merkitään IPAssa [tʰ]. Suomalaisen voi olla vaikeaa erottaa tätä yhdistelmästä [th], joka esiintyy esimerkiksi suomen sanassa olethan. Ero voi kuitenkin olla tärkeä, kun halutaan puhua vieraita kieliä hyvin.
Tällainen merkintätapa sai alkunsa, kun muinaiset roomalaiset rupesivat käyttämään kirjainpareja CH, PH ja TH kreikan aspiroituneiden konsonanttien merkkeinä, kuten C:n tarinassa kerrottiin. Latinankielisiä sanoja luettaessa on Suomessa nykyisin tapana lukea CH, PH ja TH kuten K, F ja T, mutta muitakin käytäntöjä on. Eri kielissä on muutenkin paljon vaihtelua. Yhdistelmä th voi tarkoittaa aspiroitunutta t:tä, t:n ja h:n yhdistelmää, pelkkää t:tä tai dentaalispiranttia kuten englannissa. Esimerkiksi nykysaksassa CH tarkoittaa ns. ach- tai ich-äännettä, PH tarkoittaa f-äännettä eikä TH:ta pitäisi käyttää enää lainkaan, sillä vuoden 1901 oikeinkirjoitusuudistuksessa se korvattiin ääntämyksenmukaisella T:llä. Vanhakin kirjoitustapa (esimerkiksi Neanderthal, nykyisin Neandertal) on kuitenkin säilynyt yli sadan vuoden ajan joissakin yhteyksissä.
Vanhassa kirjasuomessa esiintyy melko usein h-kirjain c:n ja varsinkin t:n jäljessä, esimerkiksi perchele, näeth. Tällöin ei tarkoitettu aspiraatiota, vaan haluttiin vain selvemmin erottaa soinniton äänne k tai p soinnillisesta g:stä tai d:stä. Yhdistelmässä dh ja gh taas oli kyse pyrkimyksestä kuvata hankausäännettä eli spiranttia, kuten D:n ja G:n tarinoissa kerrottiin.
Yleisesti kannattaa välttää sanan jakamista konsonantin ja h:n välistä, vaikka tietokoneohjelmat usein tekevät niin. Useimmiten kyseisessä kohdassa ei ole tavunrajaa, vaan konsonantin ja h:n yhdistelmä on yhden äänteen merkki. Asiasta ei voi olla täysin varma tuntematta sitä kieltä, johon sana kuuluu, mutta epäselvässäkin tilanteessa on parempi tavuttaa esimerkiksi Pan-thera eikä Pant-hera (ellei tavuttamista voi kokonaan välttää).
I-kirjain on kehittynyt kreikan aakkoston ioota-kirjaimesta, joka versaalina on täysin I:n näköinen. Gemenamuodoissa on eroa, koska ne ovat kehittyneet toisistaan riippumatta eri kulttuuripiireissä.
Gemena-i oli aluksi yksinkertainen pystyviiva, siis pienennetty versaali-I. (Tässä ei oteta huomioon viivan päissä ehkä olevia pieniä poikkiviivoja, jotka ovat fonteista riippuvia yksityiskohtia.) Vasta 1200-luvulla gemena-i sai pisteensä, joka yksinkertaistui akuutin kaltaisesta aksenttimerkistä (suunnilleen í). Tarkoituksena oli saada i erottumaan paremmin tekstistä, jossa on paljon pystyviivoja mm. m-, n- ja u-kirjaimissa. Kirjainten välit olivat pienet eikä kirjaimissa välttämättä ollut nykyisenkaltaisia selviä kaaria, joten i:n pisteet todellakin helpottivat lukemista.
Gemena-ioota puolestaan sai muodon ι, jossa siis ei ole pistettä, mutta jossa on alhaalla pieni kaarros oikealle. Tätä merkkiä käytetään joskus matematiikassa kokonaislukumuuttujana i:n tavoin, mutta muutoin siihen ei juuri törmää muualla kuin kreikankielisessä tekstissä.
Kyrillisessä merkistössä on useita i:n tapaisia tai muuten i-äännettä tarkoittavia kirjaimia. Venäjän kirjoituksessa käytettiin ennen vuoden 1918 uudistusta kolmea erilaista i-kirjainta, joista ensimmäinen on meidän i:mme suora vastine: і, ї, и. Niistä säilytettiin vain и. Sen sijaan esimerkiksi ukrainassa säilyi täysin latinalaisen i:n kaltainen kyrillinen i (viralliselta suomenkieliseltä nimeltään valkovenäläis-ukrainalainen i).
Kuten J:n tarinassa kerrotaan, i- ja j-äänteen välinen ero on usein pieni, ehkä vain tulkintakysymys. Niinpä on ymmärrettävää, että muinaisseemiläisessä kirjoituksessa ruvettiin j-äänteen merkkiä käyttämään myös pitkän i-äänteen merkkinä. Tämä merkki, yod 𐤉, muistutti muodoltaan Z:aa ja oli ehkä syntynyt tyylitellystä käsivartta esittävästä kuvasta.
Kreikkalaiset yksinkertaistivat muodon suoraksi viivaksi ja rupesivat merkitsemään sillä yleisesti i-äännettä, sekä lyhyttä että pitkää. Senaikaisessa kreikassa ei todennäköisesti edes ollut j-äännettä, joskaan emme ehkä koskaan pääse varmuuteen siitä, ääntyikö ioota joissakin asemissa j:nä.
Muinaisseemiläisestä j:n (ja pitkän i:n) merkistä on kehittynyt mm. heprean yod-kirjain י ja arabian yāʾ-kirjain ي. Ne translitteroidaan kansainvälisessä käytännössä yleensä y:llä, koska konsonanttinen ääntämys vastaa sitä, miten englannissa y ääntyy vokaalin edessä (esimerkiksi sanassa yes). Suomalaisen standardin mukaan saa eräin ehdoin translitteroida jod-kirjaimen j:llä, jos näin tehdään johdonmukaisesti. Tästä johtuu sellainen kirjoitusasun vaihtelu kuin yom kippur ∼ jom kippur.
Latinan I ääntyi todennäköisesti aika lailla samoin kuin suomessa. Tämä ääntämys on tavallinen monessa muussakin kielessä. Sen sijaan esimerkiksi englannissa ääntämys on usein muuttunut niin, että nykyisin i-kirjain voi tarkoittaa hyvinkin erilaisia äänteitä. I:n ja muiden kirjainten yhdistelmillä on usein erikoismerkityksiä.
Monissa kielissä erotetaan toisistaan ”suppea i” ja ”lavea i” sen mukaan, miten suppea tai avoin ääntämisväylä on eli miten laaja aukko jää kielen ja kitalaen väliin. Esimerkiksi englannin sanojen feet ja fit ääntämyksen perusero on siinä, että ee:llä merkitty i-äänne on suppea, i:llä merkitty lavea. Tätä ikään kuin säestää se, että suppea on jonkin verran pidempi. Suomalainen kokee tämän helposti niin, että pituusero on olennaisin ero. Taustalla on se, että suomessa tehdään selvä ero pitkien ja lyhyiden vokaalien välillä. Tätä eroa ikään kuin säestää se, että pitkä vokaali on hiukan suppeampi.
Toisentyyppisestä erosta on kyse i:n ”etisyydessä” tai ”takaisuudessa”. Suomen i on äänteellisesti selvästi etuvokaali (ääntyy suun etuosassa). Muissa kielissä on myös taka-i eli i:n takavokaalinen vastine, ikään kuin u-äänne ilman huulten pyöristystä. Taka-i:ksi kutsutaan usein myös välimuotoa, keski-i:tä, kuten venäjän ы.
Suomen kielessä i on e:n tavoin vokaalisoinnun suhteen sikäli neutraali, että se voi esiintyä sekä etu- että takavokaalisessa sanassa, esimerkiksi passi ja pässi. Ks. E:n tarinassa esitettyä selostusta. Itsessään i on etuvokaalinen, joten taivutamme esimerkiksi silli : silliä. Joissakin sanoissa, joiden ensimmäinen vokaali on i, esiintyy toisessa tavussa epäsäännöllistä etu- ja takavokaalien vaihtelua. Niinpä pitkä on etuvokaalinen, mutta sen sukulaissana pituus takavokaalinen.
Vieraissa konsonanttiloppuisissa sanoissa käytetään yleensä i:tä sidevokaalina, jonka avulla sanaan liitetään suomen kielen mukainen taivutuspääte. Esimerkkejä: avec : avecin : avecia, Kemal : Kemalin : Kemalilla. Sidevokaalin tarve on ilmeinen, sillä suomen päätteet alkavat yleensä konsonantilla, jopa konsonanttiyhdistelmällä. Epäselvää sen sijaan on, miksi esi-isämme rupesivat käyttämään sidevokaalina juuri i:tä.
Taivutuksesta käytetty sidevokaali on usein siirtynyt myös sanan perusmuotoon. Näin on yleisesti käynyt vanhoissa ja hyvin usein uusissakin lainasanoissa: viini ← vin, kaali ← kål, filmi ← film jne. Toki on mahdollista, että i on liittynyt perusmuodon loppuun alun alkaenkin, etenkin sanoihin, jotka muutoin olisivat suomalaisen vaikeita ääntää, kuten strutsi ← struts. Tällöin voitaisiin loppu-i:tä kutsua täydennysvokaaliksi.
Sidevokaalina ei juuri käytetä muita vokaaleita, paitsi joissakin lähinnä ranskan- ja englanninkielisissä nimissä, joiden lopussa on mykkä (ääntymätön) e-kirjain. Ne taivutetaan nykyisin kirjoituksessa kuten ääntyvään e:hen loppuvatkin nimet, esimerkiksi Dale : Dalen : Dalea. Ääntämyksessä vartalon loppu-e luetaan joko e:ksi tai i:ksi, siis esimerkiksi [deilen] tai [deilin]. Aiemmin saatettiin tällaiset nimet käsitellä niin, että sidevokaali oli i sekä puheessa että kirjoituksessa, esimerkiksi Dale’in ja Dale’ia (tai Dale’iä).
Vain näennäistä poikkeusta i:n käyttöön täydennysvokaalina merkitsevät sellaiset ruotsista lainatut sanat kuin ranta ← strand. Tässä tapauksessa sana on ollut a-loppuinen lainautumisen aikoihin, mutta ruotsista loppu-a on myöhemmin kadonnut.
Edellä kuvatulle ilmiölle vastakkainen on i:n katoaminen sanan lopusta monissa tapauksissa. Sananloppuisten vokaalien kato on yleinen ilmiö maailman kielissä, mutta suomessa se on ollut suhteellisen harvinainen. Varsin monissa murteissa on kuitenkin tapahtunut sellaista etenkin s:n jälkeisen loppu-i:n katoa kuin menisi → menis, talosi → talos ja yksi → yks. Tämä on myös nykyisen yleispuhekielen tyypillisimpiä ilmiöitä, ja kirjakielen mukainen loppu-i:n ääntäminen koetaan varmaankin jo monissa tilanteissa teennäiseksi.
Itäisissä murteissa tällaiseen katoon usein liittyy loppukonsonantin palatalisoituminen: i:stä ikään kuin jää jäänne niin, että konsonantin ääntämyksessä kieli on samantapaisessa asennossa kuin i:tä (tai j:tä) äännettäessä. Suomen murteita kirjoitettaessa palatalisoitumista merkitään usein pienellä yläindeksi-j:llä tai tavallisella j:llä konsonantin jäljessä, esimerkiksi vesʲ tai vesj (← vesi). Moni muistanee, miten Tuntemattoman sotilaan elokuvaversiossa Rokka esittelee ystävänsä Suden: ”Hää o Susj” (yleiskielellä: ”Hän on Susi”). Vastaavia ilmiöitä on tapahtunut muissakin kielissä, ja kirjoitusasuun on saattanut jäädä i vain palatalisoitumisen merkiksi.
Myös sanan sisältä, varsinkin toisen vokaalin jäljestä on i saattanut kadota etenkin murteissa ja puhekielessä. Hyvin tavallista on, että painottomasta i-loppuisesta diftongista katoaa jälkiosa eli jää vain yksinkertainen vokaali: punainen → punanen, kirjoittaa → kirjottaa jne. Tämäkin on nykypuhekielelle hyvin ominaista. Ilmiötä ei kuitenkaan tapahdu puolipainollisissa tavuissa kuten nelitavuisen sanan kolmannessa tavussa, esimerkiksi aurinkoinen ja hankaloittaa.
Varsinkin -oittaa-loppuisissa verbeissä i:n kato on niin tavallista, että aikoinaan ehdotettiin, että ne saisi yleiskielessä lausua ja kirjoittaa ilman i:tä. Tätä ei kuitenkaan hyväksytty, vaan päädyttiin ratkaisuun, jossa osa tällaisista verbeistä pitää kirjoittaa i:llisinä, osa i:ttöminä. Vaikka tällöin muodostettuja mutkikkaita sääntöjä ja suurta määrää poikkeuksia on opetettu kouluissa, virheet ovat tavallisia. Milloin kirjoitetaan puhekielen mukaisesti varottaa ja ilmottaa, milloin taas liian innokkaasti lisätään puhekielen muotoihin i silloinkin, kun ei pitäisi, ja syntyy virheellisiä kirjoitusasuja kuten tiedoittaa.
Kuten edellä mainittiin, tavalliseen gemena-i:hin kuuluva piste on peräisin keskiajalta. Se on melko erikoislaatuisessa asemassa. Sitä ei tulkita ns. tarkkeeksi samaan tapaan kuin esimerkiksi joissakin kielissä käytettävän piste-e:n (ė) piste, vaan piste on i:n erottamaton osa. Normaalissa versaali-I:ssä ei toisaalta ole pistettä, mutta turkissa ja azerissa on käytössä pisteellinen versaali-I İ tavallisen I:n lisäksi.
Toisaalta i:n piste jää yleensä pois, kun i:hin liitetään tarke: î, ì jne. Näin ei välttämättä tapahdu silloin, kun tietokoneohjelma liittää i:hin ns. yhdistyvän tarkkeen ja ohjelman toteutus on tältä osin huono. Silloin voi syntyä kirjain, jossa on sekä piste että varsinainen tarke. Joissakin harvoissa tapauksissa (mm. liettuan eräissä kirjoitustavoissa) tulee i-kirjaimessa olla sekä piste että sen yllä oleva tarke.
Käytännössä i:n piste auttaa mm. erottamaan i:n kirjaimesta l (ällä). Varsinkin käsin tekstattaessa ero olisi muuten usein vaikea havaita. Joskus i voisi ilman pistettä sekaantua myös numeroon 1 (yksi) varsinkin ns. gemenanumeroita käytettäessä. Toisaalta se, että olemme tottuneet i:n pisteeseen, vaikeuttaa i:n päällä olevan tarkkeen, varsinkin akuutin havaitsemista. Monikaan ei ole huomannut, että nimissä Dalí ja Gaudí on loppu-i:n päällä akuutti, ja siksi ne niin usein kirjoitetaan virheellisesti Dali ja Gaudi.
Turkin ja azerin (eli azerbaidžanin) kielessä erotetaan kuitenkin pisteellinen i ja pisteetön ı, ja kummallakin on erikseen oma versaalivastineensa: İ ja I. Taustalla on Kemal Atatürkin toteuttama turkin kielen kirjoitusjärjestelmän uudistus. Siinä siirryttiin arabialaisesta latinalaiseen merkistöön, mutta turkin kielen ominaisuuksien takia latinalainen perusmerkistö ei riittänyt. Erityisesti päätettiin erottaa toisistaan i ja ı, jotka turkissa tarkoittavat eri vokaaliäänteitä: [i] (kuten suomen i) ja ”taka-i” [ɯ] (suun takaosassa ääntyvä i, suunnilleen kuten suomen u ilman huulten pyöristystä).
Venäjää osaaville sana ”taka-i” tarkoittaa hiukan toisenlaista vokaalia, jota merkitään kyrillisessä kirjaimistossa merkillä ы ja siirtokirjoituksessa yleensä y:llä. Sen foneettinen merkki on [ɨ], eikä se äänny yhtä takana kuin turkin ı vaan pikemminkin suun keskiosassa.
Turkin- ja azerinkielisiä nimiä kirjoitettaessa tulisi siis olla tarkkana i:n pisteiden käytössä. Esimerkiksi antiikin Smyrna tunnetaan nykyisin turkinkielisellä nimellään, joka tulisi kirjoittaa İzmir, ei Izmir.
Kun turkissa tai azerissa muunnetaan tekstiä gemenasta versaaliksi, muuttuu i İ:ksi ja ı I:ksi, eli pisteellisyys tai pisteettömyys säilyy. Tilanne on siis toinen kuin muissa kielissä, koska niissä i muuttuu I:ksi.
Joskus sanotaan, että teologit saavat aikaan suuren riidan yhdestä i:stäkin. Tällöin viitataan ns. homoiūsion-riitaan. Riita koski sitä, ovatko Isä (Jumala) ja Poika (Jeesus) samanlaista olemusta, homoiūsion, vai samaa olemusta, homoūsion. (Olemusta eli substanssia tarkoittava loppuosa ūsion kirjoitetaan useimmiten niin, että suomalaisen standardin mukaisen ū:n tai u:n tilalla on ou.) Tässä siis i-kirjain erottaa toisistaan samanlaista ja samaa tarkoittavat etuliitteet homoi- ’samanlainen’ ja homo- ’sama’. Nikean (Nikaian) kirkolliskokouksessa v. 325 vahvistettiin oikeaksi käsitykseksi homoūsion eli sama olemus. Riidassa ”yhdestä i:stä” oli kirjoituksen tasolla kyse siis kreikkalaisesta iootasta eikä meidän i:stämme.
Toisenlainen viittaus iootaan on raamatunkohdassa Matteus 5:18: ”Totisesti: laista ei häviä yksikään kirjain, ei pieninkään piirto, ennen kuin taivas ja maa katoavat, ennen kuin kaikki on tapahtunut.” Sana laki viittaa juutalaisten pyhiin kirjoituksiin ja erityisesti Mooseksen lakiin eli viiteen Mooseksen kirjaan, jotka oli kirjoitettu hepreaksi. Sanaa piirto vastaa kreikankielisessä alkutekstissä sana iōta. Aikalaiset ovat luultavasti tulkinneet sen tarkoittavan pientä iootaa, joka joissakin tilanteissa kirjoitettiin kreikkalaisessa kirjoituksessa vokaalimerkin yhteyteen (tarkemerkin tavoin) mm. osoittamaan, että vokaali ääntyy pitkänä. Jeesus puhui kyseiset sanat varmaankin arameaksi, emmekä tiedä, mihin piirtoihin hän on viitannut. Todennäköisesti hän viittasi siihen, että hepreankielisessä tekstissä käytettiin jonkinlaisia tarkemerkkejä auttamaan sanojen oikeassa ääntämisessä – aikana, jolloin hepreaa ei enää käytetty tavallisena puhekielenä.
Englannin kielessä yksikön ensimmäisen persoonan pronominin perusmuoto I kirjoitetaan aina versaalilla. Sen sijaan akkusatiivi me kirjoitetaan normaalilla tavalla, samoin pronominit my ja mine. Tämä tuntuu monista oudolta senkin takia, että toisen persoonan you kirjoitetaan lähes aina gemenalla, myös kohteliaassa puhuttelussa.
Tiedämme, että kirjoitusasua I on käytetty keskienglannin ajan (n. v. 1100–1500) keskivaiheilta alkaen. Monia selityksiä on tarjottu – ja melko vakuuttavasti kumottu. Esimerkiksi painotekniikkaan liittyvät selitykset kaatuvat käytännössä siihen, että asu tuli käyttöön jo käsin kirjoitettaessa, ennen kuin ruvettiin painamaan kirjoja.
Eräs selitysyritys on, että kirjoitusasun muutos liittyi äänteenmuutoksiin. Varhaisempina aikoina tämä pronomini koostui lyhyestä i-äänteestä ja konsonantista ja oli samantapainen kuin nykysaksan ich. Kun konsonantti katosi ja vokaali pidentyi, syntyi sana, joka koostui vain pitkästä (suppeasta) i-vokaalista. (Nykyenglannin ääntämys [ai] johtuu siitä, että pitkä i-äänne yleisesti muuttui tällaiseksi diftongiksi keskienglannin ja uusenglannin taitteessa.) Kenties kirjoitusasulla I haluttiin kuvata vokaalin ääntymistä pitkänä. Tällä olisi rinnakkaisilmiö antiikin latinassa: muinaiset roomalaiset käyttivät melko usein pidennettyä (muita kirjaimia korkeampaa) I-kirjainta, I longa ’pitkä I’, osoittamaan, että I ääntyy pitkänä.
I-kirjaimella sellaisenaan on useita symbolimerkityksiä kuten seuraavat:
Latinassa I-kirjain oli paitsi vokaalin i myös konsonantin (puolivokaalin) j merkki, ja saattoipa se tarkoittaa myös yhdistelmää ji. Vielä nykyisinkin latinaa kirjoitetaan usein tällä tavoin. Nykylatinassa kuitenkin käytetään yleisesti j:tä etenkin sanan alussa, esimerkiksi jus tai ius ’oikeus’, Juppiter tai Iuppiter, major tai maior ’suurempi’ jne.
J-kirjain on kehittynyt I:stä vasta 1300-luvulla, kun J (tai j) ruvettiin erottamaan I:stä (tai i:stä) käyristämällä merkin alapää vasemmalle ilmaisemaan, että merkki ääntyy j:nä. Käytäntö levisi hitaasti, ja sitä sovellettiin aluksi vain joissakin tilanteissa kuten sanan alussa sekä i:n ja j:n esiintyessä vierekkäin. J:n erottamisen I:stä voidaan katsoa muodostuneen järjestelmälliseksi ja yleiseksi vasta 1600-luvulla. Fraktuurateksteihin jäi käytäntö, jonka mukaan versaali-I:tä ja versaali-J:tä ei eroteta toisistaan, joskin nykyaikaisissa fraktuurafonteissa on usein erilliset muodot kummallekin (I, J).
Suomen kielessäkin käytettiin aluksi i:tä myös j:n merkkinä. Agricolan aapinen, Abckiria, ei edes mainitse mitään j-kirjainta.
Toisentyyppinen kehitys tapahtui kyrillisessä aakkostossa, jossa kyrillisestä i:stä (и) kehitettiin j-äänteen merkki lisäämällä sen päälle pieni kaari: й. Merkki kehitettiin aluksi ukrainan kirjoitusta varten, mutta vuonna 1735 Venäjän tiedeakatemia päätti ottaa sen käyttöön myös venäjässä. Tätä merkkiä, ns. lyhyttä i:tä (venäjäksi i kratkoje), kohdellaan suomalaisessa venäjän siirtokirjoituksessa hiukan mutkikkaiden sääntöjen mukaan: se korvataan j:llä tai i:llä tai se jätetään merkitsemättä (ks. kohtaa 2.5 Kyrilliset aakkoset). Tämä ei johdu ääntämyksen vaihtelusta venäjässä, vaan pikemminkin eräänlaisesta kirjoitusasun suomalaistamisesta.
Suomessa ja monessa muussa kielessä j-kirjaimella merkitty äänne, [j], on tavallaan vokaalin ja konsonantin välimuoto. Vokaalille on ominaista, että keuhkoista tulee jatkuva ilmavirta suun tai nenän kautta. Äänne-elinten asennot vaikuttavat siihen, millaisen äänen ilmavirta synnyttää. Konsonantti taas merkitsee erilaisia katkoja tai muita häiriöitä ilmavirran kulussa. Esimerkiksi konsonantti [p] merkitsee, että suu menee kiinni ja sitten taas aukeaa. Sulkeutumisen ja aukeamisen tavasta riippuu, millainen äänne syntyy. Äänne [j] on välimuoto: ilmavirta kulkee suunnilleen kuin äännettä [i] tuotettaessa, mutta kieli on lähellä kitalakea ja synnyttää ahtauman. Äänteiden luokituksissa [j] luetaan konsonanttien ryhmään mutta sen sisällä erityiseen puolivokaalien alaryhmään.
Käytännössä äänteiden [i] ja [j] ero ei useinkaan ole kovin selvä, vaan on erilaisia välimuotoja ja monenlaista vaihtelua. Tulkinnanvaraista on usein sekin, onko [i]:n ja vokaalin välissä ainakin heikko [j]. Tämä heijastuu myös oikeinkirjoitukseen. Suomen kielessä on monissa tapauksissa vain säännöissä melko mielivaltaisesti määrätty, että on kirjoitettava esimerkiksi lukioissa (sanan lukio muoto) mutta lukijoissa (sanan lukija muoto). Ääntämyksessä ei ole suurta eroa, ehkä ei mitään eroa. Suomen oikeinkirjoitukseen on kuitenkin otettu sääntö, jonka mukaan tekijännimien johdin kirjoitetaan aina -ja tai -jä, siis kalastaja, lukija, tulija jne. Sen sijaan muunlaisissa tapauksissa ei i:n ja vokaalin väliin yleensä kirjoiteta j:tä.
Kreikkalaisen kirjaimen nimi ioota lausuttiin suomessa ennen yleisesti joota lähinnä ruotsin mallin mukaan. Samoin ioni lausuttiin joni jne.
Suomeen vakiintuneeksi lienee katsottava Stalinin etunimen kirjoitusasu Josif, vaikka venäjästä translitteroitu asu on Iosif.
Yleensä sanotaan, että suomessa j ei esiinny kaksoiskonsonanttina. Tämä kuitenkin koskee vain kirjoitusasua. Ääntämyksessä esiintyy (useimmissa suomen kielen muodoissa) kaksois-j esimerkiksi sellaisissa ilmauksissa kuin tule jo ns. loppukahdennuksen (rajakahdennuksen) takia.
Lisäksi i-loppuisen diftongin ja vokaalin välissä, esimerkiksi sanassa aion, ääntyy usein j jopa kaksinkertaisena (aijon, aijjon), vaikka sitä ei kirjoitetakaan. Tällaisiin sanoihin on omaksuttu periaate, jonka mukaan kirjoitusasuun ei kuulu j:tä paitsi joissakin nimissä ja lainasanoissa (Maija, leijona, harpyija mutta toisaalta akileia, raion jne.). Kirjoitusasun vakiinnuttaminen on sikäli ymmärrettävää, että ääntämys vaihtelee.
Vieraissa kielissä konsonantin jälkeinen J usein osoittaa vain konsonantin palatalisoituneeksi. Tämä tarkoittaa, että konsonantti ääntyy niin, että kieli on lähellä kitalakea, mutta mitään erillistä j-äännettä ei ole. Aihetta kuvattiin tarkemmin kohdassa Palatalisoituminen.
Tämän takia on vieraskielisiä sanoja eri riveille jaettaessa varminta jättää jakamatta konsonantin ja J:n välistä. Esimerkiksi kroatiankielisessä nimessä Drenje yhdistelmä nj on palataalisen nasaalin merkki, joten jako Dren-je olisi väärä.
Palataalisuuden merkitseminen j:llä on sikäli luonnollista, että palataalinen konsonantti (esimerkiksi palataalinen n [ɲ]) on usein kehittynyt konsonanttiyhdistelmästä, jossa jälkimmäinen konsonantti on j-äänne (esimerkiksi [nj]), mahdollisesti palatalisoituneen välivaiheen (kuten [nʲ]) kautta. Tämän takia myös palatalisoitumisen IPA-merkki [ʲ] on muodostettu yläindeksiksi kirjoitetusta j:stä.
Palataalisuutta voidaan merkitä myös konsonantin jälkeen kirjoitetulla i:llä tai konsonantin yhteyteen kirjoitetulla tarkkeella (ks. esimerkkejä N:n tarinasta). Tarke voidaan usein ajatella i:stä tai j:stä kehittyneeksi. Kielissä, joissa etuvokaalia e tai i edeltävä konsonantti on säännönmukaisesti palatalisoitunut, ilmiö jätetään tällöin usein merkitsemättä, mutta merkitään esimerkiksi i:llä muiden vokaalien edellä. Näin on esimerkiksi liettuassa, jossa konsonantin ja takavokaalin välinen i ei siis äänny vaan vain osoittaa konsonantin palatalisoituneeksi. Esimerkiksi kaupunginnimi Šiauliai ääntyy [ʃʲauˈlʲai].
J-kirjain ääntyy j-äänteenä useissa kielissä, joskin sen ääntämyksen tarkempi luonne voi vaihdella kevyestä puolivokaalista (kuten yleensä suomessa) vahvemmin äännettyyn, luonteeltaan konsonanttisempaan.
Latinasta kehittyneissä kielissä j-äänne on saattanut muuttua affrikaataksi [ʤ] (suunnilleen suomen oikeinkirjoituksen dž). Näin on käynyt laajahkosti mm. italiassa, jossa näin syntynyttä äännettä merkitään usein gi:llä, esimerkiksi italian gioco ← latinan iocus (jocus). Englannissa j:n normaaliääntämys on tällainen affrikaatta, ja ilmeisesti ääntämys on tullut englantiin jostakin muinaisranskan muodosta. Tällainen ääntämys on melko tavallinen – englannin vaikutuksesta – monissa suhteellisen nuorissa kirjoitusjärjestelmissä, mm. siirtokirjoitusmenetelmissä. Suomalaiset kuitenkin yleisesti lukevat j:n j-äänteeksi vieraissa nimissä, vaikka se alkuperäiskielessä ääntyy toisin, esimerkiksi Indonesian pääkaupungin nimessä Jakarta.
Nykyranskassa, portugalissa ja romaniassa taas latinan j:stä on yleensä kehittynyt (j-kirjaimella merkittävä) äänne [ʒ] (suunnilleen suomen oikeinkirjoituksen ž). Espanjassa j:stä kehittyi yleensä hankausäänne [χ].
Nämä äänteelliset muutokset, joihin siis on saattanut liittyä myös kirjoitusasun muutos, ovat ymmärrettävissä sen pohjalta, että j:n ääntämystä voidaan eri tavoin toisaalta ”höllentää”, toisaalta ”tiukentaa”. Niinpä jos j-äänteeseen sisältyvää hankausta voimistetaan ja hankauskohtaa (äänneväylän supistumaa) siirretään taaksepäin, saadaan suunnilleen espanjalainen ääntämys. Affrikaattaääntämyksen taas voi ajatella syntyneen niin, että j on äännetty alkuosaltaan jäntevämmin niin, että kieli koskettaa kitalaen etuosaa, jolloin syntyy d-äänteen tapainen sulkeuma. Kun sulkeuma laukeaa ja samalla tulee voimakas ilmavirta samaan tapaan kuin j:ssä, syntyy ”englantilainen” j:n ääntämys.
Kun sanan kirjoitusasun lopussa on vokaali ja j, on usein tulkinnanvaraista, ääntyykö j konsonanttina vai vokaalina i (diftongin jälkiosana). Äänteellisesti ero on sikäli selvä, että j merkitsee jonkinasteista äänneväylän sulkeutumista. Kuitenkin suomalainen helposti kokee, että esimerkiksi ruotsalaisen nimen Kaj tai venäläisen nimen Алексей (tieteellisen translitteraation mukaan: Aleksej) lopussa on diftongi eli ne ääntyvät kuten suomen Kai ja Aleksei, vaikka ne ruotsissa ja venäjässä on oikeampaa tulkita j-loppuisiksi.
Konsonanttiloppuinen ääntämys olisi suomen kielessä hankalaa taivutuksen kannalta, koska tarvittaisiin sidevokaali, esimerkiksi ”Kajin” ja ”Aleksejin”, mikä ei tunnu luontevalta. Niinpä tällaiset sanat käsitetään vokaaliloppuisiksi ja taivutetaan esimerkiksi Kaj’n (tai usein sääntöjenvastaisesti ilman heittomerkkiä: Kajn) joka lausutaan kuten suomen Kain. Venäjän translitteroinnissa taas suomalaisen standardin ja käytännön mukaan kirjoitetaan esimerkiksi Aleksei, jolloin taivutus on ongelmatonta.
Fysiikassa J on energian ja työn yksikön joulen tunnus. Yksikön nimi johtuu englantilaisesta fyysikosta James Joulesta (1818–1889) ja kirjoitetaan suomessa joskus virheellisesti ”jouli”. Koska joule on suhteellisen pieni yksikkö, käytetään yleisesti sen kerrannaisia kilojoule (kJ) ja megajoule (MJ).
Pelikorttien merkinnöissä J tarkoittaa sotilasta eli sotamiestä eli ”jätkää”. Tämä johtuu englannin sanasta jack.
Matematiikassa ja ohjelmoinnissa j esiintyy usein yhdessä i:n kanssa kokonaislukumuuttujan nimenä, esimerkiksi taulukoiden indeksinä.
Kreikan kappa kehittyi seemiläisestä kaf-kirjaimesta 𐤊, jonka nimi todennäköisesti tarkoitti kämmentä ja jonka muoto muistutti ihmisen kämmentä, jossa sormet ovat levällään. Vieläkin voimme kuvitella K:n sellaiseksi, vaikka sormia näkyykin vain neljä. Se, että k-kirjain on myös suomen sanojen käsi ja kämmen alkukirjain, on tietysti pelkkää sattumaa.
Kaf-merkistä ovat kehittyneet heprean kaf כ ja arabian kaf ك.
Gemena-k syntyi keskiajalla versaali-K:sta siten, että pystyviiva piteni ja kirjaimen kokosuhteita muutettiin.
Kyrillisessä aakkostossa on kaa-kirjain, joka on k-äänteen merkki ja joka versaalina on täysin meidän K:mme näköinen. Sen sijaan gemena-kaa on pienennetyn versaalin näköinen (к) ja siis erilainen kuin gemena-k. Sitä ei pidä sekoittaa latinalaisen aakkoston harvinaiseen, grönlannissa aiemmin käytettyyn kraa-kirjaimeen ĸ.
C-kirjaimen tarinassa kerrottiin k-äänteen erilaisista merkeistä ja niiden käyttöalan muuttumisesta. Latinassa K väistyi lähes kokonaan C:n tieltä, mutta palasi sitten useissa latinan tytärkielissä ja muissa kielissä k:n merkiksi. Keskeinen syy oli se, että latinan k-äänteen muuttumisen takia C-kirjain tarkoitti eri tilanteissa eri äänteitä. Siksi K otettiin käyttöön etenkin tilanteisiin, joissa C:tä ei olisi luettu k-äänteeksi.
Tämä tausta, siis K-kirjaimen äänteellisen merkityksen yksiselitteisyys useimmissa kielissä, selittää myös sen, että juuri K:sta tuli suomen kirjoitusjärjestelmässä k-äänteen merkki. Toisaalta joissakin kielissä on k-kirjaimella merkitty äänne muuttunut sen jälkeen, kun kirjoitusjärjestelmä on vakiinnutettu. Niinpä ruotsissa on tapahtunut olennaisesti samanlainen muutos kuin aikoinaan latinassa: k-äänne muuttui etuvokaalin edellä affrikaataksi [ʧ]. Kirjoitusasua ei kuitenkaan ole muutettu, vaan kirjoitetaan kedja, kista, kär jne.
Monissa kielissä k-kirjain on harvinainen, vain lainasanoissa esiintyvä. Se on niissä hiukan samaan tapaan eksoottinen kuin c suomessa, joten sitä saatetaan käyttää esimerkiksi liikemerkeissä ja tuotenimissä erikoisuuden tavoittelemiseksi. Tällaista esiintyy myös Yhdysvalloissa, esimerkiksi nimissä Krispy, Krusty ja Konqueror. Toisaalta joissakin kulttuureissa K saatetaan mieltää erityisesti saksalaiseksi kirjaimeksi, myös sävyltään kielteisellä tavalla.
Kirjain k tarkoittaa SI-mittayksikköjärjestelmässä yksikön tunnuksen etuliitteenä tuhatkertaista. Se vastaa sanallista etuliitettä ”kilo-”. Esimerkiksi 1 km = 1 000 m eli kilometri on tuhat metriä. Taustalla on muinaiskreikan sana khílioi ’tuhat’. Hiukan epäloogisesti siis otettiin k tuhatta tarkoittamaan, vaikka kreikan sana alkaa khii-kirjaimella eikä k:n vastineella kappa-kirjaimella.
Kirjainta k on käytetty tuhatkertaisuuden tai tuhannen merkkinä yleisemminkin, vaikka tätä on pyritty tarmokkaasti vastustamaan. Jo markka-aikana monet puhuivat ”kilomarkoista” ja kirjoittivat ”kmk”. Euroaikana on vastaavasti käytetty merkintöjä ”k€” ja ”kEUR” tuhatta euroa tarkoittamaan. Sanaa ”kilo” ja lyhennettä ”k” tai ”K” käytetään jopa yleisesti luvun tuhat sijasta tai tarkoittamaan tuhatta jotakin, esimerkiksi tuhatta euroa, tuhatta volttia tai jopa tuhatta ihmistä. Tavanomaisessa arkisessa yleiskielessä hyväksyttynä voidaan pitää sanan ”kilo” merkitystä ’kilogramma’, mutta kilon (kilogramman) tunnus on silti ”kg” eikä arkikielessäkään pelkkä ”k”.
Tietotekniikassa kilo- tai k-etuliitteellä on usein merkitys ’1 024’. Tämä johtuu siitä, että 1 024 on 2:n 10:s potenssi (210). Teknisistä syistä tietokoneasioissa pyritään usein käyttämään lukuja, jotka ovat 2:n potensseja. Kymmenes potenssi sattuu olemaan sen verran lähellä tuhatta, että aikoinaan ajateltiin, että k:ta voi käyttää myös 1 024:n merkkinä. Tarkka merkitys on usein pääteltävä asiayhteydestä ja vallitsevasta käytännöstä. Kun esimerkiksi tietokoneen tiedoston koko ilmoitetaan ”kilotavuina”, lyhenne kt tai kB, tarkoitetaan ”binaarisia kiloja” eli kilotavu = 1 024 tavua. Kun taas puhutaan tiedonsiirron nopeudesta, tarkoittaa esimerkiksi ”kilobittiä sekunnissa”, lyhennettynä kb/s, tarkoitetaan ”desimaalisia kiloja” eli kilobitti = 1 000 bittiä.
Tätä sekavuutta on yritetty korjata käyttämällä ”binaarisen kilon” merkkinä versaali-K:ta, siis siten, että k = 1 000 ja K = 1 024. Tämä ei ole kuitenkaan mitenkään virallinen käytäntö eikä kovinkaan yleisesti noudatettu. Virallinen, jopa usean kansainvälisen järjestön vahvistama, on sen sijaan periaate, jonka mukaan ”binaarisen kilon” merkityksessä tulisi käyttää etuliitettä ”kibi-” ja tunnusta ”Ki”. Tällöin siis k = 1 000 ja Ki = 1 024. Tämäkään erottelu ei ole tullut yleiseen käyttöön.
Fysiikassa K tarkoittaa kelviniä, termodynaamisen lämpötilan yksikköä. Se on samansuuruinen kuin celsiusaste (°C), mutta asteikon nollapiste on toinen, nimittäin absoluuttinen nollapiste −273,15 °C. Yksikön nimi johtuu englantilaisesta fyysikosta William Kelvinistä (1824–1907). Aiemmin puhuttiin kelvinasteesta ja käytettiin merkintää °K, mutta kelviniin ja K:hon siirryttiin virallisesti jo vuonna 1968. Unicode-standardissa on myös erillinen merkki kelvin (U+212A), joka saattaa olla hiukan erinäköinen kuin K, mutta se on mukana vain yhteensopivuussyistä, eikä standardi suosittele sen käyttöä.
Pelikorttien ja šakkinappuloiden merkinnöissä K tarkoittaa kuningasta. Tämä johtuu englannin sanasta king.
K-kauppojen nimessä K johtuu Kesko-nimestä, jolla alkujaan haluttiin kuvata tukkukaupan keskittämistä. Yhdysvalloissa K-kirjain oli suuren Kmart-kauppaketjun tunnus ja johtui sen perustajan sukunimestä (Kresge), mutta K-tunnuksen käyttö on vähentynyt sen jälkeen, kun Sears-yhtiö osti Kmartin.
Joissakin yhteyksissä K-kirjainta käytetään esittämään kuvaannollista kovuutta, ankaruutta. Eräs jyrkkää suomalaisuuslinjaa ajanut yhdistys käytti lyhennettä K.P.T., joka ehkä oli valittu tarkoituksellisesti niin, että siinä on suomen kielen ”kovat” konsonantit (soinnittomat klusiilit). Kovuutta on saatettu tavoitella myös Klu Klux Klanin nimellä ja lyhenteellä KKK.
Suomessa esimerkiksi lyhenne K-15 tarkoittaa yleensä ’kielletty alle 15-vuotiailta’. Yhdysvalloissa taas K-12 tarkoittaa oppilaitoksia ja opetusta lastentarhasta suomalaista lukiotasoa vastaaviin kouluihin; tässä K johtuu saksalaisperäisestä sanasta kindergarten ’lastentarha’ ja 12 viittaa 12. kouluvuoteen.
K-kirjaimesta on kehitetty ympäröity K, Ⓚ, jota käytetään košer-ruokien eli juutalaisuuden (Mooseksen lain) puhtaussäädökset täyttävien ruokien merkkinä.
Meidän L:mme on kehittynyt kreikkalaisesta lambda-merkistä Λ, joka etruskien merkistössä muuttui epäsymmetriseksi, koukkumaiseksi, kun toinen haaroista lyheni. Asennon muuttuessa syntyi L:n muoto.
Keskiajalla L:stä kehittyi gemena-l, kun vaakaviiva jätettiin pois kirjoittamisen nopeuttamiseksi. Tällöin syntyi sekaannusten mahdollisuuksia, jotka osaltaan vaikuttivat siihen, että gemena-i sai pisteensä. Kreikkalaisessa merkistössä taas Λ-muodosta syntyi gemena-λ siten, että toinen viivoista piteni ja merkki kokonaisuudessaan pieneni.
Kyrillinen el-kirjain Л on kehittynyt lambdasta siten, että viivat ovat yläosastaan loitonneet toisistaan. Kyrillinen gemena-el л on luonteeltaan pienennetty versaali.
Lambda-kirjaimen nimi esiintyy myös kirjoitusasussa lamda. Gemena-lambdaa λ käytetään fysiikassa ja matematiikassa melko paljon symbolina. Erityisesti kursiivisena λ on valon aallonpituuden tunnus, ja tämän takia lambda-sana esiintyy myös eräiden valon eri aallonpituuksien käyttöön liittyvien tekniikoiden nimityksissä (esim. lambdaverkot). Lambda on käytössä myös IPAssa l:ää vastaavan palataalisen äänteen merkkinä.
Kreikan lambda kehittyi seemiläisestä lamd-merkistä 𐤋, jonka nimi todennäköisesti tarkoitti jonkinlaista keppiä tai sauvaa. Alkuperäinen muoto muistutti paimensauvaa. Myöhemmin sauva piirrettiin ylösalaisin niin, että se muistutti J:tä tai J:n peilikuvaa, jonka kaari sittemmin muuttui kulmikkaaksi.
Lamedh-merkistä ovat kehittyneet heprean lamed ל ja arabian lam ل, josta vielä voi nähdä paimensauvan muodon.
Koska gemena-l on yksinkertaisimmillaan (groteskifonteissa) pelkkä pystyviiva, se voi sekaantua moniin muihin merkkeihin kuten versaali-I:hin, pystyviivamerkkiin | ja numeroon 1. Sekaannusta ikään kuin käytettiin hyväksi varhaisissa kirjoituskoneissa. Mekaniikan ja taloudellisuuden takia piti tulla toimeen mahdollisimman harvoilla näppäimillä ja niihin liittyvillä kirjasinvarsilla ja kirjasimilla. Niinpä usein jätettiin numero 1 pois, ajatuksena, että sen tilalla käytetään gemena-l:ää.
Tästä toisaalta seurasi tarve gemena-l:n ja numeron 1 pitämiseen samanlaisina. Ne ovatkin yhä monissa fonteissa häiritsevän samanlaisia. Etenkin koodimerkinnöissä, joissa on sekaisin kirjaimia ja numeroita, sekoittuvuus voi olla erittäin harmillista.
Hyvin tehdyssä fontissa numero 1 erottuu selvästi gemena-l:stä mm. sillä, että numerossa 1 on ylhäällä noin 45°:n kulman muodostava ja selvästi erottuva viiva. Se ei toisaalta saa olla niin pitkä, että 1 sekoittuu 7:ään.
Äänneympäristön mukaan l-äänne voi ääntyä ”heleänä” tai ”tummana”, mutta tämä ero ei useimmissa kielissä ole foneemiero eli ei erota sanoja toisistaan. Ääntämyksen aitouteen asia kyllä vaikuttaa.
Foneettisesti tumma l tarkoittaa, että kielen takaosa nousee ylöspäin, joten l tuntuu ääntyvän syvemmältä. Tällaista l-äännettä voidaan merkitä IPAssa merkillä [ɫ]. Esimerkiksi albanian kielessä tehdään järjestelmällinen ero: tavallista eli heleää l:ää merkitään l:llä, tummaa ll:llä.
Tätä eroa ei pidä sekoittaa l:n ja vastaavan palataalisen äänteen [λ] eroon. Esimerkiksi espanjan useissa muodoissa ll tarkoittaa kyseistä palataalista äännettä.
Vaikka suomen l- ja r-äänne ovat varsin erilaiset, l-äänne melko helposti sekoittua ”kevyempään” r-äänteeseen, joka on monissa kielissä tavallinen. Lisäksi r-vikainen saattaa tuottaa l-äänteen, kun yrittää lausua r:n, tai jopa tietoisesti korvata r:n l:llä.
Usein sanotaan, että kiinalaiset lausuvat r:n l:nä, ja tästä on kehitetty monia vitsejä. Kuitenkin kiinassa r- ja l-äänne ovat toisistaan erilliset, mutta r on tärytön (ks. R:n tarinaa) ja siksi kuulostaa muiden kielten puhujista helposti l:ltä.
Japanissa taas ei ole l-äännettä, ja japanilaiset korvaavat lainasanojen r:n l:llä. Toisaalta tästä seuraa, että japanilaisilla voi olla vaikeuksia erottaa r ja l selvästi toisistaan esimerkiksi englantia puhuessaan.
L-kirjaimella sellaisenaan on useita symbolimerkityksiä kuten seuraavat:
L-kirjaimesta kehitettyjä erillisiä symboleja ovat muun muassa seuraavat:
M-kirjain on peräisin kreikkalaisen kirjaimiston myy-kirjaimesta, joka versaalina on aivan samanlainen kuin M. Gemenamuodoissa on huomattava ero: gemena-m on kehittynyt M:n muotojen pyöristymisen kautta, kun taas gemena-myy μ on syntynyt pikemminkin siten, että versaali-myyn vasen pystyviiva on venynyt alas ja kirjain kokonaisuutena on pienentynyt.
Kyrillisessä kirjaimistossa em-kirjain on versaalina täysin samanlainen kuin latinalainen M. Gemenana se on pienennetty versaali: м.
Kreikan myy kehittyi seemiläisestä mem-merkistä 𐤌, jonka nimi tarkoitti vettä ja jonka muoto oli aaltoviiva. Myöhemmin aallon kaarevat muodot muuttuivat kulmikkaiksi. Mem-merkistä ovat kehittyneet heprean mem מ ja arabian mim م.
M-kirjain tarkoittaa yleensä m-äännettä, joka on bilabiaalinen (molempia huulia käyttäen äännettävä) nasaalinen konsonantti. Nasaalisuus tarkoittaa, että ilmavirta kulkee nenän kautta.
Kuitenkin v- tai f-äänteen edellä m usein ääntyy labiodentaalisena nasaalina, jonka foneettinen merkki on IPAssa [ɱ]. Labiodentaalisuus tarkoittaa, että huulet eivät kosketa toisiaan vaan alahuuli koskettaa ylähampaita – ennakoiden v:n tai f:n ääntämistä. Myös v:tä tai f:ää edeltävä n voi ääntyä tällä tavoin. Kyse on sellaisesta äänteellisestä vaihtelusta, joka ei vaikuta sanojen merkitykseen ja jota ei merkitä kirjoituksessa, paitsi tarkassa foneettisessa kirjoituksessa. Se kuitenkin heijastuu kirjoitusasuun sikäli, että joissakin sanoissa on vaihtelu m ∼ n v- tai f-äänteen edellä, esimerkiksi englannin symphony, suomen sinfonia.
Monissa kielissä kuten ranskassa ja portugalissa vokaalin jälkeinen m ei äänny vaan osoittaa, että vokaali on nasaalinen eli ääntyy (osittain) nenän kautta. Ilmiötä käsitellään tarkemmin N-kirjaimen tarinassa.
Portugalissa m:n käyttö tähän tarkoitukseen on niin yleistä, että m on usein korvannut alkuperäisen (latinan mukaisen) n:n. Esimerkiksi latinan sanasta bonum ’hyvä’ johtuva sana lausutaan ranskassa ja portugalissa suunnilleen samoin (b-äänne ja nasaalinen o-äänne) mutta kirjoitetaan ranskassa bon, portugalissa bom.
Osittain nasaalisuuteen, osittain m:n heikkoon ääntämiseen ja osittain tilan säästämiseen perustunee se, että vokaalin jälkeisen m:n tilalla käytettiin usein vain vokaalin päälle vedettyä vaaka- tai aaltoviivaa. Esimerkiksi templum ’temppeli’ saattaa esiintyä asussa tēplū tai tẽplũ. Käytäntö alkoi keskiajalla ja jatkui 1600-luvulle asti.
Vokaalin jälkeinen m ääntyy usein heikkona varsinkin sanan lopussa. Esimerkiksi antiikin latinasta on päätelty mm. runomittoja tutkimalla, että sananloppuinen m jäi usein kokonaan ääntymättä tai ääntyi vain edeltävän vokaalin nasaalistumisena tai pidentymisenä.
Sananloppuinen m on usein häviämisen sijasta muuttunut hiukan helpommin äännettäväksi, n-äänteeksi. Näin kävi mm. muinaiskreikassa, jossa sananloppuista m:ää ei esiinny lainkaan. Samoin on käynyt suomessa. Muun muassa alkuperäinen akkusatiivin pääte -m on muuttunut päätteeksi -n, jolloin akkusatiivi ja genetiivi ovat langenneet yhteen. Tämän takia sanomme näin pojan ja pojan pallo käyttäen samaa muotoa pojan, vaikka muodolla on aivan eri merkitykset.
M-kirjaimen käyttö jonkinlaisena lukumerkkinä on osittain varsin hämmentävää. M voi tarkoittaa tuhatta tai miljoonaa tai yli miljoonaa, ja m taas tuhannella jakamista tai miljoonalla kertomista.
Roomalaisena lukumerkkinä M tarkoittaa tuhatta (1 000). Se on latinan sanan mille ’tuhat’ alkukirjain, mutta alkujaan kyseessä oli kirjaimista erillinen merkki, joka myöhemmin samastettiin M-kirjaimen kanssa.
Mittayksikön etuliitteen tunnuksena M tarkoittaa miljoonakertaista, m taas tuhannesosaa. Esimerkiksi MW tarkoittaa megawattia eli miljoonaa wattia, mm taas millimetriä eli metrin tuhannesosaa. Joskus nämä sekaantuvat toisiinsa, jolloin virhe on periaatteessa hyvin suuri, mutta käytännössä asiayhteys yleensä auttaa ymmärtämään, mistä on kyse. Tunnus M johtuu kreikan sanasta megas ’suuri, valtava’, tunnus m taas latinan sanasta mille.
Geologiassa ja tähtitieteessä on usein tarvetta puhua miljoonista vuosista. Englannin kielessä käytetään tällöin usein lyhennettä ”My”, missä ”y” tarkoittaa vuotta (year). Kyseessä ei kuitenkaan ole megavuosi (megayear) – tällaista nimitystä ei juuri käytetä – vaan se on vain lyhenne sanoista millions of years. Suomessa käytetään milloin ilmausta ”Mv” tai ”mv”, milloin ilmausta ”Ma”, jossa ”a” on vuoden kansainvälinen joskin standardoimaton tunnus. Viimeksi mainittu lienee asetettava etusijalle, jos lyhennettä ”milj. v.” pidetään liian pitkänä.
Ydinaseen vaikutusta kuvaava sana megatonni on muodollisesti massan yksikkö (miljoona tonnia eli miljardi kilogrammaa), mutta käytännössä se ilmoittaa, miten suurta määrää erästä räjähdettä (TNT) aseen vaikutuksen arvioidaan vastaavan.
Etuliitteen tunnus μ (mikro-) on m-kirjaimen kreikkalainen vastine myy. Se tarkoittaa miljoonasosaa ja johtuu kreikan sanan mikros (μικρός) ’pieni’ alkukirjaimesta.
Kirjainta M käytetään melko usein ilmaisemaan miljoonakertaisuutta muuallakin kuin SI-yksiköiden tunnusten kanssa. Esimerkiksi Mmk esiintyi aiemmin melko usein miljoonan markan lyhenteenä. Kielenhuolto on suhtautunut tällaiseen käyttöön torjuvasti. Kuitenkin M€ tai Me on nykyisin hyväksytty miljoonaa euroa tarkoittava ilmaus, mutta vain, ”kun tilaa on todella hyvin vähän” (Kielitoimiston ohjepankki, sivu Rahasummat).
Tietotekniikassa M aiheuttaa samantapaisia ongelmia kuin k, sillä tietotekniikan ”mega” on ”kilo kiloja”, joka taas voi olla 1 000 × 1 000 eli miljoona (”desimaalinen mega”) tai 1 024 × 1 024 eli 1 048 576 eli ”binaarinen mega” tai jopa sekamuotoa 1 024 × 1 000. Käytännössä näiden välinen ero on usein merkityksetön. K:n tarinassa mainitulla uudistuksella, joka ei tunnu etenevän, on kuitenkin haluttu eriyttää merkitykset niin, että M tarkoittaisi aina miljoonaa ja tunnus Mi (luetaan: mibi) tarkoittaisi ”binaarista megaa”.
Usein M:n tilalla käytetään gemena-m:ää. Saatetaan esimerkiksi kirjoittaa ”512 mb” kun todellisuudessa tarkoitetaan 512 megatavua (MB). Aiemmin ”mmk” merkityksessä ’miljoona markkaa’ oli melko yleinen. Nykyisin käytetään jonkin verran lyhennettä ”me” merkityksessä ’miljoona euroa’. Periaatteessa tämä on mieletöntä, koska mittayksikön etuliitteen tunnuksena m tarkoittaa tuhannesosaa. Tosin lähes aina asiayhteys tekee selväksi, ettei siitä voi olla kyse.
M-kirjaimella sellaisenaan on useita symbolimerkityksiä kuten seuraavat:
N-kirjain on peräisin kreikan aakkosten nyy-kirjaimesta. Latinalainen N ja kreikkalainen N (nyy) ovat käytännössä edelleen samanlaiset. Gemenakirjaimissa muodot ovat eriytyneet: meidän ”pientä n:äämme” vastaa kreikkalainen ”pieni nyy” ν, jonka muoto siis muistuttaa v:tä. Gemena-n lienee syntynyt siitä, että N:n jälkimmäinen pystyviiva jätettiin pois kirjoittamisen nopeuttamiseksi, ja jäljelle jäänyt osa pyöristyi.
Kreikan nyy N puolestaan on peräisin muinaisseemiläisestä nun-kirjaimesta 𐤍, jonka seuraajia ovat heprean nun-kirjain נ ja arabian nun ن . Alkuperäisin muoto on ilmeisesti ollut mutkalla olevan käärmeen tai ankeriaan kuva, ja nun-sana on tarkoittanut jotain niiden tapaista eläintä. Myöhemmin kaarevuus muuttui murtoviivaksi, mutta hyvällä mielikuvituksella voi vielä ajatella N:n tyylitellyksi käärmeeksi. Murtoviivan muoto vaihteli, kunnes se vakiintui nykyisenkaltaiseksi N:ksi.
N-kirjaimen alkumuotoja
Kyrillistä kirjaimistoa muodostettaessa kreikan nyyn vino viiva muuttui vaakasuoraksi ja tuloksena oli meidän H:mme näköinen kirjain. Siksi ”Kekkonen” kirjoitetaan kyrillisin kirjaimin näin: Кекконен.
Kirjaimen n äännearvo on eri kielissä yleensä varsin samanlainen ainakin silloin, kun se esiintyy sanan tai tavun alussa. Muissa asemissa on saattanut tapahtua äänteenmuutoksia. Äännearvoa eli n-äännettä voidaan kuvata sanomalla, että kielen asema on sellainen, että ulos virtaava ilma kulkee pääasiassa nenän kautta. Tämä ilmaistaan sanomalla, että n-äänne on nenä-äänne eli nasaali. Suomen kielen sana nenä onkin äänneasultaan varsin kuvaava, koska siinä on kaksi n-äännettä. Monissa muissakin kielissä nenää tarkoittava sana alkaa n:llä: nose, näs jne.
Nasaaleja on muitakin kuin n, ja ilman kulkeminen nenän johtuu eri syistä. Se johtuu n:ää äännettäessä siitä, että kielen kärki on kiinni hammasvallissa (ylähampaiden yläpuolella).
Suomen kielessä n-äänne on yleensä muuttunut m-äänteeksi, jos se on joutunut p:n (tai b:n) edelle. Tämä johtuu siitä, että ihmiset ovat pyrkineet helpottamaan ääntämystä. Koska p äännetään niin, että huulet koskettavat toisiaan, on n:n ääntämistapaa mukautettu tähän aina siihen asti, että huulet jo valmiiksi koskettavat toisiaan – jolloin syntyy m-äänne. Ilmiöstä käytetään nimitystä assimilaatio (samankaltaistuminen).
Suomen kirjoitusjärjestelmän periaatteisiin kuuluu, että tällaista assimilaatiota ei merkitä kirjoituksessa, jos n ja p kuuluvat eri sanoihin. Tällöin sanoiksi lasketaan myös yhdyssanan osana oleva sana ja liitepartikkelit -pa ja -pä. Niinpä kirjoitetaan pojan pallo, pojanpoika ja pojanpa vaikka lausutaan pojam pallo, pojampoika ja pojampa. (Hitaassa puheessa assimilaatiota ei aina tapahdu, jos sanojen välissä on tauko: voidaan lausua myös pojan pallo.)
Toisenlainen assimilaatio on n:n muuttuminen äng-äänteeksi k:n edellä; tätä tarkastellaan hiukan jäljempänä. Vielä yksi assimilaatiotapaus on se, että sekä n että m saattavat muuttua f:n tai v:n edellä erikoiseksi äänteeksi, jolla ei ole suomen kirjoitusjärjestelmässä omaa merkkiä, mutta josta foneettisessa kirjoituksessa käytetään merkkiä µ (myy-kirjain). Täten siis m:n ja n:n ero saattaa hävitä f:n tai v:n edellä, ja tämä selittää myös eräitä kirjoitusasun vaihteluita kuten sen, että suomessa kirjoitetaan sinfonia, mutta englannissa symphony.
Monissa kielissä n-äänne on heikentynyt silloin, kun se sijaitsee vokaalin jäljessä sanan tai tavun lopussa. Esimerkiksi viron kielestä se on usein hävinnyt: suomen sananmuotoa pojan vastaa viron poja. Nykykreikassa saattaa kirjoitusasussa vielä esiintyä sanan lopussa n:n vastine (nyy), vaikka sitä ei enää äännetä. Kirjoitettaessa kreikkaa latinalaisin kirjaimin saatetaan toimia joko vanhan kirjoitusasun mukaan (esimerkiksi Iraklion) tai äänneasun mukaan (Iraklio).
Kuitenkaan ei n-äänne aina ole kadonnut jälkiä jättämättä, vaan se on saattanut ensin muuttaa edeltävän vokaalin nenä-äänteeksi eli nasaaliksi. Tällainen vokaalin nasaalistuminen on sekin eräänlaista assimilaatiota.
Esimerkiksi ranskan sanassa chanson ei äänny minkäänlaista n-äännettä, vaikka se on peräisin muodosta, jossa oli kaksi n:ää. Sen sijaan a ja o ääntyvät nasaalisina eli ilmavirta kulkee nenän kautta. Nasaalisuus ei ole suomalaisellekaan kovin outoa, sillä saatamme ääntää vokaalit ainakin osittain nenän kautta varsinkin silloin, kun ne esiintyvä nasaalisten konsonanttien välissä, esimerkiksi sanassa mannan tai mangun. Tästä johtuu, että ranskan nasaalivokaaleja on yritetty kuvata ikään kuin niiden yhteydessä ääntyisi äng-äänne, esimerkiksi ääntämisohjeella ”shangsong”.
Nasaalivokaalin ja tavallisen, suun kautta äännettävän (oraalisen) vokaalin välillä ei ole selvää rajaa, koska ilmavirta voi kulkea osittain suun, osittain nenän kautta. Niiden välillä on silti olennainen ero joissakin kielissä. Esimerkiksi ranskassa sanojen bas ’sukka’ ja banc ’pankki’ ainoa ero ääntämyksessä on se, että jälkimmäisessä vokaali on nasaalinen. (Näiden sanojen loppukonsonantit eivät äänny.) Tällaisia kieliä puhuttaessa pitää siis osata tehdä riittävä ero nasaalisen ja tavallisen vokaalin välillä: ilmavirta kulkee kokonaan tai lähes kokonaan joko nenän tai suun kautta, ei siltä väliltä.
Johtunee paljolti juuri n:n heikosta ääntämyksestä, että n-kirjain ruvettiin usein kirjoittamaan vain pieneksi lisukkeeksi edeltävän kirjaimen päälle. Mikael Agricolakin saattoi kirjoittaa esimerkiksi colmẽ (tai colmē, sen mukaan miten hänen merkintänsä tulkitaan), kun hän tarkoitti sanaa kolmen. Syynä oli osittain varmaankin myös tilan säästämisen tarve aikana, jolloin kirjoitusmateriaali oli kallista.
Vokaalin päälle kirjoitetusta pienestä n-kirjaimesta kehittyi tilde, joka on käytössä muun muassa portugalin kielen kirjoituksessa. Siinä esimerkiksi ã tarkoittaa nasaalivokaalina ääntyvää a:ta. Viron kielen õ-kirjain on kuitenkin erilainen tapaus: se ei tarkoita nasaalivokaa#lia, vaan on lähinnä kuten o mutta ilman huulien pyöristystä (foneettinen merkki [ɤ]). Sen taustasta kertoo verkkosivu Kun Õ tuli viron kirjakieleen.
Samaan tapaan mutta vokaalin alle kirjoitetusta n:stä on kehittynyt toinen tarke, ogonek, joka esiintyy esimerkiksi e-kirjaimen alla puolalaisessa nimessä Wałęsa. Ogonek on alkujaan osoittanut vokaalin nasaalisuutta, mutta nykykielissä se saattaa osoittaa myös vokaalin pituutta.
Tildestä kehittyi myös erillinen merkki. Tietokoneajan alussa ajateltiin, että tarkkeelliset merkit tulostettaisiin niin, että tulostetaan kirjain, siirretään kirjoituskohtaa merkin verran taaksepäin ja tulostetaan tarke erillisenä merkkinä. Tällainen päällepainaminen johtaa kuitenkin varsin rumiin tuloksiin, eikä siitä koskaan tullut yleistä. Muistoksi tästä jäi kuitenkin muun muassa tilde, ja kun se kerran oli merkistöissä ja näppäimistöissä, sille keksittiin käyttöä. Melkoisen mielivaltaisesti tilde otettiin esimerkiksi viittaamaan käyttäjän omaan hakemistoon (kansioon) tietokoneessa. Tästä on peräisin tilden käyttö www-osoitteissa, esimerkiksi http://users.teilar.gr/~g1951d/. Erillisenä merkki tilde muodostui erityyliseksi kuin tarkkeena käytetty tilde; vertaa esimerkiksi tildeä ~ merkissä ã esiintyvään tildeen.
Espanjan kielessä ruvettiin kirjoittamaan tilde n-kirjaimen päälle eli kirjainpari nn lyhennettiin muotoon ñ. Se tarkoittaa palataalista nasaalia, jota voidaan karkeasti merkitä kirjainparilla ”nj”. Kyse on kuitenkin yhdestä äänteestä eikä kahden äänteen yhdistelmästä. (Ks. Palatalisoituminen.) Useissa tapauksissa ñ on peräisin nn-yhdistelmästä; esimerkiksi espanjan sana año ’vuosi’ on kehittynyt latinan sanasta annus (tai annum). Yhtenäisyyden vuoksi espanjassa kuitenkin merkitään palatalisoitunutta n:ää ñ:llä alkuperästä riippumatta.
Palatalisoitunutta n:ää voidaan kuvata sanomalla, että suu ja kieli pannaan sellaiseen asentoon kuin j:tä äännettäessä, mutta äännetäänkin n. Tulos kuulostaa tavallaan j:n ja n:n yhteensulautumalta. Esimerkiksi espanjan sana España lausutaan siis hiukan toisin kuin suomen Espanja.
Joissakin muissa kielissä palatalisoituneen n:n merkiksi on otettu yhdistelmä nj tai ni taikka n, jossa on jokin muu tarke. Seuraava taulukko esittää tarkkeellisia n-kirjaimia, jotka voidaan tuottaa laajennetulla suomalaisella näppäimistöllä tarkenäppäinten avulla (esimerkiksi ń-kirjain näppäilyllä ´n).
|
Merkin nimi |
Kieli |
Esimerkkejä |
---|---|---|---|
ñ |
tilde-n |
espanja, katalaani, baski |
Buñuel, señor |
ń |
akuutti-n |
puola |
Gdańsk, Poznań |
ň |
hattu-n |
tšekki, slovakki |
Plzeň, Mňačko |
ņ |
sedilji-n |
latvia |
Akmeņrags, Zariņš |
Eurooppalaisissa kielissä n:ään liittyvä tarke osoittaa palataalisuutta. Afrikkalaisissa kielissä n:n tarkkeella on muitakin merkityksiä.
Palataalisen nasaalin merkki kansainvälisessä foneettisessa kirjoituksessa on ɲ, joka siis muistuttaa n:ää, jossa on vasemmalla alauloke. Suomalaisten hakuteosten ääntämisohjeissa käytetään kuitenkin yleensä merkintää nj joko sellaisenaan tai niin, että j on yläindeksinä (nj). Palataalisuutta saatetaan merkitä myös heittomerkillä: n’.
Edellä mainittiin n:n assimiloituminen äng-äänteeksi k:n edellä. Tämä on varsin tavallista maailman kielissä, joskin on myös kieliä, joissa ”nk” lausutaan kirjaimellisesti. Yleistä on myös assimiloituminen g:n edellä. Ilmiö on usein niin säännöllinen, ettei koeta olevan mitään tarvetta erikseen merkitä sitä. Kun kielen puhujat tietävät, että n-kirjain yhdistelmissä ”nk” ja ”ng” ääntyy aina äng-äänteenä, ei epäselvyyksiä synny.
Suomen kielessä oli aiemmin g:n tapainen äänne, joka ääntyi myös yhdistelmässä ”ng”. Kun tämän yhdistelmän ääntämys myöhemmin muuttui kaksois-äng-äänteeksi, syntyi uudenlainen tilanne. Johdonmukaisuus vaatisi, että äng-äänteellä olisi oma merkkinsä, esimerkiksi ŋ, ja kirjoitettaisiin esimerkiksi ”raŋka” ja ”raŋŋan” eikä ”ranka” ja ”rangan”. Uuden kirjaimen tuominen kieleen olisi kuitenkin ollut hankalaa.
Usein mainitaan, että suomen kirjoitusjärjestelmä on ihanteellinen: jokaisella äänteellä on oma merkkinsä. Tämän jälkeen mainitaan yleensä, että sääntöön on vain kaksi poikkeusta: äng-äänne ja niin sanotun loppukahdennuksen merkitsemättä jättäminen (sanotaan ”menep pois” mutta kirjoitetaan ”mene pois”). Todellisuudessa poikkeuksia on monia muitakin. Joka tapauksessa äng-äänne on edelleen vailla omaa merkkiään, vaikka tämä koetaankin ikäväksi tahraksi kielen muutoin lähes ihanteelliseksi luullussa järjestelmässä.
Käytännössä ongelmia aiheuttaa jonkin verran se, että jotkut luulevat, että yhdistelmässä ”ng” pitäisi ääntää jonkinlainen g-äänne. Tosin tämä yleensä jää vain luuloksi, jota ei yritetä toteuttaa, paitsi ehkä suomea opettelevien ulkomaalaisten puheessa. Toisaalta muissa kielissä yleensä g ääntyy tässä yhdistelmässä. Englannin sanassa finger pitäisi ääntää selvä g-äänne äng-äänteen jälkeen. Joissakin harvoissa suomen lainasanoissa esiintyy samanlainen tilanne. Esimerkiksi pangermanismi jäsentyy yhdyssanaksi (pan+germanismi) ja ääntyy luontevimmin [pɑŋgermɑnismi]. Kun ng-yhdistelmä esiintyy sanan lopussa tai konsonantin edellä (esimerkiksi doping tai englanti), se yleensä ääntyy suomen kielessä äng-äänteenä. Sen sijaan esimerkiksi englannin sanassa English ääntyy myös g: [ɪŋɡlɪʃ].
Toisentyyppinen ongelma syntyy siitä, että monissa murteissa ”nk” ei ole astevaihtelussa, vaan taivutetaan esimerkiksi kenkä : kenkän. Tällaisilta alueilta peräisin olevien puheessa saattaa tämä murrepiirre säilyä silloinkin, kun he yrittävät puhua yleiskieltä, ehkä jopa kirjoituksessakin. Koska g-kirjain yleensä ääntyy suomessa melko lailla k-äänteenä, saattaa murteenpuhuja kirjoittaa kengän mutta lukea kenkän.
Pieniä ongelmia syntyy myös vierasperäisten sanojen ääntämisessä: ääntyykö yhdistelmässä ”gn” esimerkiksi sanoissa magnum ja kognitio n-äänteen edellä g-äänne vai äng-äänne? Kumpaakin esiintyy, ja ääntämys vaihtelee myös sanoittain. Oikeana pidettävä ääntämys on siis tarvittaessa opeteltava erikseen sivistys- tai tietosanakirjasta. Käsitykset saattavat myös muuttua; g:llinen ääntämys on ilmeisesti yleistymässä. Ääntämyksen horjuvuus on osittain syynä myös kirjoitusvirheisiin. Esimerkiksi oikean asun magneetti sijasta saatetaan kirjoittaa mangneetti tai mangeetti.
Edellä mainittu ŋ-merkki, äng-kirjain, on alkujaan kehitetty ääntämistä suhteellisen tarkoin kuvaavan eli foneettisen kirjoituksen tarpeisiin. Sitä käytetäänkin yleisesti sanakirjoissa, kieliopeissa ja tietosanakirjoissa. Esimerkiksi finger-sanan ääntämystä brittienglannissa kuvataan merkinnällä [fiŋgə], ja suomen signaali-sanan tavallisinta ääntämystä kuvaa [siŋnaali].
Äng-kirjain on siis hyvä tuntea; sen voi jopa sanoa kuuluvan yleissivistykseen. Sen sijaan se ei kuulu suomen aakkostoon, vaikka tällaistakin on jopa kouluopetuksessa joskus väitetty. Syynä on ollut lähinnä kirjaimen ja äänteen käsitteiden sekoittaminen toisiinsa. Osasyynä on saattanut olla se, että joissakin vanhoissa aapisissa ei esitetty G-kirjainta erillisenä merkkinä vaan vain yhdistelmässä NG, ja tästä yhdistelmästä on ehkä puhuttu äng-kirjaimena.
Äng-kirjaimen sijasta on ääntämisohjeissa käytetty usein sitä hiukan muistuttavaa kreikkalaista eeta-kirjainta η. Tämä on johtunut painoteknisistä syistä: eeta on ollut käytettävissä, koska sitä tarvitaan kreikankielisiä tekstejä varten, kun taas äng-kirjain on uudempi keksintö. Käytäntö on kuitenkin epäjohdonmukaista, koska kreikassa eeta on vokaalin merkki – vanhassa kreikassa pitkän e:n, nykykreikassa lyhyen i:n.
Foneettisesta kirjoituksesta ŋ-merkki on otettu myös joidenkin kielten varsinaiseen kirjoitusjärjestelmään. Kyse on kielistä, joille on kehitetty kirjakieli melko myöhään. Niihin kuuluu joitakin saamen kieliä (pohjoissaame, inarinsaame ja kolttasaame) ja useita afrikkalaisia kieliä. Tällöin on syntynyt ongelma, joka on eri tahoilla ratkaistu eri tavoin: millainen tulisi äng-kirjaimen olla versaalina? Tätä käsitellään Vierasnimikirjan kohdassa Äng.
Foneettisessa kirjoituksessa käytetään myös kirjainta ɳ, joka merkitsee ns. retrofleksista n:ää. Tämä tarkoittaa äännettä, joka muistuttaa n-äännettä, mutta jota lausuttaessa kielen kärki on kaartunut taaksepäin. Tämän voidaan sanoa antavan n:lle ja myös edeltävälle vokaalille r:n tyyppistä sävyä. Esimerkiksi riikinruotsin sanassa barn ei ole r-äännettä, vaan ”rn” ääntyy retrofleksisenä n:nä.
Retrofleksisen n:n merkissä ɳ oikealla oleva alapidennys kaartuu hiukan oikealle, kun taas ängässä ŋ se kaartuu vasemmalle.
N-kirjain on kemiassa typen (latinaksi nitrogenium) tunnus. Tähän ja siihen, että kirjaimen nimi lausutaan joskus ”en” eikä ”än”, perustuu kulunut koululaisvitsi: ”– Tiedätkö, mikä on typen kemiallinen merkki? – En. – Aivan oikein!”
Matematiikassa gemena-n:ää käytetään (kursivoituna: n) usein muuttujana, jonka arvot ovat luonnollisia lukuja (0, 1, 2, …). Tämä johtuu latinan sanasta naturalis ’luonnollinen’. Matemaattisesti suuntautuneet opiskelijat käyttävät usein n:ää arkipuheessakin, yleensä tarkoittamaan jotain suurehkoa tuntematonta tai ainakin mainitsematonta lukua. Esimerkiksi ”Tässä on n eri vaihtoehtoa” tarkoittaa tällöin suunnilleen samaa kuin ”Tässä on monta eri vaihtoehtoa.”
Merkintätapa NN voi sekin tarkoittaa tuntematonta, nimittäin tuntematonta tai nimeämätöntä henkilöä, mutta asian tausta on toinen. Esimerkiksi asiakirjakaavassa tai valan kaavassa se tarkoittaa, että sen tilalle on kirjoitettava tai lausuttava asianomaisen henkilön nimi. Merkinnän synnylle on kaksi selitystä: latinan sanat nomen nescio ’nimeä en tiedä’ ja samoin latinaa olevat sanat nomen notetur ’nimi merkittäköön [tähän]’.
Muita tavallisia n-kirjaimen symbolimerkityksiä ovat seuraavat:
N-kirjaimesta kehitettyjä erikoissymboleja on melko vähän. Niihin kuuluvatu ℕ (U+2115), joka on matematiikassa luonnollisten lukujen joukon merkki, ja ₦, joka tarkoittaa Nigerian rahayksikköä nairaa.
Kuten muutkin vokaalien merkit, omikron kehittyi konsonantin merkistä, nimittäin seemiläisestä ain-merkistä 𐤏. Sen nimi alkoi konsonantilla, jota voidaan kuvata nieluntauksessa ääntyväksi soinnilliseksi hankausäänteeksi, karkeasti sanoen voimakkaaksi kurkku-h:ksi tai kurkku-g:ksi. Nimi tarkoitti silmää. Ain-merkistä ovat kehittyneet heprean ayin ע ja arabian ʿayn ع.
Emme tiedä, miksi kreikkalaiset ottivat ain-merkin juuri o-vokaalia tarkoittamaan. Kenties alun kurkkuäänne sai a-vokaalin kuulostamaan hiukan o:lta. Joka tapauksessa kreikkalaiset kehittivät omikronista myös pitkän o:n merkin Ω, joka siis alkujaan oli Ο:n muunnelma ja joka sijoitettiin aakkoston loppuun Kreikkalaiset antoivat uudelle kehitelmälleen nimen ō mega ’suuri o’ ja alkuperäiselle Ο:lle nimen o mikron ’pieni o’. Versaali-oomegasta kehitettiin uudella ajalla sähkönvastuksen (resistanssin) tunnus, ohmin merkki Ω; se perustuu saksalaiseen henkilönnimeen Ohm, jossa ääntyy alussa pitkä o.
Latinalainen o, kreikkalainen omikron ja kyrillinen o ovat keskenään aivan samanlaiset. Versaalimuoto on enemmän tai vähemmän soikea (O), gemenamuoto yleensä lähes täysin pyöreä (o). antiikvafonteissa o:n täydellisen pyöreyden kuitenkin ”rikkoo” viivanpaksuuden vaihtelu, joka näkyy selvästi, kun merkkiä suurennetaan.
Äänteinä o ja u muistuttavat toisiaan melko lailla. Erona on lähinnä se, että u on suppeampi. Monissa kielissä, mm. ranskassa ja italiassa, esiintyy toisaalta sekä suppeampi o että väljempi o, jonka foneettinen merkki IPAssa on [ɔ]. Toisaalta niiden välille ei yleensä tehdä eroa kirjoituksessa, ei ainakaan millään järjestelmällisellä tavalla.
Suomen o-äänne kuvataan yleensä suppeammaksi o:ksi, IPA-merkein esitettynä [o]. Koska suomesta puuttuu suppeamman ja väljemmän o:n vastakohtaisuus, saattaa o:n ääntämys kuitenkin vaihdella. Yleensä pitkät vokaalit ovat ainakin hiukan suppeampia kuin lyhyet.
Varsinkin suppeampi o on kielten kehityksessä usein muuttunut u:ksi tai toisinpäin. Ruotsissa (ja norjassa) o-kirjain, joka aiemmin edusti o-äännettä, edustaa nykyisin usein u-äännettä. Kirjoitusasusta ei voi tietää, missä sanoissa o on muuttunut u:ksi. Joitakin yleisiä sääntöjä voidaan muotoilla, mutta niiden oppiminen ja soveltaminen on ehkä hankalampaa kuin sanojen oppiminen sellaisenaan. On vain osana ruotsin sanaston oppimista opittava, että o äännetään esimerkiksi sanassa blomma u:na, sanassa komma o:na.
O-kirjaimen ääntämyksessä esiintyy paljon muutakin vaihtelua, mutta siitä otetaan tässä esille vain venäjän niin sanottu akanje-ilmiö. Sillä tarkoitetaan, että o-kirjain ääntyy painottomissa asemissa joko väljänä a:n tapaisena äänteenä (foneettisesti lähinnä [ʌ] eli sama kuin esimerkiksi brittienglannin sanassa cup) tai neutraalina vokaalina eli švaana (foneettisesti [ə] eli sama kuin englannin sanan about alussa). Molemmat saattavat suomalaisesta kuulostaa lähinnä hiukan epämääräiseltä a:lta.
Esimerkiksi venäjän sana хорошо ’hyvä’, translitteroituna horošo, ääntyy [xərʌˈʃɔ]. Painollisen lopputavun edellä olevan tavun o ääntyy siis a:n tapaisena ja vielä painottomammassa asemassa švaana. Suomalainen kuulee tämän ehkä suunnilleen harašoo, ja š helposti korvautuu s:llä.
Akanje esiintyy vain joissakin venäjän muodoissa, mutta sen katsotaan kuuluvan venäjän yleiskielen mukaiseen ääntämykseen. Akanjen alkuperästä ei ole varmuutta. Kirjoitusasu viittaa siihen, että o-äänne olisi muuttunut a:n tapaisiksi äänteiksi, mutta kehityssuunta on saattanut olla toisenkinlainen.
Versaali-O ja numero 0 ovat molemmat muodoltaan soikioita ja saattavat sekaantua toisiinsa. Sekaannusta ikään kuin käytettiin hyväksi varhaisissa kirjoituskoneissa, samaan tapaan ja samoista syistä kuin gemena-l ja numero 1 yhdistettiin toisiinsa. Näppäimistöistä usein jätettiin numero 0 pois, ajatuksena, että sen tilalla käytetään versaali-O:aa.
Tästä toisaalta seurasi tarve versaali-O:n ja numeron 0 pitämiseen samanlaisina. Ne ovatkin yhä joissakin fonteissa häiritsevän samanlaisia. Etenkin koodimerkinnöissä, joissa on sekaisin kirjaimia ja numeroita, sekoittuvuus voi olla erittäin harmillista.
Myöhemmin kun versaali-O ja numero 0 erotettiin toisistaan merkistöissä, saatettiin tehdä 0:sta sellainen, että siinä on poikkiviiva, siis tanskalaisen ö:n Ø tapainen. Syynä oli mm. se, että alkeellisilla tulostusvälineillä ei voitu toteuttaa kovinkaan hienostuneita muotoja, vaan ero oli tehtävä karkealla tavalla. Hämmennystä toisaalta aiheutti, että joissakin merkkien esityksissä poikkiviiva olikin O-kirjaimen päällä!
Useimmissa nykyisissä fonteissa numero 0 erottuu selvästi versaali-O:sta lähinnä siten, että numero 0 on paljon kapeampi.
O-kirjaimella on suhteellisen vähän käyttöä erikoissymbolina, ehkä sen takia, että se sekoittuu helposti nollaan 0.
Kemiassa O on hapen (latinaksi oxygenium) tunnus. Merkintä O2 tarkoittaa vapaan, ilmassa esiintyvän hapen tavallisinta, kaksiatomista muotoa. Merkintä O3 tarkoittaa kolmiatomista muotoa eli otsonia.
Matematiikassa merkintä O(n) tarkoittaa suuretta, joka on samaa kertaluokkaa (suuruusluokkaa) kuin n siinä mielessä, että se kasvaa tai pienenee suhteessa n:n arvoon. Tässä yhteydessä O johtuu englannin sanasta order ’suuruusluokka’.
Irlantilaisten sukunimien etuliitteenä O’ ei ole lyhenne, vaan jälkeläistä tarkoittava sana. Esimerkiksi O’Connor tarkoittaa siis suunnilleen ’Connorinpoika’.
P-kirjain ei ole kehittynyt kreikan pii-kirjaimesta Π vaan sen varhaisemmasta muodosta, jossa oikea jalka oli lyhyempi. Tämä jalka muuntui vasemmalle kaartuvaksi ja lopulta kokonaan kaarevaksi, jolloin päädyttiin P-muotoon. Gemena-p on yksinkertainen muunnelma: se on hiukan pienempi ja ennen muuta alempana kuin P. Kreikkalaisessa aakkostossa gemena-pii π on lähinnä pienennetty ja hiukan tyylitelty muoto versaali-piistä.
Gemena-piitä π käytetään yleisesti matematiikassa ympyrän kehän ja halkaisijan pituuksien suhteen merkkinä (lukuarvoltaan noin 3,14). Vähemmän tunnettua on, että versaali-piistä Π on kehitetty symboli ∏, jota käytetään eräänlaisen kertolaskun tulon (englanniksi product) ilmaisemiseen.
Kyrillinen aakkosto seuraa kreikan käytäntöä: kyrillinen pee on versaalina (П) täysin samannäköinen kuin versaali-pii. Gemenamuoto on pienennettyä versaalia: п.
Kreikan pii kehittyi seemiläisestä pe-merkistä 𐤐, jonka nimi todennäköisesti tarkoitti suuta mutta jonka alkumuoto oli lähinnä yksinkertainen kulma. Kenties kulma oli suun kuvasta voimakkaan tyylittelyn kautta syntynyt. Joka tapauksessa kreikkalaiset muunsivat kulmaa lisäämällä siihen kolmannen viivan, jolloin tulos muistutti hirsipuuta. Antiikin ajalta tunnetaan jopa huudahdus I ad Graecum pi! ’Mene kreikkalaiseen piihin [= hirteen]!’.
Pe-merkistä on kehittynyt heprean pe פ. Arabialaisessa aakkostossa sillä ei ole vastinetta, koska arabiassa ei ole p-äännettä.
Kuten B:n tarinassa kerrottiin, p ja b ovat toisiaan vastaavia äänteitä siten, että p on soinniton (”kova”) ja b soinnillinen (”pehmeä”). Suomen kielessä ero ei kuitenkaan ole kovin selvä, ja b-kirjain ääntyy yleensä lähes tai täysin samoin kuin p-kirjain, paitsi hyvin huolitellussa puheessa.
P- ja B-kirjainten muodon samantapaisuus on lähinnä sattumaa. Kuten esitetyistä kuvauksista on ilmennyt, näiden kirjainten alkumuodot ovat olleet varsin erilaiset.
Useissa kielissä yhdistelmä ph on f-äänteen merkki. Tämän taustaa selitettiin C:n tarinassa kohdassa CH:n monet merkitykset. Suomen kielestä tällainen merkintätapa hävisi (muualta paitsi sitaattilainoista ja vieraista nimistä) jo vanhan kirjasuomen aikana, vaikka Agricola saattoi vielä kirjoittaa esimerkiksi prophetat ’profeetat’.
Mittayksikön etuliitteen tunnuksena p vastaa etuliitettä piko- ja tarkoittaa biljoonasosaa. Tämä etuliite on harvinainen, koska sille on käyttöä vain erikoistapauksissa, esimerkiksi joskus kerrannaisessa pF (pikofaradi). Etuliitteen nimi johtuu lähinnä italian sanasta piccolo ’pieni’.
Mittayksikön etuliitteen tunnuksena P taas vastaa etuliitettä peta-, joka ja tarkoittaa 1015- eli tuhatbiljoonakertaista. Etuliite johtuu kreikan sanasta pétalos ’laaja’. (Toinen selitys on, että se johtuu kreikan sanasta pénte ’viisi’, koska kyseessä on viides etuliite sarjassa k, M, G, T, P.) Tietotekniikassa P tarkoittaa tuhatbiljoonakertaista tai 10245-kertaista (vrt. tunnusten k, M, G ja T kuvauksiin kyseisten kirjainten tarinoissa).
Mittayksikön tunnuksena p tarkoittaa poisia, viskositeetin (nesteiden sisäisen kitkan) yksikköä.
Vanhentuneena mittayksikön tunnuksena p tarkoittaa voiman yksikköä pondia.
Kirjain p on fysiikassa myös erään alkeishiukkasen, protonin, tunnus.
Geometriassa käytetään usein kirjaimia P, Q, R jne. tason pisteiden symboleina. P:stä aloittaminen johtuu siitä, että se on latinan sanan punctum ’piste’ alkukirjain.
Matematiikassa P tai p tarkoittaa usein todennäköisyyttä. Tämä johtuu latinan sanasta probabilitas ’uskottavuus, todennäköisyys’.
Muodollisessa logiikassa käytetään usein kirjainta p tarkoittamaan mitä tahansa lausetta tai tarkemmin sanoen propositiota eli väitelausetta, joka on joko tosi tai epätosi. Kirjain p johtuu sanasta propositio. Kun tarvitaan lisäsymboleita propositioille, käytetään usein seuraavia kirjaimia q, r jne. Versaali-P:tä käytetään logiikassa yleensä tarkoittamaan predikaattia eli olion ominaisuuden kuvausta.
Perinnöllisyystieteessä P on tarkasteltavan periytymisilmiön ensimmäisen sukupolven eli parentaalipolven tunnus, vastakohtana jälkeläispolvien tunnuksille F1, F2 jne. Kirjain P johtuu latinan sanasta parentes ’vanhemmat’.
Musiikin esitysmerkintänä p tarkoittaa ’hiljaa, kevyesti’ ja johtuu italian sanasta piano. Suurempaa keveyttä osoitetaan merkinnöillä pp (luetaan pianissimo) ja ppp (piano pianissimo).
P-kirjaimesta on kehitetty merkki ℗ (U+2117), jota käytetään äänitteiden tekijänoikeusmerkkinä (sound recording copyright) lähinnä tuotepakkauksissa. Siinä P johtuu merkin vanhemmasta nimestä phonorecord sign.
Q-kirjain on peräisin seemiläisestä qof-kirjaimesta 𐤒, jonka nimi tarkoitti apinaa ja jonka muoto muistutti (paljon myöhemmin syntynyttä) kreikkalaista φ-kirjainta. Kenties kirjain oli kehittynyt kuvasta, joka esitti apinaa takaa päin katsottuna niin, että häntä roikkuu alhaalla. Q-kirjaimenkin voi kuvitella esittävän jotain hännällistä eläintä takaa päin.
Joka tapauksessa qof tarkoitti k:n tapaista mutta taempana ääntyvää konsonanttia. Siitä on kehittynyt heprean qof ק ja arabian qaf ق.
Kreikkalaiset muokkasivat qofista koppa-kirjaimen Ϙ, joka kuitenkin jäi pois kirjainkäytöstä jo 400-luvulla ja eKr. ja jäi käyttöön vain luvun merkkinä (90). Sen sijaan etruskit ottivat koppa-kirjaimesta kehitetyn merkin käyttöön kirjaimena, ja roomalaiset omaksuivat sen heiltä Q-kirjaimen muodossa k-äänteen merkiksi.
Vaikka gemena-q:n voisi ajatella kehittyneen suoraan qof-kirjaimesta, sen vasemmasta puoliskosta, alkuperänä on kuitenkin versaali-Q. Kirjain piirrettiin pienempänä ja sen alauloke korvautui toisentyyppisellä, oikealta alas vedetyllä viivalla, joka oli nopeampi kirjoittaa.
Jo antiikin aikana Q-kirjaimen ”häntä” muuttuu suoraan alaspäin osoittavasta vinoksi ja jopa lähes vaakasuorasti oikealle osoittavaksi. Vanhoissa piirtokirjoituksissa Q:n häntä usein ulottuu pitkälle seuraavan kirjaimen alle. Samoin on ollut monissa painotekstien fonteissa. Kirjoituskoneissa ja tietokonefonteissa Q:n muoto on yksinkertaistunut, joskin monet nykyiset ladontatekniikat kyllä sallisivat pitkähäntäisen Q:n.
Kuten C-kirjaimen tarinassa kerrottiin, Q:ta käytettiin latinassa aluksi O:n ja U:n (V:n) edellä, jossa k-äänne luonnostaan ääntyy hiukan taempana, hieman qofin tyylisesti. Myöhemmin Q jäi vain erikoiskäyttöön yhdistelmässä QU (QV) + vokaali.
Yhdistelmän QU alkuperäisestä ääntämisestä latinassa on kolme käsitystä:
Nykykielissä esiintyy myös ääntämys [ku] (mm. italiassa) ja [k] (mm. ranskassa). Espanjassa latinan qu-yhdistelmä on kehittynyt eri yhteyksissä eri tavoin (esim. aqua → agua), mutta jos kirjoituksessa on säilynyt qu, se lausutaan [k].
Tässä aloittaminen fraasilla ”Jo muinaiset roomalaiset” merkitsisi liian myöhäisestä vaiheesta aloittamista. Lyhyesti sanottuna siinä seemiläisessä kirjaimistossa, johon aakkosemme palautuvat, oli kolme erilaista k:n tapaisen mutta keskenään eri tavoin ääntyvän klusiilin merkkiä. Latinalaisen kirjaimiston muotoutuessa monen mutkan kautta tilanne oli se, että edellä mainituista merkeistä olivat kehittyneet C, K ja Q. Tähän viitattiin jo C:n tarinassa.
Eri vaiheiden jälkeen käytännöksi muodostui, että latinassa käytettiin k-äänteen merkkinä yleensä C:tä mutta U:n edellä yleensä Q:ta. Tätä (tuntemistaan kielistä oppimaansa) Mikael Agricola noudatti, kun hän loi suomen kirjakielen 1500-luvulla. Hän kirjoitti esimerkiksi quinga ja quiwa, vaikka tarkoitti samaa lukutapaa kuin me tarkoitamme asuilla kuinka ja kuiva.
Kirjoitustapa muuttui jo vuoden 1642 raamatunsuomennoksessa: q:n tilalle tuli k. Mielikuvat kirjoitusasusta quin (tai qujn) ja vastaavista voivat osittain perustua kuviin Agricolan teksteistä tai teoksista, joissa niitä on esitelty nykyaikaisia fontteja käyttäen. Toisaalta tällaiset kirjoitusasut voivat olla myös myöhempien aikojen ”uusvanhaa” leikillisyyden tuotetta, sillä tunnetaanhan q – lähinnä juuri yhdistelmässä qu esiintyvänä – monista vieraista kielistä.
Q-kirjaimen alkuperä ilmenee vielä muun muassa siten, että q-kirjainta käytetään eräissä yhteyksissä ”taka-k:n” eli kurkussa, tarkemmin sanoen kitakielekkeen avulla ääntyvän k:n tapaisen äänteen merkkinä. Tämä äänne on kielitieteelliseltä nimeltään soinniton uvulaarinen klusiili. Tällainen äännearvo q:lla on arabian siirtokirjoituksessa, jossa se on qaf-kirjaimen vastine, ja foneettisessa IPA-merkistössä.
Esimerkiksi nimi Qatar lausutaan (yleis)arabiassa siten, että alkuäänne ei synny kielen takaosan koskettaessa kitalakea (kuten k-äänteessä), vaan sulkeuman muodostaa kitakieleke. Tavallisessa suomenkielisessä puheessa ei ole syytä tavoitella tällaista ääntämystä, vaan arabian siirtokirjoituksen q luetaan k:ksi. Tämän mukaisia ovat myös yleensä hakuteoksissa olevat ääntämisohjeet.
Q-kirjainta käytetään myös kiinan kielen nykyisin virallisessa siirtokirjoitusjärjestelmässä pīnyīnissä (ks. kiinan kuvausta luvusta 6). Se tarkoittaa suomalaiselle outoa äännettä, jota voi kuvata karkeasti merkinnällä ”tsj” ja tarkemmin IPA-merkinnällä [ʨʰ]. Tämä tarkoittaa soinnitonta affrikaattaa, jonka alkukomponentti on t ja jälkikomponentti on aspiroitunut alveolaaris-palataalinen frikatiivi. Merkinnän ”tsj” j-kirjaimella on tässä haluttu kuvata palataalista, ”j-sävyistä” ääntämystä.
Olennaisinta on, ettei q kiinan siirtokirjoituksessa siis tarkoita ollenkaan k:n tapaista äännettä. Nimeä Qīng ei pidä lausua kuten englanninkielinen nimi King, vaan pikemminkin Tsjing. Q-kirjain otettiin tehtäväänsä lähinnä siksi, että se sattui olemaan latinalaisen perusaakkoston vapaana oleva kirjain sen jälkeen, kun muille kirjaimille oli annettu melko luonnolliset merkitykset.
Aiemmin käytetyssä Waden ja Gilesin järjestelmässä kyseisen äänteen merkkinä oli ch tai tarkemmassa kirjoitusasussa ch‘. Esimerkiksi kaupunginnimi Qīngdǎo kirjoitettiin aiemmin Ch‘ing-tao tai tavallisemmin Chingtao. Olutmerkin nimessä ja myös monissa kartoissa se esiintyy vielä toisessa vanhemmassa kirjoitusasussa Tsingtao.
Vanhassa kirjasuomessa Q-kirjainta käytettiin yleisesti k-äänteen merkkinä u-äänteen edellä, mutta jo pitkään Q:ta on käytetty vain harvoissa vierasperäisissä sanoissa, käytännössä vain sitaattilainoissa. Tällaisia ovat esimerkiksi acquis, bouquet, quiche, quisling ja squash. Niiden lukutapa on periaatteessa tietysti alkukielen mukainen, ja Q ääntyy lähes aina k:na. Sen jälkeinen U voi jäädä ääntymättä tai ääntyä u-, v- tai w-äänteenä.
Kansainvälisissä sanoissa (sivistyssanoissa), jotka johtuvat latinasta, on suomessa latinan qu-yhdistelmän tilalla kv, esimerkiksi akvaario (lat. aquarium) ja kvintti (lat. quinta). Vanhoissa, yleensä ruotsin kautta tulleissa lainasanoissa latinan sananalkuista qu:ta vastaa pelkkä v, esimerkiksi vartti (lat. quartum), koska sananalkuiset konsonanttiyhdistelmät ovat suomessa yleisesti yksinkertaistuneet. Joissakin sanoissa latinan qu:ta vastaa k tai kk eri syistä, esimerkiksi karanteeni (ranskan quarantaine) tai uudissana ubiikki (englannin ubiquitous).
Vieraissa nimissä Q-kirjain on suhteellisen tavallinen. Latinalaista aakkostoa käyttävissä kielissä q esiintyy yleensä u:n edellä, esimerkiksi Queens. Maltankielisissä nimissä q voi esiintyä yksinäänkin, samoin arabialaisesta tai kiinalaisesta kirjoituksesta siirtokirjoitetuissa nimissä, esimerkiksi Qatar ja Qinghai.
Joissakin vieraissa nimissä voi ”yksinäinen”, siis muuten kuin u:n edellä esiintyvä q-kirjain olla muutakin alkuperää, kenties vain erikoisuuden tavoittelua, esimerkiksi lentoyhtiön nimessä Qantas. Se on lyhennesana, joka on muodostettu sanoista Queensland and Northern Territory Aerial Service, ja se äännetään ikään kuin kirjoitusasu olisi Quantas. Tavallisempaa on, että q:ta käytetään vain tyylisyistä, esimerkiksi nimissä Compaq ja Elcoteq, ja se luetaan k:n tavoin.
Monet ovat niin tottuneet siihen, että q-kirjain esiintyy vain u:n edellä, että he automaattisesti kirjoittavat q:n jälkeen u:n. Niinpä virheellinen kirjoitusasu Quantas on varsin tavallinen, samoin Quatar.
Ruotsinkielisissä nimissä q:n jäljessä on usein v, muun muassa -qvist-loppuisissa nimissä. Tavallaan tämä on muistoa ajalta, jolloin u:n ja v:n välillä ei ollut eroa (ks. U-kirjaimen tarinaa). Arkisemmin kirjoitusasun voi sanoa johtuvan siitä, että se vastaa ääntämystä: -qvist äännetään kuten -kvist. Toisaalta q on ruotsalaisissa nimissä tavallaan vain koristekirjain, jota joskus käytetään k:n tilalla. Latinasta peräisin olevissa lainasanoissa qu on ruotsissa korvautunut kv:llä, esimerkiksi qualitatem → kvalitet.
Q-kirjaimen nimi luetaan suomessa kuu, ei guu. Epäselvää on, mistä g:llinen ääntämys on saanut alkunsa. Ehkä kyseessä on vain pyrkimys ääntää nimi hienosti: koska kirjain on vieras, ajatellaan, että sen nimeen pitää saada vieras äänne. Mahdollisesti myös g- ja q-kirjainten samantapaisuus on vaikuttanut asiaan, mutta useimmissa fonteissa ne ovat aika erinäköiset.
Leikillisessä kirjoituksessa käytetään q-kirjainta joskus äänneyhdistelmän kuu tai ku merkkinä eli niin, että sen tilalla on tarkoitus lukea kirjaimen nimi. Esimerkkejä: qluu = kuuluu, ihq = ihku ’ihana’. On väitetty, että ääntämys guu johtuisi pyrkimyksestä pitää kirjaimen nimi erossa sanasta kuu, mutta tämä ei tunnu uskottavalta, koska mitään sekaannuksen vaaraa ei ole, koska sanoja ei käytetä samoissa yhteyksissä.
Virheääntämystä guu väitetään jopa opetetun koulussa. Todennäköisesti kyseessä on kuitenkin vain yhdenlainen hyperkorrektismi eli oikeaksi, hienoksi luullun asun tavoittelu. Suomen kielessä ei juuri ole eroa k- ja g-äänteen välillä, mutta erikoisen oikeaa ääntämystä tavoiteltaessa saatetaan g-kirjain lukea (lähes) soinnillisena vieraiden kielten tavoin. Niinpä vaikka g:n nimi yleensä lausutaan kee, useimmat tietävät, että se pitäisi lausua gee. Tästä saattaa syntyä käsitys, että myös toisen vieraan konsonantin nimi kuu on väärä ja rahvaanomainen ja pitää lausua hienosti guu.
Fysiikassa q ja Q (kursiivilla) ovat useiden suureiden merkkejä: q voi tarkoittaa poikkipinta-alaa, tilavuusvirtaa tai massavirtaa, ja Q voi tarkoittaa sähkövarausta, lämpömäärää tai valomäärää. Näistä q:n merkitysten voi ajatella johtuvan ainakin osittain latinan sanasta quadratum ’neliö’, Q:n merkitysten taas sanasta quantitas ’paljous, määrä’.
Pelikorttien merkinnöissä (ja englannissa šakkinappuloiden merkinnöissä) Q tarkoittaa rouvaa eli kuningatarta. Tämä johtuu englannin sanasta queen.
Q-kirjaimesta on kehittynyt myös kysymysmerkki. Kysymyksen loppuun ruvettiin kirjoittamaan latinan sanan quaestio ’kysymys’ alkukirjain (versaalina). Tyylitellystä Q:sta tai sen oikeasta puoliskosta kehittyi sitten ”?”.
Nykykielessä Q on usein kysymystä tarkoittavan sanan kuten englannin question lyhenteenä. Esimerkiksi verkkokirjoittelussa saatetaan viestin otsikko aloittaa ”Q: ” sen korostamiseksi, että esitetään kysymys. Tätä voi verrata espanjan kielen käytäntöön, jossa kysymyksen alussa on käänteinen kysymysmerkki ¿.
Q-kirjaimen ”kysymyksellistä” luonnetta korostaa se, että varsin monet latinan ja sen tytärkielten kysymyssanat ovat q-alkuisia. Tämä ilmenee myös runomittaisesta latinankielisestä säkeestä, jonka tarkoitus on auttaa muistamaan, mitkä kysymykset on kysyttävä asioita selvitettäessä, esimerkiksi rikosta tutkittaessa: Quis? Quid? Ubi? Quibus auxiliis? Cur? Quomodo? Quando? (Kuka? Mitä? Missä? Minkä tai keiden avulla? Miksi? Millä tavoin? Milloin?)
Raamatuntutkimuksessa käytetyssä ilmauksessa Q-lähde Q-kirjain ei kuitenkaan tarkoita kysymystä eikä arvoituksellisuutta, vaikka kyseessä onkin vain päätelmiin perustuva oletettu tietolähde. Q-lähteellä tarkoitetaan Jeesuksen sanojen kokoelmaa, jonka oletetaan olleen sekä Matteuksen että Luukkaan käytettävissä. Nimi johtuu arkisesti saksan sanasta Quelle ’lähde’.
Matematiikassa käytetään Q:stä kehitettyä symbolia ℚ (U+211A) rationaalilukujen (kokonais- ja murtoluvuilla esitettävissä olevien lukujen) joukon merkkinä.
Latinalaisen aakkoston R on kehittynyt kreikkalaisen aakkoston rhoo-kirjaimesta Ρ. Siihen lisättiin viiva alas oikealle selvyyden vuoksi, koska muutoin oli sekaannuksen vaara varsinkin, kun Π-kirjaimesta kehittyi P. Tosin jo kreikassa esiintyi rhoosta R:n tapainen rinnakkaismuoto, josta latinan R saattaa olla peräisin.
Tällöin syntyi hiukan erikoinen tilanne, jossa täysin samannäköisellä merkillä P on eri merkitys kreikkalaisessa kuin latinalaisessa aakkostossa. Kyrillinen aakkosto on säilyttänyt kreikkalaisen käytännön eli kyrillinen pee П on p-äänteen ja kyrillinen er Р r-äänteen merkki.
Gemenamuoto r kehittyi versaalimuodosta R voimakkaan yksinkertaistumisen kautta: piirrettiin vain pystyviiva ja sen yläosaan pieni kaari oikealle, ikään kuin R:n kirjoittaminen jäisi kesken. Tällöin muoto sattui palaamaan lähelle rhoon muotoa. Toisaalta kreikassa gemena-rhoo muodostui hyvin erilaiseksi: ρ. Sen voi ajatella syntyneen versaali-rhoosta Ρ melko lailla samaan tapaan kuin latinalaisessa aakkostossa syntyi versaali-P:stä gemena-p. Tosin gemena-rhoon muoto vaihtelee, ja sen alauloke on usein oikealle kaartuva (esimerkki: ρ). Rinnakkaiskehitys tapahtui myös kyrillisessä aakkostossa, sillä gemena-er on aivan latinalaisen p:n näköinen.
Kreikan rhoo Р kehittyi seemiläisestä rosh-kirjaimesta 𐤓, jonka nimi tarkoitti päätä ja jonka muoto oli kehittynyt tyylitellystä ihmisen pään ja kaulan kuvasta. Roshin muoto oli P:n peilikuvan kaltainen ja siis kehittynyt vasemmalle katsovan ihmisen kuvasta, mutta vaihtaessaan kirjoitussuunnan kreikkalaiset vaihtoivat myös ”katseen suunnan”. Roshista ovat kehittyneet heprean resh ר (jossa siis voi vielä nähdä ”katseen vasemmalle”) ja arabian raʾ ر.
Eri kielissä r-kirjain ääntyy hyvin eri tavoilla, joiden välillä ei ole äänteellisesti paljoakaan yhteyttä. Suomalaiseen r:ään kuuluu selvä tärinä (kielen kärki tärisee eli tremuloi hampaiden takana olevaa ns. hammasvallia vasten), mutta monissa muissa ”r:issä” tärinä on vain yksi tärähdys tai pelkkä hankaus jos sitäkään. Lisäksi tärinän tai hankauksen paikka voi olla kurkunpäässä niin, että kielen kärki ei osallistu ääntämiseen lainkaan. Vielä ”r-äänne” voi olla vain r-mäinen piirre toisen äänteen ääntämyksessä tai jopa selvä vokaali. Tavallisimmat r:n ääntämistavat ovat:
Suomalaiselle tutun täry-r:n [r] ääntämyksessä on siinäkin vaihtelua mm. tärinän voimakkuudessa ja määrässä. Suomessa ja brittienglannissa r ääntyy täry-r:nä, mutta suomessa usein vahvemmin. Suomen kaksois-r (rr [rr]) olisi tulkittavissa myös pitkäksi, hyvin monitäryiseksi täry-r:ksi [rː].
Kyse ei kuitenkaan ole ihan puhtaasti siitä, että käytetään vain samaa kirjainta eri äänteistä. Eri ”r:t” kuitenkin koetaan jollakin vaikeasti kuvattavalla tavalla samantapaisiksi, ja ennen muuta ne voivat muuttua toisikseen kielen muuttuessa – ja myös korvata toisiaan esimerkiksi r-vikaisen puheessa. ”R-vika” on suhteellinen, kielestä riippuva käsite. Esimerkiksi jos suomalainen ääntää r:n kurkku-r:nä, hän käyttää äännettä, jota pidetään oikeana ranskassa – jossa taas suomalainen r voidaan kokea r-viaksi. Amerikassa voidaan skotlantilaisen tai suomalaisen täry-r:ää voidaan pitää huvittavana erikoisuutena, joka leimaa ulkomaalaiseksi. ”R-viat” ovat epäilemättä osaltaan vaikuttaneet r:n ääntämyksen muutoksiin ja kirjavuuteen.
Tunnetusti monissa kielessä, esimerkiksi brittienglannissa, kirjoituksessa esiintyvä r jää usein ääntymättä etenkin sanan lopussa. Tällöin kielessä on aiemmin ollut jonkinlainen r-äänne ja se on hävinnyt. Täydellistä häviämistä lievempää on se, että itse r-konsonantti häviää mutta siitä elämään jonkinlainen ”r-sävyisyys” edeltävässä vokaalissa tai seuraavassa konsonantissa. Sävy voi ilmetä konsonantin ääntymisenä siten, että kielen kärki kääntyy taaksepäin (retrofleksisyys), ja vokaalin ääntämisenä siten, että kielen kärki jossain määrin lähenee hammasvallia (roottisuus). Esimerkiksi amerikanenglannissa r:n ääntäminen sanan lopussa on viimeksi mainittua tyyppiä; esimerkiksi sanassa car ei tällöin äänny lopussa konsonanttia, vaan sanan vokaalin ääntämyksen lopussa kieli vain lähenee sentapaista asentoa kuin r:n ääntämyksessä. Toisaalta amerikkalainen ehkä kokee asian toisin, koska amerikanenglannin r-äännekin on yleensä pikemminkin ns. approksimantti kuin täry- tai edes hankausäänne (kieli on lähellä meidän r:mme mukaista asentoa mutta ei tärise eikä edes muodosta selvää ahtaumaa).
Kielessä voi olla useita r-äänteitä, mutta silloin ne ovat yleensä toistensa vaihtoehtoja eri murteissa tai eri äänneympäristöissä. Niiden voidaan siis sanoa olevan saman foneemin eri toteutumia. Tosin joskus kuvataan kurkku-r:ksi se arabian äänne, jota siirtokirjoituksessa merkitään gh:lla. Tällöin esimerkiksi sanassa Ghraib olisi kaksi erilaista r:ää peräkkäin. Kuitenkin gh:lla merkitty äänne on pikemminkin g:n tapainen hankausäänne kuin kurkku-r.
Esimerkiksi saksassa r-kirjain voi ääntyä kolmella tavalla:
[r] (kuten suomalainen r), etenkin sanan alussa
[ʁ] (hankaava kurkku-r), etenkin konsonantin jäljessä
[ɐ] (epäselvän a:n tapainen vokaali), etenkin vokaalin jäljessä.
Ääntämyksessä on myös murteittaista vaihtelua. Suomessa saksanopetuksessa ja saksalaisten sanojen ääntämisohjeissa usein ”oikaistaan” esittämällä r:n ääntämys aina suomenmukaisena.
Tämä moninaisuus on hankala niille, jotka haluavat oppia puhumaan vieraita kieliä mahdollisimman aidosti. Toisaalta ärrävikaisten on lohdullista tietää, että hyvinkin monet ”r-äänteet” osataan tulkita halutulla tavalla. Jos ei osaa tuottaa suomalaista täry-r:ää, voi tyytyä amerikkalaistyyppiseen r:ään, jolloin puhe on täysin ymmärrettävää, kunhan ääntämys on johdonmukaista. Sen sijaan r:n korvaaminen l:llä ei ole hyvä ajatus, koska silloin sanat voivat sekoittua toisiinsa.
R-äänteet muistuttavat osittain l-äänteitä niin, että niille on annettu yhteisnimitys likvidat. R-vikaisen puheessa r usein korvautuu l:llä – tai näin ulkopuolinen saattaa ainakin tilanteen kuulla.
Samankaltaisuutta osoittaa sekin, että r ja l saattavat muuttua toisikseen. Usein kyse on erilaistumisesta eli dissimilaatiosta: samassa sanassa olevista kahdesta r:stä (tai kahdesta l:stä) toinen muuttuu l:ksi (tai r:ksi). Tällöin ääntämys helpottuu, koska kahta lähekkäistä r:ää (tai l:ää) on hiukan hankala lausua. Tämä selittää esimerkiksi suomen sanan räätäli l:n; ruotsissa vastaava sana on skräddare.
Samankaltaisuus on joissakin kielissä johtanut jopa siihen, että r:n ja l:n välillä ei lainkaan tehdä eroa. Tämä koskee mm. japania ja kiinaa. Näiden kielten puhujilla on tämän takia usein vaikeuksia tehdä r:n ja l:n välillä eroa muita kieliä puhuessaankin. Japanissa voidaan sanoa olevan r-äänne mutta ei l:ää, ja siksi japanilainen saattaa korvata vieraan kielen l:t r:illä. Kiinan kielessä taas tilanne on toisinpäin.
H-kirjaimen tarinassa kerrottiin spiritus-merkeistä ja siitä, miten kreikassa kirjoitettiin spiritus asper myös sananalkuisen rhoo-kirjaimen yhteyteen (ῥ, Ῥ). Tämä johtui todennäköisesti siitä, että rhoolla merkityssä r-äänteessä oli tai oli ollut jonkinlainen aspiraatio tai muu piirre, kuten soinnittomuus. Roomalaiset käyttivät kreikkalaisten lainasanojen kirjoitusasussa vastaavasti yhdistelmää RH, esimerkiksi rhetor ’puhuja, reetori’, rhythmus ’rytmi’ ja Rhodus ’Rodos’. On mahdollista, että he myös äänsivät jonkinlaisen aspiraation ainakin huolellisessa puheessa.
Kaksois-rhoossa (sanan sisällä) saattoi spiritus liittyä kumpaankin kirjaimeen, ja tällöin tuli kyseeseen myös spiritus lenis, esimerkiksi Πύῤῥοσ (tai Πύρροσ). Jos tällainen sana on lainautunut latinaan, sen kirjoitusasussa on yleensä rrh, esimerkiksi Pyrrhus. Suomalaisista historiankirjoista tunnemme tämän nimen kantajan yleensä nimellä Pyrrhos ja puhumme Pyrrhoksen voitosta (joka tarkoittaa liian kalliiksi käyvää voittoa, joka tuhoaa voittajan). Suomalaisen standardin mukainen siirtokirjoitettu asu olisi kuitenkin Pyrros. Standardin mukaan nimittäin rhoo siirtokirjoitetaan vanhankin kreikan osalta aina pelkällä r:llä, spirituksesta riippumatta. Tähän sääntöön on tosin kyllä muitakin poikkeuksia, kuten kirjaimen itsensä nimi rhoo ja (yleisen käytännön ja monien sanakirjojen mukaan) sana rhododendron ’alppiruusu’.
Yhdistelmää rh ei siis suomen kielessä yleensä säilytetä lainasanoissa, ainoastaan vieraissa nimissä ja kansainvälisissä merkintätavoissa. Tästä esimerkkinä on, että kirjoitamme reesusapina emmekä latinan ja englannin mukaan rhesus, mutta tästä apinasta nimensä saanutta veren antigeeniä merkitään kansainvälisen käytännön mukaisesti symbolilla Rh. Sen pitemmässä nimityksessä ilmenee ymmärrettävää horjuvuutta: Rh-tekijä ∼ rhesustekijä ∼ reesustekijä.
Matematiikassa r tarkoittaa ympyrän tai pallon sädettä ja johtuu latinan sanasta radius ’säde’.
Postiliikenteessä R on kirjatun lähetyksen kansainvälinen tunnus. Se johtuu ranskan sanasta recommandé ’kirjattu’.
Fysiikassa r tarkoittaa kierrosta esimerkiksi ilmauksissa r/min ’kierrosta minuutissa’ ja r/s ’kierrosta sekunnissa’. Kirjain r johtuu tässä käytännössä englannin kierrosta tarkoittavasta sanasta round tai revolution. Esimerkiksi ilmauksen r/s sijasta käytetään myös (ja periaatteessa oikeammin) ilmausta 1/s tai s−1.
Sähköopissa R on suureen symboli, joka tarkoittaa resistanssia, jonka mittayksikkö on ohmi.
Nopeassa kirjoitetussa viestinnässä englanniksi (etenkin Internetissä) r tarkoittaa usein sanaa are ’olet, olemme, olette, ovat’, koska tämä sana ja r-kirjaimen englanninkielinen sana ääntyvät samoin. Tämä merkitys r-kirjaimella on myös mm. tunnetussa amerikkalaisessa liikemerkissä Toys “R” Us, joka logona kirjoitetaan niin, että R on leikillisesti peilikuvana (Я:n tapainen).
Matematiikassa käytetään R:stä kehitettyä symbolia ℝ (U+211D) reaalilukujen (jatkuvien suureiden arvoja kuvaavien lukujen) joukon merkkinä. Sen muoto vaihtelee; useissa fonteissa vain vasemmalla oleva pystyviiva on kaksinkertainen.
Šakkipelin merkinnöissä englannin kielessä R tarkoittaa tornia. Se johtuu sanasta rook, joka taas johtuu sotavaunuja tarkoittavasta persian sanasta. Suomalaisissa šakkimerkinnöissä taas R tarkoittaa ratsua.
R:stä kehitetty on myös rekisteröidyn tavaramerkin symboli ®. Tätä merkkiä ei suinkaan tarvitse tavallisen kirjoittajan liittää tavaramerkin nimen perään. Ainoastaan hakuteoksen laatija on velvollinen mainitsemaan tavaramerkistä, että se on rekisteröity – jos tavaramerkin haltija tätä vaatii. Jos kuitenkin halutaan lyhyesti ilmaista, että kyseessä on tavaramerkki, voidaan kirjoittaa rekisteröidyn tavaramerkin symboli ® tai, jos tavaramerkki ei ole rekisteröity, yleinen tavaramerkin symboli ™. Jos tavaramerkki tällöin esiintyy taivutetussa muodossa, mitä pitäisi välttää, niin symboli tulee taivutetun sanan perään. Yleensä näitä merkkejä käyttävät vain tavaramerkkien haltijat mainonnassaan. Tosin joissakin yrityksissä saattaa varovaisuuden vuoksi olla sääntöjä siitä, että muidenkin yritysten tavaramerkkien yhteydessä on käytettävä symbolia ® tai ™. Silloin siis ehkä joudutaan kirjoittamaan tähän tyyliin: ”Juomaksi on tarjolla Coca-Colaa® ja Hyla®-maitoa.”
S-kirjain on kehittynyt kreikkalaisesta sigma-kirjaimesta Σ muodon yksinkertaistumisen ja pyöristymisen kautta. Välimuodoksi voi ajatella Z:n peilikuvan, jossa sigman kulmikas viiva on korvautunut suoralla.
Gemena-s s on muodoltaan pienennettyä versaalia, mutta käsin kirjoitettaessa s usein liittyy edelliseen kirjaimeen jyrkästi nousevalla viivalla. Tämän mukainen on s nykyisinkin joissakin kaunokirjoitusta jäljittelevissä fonteissa.
Gemena-sigma kehittyi aivan toisenlaiseksi, ja siitä on kaksi muotoa: tavallinen σ ja sanan lopussa käytettävä ς. Versaali-sigmasta puolestaan on uudella ajalla kehitetty matematiikan sigma-symboli ∑, joka käytetään summalausekkeiden esittämiseen. Tämä perustuu siihen, että sigma ääntyy kuten latinan sanan summa alkukirjain.
Sigmasta – sen yksinkertaistuneesta muunnelmasta – on kehittynyt myös kyrillisen aakkoston C-kirjain, joka tarkoittaa s-äännettä. Se on siis aivan eri alkuperää kuin latinalainen C.
Kreikkalainen sigma-kirjain on kehittynyt seemiläisestä shin-kirjaimesta 𐤔, jonka nimi tarkoittaa hammasta ja jonka muoto lienee syntynyt kahden ylähampaan kuvasta, jonka muoto muodostui W:n tapaiseksi. Hampaiden muoto näkyy tavallaan selvempänä shinin seuraajassa heprean shin-kirjaimessa ש ja vielä selvemmin siitä kehitetyssä kyrillisessä šaa-kirjaimessa Ш. Arabiassa shinin seuraajia ovat sin س ja šin ش. Seemiläisissä kielissä muutenkin shinistä kehittyneet kirjaimet ovat tarkoittaneet sekä s- että š-äännettä siten, että lisämerkeillä (pienillä pisteillä) on saatettu osoittaa, kummasta on kyse. Shinin alkuperäinen ääntämys on ehkä ollut vain š.
Kreikkalaiset muuttivat shinin asennon kiertämällä sitä 90° myötäpäivään eli oikealle osoittavaksi, jolloin syntyi Σ. Kreikassa se tarkoittaa vain s-äännettä, koska suhu-s š puuttuu kreikasta.
Fraktuurassa (josta kerrottiin kohdassa 2.8) oli kaksi olennaisesti eri muotoa gemena-s:stä: tavallinen s eli ”lyhyt s” ja ”pitkä s” ſ. Nimet viittaavat kirjainten pituuteen, oikeastaan korkeuteen, eivät äänteen pituuteen; kumpikin oli ääntämykseltään tavallinen s, ei kaksoiskonsonanti kuten suomen ss. ”Lyhyt s” on olennaisesti gemena-S pienennettynä, kun taas ”pitkä s” oli alkujaan merkin ∫ tapainen, ikään kuin vaakasuunnassa litistetty versio S:stä. Myöhemmin merkin alakaari usein jäi pois, jolloin päädyttiin muotoon, joka muistuttaa f:ää. Pienimmillään ero voi olla sellainen, että pitkässä s:ssä ſ on lyhyt poikkiviiva vain pystyviivan vasemmalla puolella, f:ssä molemmilla puolilla.
Kahta erilaista s-kirjainta käytettiin myös käsin kirjoitetussa tekstissä, ja tämä tapa säilyi viimeisenä piirteenä vanhoista käsialoista. Myös painotekstissä se saattoi säilyä jonkin aikaa senkin jälkeen, kun fraktuurasta oli muutoin luovuttu. Tätä kuvastaa se, että vuonna 1948 julkaistu Aarni Penttilän Suomen kielen äänne- ja oikeinkirjoitusoppi kertoo:
”Kirjaimet ſ ja w (W) ovat tarkoin samatehtäväisiä kuin s ja v (V), mutta niiden käyttö on harvinaisempaa. Edellinen kuuluu varsinaisesti erityiseen kirjasinlajiin, fraktuuraan, jossa se on tavunalkuisen s:n merkkinä (käytetty kohdittain poikkeuksellinen tavujako periytyy kuitenkin vanhoilta ajoilta, niin että esim. niska, vastaan kirjoitetaan niſka, vaſtaan). Jälkimmäinen kuuluu sekin fraktuuraan, mutta jotkut viljelevät sitä (varsin tarpeettomasti) etupäässä nimissä ja lähinnä koristelusyistä antiikvassakin (esim. Wäinö, Weikko, Wainio).”
Viittaus vanhaan tavujakoon tarkoittanee sitä, että aiemmin saatettiin tavutuksessa erottaa kaksi konsonanttia kuten sk tai st tavun alkuun (ni-ska, va-staan). Tämä noudatti vieraita esikuvia. Monissa kielissähän sk tai st voi aloittaa sanan, jolloin on luonnollista käsittää ne myös sanan sisällä samaan tavuun kuuluviksi. Tosin tämä selitys saattaa olla turhan hankala. Valinta lyhyen ja pitkän s:n välillä saattoi riippua typografisista seikoista.
Pitkä s oli alkujaan gemena-s:n tavallisempi muoto, ja meidän s:äämme muistuttavaa muotoa käytettiin vain sanan lopussa. Kyse oli samanlaisesta ilmiöstä kuin kreikan kirjoituksessa, jossa s-kirjaimen vastineella on gemenassa sanan lopussa eri muoto (ς) kuin muualla (σ). Lisäksi ss-yhdistelmän ensimmäinen s kirjoitettiin pitkänä: ſs. Myöhemmin lyhyen muodon käyttö laajeni ja lopuksi, antiikvaan siirryttyä, syrjäytti pitkän s:n kokonaan.
Fraktuuran kirjainmuodot ovat myös saksan kaksois-s:n ß takana.
S-kirjaimen ääntämys vaihtelee suuresti, vaikka se yleensä on ”jonkinlainen s-äänne”. Esimerkiksi englannin kielessä esiintyy tavallinen s, joka ääntyy suomalaista terävämmin, suhu-s, jota yleensä merkitään sh:lla, soinnillinen s, jota merkitään z:lla tai s:llä, ja soinnillinen suhu-s, joka esiintyy melko harvoissa sanoissa, esimerkiksi sanassa measure. Venäjän kielessä on vielä enemmän ässiä.
Monissa kielissä s-kirjain ääntyy usein soinnillisena (IPA-merkki [z]) etenkin vokaalien välissä ja soinnillisen äänteen jäljessä sanan lopussa. Esimerkiksi englannin sanan roses ’ruusut’ molemmat s:t ääntyvät soinnillisina. Sellaisissa kielissä käytetään usein vokaalien välissä kahta s:ää (ss) tavallisen s‑äänteen merkkinä.
Koska suomen s-äänteellä ei varsinaisesti ole kilpailijoina muita s-äänteitä, sen ääntämys voi vaihdella äänteellisen aseman ja puhetilanteen mukaan ilman isoja ongelmia. Yleensä siinä on ainakin jonkin verran suhahtavuutta eli muiden kielten suhu-s:n piirteitä. Vaikka s ääntyisi täysin suhu-s:nä kuten usein humaltuneen puheessa, se on tunnistettavissa s:ksi, koska suomessa ei tarvitse juuri erottaa tavallista s:ää ja suhu-s:ää.
Periaatteessa huoliteltuun suomen yleiskieleen kuitenkin katsotaan kuuluvan s:n lisäksi suhu-s, joka tulisi merkitä š:llä, ja soinnillinen suhu-s, joka tulisi merkitä ž:lla ja joka käytännössä esiintyy (vieraita nimiä lukuun ottamatta) vain yhdistelmässä dž ja vain harvoissa sanoissa. Aiheesta on lisää Š:n ja Ž:n tarinoissa.
Kirjain s on ajan yksikön sekunnin tunnus. Aiemmin käytetystä suomalaisesta lyhenteestä ”sek.” on enimmäkseen luovuttu, kun taas englannin kielessä ”sec” tai ”sec.” on vielä melko tavallinen.
Kirjain S taas on siemensin, sähköopissa käytetyn konduktanssin yksikön tunnus.
Fysiikan kaavoissa kursivoitu s tarkoittaa usein matkaa, S taas entropiaa.
Vaatteiden kokomerkintänä S tarkoittaa pientä, englanniksi small.
S kompassisuunnan tunnuksena tarkoittaa etelää, englanniksi south.
Sellaisissa ilmauksissa kuin Ässärykmentti ei sana ässä ole s-kirjaimen nimenä vaan viittaa korttipakan ässään, joka on monissa peleissä maansa korkein kortti. Korttipakan ässän nimi johtuu monen vaiheen kautta latinan sanasta as (genetiivi assis), joka tarkoittaa kuparikolikkoa. Yhteys s-kirjaimen nimeen on siis sattumaa, mutta sitä voidaan käyttää kaupallisesti hyväksi: esimerkiksi S-kauppa voidaan mieltää Ässäkaupaksi.
Dollarin merkki $ näyttää S-kirjaimesta kehitetyltä, ja tavallaan se onkin. Sen alkuperä on ilmeisesti espanjalaista rahayksikköä tarkoittavan sanan peso monikkomuodon pesos lyhenne PS. Kun kirjaimet P ja S ruvettiin kirjoittamaan nopeasti päällekkäin, jäi P:stä jäljelle vain pystyviiva. Tässä vaiheessa symboli oli jo siirtynyt dollarin merkiksi. Myöhemmin se on otettu monien muidenkin valuuttojen merkiksi.
Hattu-s š on otettu suomen kieleen vuonna 1907 tšekin kielestä. Päätös tehtiin E. N. Setälän johtamassa oikeinkirjoitusta käsitelleessä kokouksessa. Perusteena oli, että kun suomessa yleisesti merkitään yhtä äännettä yhdellä kirjaimella, tarvittiin suhu-s:llekin oma merkkinsä. Tällöin ajateltiin, että kielessä on suhteellisen paljon sellaisia suhu-s:n sisältäviä vierasperäisiä sanoja, jotka on järkevää mukauttaa suomen kirjoitusjärjestelmään. Ei siis käytettäisi eri lainanantajakielten mukaisia merkintöjä suhu-s:lle, kuten saksan ”sch”, ranskan ”ch” ja englannin ”sh”, vaan yhtä suomalaista kirjainta.
Hattu-s:n rinnalla mainitaan yleensä hattu-z ž, jonka merkitys on paljon vähäisempi, mutta siitä on jäljempänä oma tarinansa.
Suositusta noudatti muun muassa vuosina 1908–1920 julkaistu laaja Tietosanakirja, jolla muutoinkin oli uraauurtava merkitys suomalaiselle tietokirjallisuudelle ja oikeinkirjoitukselle. Toisaalta suositus on usein unohtunut. Etenkin kirjoituskoneita käytettäessä suositusta on ollut vaikeaa tai mahdotonta noudattaa, ja sama koski pitkään myös tietokoneita.
Kielenhuoltajat ovat useaan otteeseen kuitenkin vahvistaneet suosituksen periaatteen, vaikkakin sävyssä ja yksityiskohdissa on ollut eroja. Muun muassa vuonna 2005 suomen kielen lautakunta esitti kannanoton suhuäänteiden merkinnästä vierasnimissä. Kannanotossa vaaditaan š:n ja ž:n käyttöä varsin tiukasti, tosin täsmentämättä, mitä kaikkia nimiä tämä periaate koskee. Verkkosivulla Suomen kielen normien muutoksia on kuvattu muutoksia š:n käytön ohjeisiin.
Tšekin kirjakielen loi Jan Hus (n. 1370 – 1415), joka parhaiten tunnetaan uskonpuhdistajana. Koska uskonpuhdistukseen sisältyi Raamatun saaminen kansan luettavaksi kansan kielellä, Hus oli myös kansallinen herättäjä ja kielen kehittäjä.
Hus otti käyttöön hatun, tšekiksi háček, eräiden kirjainten yhteyteen voidakseen merkitä tšekin kielen äänteitä, joille ei ollut sopivaa merkkiä latinalaisessa perusaakkostossa. Näihin kuuluivat š ja ž, jotka ovat suhu-s:n ja soinnillisen suhu-s:n merkkejä. Samaan tarkoitukseen ne otettiin suomen kieleen. Hus käytti aluksi yläpuolista pistettä (esimerkiksi ċ), mutta myöhemmin siirryttiin hattuun (esimerkiksi č), varmaankin paljolti selvyyden vuoksi.
Monet pitävät š:ää ja ž:aa suomessa tarpeettomina. Niitä käytetäänkin vain suhteellisen harvoissa lainasanoissa ja vieraissa nimissä. Osa suomalaisista ei edes tunne näitä kirjaimia kunnolla muun muassa siksi, ettei niitä juuri ole opetettu koulussa. Moni asia yksinkertaistuisi, jos š ja ž korvattaisiin lainasanoissa s:llä ja siirtokirjoituksessa englannin mukaisilla merkkipareilla sh ja zh.
Nykyisten sääntöjen mukaiseen kieleen š ja ž kuitenkin kuuluvat ja ovat kuuluneet jo sadan vuoden ajan. Tavallisessa tekstinkäsittelyssä ne on nykyisin helppo tuottaa, kunhan kerran selvittää, miten se käytettävässä ohjelmassa onnistuu.
Monissa lainasanoissa esiintyy suhu-s, vaikka niiden kirjoitusasussa ei ole hattu-s:ää, sillä ne kirjoitetaan lainantajakielen mukaisesti. Esimerkiksi sanassa show on suhu-s mutta ei hattu-s:ää, koska tässä englannista peräisin olevassa sanassa on säilytetty sen alkuperäinen kirjoitusasu. Toisaalta hattu-s ei käytännössä suinkaan aina äänny suhu-s:nä, vaan se voi toteutua lähes tai täysin s-äänteen kaltaisena. Nekin, jotka kirjoittavat šeriffi, saattavat sanoa seriffi.
Oikeastaan suhu-s esiintyy paitsi vierasperäisissä sanoissa myös hyssyttelyä tarkoittavassa interjektiossa, joka ääntämyksensä perusteella olisi kirjoitettava lähinnä šš, joskin se useimmiten kai kirjoitetaan shh.
Hattu-s siis kuuluu suomen viralliseen kirjoitusjärjestelmään, vaikka sitä ei kovinkaan hyvin opeteta koulussa. Monelle se on melko tuntematon. Lisäksi asiantuntijatkin saattavat sekoittaa käsitteitä ja puhua tästä kirjaimesta suhu-s:nä. Hattu-s on kirjaimen nimi, suhu-s taas äänteen nimi. Hattu viittaa kirjaimessa olevaan merkkiin, suhu taas äänteen suhisemiseen.
Kirjaimen š nimeksi mainitaan joskus äššä, mutta tämä on pikemminkin teoreettinen ajatus kuin käytössä oleva nimi.
Jos hattu-s:ää on teknisesti mahdotonta käyttää turvallisesti, käytetään sen tilalla kirjainparia sh. Viralliset säännöt eivät tätä sano, mutta pakkohan š on jollain korvata, jos sitä ei voi käyttää, eikä muita järkeviä vaihtoehtoja ole kuin sh.
Turvallisuus viittaa tässä mm. siihen, että kirjoitettaessa sähköpostia on kyllä usein helppoa kirjoittaa š, mutta on hyvin mahdollista, että viestin vastaanottaja näkee sen tilalla muun merkin tai ei mitään merkkiä. Myös muussa tiedon siirrossa järjestelmästä tai ohjelmasta toiseen voi syntyä vastaavia tilanteita. Kirjapainoalalla huolenaiheena on usein se, että š kyllä tulostuu paperille, mutta jälki on rumaa, koska š on peräisin eri fontista kuin muu teksti. Tällaiset ongelmat ovat väistymässä, mutta hitaasti.
Epäselvää on, miten tulisi suhtautua vieraissa nimissä esiintyvään š- tai ž-kirjaimeen silloin, kun tämä kirjain ei ole käytettävissä mutta se kuuluu nimen alkuperäiseen asuun (ei siirtokirjoitukseen) esimerkiksi tšekin tai liettuan kielessä. Korvaaminen sh:lla tai zh:lla ei vaikuta luontevalta. Tavallisinta on käytännössä jättää tarke pois. Täten esimerkiksi nimi ”Žīgure” typistetään yleensä muotoon ”Zigure”, jos joudutaan käyttämään suppeaa merkkivalikoimaa.
Kielenhuollon nykyisen kannan mukaan kirjaimia š ja ž ei tule korvata sh:lla ja zh:lla. Aiemmin kanta on ollut sallivampi eli sh ja zh on sallittu vaihtoehtoina.
Tiukkaa linjaa on perusteltu muun muassa sillä, että suomen kielessä yleisesti merkitään yhtä äännettä yhdellä kirjaimella. Suomen kielessä esiintyy myös kirjainyhdistelmä sh siten, että s ja h ääntyvät erikseen. Tällaisia tapauksia on yhdyssanoissa (esim. perushoito, mieshormoni), sanan ja liitepartikkelin rajalla (esim. tuloshan) ja joissakin lainasanoissa (esim. pasha ’eräs ruokalaji’). Kun lukija kohtaa sanan puoshaka, hän ei ehkä tiedä, että tämä on vanha suomen kielen sana, jossa sh:ta ei missään tapauksessa pidä ääntää suhuäänteenä.
Lisäksi suhuässä voi esiintyä kaksoiskonsonanttina, mikä ei aiheuta ongelmia hattuässää käytettäessä, mutta esimerkiksi vanhaa kirjoitusasua revanshi käytettäessä piti lukijan vain jostakin tietää, että se on tarkoitettu lausuttavaksi revanšši eikä revanši. Toisaalta kyllä nykyisin jo suositellaan asua revanssi.
Suhuässän merkitseminen sh:lla voi myös aiheuttaa virheellisen tavutuksen. Tavutuksen hoitavat nykyisin yleensä tietokoneohjelmat, eikä niiden voi olettaa ymmärtävän, ettei sanaa matkashekki saa jakaa s:n ja h:n välistä (matkas-hekki).
Jos teksti painetaan tai sen ulkoasu on muutoin erityisen tärkeä, on syytä tarkistaa erikseen, että siinä esiintyvät š ja ž näkyvät oikeanlaisina. On tavallista, että ovat ulkoasultaan huonoja esimerkiksi siksi, että ne ovat peräisin eri fontista kuin muu teksti (esim. šakissa) tai ne ovat huonosti suunniteltuja (esim. hattu väärässä kohdassa). Joskus voi olla tarpeen jopa vaihtaa koko tekstin fontti paremmaksi tämän takia.
Toisaalta usein vielä esiintyy pakkotilanteita, joissa nämä merkit eivät ole käytettävissä, jolloin ne joudutaan korvaamaan sh:lla ja zh:lla. Näin on yleensä syytä tehdä muun muassa sähköpostia kirjoitettaessa. Vaikka š:n ja ž:n kirjoittaminen siinä onnistuisikin, ei ole mitään takeita, että vastaanottajan sähköpostiohjelma osaa esittää ne oikein. Sen sijaan sähköpostin liitetiedostona lähetettävässä asiakirjassa voi yleensä hyvin käyttää hattu-s:ää ja hattu-z:aa.
Lainasanoissa käytettävää š-kirjainta vastaavat eri lainanantajakielissä eri kirjaimet ja kirjainyhdistelmät, etenkin sh, ch ja sch, joskus harvoin š. Sitaattilainoina kirjoitettavissa sanoissa suhu-s:kin kirjoitetaan alkukielen mukaan, joten niitä suositus hattu-s:n käytöstä ei yleensä koske. Esimerkkejä:
Kahdessa viimeksi mainitussa esimerkissä š ei kuulu alkuperäiseen kirjoitusasuun vaan siirtokirjoitukseen (translitteraatioon). Sen sijaan esimerkiksi sana šoguni on lainasana; vastaava sitaattilaina olisi japanin kielen mukainen siirtokirjoitettu asu shōgun (tai shogun tai šogun, sen mukaan, mitä siirtokirjoitusta käytetään).
Sitaattilainan ja kieleen mukautuneen lainasanan välillä ei ole selvää rajaa, kuten C:n tarinassa kuvattiin. Vaikka sitaattilainat tavallisesti mukautuvat suomen omaan kirjoitusjärjestelmään, kun ne leviävät yleiseen käyttöön, jotkin sanat tuntuvat olevan suojassa tällaisilta muutoksilta. Show ja chic tuskin muuttuvat kirjoitusasuihin šou ja šik.
Sitaattilainojen johdoksissakin käytetään yleisesti alkukielen kirjoitusasua, vaikka johdoksen muodostaminen jo osoittaa, että kyseessä on pikemminkin varsinainen lainasana kuin sitaattilaina. Toisaalta tällaiset sanat ovat yleensä arkisia, eikä niitä juuri huolitellussa kielessä, paitsi erisnimien johdoksia. Esimerkkejä: shoppailla, charmikas.
Erikoistapaus on sana šakki. Kielenhuollon käsikirja toteaa oudosti: ”Kirjainyhdistelmä sh on säilytettävä englanninkielisissä sitaattilainoissa sherry (voidaan suomalaisemmin kirjoittaa serri), shetlandinponi, venäläislainassa pasha ja – shakinpelaajien toivomuksesta – myös pelinnimessä shakki.” Kuitenkin Kieli%toimiston sanakirja esittää päähakusanana muodon šakki, joskin mainitsee asun shakki rinnakkaismuodoksi, ja kielitoimiston kannanotto vuodelta 1998 esittää sanan šakki yhtenä esimerkkinä tapauksesta, jossa on käytettävä merkkiä š.
Tavallisissa lainasanoissa suhuässä on laajasti korvautunut tavallisella ässällä, ja tällöin kirjoitetaan s-kirjain. Lisäksi käytännössä äännetään varsin yleisesti tavallinen ässä silloin, kun normien mukaista olisi kirjoittaa š ja lausua suhuässä.
Jo Nykysuomen sanakirjaan omaksuttiin tavallinen s eräisiin tapauksiin, joissa aiemmin oli ainakin periaatteessa äännetty suhuässä, nimittäin
Vuonna 1968 kielilautakunta lisäksi suositteli s:n käyttöä
Suuntaus on jatkunut. Esimerkki nykyisin kirjoitetaan jo usein sekki ja sokki, joskin varsinkin jälkimmäiseen sopii monien mielestä paremmin suhuässä sanan merkityksen takia. Lisäesimerkkejä: esimerkiksi sakaali ja samppanja kirjoitetaan sääntöjen mukaan tavallisella s:llä, vaikka ääntämyksessä on usein vielä suhu-s.
Sen sijaan š on säilytetty mm. seuraavissa sanoissa: šakki, šeikki, šeriffi.
Tilanne on epävakaa, eikä aina ole helppoa sanoa, mikä olisi viralliseen kielenkäyttöön sopivin muoto. Ääntämys vaihtelee paljolti kirjoitusasusta riippumatta, puhujan ja puhetilanteen mukaan. Varsin monissa edellä mainituissa s:llisiksi jo päätetyissäkin sanoissa äännetään usein suhuässä, samoin (ehkä tyylisyistä) esimerkiksi sanassa samppanja.
Š-kirjain esiintyy myös viron kielessä samassa tehtävässä kuin suomessa, siis lainasanoissa suhu-s:n merkkinä. Se otettiin käyttöön hiukan myöhemmin kuin suomessa, vuonna 1918.
Š on virossa jonkin verran yleisempi kuin suomessa, lähinnä siksi, että viro on usein säilyttänyt š:n tapauksissa, joissa suomessa on (ainakin virallisessa oikeinkirjoituksessa) nykyisin s. Esimerkkejä: šaakal ’sakaali’, šampanja ’samppanjaˇ’, šimpans ’simpanssi’, šrift ’kirjoitus’ (vrt. saksan sanaan Schrift.).
Jos vieraskielisessä, esimerkiksi englanninkielisessä tekstissä esiintyy muunkielisessä nimessä yhdistelmä sh (tai ch), se on usein korjattava š:ksi (tai tš:ksi) suomea kirjoitettaessa. Tämä voi johtua siitä, että š kuuluu nimen alkuperäiseen kirjoitusasuun, tai siitä, että kielen siirtokirjoitukseen on suomessa sovellettava eri sääntöjä kuin englannissa. Vastaavasti saksankielisen tekstin sch, ranskankielisen tekstin ch, ruotsinkielisen teksti sj jne. on usein korvattava š:llä.
Ei kuitenkaan pidä ruveta kaavamaisesti tekemään sellaisia muutoksia. Jos esimerkiksi englanninkielisessä uutisessa esiintyy vietnamilainen nimi, jossa on ch, sitä ei saa korjata tš:ksi, koska ch kuuluu alkuperäiseen vietnaminkieliseen kirjoitusasuun. On tiedettävä, mitä kieltä nimi on ja mitä sääntöjä suomenkielisessä tekstissä sovelletaan kyseistä kieltä oleviin nimiin. Jos nämä ehdot eivät täyty, on parempi jättää nimi ennalleen. Parasta on tietysti tarkistaa asia, jos mahdollista. Luvussa 6 olevat kuvaukset eri kielten merkistöistä ovat tässä avuksi. Seuraavassa on tiivistettynä muutama perussääntö:
Etenkin arabiankielisissä nimissä on tavallista käyttää sh-yhdistelmää mm. siksikin, että aina ei tiedetä, onko kyseessä varsinaisesti arabialainen nimi vai arabialaisperäinen mutta englanninkieliseen ympäristöön mukautunut nimi (esim. Omar Sharif, ei Omar Šarif).
Useat ohjeet mainitsevat, että š on šillingin lyhenne. Tämä on kuitenkin aika teoreettista. Šillinki rahayksikkönäkin on käynyt harvinaiseksi: suomalaisille se oli tutuin Britannian punnan osana (poistui v. 1971) ja toiseksi tunnetuin Itävallan rahayksikkönä (poistui euroon siirryttäessä v. 2002). Nykyisin se on käytössä vain eräissä Itä-Afrikan maissa (Keniassa, Somaliassa, Tansaniassa ja Ugandassa). Teoriassa suomalaiset Itä-Afrikan matkojen tekijät ja järjestäjät voisivat tarvita lyhennettä šillingille, mutta liekö miten realistista saada heidät käyttämään š:ää, jota paikallisissa hintalapuissa ei taatusti esiinny? Jos šillingille jotain lyhennettä tarvitaan, englannin mukainen ”sh” on varmasti tavallisin.
T-kirjain on kehittynyt kreikkalaisesta tau-kirjaimesta, joka versaalina on aivan T:n kaltainen. Gemenamuodoissa on eroa. Gemena-t on syntynyt siten, että poikkiviiva on laskeutunut alemmas ja pystyviiva on kaartunut alhaalta oikealle. Gemena-taun τ poikkiviivan asema ei ole muuttunut, mutta se on muuttunut hiukan aaltoilevaksi, ja pystyviivan kaareutuminen alhaalla on yleensä suhteellisesti voimakkaampaa kuin t:ssä.
Kyrillinen tee-kirjain on versaalina samanmuotoinen kuin latinalainen T ja versaali-T. Gemenana se on kyrillisen kirjaimiston yleiseen tapaan lähinnä pienennetyn versaalin muotoinen т, joskin aidossa kursiivissa se on aivan erilainen, lähes tai täysin latinalaisen kursiivi-m:n kaltainen: т.
Kreikan tau-kirjain kehittyi seemiläisestä rastin muotoisesta merkistä, jonka muuntuneita seuraajia ovat heprean tav ת ja arabian taʾ ت. Kreikkaan merkki omaksuttiin foinikialaisessa muodossa, joka muistutti +-merkkiä jotenkin kierrettynä; ulkoasu vaihteli. Kreikkalaiset vakiinnuttivat merkin asennon ja jättivät ylimmän sakaran pois sekä pidensivät alinta sakaraa.
Suomalaiset sanovat – tai ainakin ennen usein sanoivat – d-äännettä pehmeäksi t:ksi, oikean t:n eli kovan t:n vastakohtana. Nämä äänteet ovatkin toistensa vastineita monessa mielessä. Kuten D:n tarinassa kerrottiin, eroa on muussakin kuin soinnillisuudessa. Suomen t:tä äännettäessä kieli normaalisti koskettaa yläetuhampaita, ja tästä kosketuksesta aiheutuva ilmavirran katkeaminen on varsinainen t-äänne. Suomen d:ssä kieli sen sijaan koskettaa hampaiden yläpuolella olevaa hammasvallia.
Suomen t ei ole kova siinä mielessä kuin esimerkiksi englannin kielen t:n voi kokea oleva kova, nimittäin aspiroitunut. Aspiraatiossa kielen muodostama ilmavirran sulkeuma avautuu nopeasti ja siten, että ilman virtaaminen ulos luo h-maisen vaikutelman.
Englannin t-kirjain ei suinkaan aina tarkoita aspiroitunutta eikä edes soinnitonta äännettä. Esimerkiksi amerikanenglannissa sanassa latter yhdistelmä tt ääntyy lähinnä d:n tapaisena.
Useissa kielissä käytetään yhdistelmää th t-äänteen merkkinä monissa sanoissa, jotka on lainattu kreikasta, usein latinan kautta. Esimerkiksi saksan sanassa Theorie ’teoria’ ei h:lla ole merkitystä ääntämyksen kannalta – t-äänne on samassa määrin aspiroitunut kuin sanoissa, joissa sen merkkinä on vain t. Tämän taustaa selitettiin C:n tarinassa kohdassa CH:n monet merkitykset.
Englannin kielessä th kuitenkin tarkoittaa dentaalispiranttia [ð] tai [θ] myös kreikkalaisperäisissä sanoissa kuten theory.
Lisäksi th saattaa tarkoittaa aspiroitunutta t:tä etenkin sellaisia kieliä kirjoitettaessa, joissa esiintyy myös aspiroitumaton t. Näin on esimerkiksi thaikielessä. Suomalainen saattaa lausua th:n kirjaimellisesti lausumalla t:n ja h:n peräkkäin sikäli kuin osaa. Tämä on yleensä melko hyvä aspiraation jäljitelmä. Toisaalta se on turha sellaisissa vieraissa nimissä, joiden kirjoitusasuun kuuluu th mutta joissa yleisesti lausutaan tavallinen t, esimerkiksi Thaimaa.
Fysiikassa T on mittayksikön etuliitteen tera- tunnus ja tarkoittaa 1012- eli biljoonakertaista. Esimerkiksi TW = terawatti = 1 000 000 000 000 wattia. Etuliite johtuu kreikan sanasta teras (genetiivi: teratos) ’hirviö’. Tietotekniikassa T tarkoittaa biljoonakertaista tai 10244-kertaista (vrt. tunnusten k, M ja G kuvauksiin kyseisten kirjainten tarinoissa).
Mittayksikön tunnuksena T tarkoittaa magneettivuon tiheyden yksikköä teslaa, joka on saanut nimensä kroatialais-yhdysvaltalaisesta fyysikosta Nikola Teslasta.
Kansainvälisenä mittayksikön tunnuksena t tarkoittaa tonnia eli 1 000 kilogrammaa (eli 1 megagrammaa). Tonnin suomalainen lyhenne, jota kielitoimiston mukaan tulisi käyttää suomenkielisessä tekstissä on t. Suomalaisena lyhenteenä t tarkoittaa tuntia, jonka kansainvälinen tunnus on h. Tästä hiukan sekavasta tilanteesta ei juuri ole käytännön haittaa, koska varsin harvoin t olisi mielekkäästi tulkittavissa sekä tunniksi että tonniksi. Liikennemerkissä voisi sellainen merkintä kuin ”2 t” olla kaksitulkintainen (paino- vai aikarajoitus?), ellei tunnettaisi liikennemerkin tyyppiä tai sitä periaatetta, että merkinnöissä käytetään kansainvälisiä tunnuksia.
Fysiikan suureen tunnuksena t tarkoittaa toisaalta aikaa, toisaalta celsiuslämpötilaa. Versaali T puolestaan tarkoittaa termodynaamista, absoluuttista lämpötilaa taikka jaksonaikaa eli värähdysaikaa. Taustalla ovat latinan sanat tempus ’aika’ ja temperatura ’lämpötila’
Pelikorttien merkinnöissä T tarkoittaa joskus kymppiä (10). Merkintä johtuu englannin sanasta ten. Merkintää käytetään silloin, kun esimerkiksi tekstin asettelun takia halutaan merkitä kaikki korttien arvot yhdellä merkillä (2, 3, 4, 5, 6, 7, 8, 9, T, J, Q, K, A).
Šakkipelin merkinnöissä T tarkoittaa useissa kielissä tornia.
Versaali-T:n yksinkertainen muoto on synnyttänyt mm. sanat T-paita ja T-risteys. Varsinkin sana T-paita on ymmärrettävissä vain mielikuvitusta käyttämällä: kyse on lyhythihaisesta paidasta, jonka hihat ajatellaan T:n sivuviivoiksi ja muu osa leveäksi pystyviivaksi. Koska tämä usein jää hahmottamatta, esiintyy myös kirjoitusasuja teepaita ja t-paita, joissa idea T:n muodosta hämärtyy.
Kuten V:n tarinassa kerrotaan, latinassa V oli sekä u- että v-äänteen merkki. Keskiajalla ne ruvettiin vähitellen erottamaan toisistaan, mutta järjestelmälliseksi tämä käytäntö muodostui vasta 1600-luvulla.
U:n taustalla on jo vanhalla ajalla syntynyt V-kirjaimen pyöristynyt muoto. Kaksi eri muotoa – alkujaan puuhun kaiverrettaessa, kiveen hakattaessa tms. käyttökelpoinen V-muoto ja käsin kirjoittamiseen sopivampi pyöristynyt U – eriytettiin eri äänteiden merkeiksi. Siksi ei voinut tapahtua normaalia kehitystä, jossa vanha muoto muodostuu versaaliksi ja nopean käsin kirjoittamisen muoto gemenaksi. Niinpä U:n ja V:n gemenamuodoiksi otettiin yksinkertaisesti versaalit pienennettyinä: u ja v.
Tämän taustan takia U:lla merkkinä ei ole vastinetta kreikkalaisessa eikä kyrillisessä aakkostossa. Kuitenkin Y:n vastine kreikassa, ypsilon, on gemenana (υ) melko lailla u:mme kaltainen. Siirtokirjoituksessa latinalainen u toimii kyrillisen y:n vastineena äännearvojen vastaavuuden takia.
Vanhassa kirjasuomessa käytettiin kirjaimia u, v ja w varsin sekavasti. Kukin niistä saattoi olla konsonantin v tai vokaalin u tai pitkän vokaalin uu merkki ilman selkeää logiikkaa. Kuvaava esimerkki on Uuden testamentin ensimmäisen suomennoksen nimi: Se Wsi Testamenti.
Ruotsin kielessä u-kirjain ääntyy ns. keskivokaalina eli ei etu- eikä takavokaalina vaan siltä väliltä. Sen voi sanoa olevan tavallaan suomen u:n ja suomen y:n välimuoto. Foneettinen IPA-merkki sille on poikkiviiva-u [ʉ]. Esimerkiksi ruotsin sana nu on IPA-merkinnöin [nʉː]. Jotta ruotsissa voitaisiin pitää erillään äänteet [u], [ʉ] ja [y] (esimerkiksi sanoissa nog, nu ja ny), ääntyy ruotsin [y] vielä edempänä suussa kuin suomen vastaava äänne.
Ruotsin [ʉ] kuulostaa suomalaisen korvaan usein y-äänteeltä, ainakin melkein. Jotkut ovat saattaneet suomea puhuessaankin ääntää u-kirjaimen y:hyn vivahtavalla tavalla, ainakin jos kyseessä on ruotsista lainattu sana, kuten vaikkapa kulturelli. Tähän perustuu irvailu sellaisilla sanojen asuilla kuin kyldyrelli.
Tästä riippumaton ilmiö on, että ranskassa latinan u-äänne on yleensä kehittynyt y-äänteeksi, vaikka kirjoituksessa onkin säilytetty u. Niinpä esimerkiksi ranskan sanassa culture kumpikin u ääntyy y:nä. Toisaalta ranskassa on otettu käyttöön ou-yhdistelmä u-äänteen merkiksi.
Fysiikassa U on suureen symboli, joka tarkoittaa potentiaalia tai sisäistä energiaa (yksikkönä joule) tai sähköopissa jännitettä (yksikkönä voltti).
Fysiikassa u on tarkoittanut atomimassayksikköä, joka on hyvin pienten massojen ilmaisemiseen käytettävä yksikkö, suuruudeltaan noin 1,660 × 10–27 kg. Tämä yksikön nimi on nykyisin dalton ja tunnus Da.
Toinen vanhentunut u:n käyttötapa on sen käyttäminen mikro-etuliitteen tunnuksena oikean symbolin μ (myy-kirjain) sijasta, esimerkiksi ug = mikrogramma (oikea tunnus μg). Tämä on johtunut merkkivalikoiman rajoittuneisuudesta, mutta tällaista käyttöä esiintyy edelleen aivan tarpeettomasti.
Kemiassa U on uraanin tunnus. Koska uraani on ydinenergian tuotannossa tärkeä metalli, mainitaan yleiskielisessäkin tekstissä melko usein sen isotooppi uraani-235 tai uraani-238. Niiden kemiallisten tunnusten oikea kirjoitustapa on 235U ja 238U.
Joissakin yhteyksissä U-kirjain viittaa maan- tai merenalaisuuteen ja johtuu tällöin sanasta unter tai under ’alla’. Esimerkiksi sukellusvene on ruotsiksi ubåt, joka on lyhentymä sanasta undervattensbåt ’vedenalainen vene’, ja maanalainen kaupunkirata (metro) on saksaksi U-bahn, joka on lyhentymä sanasta Untergrundbahn ’pinnanalainen rata’.
Nopeassa kirjoitetussa viestinnässä englanniksi (etenkin Internetissä) u tarkoittaa usein sanaa you ’sinä te’, koska tämä sana ja u-kirjaimen englanninkielinen sana ääntyvät samoin.
Burmalaisen (myanmarilaisen) sukunimen edessä oleva U – esimerkiksi YK:n entisen pääsihteerin nimessä Sithu U Thant – ei ole lyhenne vaan sana, joka tarkoittaa ’herra’.
Matemaattisessa joukko-opissa käytetään U-kirjaimesta kehitettyä operaattoria ∪, joka tarkoittaa joukkojen yhdisteen eli unionin muodostamista. Joukko A∪B koostuu niistä alkioista, jotka kuuluvat A:han tai B:hen tai molempiin.
Unicode-merkeistä käytetyssä merkintätavassa U+nnnn oli alkujaan erikoismerkki ⊎ (U+228E, multiset union), joka on muodostettu unionin symbolista ja plusmerkistä. Sen oli tarkoitus kuvata Unicoden luonnetta kaikkien merkkijoukkojen unionina ja laajennuksena. Koska kyseinen erikoismerkki oli vain harvoin käytettävissä, sen tilalle kirjoitettiin ”U+”, joka muodostui varsinaiseksi merkintätavaksi, ja alkuperäinen jäi pois käytöstä.
Latinalaisen aakkoston V oli alkujaan sekä u-vokaalin että v-konsonantin merkki, ja tämä selittää sen alkuperää. V nimittäin oli alkujaan kreikan ypsilon-kirjaimen Υ muunnelma, ja ypsilon tarkoitti kreikassa u:n etuvokaalista vastinetta y:tä ja osittain varmaankin myös u-äännettä. Ypsilon puolestaan on seemiläisestä wau-kirjaimesta 𐤅 kehittynyt, kuten F:n tarinassa mainittiin.
Koska u- ja v-äänne ovat melko samantapaisia ja koska latinassa ei ollut y-äännettä, roomalaiset siis rupesivat käyttämään ypsilonista kehittynyttä V:tä sekä u:n että v:n merkitsemiseen. He kirjoittivat esimerkiksi SVS, POPVLVS, VAE, VVLT.
Nykyisessä latinan kirjoitustavassa tavallisin käytäntö on, että vanhan latinan V:n tilalla käytetään u:ta tai v:tä sen mukaan, onko se vokaalin vai konsonantin merkki. Kirjoitetaan esimerkiksi sus, populus, vae, vult. Kuitenkin u:ta käytetään v-äänteen merkkinä erikoistapauksessa: konsonantin ja vokaalin välissä, esimerkiksi suavis ja quid. (Yhdistelmästä qu ks. Q:n tarinaa.) Toinen, harvinaisempi käytäntö on käyttää V:n vastineena aina u:ta, esimerkiksi sus, populus, uae, uult. Tämä siis vastaa antiikin aikaista kirjoitustapaa, paitsi että kirjaimen muoto on toinen.
Suomessa [v]:n ja [f]:n ero on liukuva, koska [f] esiintyy vain uudehkoissa lainasanoissa ja on usein muuttunut tai muuttumassa [v]:ksi. Niinpä ääntämys voi olla asfaltti tai asvaltti tai jotain siltä väliltä ymmärrettävyyden kärsimättä. Vaikka [v] on soinnillinen, sen ei siis tarvitse olla selvästi ja vahvasti soinnillinen.
Suomen kielessä ei ole myöskään [v]:n ja [w]:n välistä vastakohtaa kuten englannissa. Onkin väitetty, että v:n liian kevyt ääntämys on suomalaisten tavallisimpia kielivirheitä englantia puhuttaessa. Suomen v:hen ei useinkaan sisälly selvää hankausta (frikatiivisuutta), kun ilma kulkee alahuulen ja ylähampaiden välistä. Huuli ja hampaat eivät ehkä edes ole jäntevästi kiinni toisissaan vaan vain kevyesti sipaisevat tai vain lähestyvät toisiaan, jolloin äännettä sanotaan approksimantiksi.
Foneettisessa kuvauksessa suomen v-äänne saattaisikin usein olla paremmin esitettävissä approksimantin merkillä [ʋ] kuin varsinaisen v-konsonantin merkillä [v]. Englannissa pitäisi v lausua selvästi hankausäänteenä, suunnilleen kuin suomessa sanottaessa pontevasti ja painokkaasti Voi Venäjä! Tällöin syntyy selvä ero v:n ja w:n välille ja esimerkiksi sana vet eroaa kuuluvasti sanasta wet.
Tunnettu alatyylin sana lyhennetään kirjoituksessa yleensä v–u, v:u tai vain v. Tällainen kiertoilmaisu on muodostunut niin yleiseksi, että sitä käytetään myös puheessa, joten sanasta vee on tavallaan muodostunut itsenäinen kirosana tai ehkä pikemminkin harmittelusana, joka saatetaan kirjoittaa myös sanana vee eikä vain kirjaimella v. Sivistyneeseen asiatyyliin se ei tietenkään kuulu.
Sanaksi kehittymistä osoittaa myös johdos v:mäinen tai veemäinen. Jos kyseessä olisi vain kirjoituksen lyhennemerkintä alkuperäisen sanan johdoksesta, se olisi vokaalisoinnun mukaisesti v:mainen.
V-kirjaimen tai sen nimen (vee) käyttö tällaisessa tehtävässä on niin yleistä, että sen vaikutukset kannattaa ottaa huomioon. Murrosikäisille koululaisille puhuttaessa tai kirjoitettaessa ei ehkä kannata käyttää sellaisia ilmauksia kuin V-tyyli, V:n muotoinen jne.
Versaali-V on typografisesti ongelmallinen, koska se on ylhäältä hyvin leveä, jolloin sen ja viereisen merkin väliin jää usein niin paljon tilaa, että siinä näyttää jopa olevan sananväli. Monissa fonteissa esimerkiksi sana Valko-Venäjä näyttää siltä, kuin siinä olisi kolmekin sananväliä: ensimmäisen V:n jäljessä ja toisen V:n molemmin puolin.
Ongelma on usein korjattavissa säätämällä merkkien välistystä, mutta tätä eivät useimmat kirjoittajat tai toimittajat osaa tai viitsi tehdä. Tosin kehittyneet taitto-ohjelmat saattavat huolehtia asiasta automaattisesti.
Etenkin otsikoissa ja logoissa välistystä kannattaa ehkä säätää etenkin juuri V:n yhteydessä. Esimerkiksi Word-ohjelmassa voidaan valita merkkijono hiirellä maalaamalla, antaa komento Muotoile→Fontti, valita Merkkiväli-välilehti, asettaa välistys arvoon Tiivistetty, 1 pt. Tällöin Word pienentää merkkijonon kunkin merkin jälkeistä tyhjää tilaa 1 typografisen pisteen verran (noin 0,4 mm). Tiivistyksen lukuarvoa voi joutua säätämään fontin, fonttikoon ym. mukaan. Seuraavassa on sana Valko-Venäjä Jomolhari-fontilla ensin ilman tiivistystä, sitten edellä mainitut kolme kohtaa puolen¤toista pisteen verran tiivistettyinä:
Sama ongelma koskee toki W:täkin, mutta se on suomen kielessä paljon harvinaisempi.
V-kirjaimella sellaisenaan on useita symbolimerkityksiä kuten seuraavat:
Muodollisessa logiikassa käytetään v-kirjaimesta kehitettyä operaattoria ∨, joka tarkoittaa loogista tai-operaattoria. Taustalla on latinan sana vel ’tai’.
W-kirjain on syntynyt V:n kahdentamisesta. Suomalainen nimi kaksois-v johtuu tietysti tästä. Luultavasti kaksi peräkkäistä V-kirjainta on kirjoitettu alun alkaenkin ligatuuriksi, kiinni toisiinsa tai jopa limittäen. Epäselvempää on, miksi, missä ja milloin näin on tapahtunut. On mahdollista, että W on keksitty useaan kertaan tai että W:n muoto on lainautunut mutta sen tulkinta ja merkitys ovat muuttuneet.
Muinaisenglannissa otettiin käyttöön kahdennettu u-kirjain osoittamaan konsonanttia (tai puolivokaalia) [w]. W:n englanninkielinen nimi double u ’kaksois-u’ heijastaa sitä, että merkki miellettiin kahden u-vokaalin merkin yhdistelmäksi, mutta merkin muoto vastaa yhdistelmää vv. Ristiriita selittyy sillä, että tuolloin u- ja v-kirjainta ei ainakaan johdonmukaisesti vielä erotettu toisistaan. W:n käyttö lienee alkanut 600-luvulla mutta ei muodostunut kovin yleiseksi, koska w-äänteen merkkinä käytettiin usein riimukirjoituksen wynn-kirjainta ᚹ. Normannien valloitettua Englannin vuonna 1066 alkoi w yleistyä, ja vähitellen se korvasi wynnin.
Saksassa kaksois-v:tä eli w:tä ruvettiin käyttämään 1000-luvulla, jotta voitaisiin erottaa toisistaan v- ja f-äänne. Taustalla oli se, että v-äänne oli usein muuttunut f-äänteeksi mutta kirjoitusasussa oli säilytetty V-kirjain. Kirjoitusjärjestelmässä tosin jo oli F-kirjain, mutta V:tä ei kuitenkaan näissä tapauksissa vaihdettu F:ksi – kenties siksi, että muutos olisi koettu liian isoksi. Sen sijaan V-kirjain jätettiin vain f-äänteen merkiksi, ja v-äännettä tarkoittava V ruvettiin kahdentamaan.
Puolan kieleen on omaksuttu w v-äänteen merkiksi, kun taas v:tä ei puolassa käytetä lainkaan.
Seemiläisestä wau-kirjaimesta 𐤅 on siis kehittynyt viisi latinalaisen (englantilaisen) aakkoston kirjainta: F, U, V, W ja Y.
Kuten kohdassa 2.10 kuvattiin, englannin w-äänteessä huulet lähenevät toisiaan mutta eivät (ainakaan selvästi) kosketa toisiaan. Se siis poikkeaa sekä u-vokaalista, jossa suu on selvästi avoinna ja pyöristyneenä, että v-äänteestä, jossa alahuuli koskettaa ylähampaita. Englannissa näiden äänteiden pitäminen erossa toisistaan on olennaista. Suomessa englannista peräisin oleva w ääntyy helposti v:nä.
Toisaalta suomalaisissa ääntämisohjeissa merkitään w-äännettä usein u-kirjaimella silloin, kun halutaan esittää ohjeet mahdollisimman yleistajuisina. Esimerkiksi Wisconsin-nimen ääntämys saatetaan kuvata merkinnällä [uiskonsin]. Tämän ajatellaan antavan oikeamman kuvan ääntämyksestä kuin v-kirjain antaisi. Toisaalta merkintä saatetaan ymmärtää väärin niin, että lausutaan esimerkiksi diftongi [ui].
Monissa muissakin kielissä esiintyy w-äänne. Esimerkiksi japanin siirtokirjoituksessa käytetty w-kirjain (kuten nimessä Kurosawa) tarkoittaa sitä, eikä japanissa edes ole v-äännettä.
W-kirjain on suomen kielessä vanhastaan V:n rinnakkaismuoto. Se on usein koettu vain V:n koristeellisemmaksi muunnelmaksi.
W-kirjain oli erityisen tavallinen fraktuurassa, ja fraktuuran mukainen w säilyi melko pitkään myös antiikvassa. Tähän on ehkä vaikuttanut se, että w on kirjainhahmoltaan selvemmin u:sta (ja muista kirjaimista) erottuva kuin v. Tämä oli erityisen merkitsevää fraktuurassa, jossa u:n ja v:n ero oli usein pieni ja ne saatettiin sekoittaa (kirjainten jonoissa) myös n:ään, kun taas w erottui selvästi. Niinpä fraktuurassa v-äänteen merkkinä oli yleensä w (w), usein u (u), harvoin v (v). Fraktuuran versaalikirjaimistossa ei yleensä edes ollut erillistä versaali-V:tä, ainoastaan versaali-U U ja versaali-W W.
W-kirjain äännetään suomen kielessä yleensä v:nä silloinkin, kun sana on englannista peräisin. Esimerkiksi sanassa watti ääntyy v, ja web lausutaan yleensä veb tai vep. Tosin myös w-ääntämystä saattaa esiintyä varsinkin huolitellussa puheessa, jos kyse on selvästi vieraasta nimestä, joka koetaan englannista peräisin olevaksi, esimerkiksi Washington tai Wilson.
Yleisesti kun sitaattilaina suomalaistuu kirjoitusasultaan, siinä ehkä oleva w muuttuu v:ksi, esimerkiksi wok → vokki. Toisaalta w tuntuu asettuneen jäädäkseen joihinkin lainasanoihin kuten show, joka ei osoita mitään merkkejä muuttumisesta suomalaiseen kirjoitusasuun šou. Yksinkertaiset, lyhyet, englanninkielisissä teksteissä usein esiintyvät sanat tuntuvat vastustavan kirjoitustavan suomalaistamista, etenkin jos se merkitsisi nykyisestä paljon poikkeavaa asua.
Erikoisen sanaparin muodostavat talousalan termit warrantti ja varrantti, jotka molemmat johtuvat englannin sanasta warrant. Vanhempi laina varrantti ’todiste tavaratalletuksen vastaanottamisesta’ on kirjoitusasultaan mukautunut suomeen. Uudempi warrantti ’oikeus ostaa tai myydä määrätty kohde määrättyyn hintaa määrättynä päivänä tai ennen sitä’ on säilyttänyt w:n, joskin sekaannusten takia siihenkin joskus kirjoitetaan v.
Erisnimien johdoksissa w kuten muutkin vieraat kirjaimet yleensä säilytetään. Poikkeuksen muodostaa mm. se, että Charles Darwinin nimestä johdettu opin nimi suositellaan nykyisin kirjoitettavaksi asussa darvinismi.
Rinnakkaisuuden takia W aakkostettiin kuten V. Tämä on ollut kätevää, koska löytääkseen herra Virran nimien luettelosta ei tarvitse tietää, käytetäänkö hänen nimessään kirjoitusasua Virta vai asua Wirta. Melko monissa sukunimissä on säilytetty W-kirjain, osittain siksi, että nimien asut yleisesti muuttuvat hitaammin kuin kieli muutoin, osittain siksi, että W alettiin kokea jotenkin hienoksi ja sivistyneeksi. Onpa W jopa pyritty tuomaan V:n tilalle nimiin (kuten Varkaus), joissa sitä ei ole vuosikymmeniin käytetty.
Saksankielisten sanojen w-kirjain ei aiheuttanut ongelmia, koska sekin piti lukea v-äänteeksi. Sen sijaan englanninkielisten lainojen ja nimien yleistyminen on horjuttanut tilannetta. Esimerkiksi puhelinluetteloiden tekijät joutuivat hankalaan tilanteeseen. Ulkomaalaiset, varsinkin englanninkieliset, kokevat yleensä V:n ja W:n eri merkeiksi eivätkä siten osaisi etsi Wilsonia V-alkuisten sanojen seasta. Jos taas V ja W erotetaan aakkostuksessa eri merkeiksi, joudutaan suomalaisia nimiä etsittäessä katsomaan ehkä sekä Vuoren että Wuoren kohdalta. Käytännössä ongelma on aika selvästi ratkaistu kansainvälisyysperiaatteen mukaan: W aakkostetaan V:n jälkeen eri merkiksi. Samaan tulokseen on usein päädytty ilman erityistä päätöstä, koska tietokoneella tehty aakkostus automaattisesti johtaa siihen, ellei aakkostusta ole erityisesti sovitettu vanhan suomalaisen käytännön mukaiseksi.
Kuten luvussa 2 aakkostuksen kuvauksessa mainittiin, v ja w ovat suomalaisen aakkostusstandardin mukaan aakkostuksen kannalta sama kirjain, mutta tästä saa poiketa. Poikkeaminen on yhä yleisempää, ja aikanaan standardi muuttunee sellaiseksi, että w aakkostetaan erillisenä kirjaimena v:n jälkeen. Vanhan aakkostustavan perustana on ollut pohjoismainen käytäntö, mutta siitä ollaan virallisestikin luopumassa muissa pohjoismaissa. Ruotsin akatemian sanakirjassa ruvettiin vuonna 2006 käsittelemään w:tä itsenäisenä kirjaimena, joka aakkostetaan v:n jälkeen.
Edellä kuvatuista syistä monissa suomalaisissa nimissä esiintyy w-kirjain, esimerkiksi Waltari, Wiipurin Sanomat, Wiipurilainen Osakunta. On jopa pyritty muodostamaan uusvanhoja kirjoitusasuja kuten Warkaus ja Welho, lähinnä kai huomion tavoittelemiseksi.
Jos nykyisin käytössä olevassa nimessä on w-kirjain, esimerkiksi Wuori, niin se on tietysti säilytettävä nimeä kirjoitettaessa. Tulkinnanvaraisempaa on, miten tulee menetellä, kun mainitaan jokin aiemmin käytetty nimi tai lainataan vanhaa tekstiä. Jos vanhassa tekstissä on käytetty johdonmukaisesti w:tä, voidaan ajatella, että kyse on fontin verrattavasta asiasta ja että lainauksessa siten voidaan käyttää v:tä. Esimerkiksi vanhojen kirjojen ja lehtien nimissä sen sijaan on ehkä perustellumpaa säilyttää w-kirjain, osittain siksikin, ettemme aina tiedä, onko w:n käyttö ollut tarkoituksellinen valinta.
Fysiikassa W-kirjainta käytetään tehon yksikön watin tunnuksena. Watti-nimi johtuu englantilaisen keksijän James Watt (1736–1819) nimestä. Usein käytetään watin kerrannaisia kilowatti (kW) ja megawatti (MW). Hevosvoima (hv), joka on vanha tehon (ei voiman) yksikkö, on noin 735 wattia.
Kemiassa W on volframin, teknisesti tärkeän metallin kemiallinen tunnus. Tunnus on sikäli harvinainen, että se on muodostettu saksan sanasta. Saksankielinen nimitys Wolfram on muodostettu sanoista Wolf ’susi’ ja Rahm ’lika’. Englanniksi volframi on tungsten, joka puolestaan johtuu ruotsista (tung sten ’painava kivi’).
W kompassisuunnan tunnuksena tarkoittaa länttä, englanniksi west.
X-kirjain on muodoltaan peräisin kreikan aakkosten khii-kirjaimesta. Versaali X ja versaali khii ovat käytännössä edelleen samanlaiset, mutta gemenakirjaimissa muodot ovat eriytyneet: x, χ.
Muinaiskreikassa khii ääntyi k:na, johon liittyy voimakas aspiraatio, h:n tapainen ”henkäys”. Foneettisesti tätä merkitään seuraavasti: [kʰ]. Myöhemmin ääntämys muuttui eräänlaisen voimakkaasti äännetyn kurkku-h:n tapaiseksi, ja tätä merkitään foneettisesti gemena-khiillä: [χ]; äänteen nimitys on soinniton uvulaarinen frikatiivi.
X:llä on latinassa kuitenkin eri äännearvo kuin khiillä kreikassa, nimittäin [ks]. Hämmennystä lisää, että kreikassa oli ja on myös kirjain, jonka äännearvo on [ks], nimittäin ksii (Ξ, ξ). Selitys on, että roomalaiset eivät omaksuneet X-kirjainta meidän tuntemastamme ”normaalista” (attikalaisesta) lreikan kirjaimistosta vaan länsikreikkalaisesta muunnelmasta, jossa khiin äännearvo oli [ks].
Tiedämme siis X:n kreikkalaisen alkuperän, mutta varhaisempi kehitys on osittain epäselvä. Todennäköisesti sekä kreikan ksii (Ξ) että kreikan khii (Χ) kehittyivät muinaisseemiläisestä semk-kirjaimesta 𐤎. Samedhin muita seuraajia ovat heprean samekh ס ja arabian sad ص, äännearvoltaan ns. faryngalisoitunut s (s-äänne, jota lausuttaessa kurkunpää on supistunut niin, että äänne kuulostaa painokkaalta).
Semkin alkuperä jää historian hämäriin. Kirjaimen nimi lienee tarkoittanut kalaa, mutta sen muodon on päätelty kehittyneen jonkinlaisesta teltan tukirakennelman kuvasta.
Kyrillisessä kirjaimistossa on täysin meidän X:mme näköinen kirjain, jonka nimi kuitenkin on ”ha” ja joka ääntyy voimakkaan h:n tapaisena. Se on peräisin kreikan khiistä. Sitä käytetään venäjän kielessä usein muiden kielten h-äänteen vastineena; esimerkiksi Helsinki kirjoitetaan venäjässä yleensä Хельсинки. Venäjässä ei ole meidän h:tamme suoraan vastaavaa äännettä. Toisaalta venäjän joissakin murteissa g-äänne, jota kyrillisessä kirjoituksessa merkitään Г:llä, on kehittynyt h:ksi, ja muutenkin g- ja h-äänne muistuttavat toisiaan. Niinpä venäjässä esiintyy myös kirjoitustapaa, jossa muiden kielten h:ta vastaa Г. Aiemmin käytettiin esimerkiksi Helsingistä sen ruotsinkieliseen nimeen Helsingfors perustuvaa asua Гельсингфорс.
Suomen kielessä x-kirjain on erittäin harvinainen. Sitä ei oikeastaan käytetä edes erikoislainoissa, ainoastaan sitaattilainoissa kuten foxtrot, josta siitäkin käytetään suomalaistettua asua fokstrotti ja arkisempaa asua foksi. Erikoislainoissa x on korvautunut ks:llä. Tuoreissa lainoissa x saattaa hetken säilyä, mutta sitten tapahtuu muutos kuten xylitoli → ksylitoli. Jostakin syystä x-kirjain on säilynyt etenkin sanojen alussa. Se esiintyy vielä usein mm. seuraavissa sanoissa, joissa kaikissa sen tilalla tulisi olla ks: xenofobia, xenon, xerokopio, xylitoli, xylofoni.
Joissakin yleiskielen sanoissa x on säilynyt sitkeästi myös sanan keskellä x suosituksista huolimatta. Kirjoitusasu taxi säilyi pitkään, koska sitä käytettiin taksien kilvissä yms., mutta nykyisin se on harvinainen. Sen sijaan fax tai faxi on yhä tavallinen; suositeltu asu on faksi.
X tietysti esiintyy vieraissa nimissä ja niiden johdoksissa kuten Luxor ja luxorilainen. Erikoistapaus on, että erisnimestä Marx johdetut sanat kuten marxilainen kirjoitetaan nykyisin usein ks:llä (marksilainen).
X-kirjain on niin harvinainen, että aapisten tekijöillä on ollut suuria vaikeuksia esimerkkien keksimisessä. Tavallisin esimerkki lienee vanhastaan ollut Xerxes, mutta tämä muinaisen kuninkaan kreikkalainen nimi pitäisi suomessa kirjoittaa Kserkses. Muutoinkin kreikkalaisten nimien siirtokirjoituksessa pitäisi suomalaisen standardin mukaan käyttää ksiin vastineena ks:ää, ei x:ää, esimerkiksi Naksos, ei Naxos. – Eri asia on, että ksii-kirjaimen translitterointi yhdellä kirjaimella sopisi paremmin translitteraation perusajatukseen: korvataan kirjaimiston merkit toisen kirjaimiston merkeillä jonkin yksinkertaisen kaavan mukaan.
Muutoinkin suomen kielessä esiintyy suhteellisen usein virheellistä x:n käyttöä, koska ei ole ymmärretty korvata vieraan kielen x:ää ks:llä. Esimerkiksi lampun valaistusvoimakkuudeksi saatetaan ilmoittaa ”800 lux”, vaikka pitäisi käyttää joko yksikön tunnusta lx (800 lx) tai yksikön suomenkielistä nimeä (800 luksia), ei sekamuotoa.
Leikittelevässä kielessä on usein käytetty x:ää ks:n tilalla, esimerkiksi yx. Käytäntö lienee yleistynyt viime vuosina verkkokeskusteluissa, tekstiviesteissä yms. paitsi luullun huvittavuutensa takia myös lyhyyden vuoksi.
Mikael Agricola käytti äänneyhdistelmän ”ks” merkkinä x-kirjainta aivan järjestelmällisesti. Nykyajan nuori, joka kirjoittaa mixei, jäljittelee siis tietämättään kirjakielemme isää. Käytäntö jatkui mm. vuoden 1642 raamatunsuomennoksessa.
Vuonna 1810 Jaakko Juteini, joka muutoinkin vaikutti oikeinkirjoituksen kehittymiseen, ryhtyi käyttämään x:n tilalla ks:ää. Muutos vakiintui melko nopeasti muualla kuin uskonnollisessa kirjallisuudessa, jossa jatkettiin x:n käyttöä. Kuitenkin jo vuonna 1776 x oli korvattu ks:llä Raamatussa.
Perinteen ja ulkomaisten esikuvien lisäksi x:n käyttöön houkutti lyhyys. Toisaalta merkintätapa oli epälooginen, koska yleensä suomessa kirjain tarkoittaa yhtä äännettä, ei kahta.
Latinassakin X oli sikäli tarpeeton kirjain, että se kuvaa äänneyhdistelmää, ei erillistä äännettä. Sen sijasta olisi voitu kirjoittaa CS, kuten joskus kirjoitettiinkin.
X-kirjaimen käyttö tekee latinan taivutuksen osittain epäsäännöllisemmäksi kirjoituksessa kuin ääntämyksessä. Esimerkiksi rauhaa tarkoittava sana on perusmuodossaan pax, genetiivissä pacis. Jos perusmuoto kirjoitettaisiin pacs, olisi vastaavuus ilmeisempi: kummassakin muodossa on kantana pac-, ja päätteet ovat -s ja -is. (Tosin tämä ei olisi muoto-opillisesti ihan oikea kuvaus; sanan perusvartalo on pace-.)
Suomalainen lukee X:n luonnostaan [ks]. Tämä vastaa X:n äännearvoa latinassa ja monissa muissa kielissä. Kuitenkin monia muitakin ääntämyksiä on. X ääntyy esimerkiksi
Kirjoitusasu Texas johtuu espanjasta, ja siinä x-kirjain tarkoittaa alkujaan edellä mainittua h:n tapaista äännettä. Espanjassa käytetään myös kirjoitusasua Tejas. Englannin kielessä vanha kirjoitusasu säilyi, ja x ruvettiin lukemaan [ks] kuten yleensä englannissa. Tämä ääntämys siirtyi suomeenkin, ja suomessa joskus kirjoitetaankin Teksas. Nimi Meksiko on samaan tapaan syntynyt espanjankielisestä muodosta México ['meχiko].
Varsin yleisesti x-kirjainta käytetään kertomerkkinä. Tämä johtuu kirjoituskoneiden ja varhaisten tietokoneiden merkkivalikoiman suppeudesta. Tietokoneiden ohjelmointikielissä kertomerkkinä käytetään yleensä asteriskia ”*”, ja se on levinnyt muuhunkin käyttöön.
Nykyisin suositellaan käytettäväksi muita tapoja kertolaskun ilmaisemiseen, kuten kertomerkkiä ×. Esimerkiksi ilmauksen 5x5 sijasta tulisi käyttää ilmausta 5 × 5. Ulkoasun samanlaisuuden takia kertomerkki on suomalaisessa kansainvälisessä näppäimistössä sijoitettu x-kirjain näppäimeen: × saadaan aikaan näppäilyllä AltGr(x).
Kertomerkiksi x on tarkoitettu myös sellaisissa CD-rom-asemien nopeuksia kuvaavissa ilmauksissa kuin ”40x”. Se, tai oikeammin siis ”40×”, tarkoittaa tiedonsiirtonopeutta, joka 40 kertaa niin suuri kuin ensimmäisten CD-rom-asemien nopeus (joka oli 150 kilotavua sekunnissa).
Italian kielessä käytetään arkisessa kirjoittelussa usein x-kirjainta sanan tai kirjainyhdistelmän per merkkinä. Esimerkiksi sana perché saatetaan kirjoittaa xché tai xche. Syynä on se, että x ajatellaan kertomerkiksi ja että kertomerkki luetaan italiassa per. Suomalaista tämä voi hämmentää, koska suomessa per tarkoittaa jakolaskua tai suhdetta.
Usein x-kirjain ymmärretään jonkinlaiseksi rastiksi tai ruksiksi, jossa on kaksi keskenään kohtisuorassa olevaa lyhyttä viivaa. Kuten edellä esitetystä ilmenee, tällainen luonnehdinta sopisi paremmin kertomerkkiin. Tyypillisessä kirjapainofontissa x-kirjaimessa on vaakasuorat pääteviivat ja alhaalta vasemmalta ylös oikealle kulkeva viiva on ohuempi kuin toinen pääviiva. Ne eivät välttämättä edes ole aivan kohtisuorassa toisiaan vasten. Niinpä x ei muodosta mitenkään puhdasta rastikuviota. Versaali-X on siitä vielä kauempana.
Kaikesta huolimatta x on mielletty rastiksi esimerkiksi silloin, kun on täytetty lomakkeita kirjoituskoneella. Pieneen neliöön lyöty x on toiminut valintamerkkinä, joka kertoo, että kyseinen vaihtoehto halutaan valita. Unicodessa on toisaalta erikseen tällaiseen käyttöön viittaava rasti- eli ruksimerkki ballot ✗ (U+2717).
Tavallaan rastiajatukseen on perustunut myös ”äksääminen” eli tekstin peittäminen (eräänlainen ylipyyhkiminen) kirjoituskoneella lyömällä kirjainten päälle x-kirjaimia. Tämä tietysti perustuu siihen, että kirjaimen päälle lyöty x yleensä melko tehokkaasti rikkoo kirjaimen hahmon. Tosin asteriski ”*” on usein tehokkaampi.
Kirjain X edustaa sanaa cross ’risti’ sellaisissa englannin kielen ilmauksissa kuin XING = crossing ’risteys’.
”Herra X” tarkoittaa tuntematonta, joskus myös ketä tahansa. Taustalla on matematiikan käytäntö, jossa kirjaimilla x, y ja z yleisesti merkitään tuntemattomia suureita tai muuttujia. Tämän taustalla puolestaan on, että kun matematiikassa usein merkitään aakkosten alkupään kirjaimilla a, b, c jne. vakioita tai tunnetuiksi oletettuja suureita, niin englannin aakkoston loppupään kirjaimet otettiin muuttujien tai tuntemattomien suureiden merkeiksi. Yleisesti nykymatematiikassa kyllä käytetään kirjaimia niin vakioiden kuin muuttujienkin merkkeinä varsin vapaasti. Koulumatematiikasta kuitenkin lienee peräisin x:n käyttö tuntemattoman symbolina yleiskielessäkin.
On selitetty, että x:n matemaattinen käyttö juontaa juurensa aikaan, jolloin Länsi-Euroopassa omaksuttiin algebra ja algebrallisia merkintätapoja arabeilta. Arabit käyttivät sanaa šayʾ ’asia, esine’ samaan tapaan kuin me käytämme x:ää. Espanjalaiset lainasivat tämän sanan kirjoitettuna asussa xei, missä x oli suhu-s:n (š) merkki senaikaisen käytännön mukaan. Tämä sana sitten lyhennettiin pelkäksi x:ksi. Vaihtoehtoinen selitys lähtee samasta arabian sanasta mutta tulkitsee, että se käännettiin latinan sanaksi causa, jota merkittiin x:llä, koska latinan x:n ääntämyksessä on sanan causa konsonantit.
Tasopinnan pisteiden sijaintia eli koordinaatteja ilmaistaessa on tapana käyttää kirjaimia x ja y koordinaattien symboleina. Tästä johtuu, että vaaka-akselia (abskissa-akselia) kutsutaan nimellä x-akseli.
Tietotekniikassa esiintyy x-kirjaimen käyttöä yleismerkkinä, joka voi edustaa mitä tahansa merkkiä tai merkkijonoakin, samaan tapaan kuin asteriskia * käytetään. Esimerkiksi lyhenne xDSL tarkoittaa joukkoa tekniikoita, joista käytetään lyhenteitä, jotka koostuvat jostakin kirjaimesta ja merkeistä DSL, siis mm. ADSL, HDSL ja VDSL. On hienoa kutsua tavallista ADSL-päätettä xDSL-päätteeksi!
Tuntemattoman merkityksestä johtuu myös englanninkielinen nimitys X rays ’röntgensäteet’. Nämä säteet olivat aluksi salaperäisiä ja aiheuttivat onnettomuuksia, koska niiden vaikutuksia aliarvioitiin. Suomen kielessäkin käytettiin joskus nimitystä X-säteet.
Tuntemattomuuteen tai salaperäisyyteen viitannee myös Marvel-yhtiön sarjakuvien (ja niihin perustuvien elokuvien) nimi X-Men. Se tarkoittaa joukkoa ihmisiä, joilla on ihmeellisiä voimia.
Kun Twitter-palvelun nimi muutettiin X:ksi vuonna 2023, X:n selitettiin kuvaavan sitä, että kyseessä on kaikkeen käytettävä sovellus, ”everything app”. X:n logoksi valittiin X-kirjaimen sellainen graafinen asu, joka voidaan esittää myös kirjoitusmerkkinä 𝕏 (U+1D54F, MATHEMATICAL DOUBLE-STRUCK CAPITAL X, matemaattinen kaksoisviivallinen iso x).
Epäselvää on, miksi x-kirjainta on ruvettu käyttämään sananosan trans vastineena joissakin englannin sanoissa varsinkin tekniikan slangissa, esimerkiksi xfer = transfer ja xlate = translate. Asiaan ehkä vaikuttaa se, että sananosa johtuu latinan prepositiosta, joka tarkoittaa mm. ’yli, tuolle puolen’. Kenties x-kirjaimen muodossa on nähty ikään kuin silta, joka johtaa joen yli.
Useissa yhteyksissä X:ää käytetään symbolisoimaan jonkinlaista kieltoa. Tämä saattaa olla yhteydessä edellä kuvattuun tuntemattoman merkitykseen mutta ehkä enemmänkin siihen, että X:n muotoista merkkiä on käytetty hylkäämisen merkkinä – ”vedetään henkselit yli”. Useinkin on kyse enemmänkin täysin symmetrisestä rastista kuin mistään kirjaimesta. Kirjoituksessa rasti kuitenkin yleensä korvataan X-kirjaimella.
Useissa maissa X esiintyy elokuvien luokituksessa tarkoittamassa ’vain aikuisille sallittu’. Alaikäisiltä kieltäminen johtuu yleensä kovasta pornosta tai raa’asta väkivallasta. Toisaalta seksi- ja pornotuotanto on ottanut X-kirjaimen mainoskäyttöön, esimerkiksi korostamalla sex-sanan x:ää. Se käyttää myös X:n toistamista (XX, XXX jne.) tehokeinona. Osittain tämän takia Yhdysvalloissa luovuttiin virallisesti X:n käytöstä luokituksessa (X-rated) ja siirryttiin merkintään NC-17. Toisaalta mielikuvien voimakkuutta osoittaa, että Internetin ylimmän tason verkkotunnuksiin on lisätty .xxx juuri seksiä ja pornoa varten.
Toisella tapaa kieltomerkkinä x-kirjain esiintyy (yleensä gemenana) lentoaikataulujen merkinnöissä, joissa luetellaan viikonpäivien numerot. Esimerkiksi 67 tarkoittaa, että lentoa liikennöidään viikon 6. ja 7. päivänä eli lauantaisin ja sunnuntaisin. Merkintä x67 tarkoittaa, että lentoa liikennöidään kaikkina muina päivinä. Tällaisessa merkintätavassa x edustaa lähinnä englannin sanaa except ’paitsi’.
X-kirjainta on ruvettu etenkin tietotekniikassa käyttämään englanninkielisissä ja lyhenteissä, usein niiden alussa, edustamassa sanaa extended ’laajennettu’ tai extensible ’laajennettavissa oleva’ taikka extra ’hyvin, lisä-, erikois-’. Tämä johtuu etenkin siitä, että X-kirjaimen nimi englanniksi on ex. Tällaisia lyhenteitä ovat esimerkiksi XBasic, XGA, XHTML ja XML.
Vaatteiden kokomerkinnöissä X:llä ei ole itsenäistä merkitystä, mutta XL tarkoittaa hyvin isoa, extra large. Tässäkin siis X-kirjain on ajateltava sanaa extra edustavaksi. Koko XXL tarkoittaa erittäin isoa, extra extra large. X tarkoittaa ”ekstraa” myös konjakin laatumerkinnässä X.O.: extra old, ’erityisen vanha’.
X-kirjaimella muitakin symbolimerkityksiä. kuten seuraavat:
Kuten F-kirjaimen tarinassa mainittiin, kreikan ypsilon Υ kehittyi wau-kirjaimesta 𐤅. Ypsilon lainautui – ehkä valmiiksi V:n tapaisessa muodossa – latinaan V-kirjaimeksi, joka toimi u- ja v-äänteen merkkinä. Myöhemmin, 1. vuosisadalla eKr., ypsilon lainautui uudestaan kreikasta latinaan. Syynä on lisääntynyt Kreikan kulttuurin tuntemus ja harrastus sivistyneiden roomalaisten keskuudessa. He omaksuivat kreikasta lainasanoja, joita he pyrkivät ääntämään kreikan mukaan. Tällöin lainautui myös y-äänne ja sen merkiksi Y-kirjain.
Aluksi y:tä käytettiin latinassa vain kreikkalaisissa lainoissa, ja niissäkin se usein todennäköisesti luettiin u:ksi ainakin arkipuheessa. Tähän viittaavat mm. kirjoitusasut, joissa on y:n tilalla u.
Gemena-y kehittyi keskiajalla versaalimuodosta siten, että kirjain ruvettiin kirjoittamaan alemmas ja piirtämään kahdella vedolla kolmen sijasta, jolloin alaosa muodostui samansuuntaiseksi kuin oikea ylähaara.
Jo antiikin ajan latinassa y-äänne alkoi muuttua i:ksi. Tätä osoittaa sellainen kirjoitusasun vaihtelu kuin lacryma ∼ lacrima. Myöhemmin y ruvettiin kokemaan vain i:n hienommaksi merkiksi, ja alkuperäisiin latinalaisiinkin sanoihin saatettiin kirjoittaa y, esimerkiksi silva ∼ sylva.
Latinasta polveutuvissa eli romaanisissa kielissä kuten ranskassa ja espanjassa y:n ääntämys on muuttunut i:ksi. Tosin joissakin sanoissa y:tä saatetaan käyttää myös j:n merkkinä. Vastaava tilanne on monissa muissakin kielissä. Englannin kielessä asiaan tuo oman lisänsä se, että y on usein tarkoittanut pitkää suppeaa i-äännettä, joka englannin suurissa äänteenmuutoksissa muuttui ai-diftongiksi (esimerkiksi sanassa why).
Monissa nykykielissä y-kirjain onkin vain i:n tai joskus j:n merkki, jota käytetään kreikkalaisperäisissä sanoissa. Usein sen nimityskin tarkoittaa ’kreikkalainen i’. Ymmärrettävistä syistä se on usein korvautunut i-kirjaimella.
Koska mm. englannissa y yleensä ääntyy vokaalin edellä (esimerkiksi sanassa yes) j:nä, on y:llä tämä äännearvo varsin monissa siirtokirjoituksen järjestelmissä. Tällöin j-kirjainta ei käytetä tai sen äännearvo on englannin mukaisesti [ʤ] (suunnilleen suomen oikeinkirjoituksen dž). Myös uudehkoissa kirjoitusjärjestelmissä, joita eri kielille on luotu, on saatettu omaksua samanlainen käytäntö. Niinpä turkissa y tarkoittaa aina j-äännettä, kun taas y-äänteen merkki on ü.
Venäjän siirtokirjoitusjärjestelmissä y tarkoittaa yleensä ns. taka-i:tä (oikeastaan keski-i:tä) kyrillisen kirjaimen ы vastineena. Suomalainen yleensä lukee sen y-äänteenä, mikä on äänteellisesti aika väärin mutta ei juuri aiheuta ymmärtämisongelmia, varsinkaan kun venäjässä ei ole y-äännettä.
Puolan kielessä y-kirjain tarkoittaa vokaalia, joka on jonkin verran väljempi kuin i-äänne ja IPA-merkillä ilmaistuna [ɪ].
Saksan kielessä y esiintyy vain lainasanoissa. Saksassa normaali y-äänteen merkki on ns. saksalainen y eli treema-u, ü.
Suomessa käytetyssä muinaiskreikan siirtokirjoituksessa sekä kreikasta lainautuneissa sanoissa on kreikan ypsilonin (Υ, υ) vastineena yleensä y-kirjain, paitsi vokaalin jäljessä u-kirjain. Kuitenkin omikronin ja ypsilonin yhdistelmän ου vastineena on suomalaisen standardin mukaan u (tai ū), joskin käytännössä ranskan ja englannin esikuvan mukainen ou on varsin tavallinen. Nämä siirtokirjoitustavat vastaavat todennäköisesti melko hyvin muinaiskreikan ääntämystä.
Niinpä esimerkiksi kreikan sana ὔβρις, jolla on haluttu kuvata ihmisen röyhkeää ylpeyttä, kirjoitetaan suomalaisen siirtokirjoituksen mukaan hybris. Englannissa se kuitenkin kirjoitetaan yleensä hubris, koska englannissa ei ole y-äännettä. Y-kirjain ääntyisi englannissa tällaisessa sanassa i:nä, mutta u-kirjaimella on tarkoitus kuvata u-äännettä, jonka ajatellaan olevan sopivampi vastine.
Englannista suomeen käännetyissä teksteissä saattaa tämän takia esiintyä hubris-tyyppisiä asuja.
Mittayksikön etuliitteen tunnuksena Y tarkoittaa kvadriljoonalla kertomista, y taas kvadriljoonalla jakamista. Ne vastaavat englannissa etuliitteitä yotta- ja yocto-, suomessa etuliitteitä jotta- ja jokto-. Kvadriljoona on miljoonan neljäs potenssi eli 1024 = 1 000 000 000 000 000 000 000 000. Ymmärrettävästikin kyseiset etuliitteet ovat erittäin harvinaisia. Joillakin fysiikan aloilla niille on kuitenkin järkevää käyttöä. Esimerkiksi Maapallon massa on noin 5 960 jottagrammaa (Yg). Nämä etuliitteet ovat varsin keinotekoisia. Ne selitetään johdetuiksi kahdeksaa tarkoittavista italian sanasta otto ja latinan sanasta octo sillä perusteella, että kyseessä ovat kahdeksannet etuliitteet sarjoissa k, M, G, T, P, E, Z, Y ja m, µ, n, p, f, a, z, y.
Matematiikassa y esiintyy usein yhdessä x:n kanssa muuttujan symbolina; usein niiden seurassa on myös z. Ks. X:n tarinaa. Usein y tarkoittaa ns. riippuvaa muuttujaa, x riippumatonta, kun tarkastellaan suureiden riippuvuutta toisistaan. Erityisesti y-akseli tarkoittaa suorakulmaisen koordinaatiston pystysuoraa akselia, joka on kohtisuorassa x-akselia vastaan.
Y-kromosomi tarkoittaa miespuolista sukupuolikromosomia; ks. X:n tarinaa.
Y-kirjaimesta on kehitetty jenin symboli ¥. Se tarkoittaa sekä Japanin rahayksikköä jeniä (japaniksi yen) että Kiinan rahayksikköä juania (kiinaksi yuán).
Z-kirjain on kehittynyt kreikan zeeta-kirjaimesta. Versaalikirjainten muodot ovat täsmälleen samat.
Nykyisin tavallisin gemena-z:n muoto on sama kuin versaali-Z:n. Aiemmin käytettiin myös toisentyyppisiä muotoja, joissa on alauloke ja jotka usein pohjautuvat fraktuuran z:aan (z). Sellaisista muodoista on kehittynyt latinalaisen kirjaimiston lisäkirjain häntä-z ʒ, josta käytetään myös nimeä ezh. Gemena-zeeta ζ poikkeaa muodoltaan melkoisesti Z:sta, mutta se lienee syntynyt niin, että Z:n vasen alakulma on pyöristynyt isoksi kaareksi ja kaarevuutta on lisätty myös merkin alku- ja loppupäähän.
Suomen kielessä Z:sta käytetty nimi lienee tavallisimmin tset, mutta taivutusmuodot muodostetaan sanasta tseta (esimerkiksi tsetan, tsetalla jne.).
Sekä vanhan ajan kreikan zeetan että vanhan ajan latinan Z:n ääntämys on epäselvä ja kiistanalainen. Zeetan ääntämyksen on arveltu olleen [dz], [zd] ja [z], missä z tarkoittaa soinnillista s:ää kuten IPA-merkinnöissä yleisesti. Jopa ääntämystä [ts], jota Suomessa on yleisesti käytetty vanhaa kreikkaa ja latinaa luettaessa, voisi perustella jossain määrin.
Monet tutkijat ovat sitä mieltä, että zeetan äännearvo oli [z] (kuten nykykreikassakin) ja että tätä ääntämystä käytettiin varhaisina aikoina myös latinassa Z:lle. Vokaalien välissä latinan Z kenties ääntyi kaksoiskonsonanttina [zz]. Ääntämys [ts] on omaksuttu ehkä vasta melko myöhään saksalaisella kielialueella, josta se on tullut suomeen.
On tapana mainita, että Z-kirjain ei kuulunut latinan alkuperäiseen aakkostoon vaan lainattiin myöhemmin kreikasta ja siksi sijoitettiin aakkoston loppuun. Kuvaus pitää paikkansa, mutta on myös esitetty, että Z kyllä jo aiemmin kuului latinan aakkostoon ja tarkoitti soinnillista sibilanttia, siis samaa äännettä kuin esimerkiksi englannissa. Tällainen z-äänne olisi ollut s-äänteestä eräissä tilanteissa (vokaalien välissä) kehittynyt ja sitten myöhemmin muuttunut edelleen r-äänteeksi. Tällöin Z-kirjain olisi jäänyt tarpeettomaksi.
Ajatus kahdesti lainaamisesta on kiehtova, mutta perustuu epävarmoihin tietoihin. Selvintä on todeta, että mahdollisen esivaiheen jälkeen Z joka tapauksessa lainattiin kreikkalaisesta aakkostosta kreikkalaisten nimien ja kreikkalaisperäisten lainasanojen kirjoittamista varten 1. vuosisadalla eKr., samoihin aikoihin kuin Y. On luonnollista olettaa syyksi se, että sellaisissa sanoissa oli äänne, jota ei latinassa ennestään ollut ja jota varten siis tarvittiin uusi kirjain. Ja helpointa oli käyttää samaa kirjainta kuin kreikassa.
Kun Zorro tekee miekallaan Zorron merkin, Z:n, hän ehkä piirtää miekalla miekan kuvan. Z nimittäin on kehittynyt muinaisseemiläisestä zai-kirjaimesta 𐤆, joka on nimittäin saattanut alkujaan esittää jonkinlaista asetta ja johtua sitä tarkoittavan sanan alkukirjaimesta. Aluksi kyseessä oli ehkä kaksi lähekkäistä yhdensuuntaista viivaa ja niitä yhdistävä poikkiviiva, kuin tyylitelty miekka. Myöhemmin viivat loittonivat toisistaan.
Zai-kirjaimesta on kehittynyt heprean zayin ז ja arabian zāy ز, joissa alkuperäisestä muodosta ei juuri ole jälkeä. Nämä kirjaimet tarkoittavat soinnillista s:ää [z], joka lienee ollut myös zain alkuperäinen ääntämys.
Kreikkalainen nimi zeeta ei ilmeisestikään ole peräisin nimestä zai vaan saattaa johtua sellaisten nimien kuin beeta ja theeta antamasta mallista.
Englannissa, ranskassa ja monessa muussa kielessä z-kirjain ääntyy soinnillisena s:nä, ja tämän mukaisesti se myös IPAssa tarkoittaa tätä. Usein englannin sana, jossa esiintyy z, on peräisin latinasta tai kreikasta (esimerkiksi zone, zoo) ja on säilyttänyt kirjoitusasun z:n, vaikka ääntämys on muuttunut. Toisaalta englannissa soinnillista s:ää merkitään useammin tavallisella s-kirjaimella, koska soinnillinen s on syntynyt tavallisesta s:stä soinnillisessa ympäristössä kuten vokaalien välissä (esimerkiksi sanassa busy).
Soinnillinen s [z] ääntyy kuten tavallinen [s] mutta siten, että kurkunpäässä sijaitsevat äänihuulet värisevät aiheuttaen äänisoinnin. Vaikka suomessa on paljon soinnillisia konsonantteja – kaikki muut paitsi k, p, t, s, f ja useimmiten h –, on [z]:n tuottaminen usein ollut vaikeaa. Vieraiden kielten opetuksen yleistyminen ja kehittyminen on vähentänyt ongelmaa, mutta suomenkielisessä puheessa [z] on edelleenkin hiukan outo tulokas.
Suomalaiset ääntävät yleensä z-kirjaimen ts:nä, ellei ole varmaa tietoa muusta ääntämyksestä. Tämä ei suinkaan johdu siitä, että [z]:n ääntämyksessä olisi mitään ts-mäiseksi tulkittavaa. Taustalla on sen sijaan saksan vaikutus, joka aikoinaan oli huomattava.
Vieraissa nimissä tulisi noudattaa alkukielen mukaista ääntämystä. Koska useimmissa kielissä z ääntyy soinnillisena s:nä, on yleensä parasta lausua z sellaisena tai tavallisena s:nä, jos oikeasta ääntämyksestä ei ole tietoa. Tämä koskee myös espanjalaisia nimiä: niissä z:n ääntämys on joissakin espanjan muodoissa [θ] (kuten englannin th sanassa think), joissakin [s], mutta ei missään [ts].
Joihinkin tunnettuihin nimiin kuten Tarzan tai Zorro on suomessa kuitenkin vakiintunut ts-ääntämys.
Ruotsin kielessä z-kirjain ääntyy samoin kuin s. Esimerkiksi nimi Franzén pitäisi siis ääntää suunnilleen ”Franseen”, ei ”Frantseen” eikä ”Franzeen” (missä z = soinnillinen s). Vastaavasti Zilliacus ääntyy s-alkuisena, ei ts-alkuisena. Tämä koskee sekä suomenruotsia että riikinruotsia.
Kuitenkin vaikka s-ääntämys on suomenruotsissakin suositusten mukainen, esiintyy ts-ääntämystä varsinkin Etelä-Suomessa julkisessa kielenkäytössäkin. Sellainen ääntämys esiintyi aiemmin Ruotsissa lähinnä varmaankin saksan vaikutuksesta, mutta hävisi sieltä jo kauan sitten. Tätä kuvaa tarkemmin Kotuksen sivu Zon och ozon.
Suomen kielessä on usein korvattu z-kirjain (tai joskus zz-yhdistelmä) ts:llä lainasanoissa ja jopa vieraissa nimissä. Tämä on tapahtunut melko epäjohdonmukaisesti. Lisäksi usein z:n on korvannut s joko suoraan tai ts-välivaiheen kautta.
Lainasanoissa on usein säilynyt z etenkin sanan alussa: zeniitti, zodiakki, zoomata, zootomia jne. Toisaalta z on muutoin yleensä korvattu ts:llä: paleotsooinen (engl. paleozoic), ratsia (italian razzia).
Erikoisasemassa on pizza-sana, joka on vielä yleisesti säilyttänyt z:nsa lähinnä kai siksi, että se näyttää hienommalta. Suositeltu kirjoitusasu pitsa on kuitenkin yleistynyt mm. Helsingin Sanomien siirryttyä siihen.
Vieraissa nimissä on yleensä säilytetty z: Zakopane, Zürich, Nizza, Suez, Azorit jne. Jos nimi kokonaisuutena on sen tuttuuden takia mukautettu suomeen, on aiemmin yleensä korvattu z ts:llä (esimerkiksi Venetsia, italiaksi Venezia). Sen sijaan esimerkiksi maannimessä Venezuela on säilytetty z, vaikka se on samaa alkuperää kuin Venetsia.
Toisaalta z-kirjaimen säilyttäminen merkitsee usein sitä, että ääntämys on toinen kuin alkukielessä. Esimerkiksi amerikanespanjassa z ääntyy yleensä samaan tapaan kuin suomen s, mutta suomalainen lausuu ”Venetsuela” eikä ”Venesuela”. Maannimi Zimbabwe ääntynee yleensä ts-alkuisena eikä alkuperäisen ääntämyksen mukaan niin, että Z ääntyy soinnillisena s:nä (foneettinen merkintä [z]).
On myös tapauksia, joissa z tai zz on korvattu ts:llä tai – etenkin uudemmissa nimissä – s:llä tekemättä nimen kirjoitusasuun muita muutoksia. Tavallaan Venetsia kuuluu tähän joukkoon. Muita tapauksia: Hertsegovina, Sambia, Sansibar, Tansania. Nämä ovat suositusten mukaisia suomenkielisiä asuja, mutta z:lla kirjoitettujakin (esimerkiksi Herzegovina) esiintyy yhä, varmaankin lähinnä englannin vaikutuksesta.
Kirjoitetun suomen kielen vanhimmissa muodoissa esiintyy yleisesti z-kirjain aivan suomalaisissa sanoissa yhdistelmässä tz, esimerkiksi metzä, itze, catzo, tai joskus yhdistelmässä dz. Näissä kirjoitusasuissa ei ollut kyse soinnillisesta s:stä, vaan tz ääntyi (niissä murteissa, joihin vanha kirjasuomi lähinnä perustui) kaksoiskonsonanttina [θθ]. Foneettinen IPA-merkki [θ] (UPAssa: ϑ) tarkoittaa soinnitonta dentaalispiranttia, samanlaista kuin esimerkiksi englannin sanassa thing.
Myöhemmin ääntämys [θθ] alkoi hävitä. Murteiden tilanne muodostui kirjavaksi: mettä, mehtä, messä jne. Nykyisen yleiskielen mukainen metsä esiintyi vain suppeahkolla alueella kaakkoismurteissa, lähinnä nykyisen itärajan takana eli luovutetussa Karjalassa. Yleiskielen metsä ei johdu näistä murteista vaan siitä, että ruvettiin lukemaan kirjoitusasun metzä mukaan, lausuen z-kirjain ruotsin mukaisesti s:ksi. Vähitellen vaihtelusta tz ∼ dz ∼ ts siirryttiin kirjoittamaan aina ts.
Mittayksikön etuliitteen tunnuksena Z tarkoittaa tuhannella triljoonalla kertomista, z taas tarkoittaa tuhannella triljoonalla jakamista. Ne vastaavat englannissa etuliitteitä zetta- ja zepto-, suomessa etuliitteitä tsetta- ja tsepto-. Tuhat triljoonaa on eli 1021 = 1 000 000 000 000 000 000 000. Nämä etuliitteet ovat erittäin harvinaisia. Joillakin fysiikan aloilla niille on kuitenkin järkevää käyttöä. Nämä etuliitteet ovat varsin keinotekoisia. Ne selitetään johdetuiksi seitsemää tarkoittavista italian sanasta sette ja latinan sanasta septem sillä perusteella, että kyseessä ovat seitsemännet etuliitteet sarjoissa k, M, G, T, P, E, Z ja m, µ, n, p, f, a, z.
Sähköopissa Z on vaihtovirran impedanssin tunnus.
Suorakulmaista koordinaatistoa käytettäessä z-akseli tarkoittaa akselia, joka on kohtisuorassa x- ja y-akselin muodostamaa tasoa vastaan. Vrt. X:n tarinassa olevaan kuvaukseen x:stä, y:stä ja z:sta. Usein z-kirjain kuvastaa tämän takia ”kolmatta ulottuvuutta”.
Koska Z on englannin aakkoston viimeinen kirjain, käytetään englannissa ilmausta A to Z samassa mielessä kuin me sanomme A:sta Ö:hön.
Matematiikassa käytetään Z:sta kehitettyä symbolia ℤ (U+2124) kokonaislukujen joukon (0, 1, 2, … ja −1, −2, …) merkkinä.
Hattu-z on syntynyt samaan tapaan kuin hattu-s (ks. Š:n tarinaa). Lähtökohtana on tällöin ollut z kirjaimena, joka ääntyy soinnillisena s:nä.
Hattu-z esiintyy mm. liettuan, latvian ja useiden slaavilaisten kirjaimistoissa, ja se on otettu myös suomen ja kirjaimistoihin käytettäväksi lainasanoissa. Lisäksi sitä käytetään siirtokirjoitusjärjestelmissä. Se tarkoittaa suhu-s:n (š) soinnillista vastinetta eli äännettä, joka esiintyy s:llä merkittynä esimerkiksi englannin sanassa measure. Ž:lla merkityn äänteen merkki foneettisessa IPA-kirjoituksessa on häntä-z eli ezh-kirjain.
Ž-kirjain on suomessa huomattavasti harvinaisempi kuin š-kirjain. Varsinaisissa suomen sanoissa se esiintyy vain muutamissa lainasanoissa, käytännössä vain yhdistelmässä dž, esimerkiksi džonkki ja maharadža.
Yhdistelmä dž vastaa usein vieraiden kielten affrikaattaa, kuten englannin j:llä merkittyä äännettä. Suomessa dž kuitenkin ääntyy kahtena konsonanttina, joten lainasanoissa ja suomeen mukautuneissa nimissä sellainen tavutus kuin maharad-ža tai Kambod-ža on sallittu.
Monien lainasanojen takana on alkuperäisessä lainanantajakielessä soinnillinen suhu-s, joka kuitenkin on yleensä korvattu soinnittomalla suhu-s:llä. Tämä johtuu osittain siitä, että sanat ovat lainautuneet ruotsin kautta, osittain siitä, että soinnillinen suhu-s on suomen äännejärjestelmässä vielä oudompi tulokas kuin soinniton. Mainitunlaiset sanat kirjoitetaan usein sitaattilainan tavoin eli alkukielen mukaisesti. Esimerkkejä: bridge (bridše), jockey (dšoki) ja journalismi (šurnalismi). Edellä on mainittu sulkeissa kirjoitusasu, jota käytettäisiin, jos noudatettaisiin suomen kirjoitusjärjestelmää. Tällaisissa sanoissa saattaa kyllä joskus esiintyä (englannin ja ranskan vaikutuksesta) myös soinnillinen suhu-s (bridže jne.), mutta tavallisempaa on, että suhu-s lähenee s-äännettä tai muuttuu sellaiseksi (bridse jne.)
Tavallisimmin ž:n kohtaa venäläisissä nimissä, sikäli kuin niissä käytetään suositeltua ž:aa eikä zh:ta. Esimerkkejä: Nižinski, Ždanov, Žukov, Brežnev, Žirinovski. Lisäksi ž esiintyy mm. balttilaisissa kielissä, esim. Žīgure.
Pakottavissa tilanteissa – kun ž:n käyttö ei kerta kaikkiaan ole mahdollista – joudutaan ž korvaamaan zh:lla, esimerkiksi maharadzha, Nizhinski, Zhdanov. Balttilaisissa nimissä, joiden varsinaiseen kirjoitusasuun (vastakohtana esimerkiksi kyrillisestä kirjaimistosta translitteroiduille asuille) ž kuuluu, zh:n käyttö ei vaikuta luontevalta. On ehkä parempi vain jättää tarkkeet pois, esimerkiksi Zigure.
Kiinalaisissa nimissä zh (esimerkiksi nimissä Zhengzhou ja Zhou Enlai) ei nykyjärjestelmän mukaan ole ž:n korvike vaan pīnyīn-siirtokirjoitukseen kuuluva yhdistelmä. Se ei edes tarkoita soinnillista suhu-s:ää, vaan erityyppistä äännettä (ks. lukua 6).
Š-kirjaimen tavoin ž esiintyy myös viron kielessä samassa tehtävässä kuin suomessa, mutta selvästi yleisempänä. Viron on säilyttänyt lainanantajakielen soinnillisen suhu-s:n monissa sanoissa, joissa suomessa on soinniton suhu-s tai tavallinen s tai joiden tilalla suomessa on omaperäinen sana. Esimerkkejä: žakett ’saketti’, želee ’hyytelö’, žiraff ’kirahvi’, žurnaal ’aikakauslehti’.
Tunnemme kirjaimen Å nimellä ruotsalainen o, ja ruotsalaista alkuperää se onkin, vaikka se myöhemmin otettiin käyttöön myös tanskassa ja norjassa. Å:ta on ruvettu käyttämään 1400-luvulla. Tämä uusi merkki lisättiin ruotsin silloisen aakkoston loppuun. Myöhemmin sen perään tulivat vielä Ä ja Ö
Alkuperä on hiukan epäselvä, mutta joka tapauksessa kyseessä on ollut A-kirjain, jonka yläpuolelle on kirjoitettu toinen kirjain pienikokoisena. Å:n muodon perusteella näyttäisi ilmeiseltä, että toinen kirjain on ollut O, mutta äänteellisin perustein on todennäköisempää, että se on alkujaan ollut A. Lisäkkeen pyöreä muoto johtuu ehkä gemena-a:sta.
Niissä nykyruotsin sanoissa, joissa esiintyy Å, on aiemmin ollut pitkä a-äänne, jota saatettiin merkitä aa:lla tai a:lla, jonka yläpuolella on pienempi a. Myöhemmin tällaisen pitkän a:n ääntämys muuttui o-äänteeksi. Vanhempi äänne on usein säilynyt ruotsista suomeen kauan sitten lainautuneissa sanoissa. Vertaa esimerkiksi sanoja skåp ja kaappi, båt ja paatti sekä Nådendal ja Naantali.
Alkujaan å siis on todennäköisesti syntynyt aa-yhdistelmän kirjoitustavasta aikana, jolloin aa:n ääntämys oli muuttunut tai muuttumassa o-äänteeksi. Myöhemmin å levisi myös muihin sanoihin o:n merkiksi. Tähän se sopi hyvin, koska sen äännearvo ruotsissa on aina o, kun taas o-kirjain voi ääntyä o:na tai u:na.
Nykyruotsissa å-kirjain ääntyy o-äänteenä, jonka pituus riippuu äänteellisestä asemasta sanassa. Esimerkiksi sanassa Åland se ääntyy pitkänä, sanassa hålla taas lyhyenä. Ruotsissa pelkkä å muodostaa myös sanan, merkitykseltään ’joki’, ja se esiintyy usein yhdyssanamuotoisten nimien jälkiosana.
Koska å-kirjain koetaan varsinkin Suomessa leimallisesti ruotsalaiseksi kirjaimeksi, sitä käytetään usein leikillisesti ruotsalaisuuteen viitattaessa, esimerkiksi kirjoittamalla ruåtsalainen.
Vasta viitisensataa vuotta syntymänsä jälkeen å-kirjain omaksuttiin ruotsista muihin kieliin. Norjan kieleen se otettiin aa:n tilalle virallisesti vuonna 1918 ja tanskan kieleen vuonna 1948.
Koska å on otettu tanskassa ja norjassa käyttöön suhteellisen myöhään, näissä kielissä esiintyy vielä nimiä, joissa usein käytetään vielä vanhaa kirjoitusasua, jossa å:n tilalla on aa. Esimerkiksi norjalainen etunimi Håkon esiintyy usein vanhassa asussa Haakon. Tanskalainen kaupunginnimi Ålborg esiintyy sekin muodossa Aalborg mm. kaupungin verkkosivuilla, vaikka niillä muutoin käytetään å-kirjainta, samoin tuotenimessä Aalborgs akvavit. Sen sijaan Århus esiintyy nykyisen oikeinkirjoituksen mukaisella asullaan.
Ymmärrettävistä syistä yhdistelmää aa käytetään usein å:n tilalla myös silloin, kun merkkivalikoima on rajoittunut, esimerkiksi verkkosivuston nimessä (www.aarhus.dk, joskin nykyisin myös www.århus.dk toimii uusilla selaimilla).
Å-kirjain mainitaan perinteisesti suomalaisen aakkoston kirjaimena. Tämä johtuu historiallisista syistä ja siitä, että suomenkielisissä teksteissä esiintyy ruotsinkielisiä nimiä. Missään suomen sanassa ei esiinny å-kirjainta, ellei oteta huomioon vieraista nimistä muodostettuja johdoksia (esim. århusilainen), ruotsalaiseen henkilönnimeen perustuvaa sanaa ångström ja lähinnä koomista sanamuodostetta hårologi ’hiustenhoidon ammattilainen’ (ruotsin sanasta hår ’hiukset’). Aapisissa esimerkit Å-kirjaimen käytöstä ovat ruotsinkielisiä nimiä kuten Åke.
Vanhassa kirjasuomessa käytettiin joskus å-kirjainta o-äänteen merkkinä, esimerkiksi hånga ’honka’. Kyse oli todennäköisesti satunnaisesta ruotsin kirjoitusjärjestelmän vaikutuksesta.
Å-kirjain ei siis kuulu suomen kielen aakkostoon, mutta se kuuluu kyllä perinteiseen suomalaiseen aakkostoon, siis Suomessa yleisesti käytettyyn aakkostoon.
Koska Suomessa on usein mukautettu ruotsinkielisiä nimiä suomen kieleen, on å-kirjain saattanut korvautua o:lla tai oo:lla. Niinpä Runebergin ruotsinkielisen tekstin vänrikki Stålista saattoi tulla suomennosten Stool, ja Ruotsin eteläisin maakunta, ruotsiksi Skåne, sai suomenkielisen nimiasun Skoone, joskin å:llinen asu säilyi sen rinnalla. Viime vuosina tällaisia nimiä on ainakin joillakin tahoilla ryhdytty palauttamaan alkukieliseen asuun.
Kansainvälisissä merkistöstandardeissa Å-kirjaimen nimenä on A with ring above, suomeksi A ja yläpuolinen ympyrä. Lisäksi Unicode-standardissa on määritelty, että Å:lla on ns. kanoninen hajotelma, joka koostuu tavallisesta A-kirjaimesta ja yläpuolisesta ympyrästä ns. yhdistyvänä tarkkeena (combining ring above, U+030A). Tämä on sinänsä vain tekninen määrittely, joka ei vaikuta siihen, että ruotsalaiset, norjalaiset, tanskalaiset ja suomalaiset yleensä kokevat Å:n omaksi erilliseksi merkikseen siinä missä Ä:n ja Ö:n taikka Æ:n ja Ø:n. Se saattaa kuitenkin vaikuttaa siihen, että muunmaalaiset kokevat Å:n vain A:ksi, jossa on outo lisuke, jonka voi jättää pois.
Å:ssa esiintyvä yläpuolinen ympyrä tulkitaan merkistöstandardeissa samaksi merkiksi kuin esimerkiksi se ympyrä, joka on kirjaimessa ů. Tämä heijastuu suomalaisessa kansainvälisessä näppäimistöasettelussa siten, että Å-näppäin toimii myös tarkenäppäimenä yläpuoliselle ympyrälle. Tämä tarkoittaa esimerkiksi sitä, että ů voidaan tuottaa näppäilemällä AltGr(vaihto(å)) u. Se, että on näppäiltävä AltGr(vaihto(å)) eikä vain luonnollisemman tuntuinen AltGr(å), johtuu Ruotsin standardista, jonka kanssa osittain yhteensopivaksi suomalainen asettelu haluttiin tehdä. Jostakin syystä Ruotsissa sijoitettiin Å-näppäimeen ensisijaiseksi tarkenäppäintoiminnoksi kaksoisakuutin (˝) lisääminen niin, että esimerkiksi unkarissa käytetty ű voidaan kirjoittaa näppäilyllä AltGr(å) u.
Fysiikassa Å-kirjainta on käytetty ångström-nimisen mittayksikön tunnuksena. Yksikön nimi johtuu ruotsalaisesta fyysikosta Anders Ångström (1814–1874). Englanninkielisessä tekstissä Å:n tilalla esiintyy usein A, vaikka SI-mittayksikköjärjestelmässä A on varattu ampeerin tunnukseksi. Ångström tarkoittaa metrin kymmenesmiljardisosaa, eli 1 Å = 10−10 m. Mittayksikköstandardien mukaan ångströmiä ei tulisi enää käyttää, mutta sitä esiintyy vielä jonkin verran etenkin valon aallonpituuksia ilmaistaessa. Tilalle sopii yleensä metrin kerrannainen nanometri (nm), sillä 1 Å = 0,1 nm. Esimerkiksi 3 000 Å = 300 nm.
Kuten luvussa 2 kuvattiin, Ä-kirjain on syntynyt AE-yhdistelmästä. Taustalla on ehkä osittain se, että latinassa AE, joka alkujaan tarkoitti ai- tai ae-diftongia, kehittyi pitkän väljän e:n [ɛː] merkiksi äänteenmuutosten takia. Väljä e muistuttaa ä-äännettä. Ä-muoto, jossa A:n yläpuolelle kirjoitettu E on kutistunut pisteiksi, vakiintui vasta 1700-luvulla.
Vanhassa fraktuurassa gemena-ä:n muodosta saattoi vielä yleensä selvästi erottaa a:n, jonka päällä on pieni e. Myöhemmissä fraktuuroissa a:n päällä oleva merkki on jo kehittynyt kahdeksi pisteeksi tai kahdeksi lyhyeksi viivaksi (ä).
Ä-kirjain on käytössä suomen lisäksi ruotsin, viron ja saksan kirjoituksessa. Tanskassa ja norjassa päädyttiin AE:stä toiseen kirjainmuotoon, ae-kirjaimeen eli tanskalaiseen ä:hän Æ (æ).
Äänteet ä ja e ovat suomessa varsin erilaisia, mutta joissakin äänteellisissä yhteyksissä (esimerkiksi r:n edellä) niiden ero pienenee. Lisäksi monissa muissa kielissä esiintyvä väljä e (foneettinen merkki IPAssa: [ɛ]) on melko lähellä ä:tä. Esimerkiksi jos haluamme kuvata ranskalaisen nimen Molière ääntämystä suomen kirjoitusjärjestelmällä, niin ”Moliäär” saattaisi osua lähemmäs kuin ”Molieer”.
Koska lisäksi ruotsin kirjoitusjärjestelmässä ä on usein e:n ja toisaalta e joskus ä:n merkki, on ymmärrettävää, että vanhassa kirjasuomessakin vallitsi melkoinen sekamelska. Agricola kirjoitti esimerkiksi änembi tenepene ja käsekw, vaikka tarkoitti lukutapoja enempi, tänäpänä ja kesäkuu. Järjestelmä kuitenkin yhtenäistettiin nykyiselle kannalle vuoden 1642 raamatunsuomennoksessa.
Samaan tapaan kuin Å:n tarinassa kerrottiin Å:sta ”ympyrä-A:na”, voidaan sanoa, että Ä on ”treema-A”. Kansainvälisissä merkistöstandardeissa Ä-kirjaimen nimenä on A with diaeresis, suomeksi A, jossa on treema tai A ja treema tai treema-A.
Unicode-standardissa on määritelty, että Ä:llä on ns. kanoninen hajotelma, joka koostuu tavallisesta A-kirjaimesta ja treemasta ns. yhdistyvänä tarkkeena (combining diaeresis, U+0308). Käytännössä Ä-kirjainta ei kuitenkaan yleensä tuoteta sellaisella yhdistelmällä.
Olennaisempaa on, että meidän Ä:mme, joka on meille itsenäinen kirjain aakkoston loppupäässä, on monille muille vain A, jossa on hassu lisuke. Saksassa Ä kyllä käsitetään erilliseksi merkiksi, mutta se aakkostetaan kuten A ja sitä pidetään A:n vastineena ns. Umlaut-ilmiössä. Niinpä siitä usein käytetään nimitystä A Umlaut – myös englannissa. Saksan kielessä Ä:n ääntämys vaihtelee kielimuodon mukaan: se voi olla väljä e [ɛ] tai tavallinen e [e].
Englanninkielisessä maailmassa saatetaan Ä:n pisteet ymmärtää myös pelkiksi erokepisteiksi, jotka osoittavat vain, että A ääntyy erillisenä eikä muodosta yhdistelmää viereisen kirjaimen kanssa. Tämä on tuttua monille Tolkienin kirjojen lukijoille. Esimerkiksi kirjoitusasussa Eärendil ä:n pisteet kertovat vain, että E ja a pitää ääntää erikseen eikä siten kuin ea-yhdistelmä yleensä ääntyy englannissa.
Nimitystä ääkköset tai skandit, virallisemmin skandinaaviset kirjaimet, käytetään lähinnä merkeistä å, ä ja ö. Laajemmassa merkityksessä ääkkösiä ovat myös tanskan ja norjan æ ja ø. Joskus myös islannin ð ja þ luetaan samaan joukkoon. Suomen kielen kannalta ääkkösistä selvästi tärkein on ä, sillä ö:n esiintymistiheys on merkittävästi pienempi. Ääkkösistä varsinkin ä:tä ja ö:tä käytetään muissakin kuin pohjoismaisissa kielissä, mm. saksassa.
Tietoteknisesti yhteistä ääkkösille on, että ne eivät kuulu tietokoneiden eräänlaiseen vanhaan perusmerkistöön, Ascii-merkistöön, mutta ne kuuluvat ISO Latin 1 -merkistöön. Aiemmin ääkkösille käytettiin monenlaisia korvaavia esitystapoja. Eräs tapa oli ns. lokkiskandien käyttö: ääkköset sijoitettiin eräiden erikoismerkkien koodipaikkoihin (å = {, ä = }, ö = |, Å = [, Ä = ], Ö = \). Nimitys johtuu siitä, että merkkien ”{” ja ”}” ajateltiin muistuttavan linnun kuvaa 90° käännettynä. Lokkiskandeja saattaa vieläkin esiintyä vanhoissa tietoaineistoissa.
Edelleenkin ääkköset tuottavat huomattavia ongelmia monissa yhteyksissä, kuten kansainvälisessä tiedonvälityksessä. Tällöin Ä ja Ö tyypillisesti korvataan AE:llä ja OE:llä, mikä on saksalaisille tuttua ja luonnollista mutta suomalaisista outoa. Vaihtoehtona on yleensä niiden korvaaminen A:lla ja O:lla.
Toisaalta monissa tilanteissa pelätään ääkkösten kirjoittamista liiaksikin. Esimerkiksi suomalaisessa sähköpostissa ja verkkosivujen sisällössä ääkköset toimivat lähes aina ongelmitta. Sen sijaan ulkomaille lähetettävissä sähköpostiviesteissä on yleensä varminta välttää ääkkösiä, ellei voida varmistaa, että lukija näkee ne oikein.
Kun suomen sanassa on ä:n paikalla a, useimmiten syynä on se, että kirjoittajalla ei ole käytössään suomalaista näppäimistöä. Hän ehkä toimii ulkomailla eikä osaa tai voi muuttaa käyttämänsä tietokoneen näppäimistöasettelua suomalaiseksi. Joskus esimerkiksi Italiassa tietokonetta käyttävä suomalainen kirjoittaa ä:n tilalle à:n, koska se löytyy helposti italialaisesta näppäimistöstä.
Myös suomalaisen näppäimistön saa turhan helposti tilaan, jossa Ä-näppäin ei tuota ä:tä. Jos sattuu huomaamattaan painelemaan näppäimiä niin, että tulee kirjoittaneeksi Alt(vaihto) – siis painaa vaihto- eli shift-näppäintä silloin, kun Alt-näppäin on alas painettuna –, vaihtuu näppäimistöasetus toiseksi. Suomessa myytävissä tietokoneissa on valmiiksi yleensä kaksi eri asetusta, suomalainen ja amerikkalainen, vaikka amerikkalaiselle ei ole Suomessa juuri mitään käyttöä. Amerikkalaisessa asettelussa Ä-näppäin tuottaa heittomerkin '. Harva tietää ja muistaa, että tavallisessa Windows-tietokoneessa saa ä-kirjaimen aikaan näppäimistöasettelusta riippumatta näppäilyllä Alt(0228), ja vielä harvempi viitsii kirjoittaa suomea sillä tavoin. Niinpä nähdään sellaisia avunhuutoja kuin ”Apua! Nappaimistostani on kadonnut a! Mita tehda?”
Joissakin tilanteissa ä kyllä osattaisiin kirjoittaa, mutta sitä ei uskalleta käyttää. Esimerkiksi verkkotunnuksissa ä oli pitkään kielletty, ja tähän on mukauduttu. Niinpä Mäntsälän kunta käyttää verkkotunnusta www.mantsala.fi. (Tosin myös www.mäntsälä.fi toimii, mutta sitä ei ole määritelty oikein: yritys mennä kyseiseen osoitteeseen aiheuttaa varmennevirhettä koskevan ilmoituksen, joka käyttäjän pitää osata ohittaa.)
Yhdenlaista ä:n vieroksumista on se, että suomen nykyisten kirjoitussääntöjen mukaan on useissa tilanteissa oikein kirjoittaa sanan päätteeseen a, vaikka lausutaan ä. Kirjoitetaan esimerkiksi Jamesilla eikä Jamesillä, vaikka lopussa lausutaankin ä, suunnilleen ”džeimzillä”. Tätä selitetään ”visuaalisella vokaalisoinnulla”: tällöin sanan kirjoitusasu näyttää noudattavan vokaalisointua.
Aivan toisentyyppisestä asiasta on kyse silloin, kun puhekielessä käytetään ä:n tilalla a:ta taikka jonkinlaista a:n ja ä:n välimuotoa. Tällaisen äänteellisen muutoksen on arvioitu alkaneen 1970-luvulla, ensin lähinnä kaupungeissa nuorten naisten keskuudessa. Onkohan syynä ollut se, että ä-äänne on koettu jotenkin maalaiseksi ja rahvaanomaiseksi? Joka tapauksessa ilmiö rajoittunee toistaiseksi puhuttuun kieleen. Kun kirjoitetaan tehdaan, syynä tuskin on se, että tämä kirjoitusasu vastaa kirjoittajan ääntämystä. Pikemminkin syynä on, että ä-kirjainta ei osata tai uskalleta kirjoittaa.
Vanhoissa suomalaisessa korttipelikirjoissa yms. Ä tarkoittaa ässää. Nykyisin suomessakin käytetään yleisesti englannin mukaista A-kirjainta ässän merkkinä.
Aakkostomme viimeinen kirjain on Ö, mutta useimmissa latinalaiseen kirjaimistoon perustuvissa aakkostoissa tilanne on toinen. Niissä joko ei lainkaan ole Ö-kirjainta tai se on sijoitettu O-kirjaimen jälkeen, esimerkiksi saksalaisessa aakkostossa. Å, Ä ja Ö sijoitettiin ruotsalaisen aakkoston loppuun, koska ne olivat lisäyksiä. Suomen aakkosto taas kopioitiin suoraan ruotsalaisesta, joskin siihen myöhemmin lisättiin Š ja Ž.
Ö-kirjain on kehittynyt yhdistelmästä OE 1700-luvulla samaan tapaan kuin Ä on kehittynyt AE:stä (ks. Ä:n tarinaa). Se on käytössä suomen lisäksi ruotsin, viron, saksan ja unkarin kirjoituksessa. Unkarissa on myös ö:tä muistuttava kaksoisakuutti-o ő, joka on pitkän ö:n merkki.
Tanskassa ja norjassa päädyttiin OE:stä toisenlaiseen kirjaimeen, Ø (ø), jossa siis poikkiviiva on eräänlainen E:n seuraaja. Tätä kirjainta kutsutaan tanskalaiseksi Ö:ksi. Vieraat nimet, joissa esiintyy Ø, tulisi suomenkielisessä tekstissäkin kirjoittaa sitä eikä Ö:tä käyttäen, esimerkiksi Møller eikä Möller. Kirjoitusasu tulisi tarvittaessa tarkistaa luotettavasta hakuteoksesta.
Tarkkaavaisuutta on noudatettava myös saksalaisissa nimissä. Niissä saattaa esiintyä OE joko nimen viralliseen asuun kuuluvana (esim. Goethe, Goebbels) tai teknisistä tai tiedollisista rajoituksista johtuvana Ö:n korvikkeena (esim. Goering oikean asun Göring sijasta).
Ranskassa taas yhdistelmästä OE on kehittynyt OE-kirjain, Œ (œ), myös OE-ligatuuriksi kutsuttu. Esimerkkejä: cœur ’sydän’, œuvre ’työ’. Käytännössä ranskalaisetkin usein korvaavat sen OE-yhdistelmällä, koska ranskalaisessa näppäimistössä ei ole Œ-näppäintä. Ranskankielisessä tekstissä yhdistelmä OE on varsin harvoin oikein, vaan useimmiten pitäisi olla joko Œ (yhden äänteen merkki) tai OË (O ja E ääntyvät erikseen). Poikkeuksen muodostavat muutamat sanat kuten moelle ’luuydin’ ja jotkin latinalaisperäiset coe-alkuiset sanat.
Kuten N-kirjaimen tarinassa mainittiin, viron kielessä Õ (õ) tarkoittaa eräänlaista suun takaosassa ääntyvää e-äännettä, taka-e:tä. Se siis on sekä kirjoituksessa että ääntämyksessä erotettava Ö:stä.
Tosin jopa hakuteoksissa saatetaan antaa ohje Õ:n korvaamisesta Ö:llä. Tämä on aivan virheellistä, koska virossa on molemmat kirjaimet eivätkä ne ole äänteellisesti lainkaan samat eivätkä edes kovin samanlaiset. Käytännössä kaikkialla, missä voidaan kirjoittaa Ö, voidaan kirjoittaa myös Õ, joskin ehkä hiukan hankalammin. Suomalaisella näppäimistöllä kirjoittaminen onnistuu tarkenäppäimen avulla: näppäily AltGr(¨) o tuottaa õ:n.
Suomalaisessa aakkostuksessa käsitellään virallisen standardin (SFS 4600) mukaan Ø:tä ja Õ:tä Ö:hön rinnastuvana, ja Œ aakkostetaan kuten OE. Toisaalta Kotoistus-hankkeessa määritellyn aakkostuksen mukaan Õ ja Œ aakkostetaan kuten O.
Suomen (ja viron ja unkarin) ö-äänne tulkitaan yleensä ns. suppeaksi ö:ksi, IPA-merkki [ø]. Monissa kielissä esiintyy sen ohella tai tilalla väljempi ö, IPA-merkki [œ], tai hyvin väljä ö, [ɶ]. Erilaisten ö-äänteiden kirjoitustavat eri kielissä vaihtelevat suuresti.
Tanskalaista ö:tä siis käytetään IPAssa meidän ö:mme foneettisena merkkinä, ja väljemmän ö-äänteen merkkinä on oe-kirjaimen gemenamuotoa. Sen sijaan ɶ, vaikka se onkin kehitetty versaali-oe:stä Œ, on Unicodessa erillinen merkki, kapiteeli-oe (U+0276).
Suomalaiset usein kokevat ö:n tapaiseksi äänteeksi sellaiset kuin esimerkiksi englannin sanan about alkuäänne. Tätä osoittaa leikkisä kirjoitusasu ”öbaut”. Kyseessä on kuitenkin hyvin erilainen äänne. Sana about on foneettisesti kirjoitettuna [ə'baut], ja [ə] tarkoittaa niin sanottua švaa-vokaalia eli neutraalivokaalia. Se ääntyy suun keskiosassa niin, että äänne-elimet ovat mahdollisimman rentoina. Siinä ei ole minkäänlaista huulien pyöristymistä kuten ö:ssä.
Englannin kielessä käytetään joskus ö-kirjainta toisen o:n perässä latinalaisperäisissä sanoissa osoittamassa, että o:t ääntyvät erikseen eivätkä pitkänä u-äänteenä kuten yleensä. Tällainen käytäntö, esimerkiksi siis coördinated, esiintyy lähinnä vain brittienglannissa ja siinäkin harvinaisena.
Joskus ö-kirjainta käytetään englannissa myös leikittelevästi, esimerkiksi englantilaisen yhtyeen nimessä Motörhead. Tällaisesta rock-yhtyeiden tavasta käyttää tarkkeita pelkkinä koristeina kirjainten päällä käytetään nimitystä heavy metal umlaut.
Ö-kirjain kuuluu suomen harvinaisimpiin. Se esiintyy joissakin yleisissä sanoissa kuten työ ja syödä, mutta enimmäkseen se kuuluu toisaalta äännemaalailua sisältäviin sanoihin, toisaalta joihinkin pääteaineksiin. Päätteissä ö esiintyy vokaalisoinnun vaikutuksesta joissakin johtopäätteissä, esimerkiksi sanoissa pyyntö, säätiö, yksilö ja mitätön.
Äännemaalailussa ö on yleensä sävyltään isoa ja kömpelöä tarkoittava (köntys, mörökölli, Mörri-Möykky), kenties myös tyhmyyteen viittaava (hölmö, pöllö, pökkelö), tai pimeään ja synkkään viittaava (yö, mörkö). Kömpelyyteen liittyvänä voidaan pitää myös käyttöä matalia ääniä kuvailevissa sanoissa (öristä, mörinä, röhkiä). Osa tällaisista sanoista saattaa olla alkujaan lainasanoja; esimerkiksi mörkö johtuu ruotsin sanasta mörk ’pimeä’. Saattaa olla, että pimeyden sävy onkin tullut ö-äänteeseen lainasanojen mukana.
Ilmaus ”A ja O”, jota käsiteltiin A-kirjaimen kohdalla, esiintyy joskus – muun muassa Seitsemässä veljeksessä – muodossa ”A ja Ö”. Tämä johtuu siitä, että ilmausta ”A ja O” ei voi ilman selitystä hahmottaa merkityksessä ’ensimmäinen ja viimeinen’ suomalaisen eikä ylipäänsä latinalaisen aakkoston pohjalta. Niinpä kansan keskuudessa O saatettiin korvata Ö:llä.
Ilmauksesta ”A ja Ö” on saatettu päätyä edelleen ilmaukseen ”Ä ja Ö” ehkä vokaalisoinnun takia. Tällöin alkuperäinen ajatus ensimmäisestä ja viimeisestä on tietysti aivan kadonnut.
Ruotsissa pelkkä ö muodostaa sanan, merkitykseltään ’saari’. Se esiintyy usein yhdyssanamuotoisten nimien jälkiosana ja joskus myös alkuosana. Nimi Öland tarkoittaa siis ’saarimaa’. Sen suomenkielinen muoto Öölanti on useimpien suomenkielisten tietosanakirjojen viimeinen hakusana.
Asian paneminen Ö-mappiin (tai mappiin Ö) tarkoittaa sen hautaamista tai unohtamista tai suorastaan asiakirjojen heittämistä roskakoriin. Ilmaus on varmaankin syntynyt sellaisesta ajatuksesta, että tärkeimmät asiat pannaan mappiin A, toiseksi tärkeimmät mappiin B jne.
Harvinaisempaa on puhe Ö-luokan asioista, tavaroista tai henkilöistä.
Jonkinlaisesta itseironiasta lienee johtunut 1980-luvulla vaikuttaneen, kulutusyhteiskuntaa ja rikkaiden maiden itsekkyyttä kritisoineen taiteilijaryhmän ottama nimitys ö-ryhmä (tai Ö-ryhmä).
Ö-kirjainta siis käytetään kuvaannollisesti tarkoittamaan (viho)viimeistä. Varsinaista symbolikäyttöä, siis käyttöä jonkin asian sovinnaisena tunnuksena, Ö:llä ei liene. Eräs vanha, nykyisiin standardeihin kuulumaton mittayksikkö, jolla ilmaistaan magneettikentän voimakkuutta, on kyllä suomenkieliseltä nimeltään örsted (tai oersted), mutta sen tunnus on Oe.
Ø- tai ø-kirjainta muistuttavia symboleita käsitellään kohdassa 5.13 Poikkiviiva-o ø (tanskalainen ö).
Luvussa 2 kuvattiin, että tarke eli diakriittinen merkki tarkoittaa kirjaimeen liitettyä pientä lisäosaa. Periaatteessa tarke voi liittyä muuhunkin kirjoitusmerkkiin kuin kirjaimeen. Sellaisia merkintätapoja käytetään jonkin verran mm. matematiikassa ja fysiikassa.
Merkkiä, johon tarke liittyy, sanotaan kantamerkiksi (base character). Kantamerkki on siis yleensä kirjain, mutta se voi olla muukin merkki, jopa tarkkeellinen merkki.
Tavallisesti tarke ajatellaan merkin osaksi, jolla on oma identiteettinsä. Tarke voidaan kuitenkin käsittää myös itsenäiseksi kirjoitusmerkiksi. Unicode-standardin käsitteistöä käyttäen tämä voidaan vielä tehdä kahdella eri tavalla: yhdistyvä tarke ja tarkkeenomainen merkki.
Voimme esittää esimerkiksi kirjaimen â (sirkumfleksi-a) joko yhtenä Unicode-merkkinä, ns. koostemerkkinä (precomposed character), tai kahtena Unicode-merkkinä, joista ensimmäinen on tavallinen a-kirjain ja toinen on yhdistyvä eli kombinoituva (combining) sirkumfleksi. Kullakin yhdistyvällä tarkkeella on oma Unicode-koodiarvonsa.
Useimmat käytännössä esiintyvät tarkkeelliset kirjaimet voi esittää koostemerkkeinä, mutta ei aivan kaikkia. Tämä on tärkein syy siihen, että on hyvä tuntea yhdistyvän tarkkeen käsite. Jos esimerkiksi joudut kirjoittamaan kyrillisin kirjaimin venäjänkielisen sanan, jossa vokaaliin liittyy akuutti (esimerkiksi бо́льшой), et voi kirjoittaa tätä tarkkeellista vokaalia yhtenä kirjaimena, koska Unicodessa ei ole sellaista. Sen sijaan kirjoitat esimerkiksi tavallisen kyrillisen o:n ja sen jälkeen yhdistyvän akuutin (U+0301). Käyttämästäsi ohjelmasta riippuu, osaako se (ja miten hyvin se osaa) esittää näin luodun yhdistelmän.
Tarkkeenomainen merkki (modifier letter) tarkoittaa kirjaimen tavoin käytettävää itsenäistä merkkiä, jonka muoto vastaa jotakin tarketta. Sellaista merkkiä käytetään samantapaisissa tehtävissä kuin tarketta, mutta se siis sijaitsee omalla paikallaan tekstissä, ei toisen merkin yllä, alla tai nurkassa. Esimerkiksi tarkkeenomainen sirkumfleksi (U+02C6) ˆ on yleensä samannäköinen ja -kokonainen kuin esimerkiksi sirkumfleksi-a:ssa â oleva tarke.
Mitään edellä esitetyistä merkeistä ei pidä sekoittaa eräisiin tarkkeista kehitettyihin merkkeihin kuten merkkiin ^ (U+005E), joka on historiallisista syistä nimeltään sirkumfleksi. Nimi kuvastaa merkin alkuperää ja vanhaa aiottua käyttöä, mutta merkki otettiin myöhemmin aivan muunlaiseen käyttöön ja sen ulkoasu, etenkin koko, muuttui vastaavasti. Nykyisin sirkumfleksi tarkoittaa esimerkiksi potenssiin korotusta eräissä merkintätavoissa (esimerkiksi 10^6 = 106 = 1 000 000).
Varhaisten kirjoituskoneiden aikakaudella merkkivalikoima oli suppea, koska mekaanisten rajoitusten takia kirjoituskoneessa ei voinut olla kovin monia näppäimiä. Niinpä tarkkeelliset kirjaimet enimmäkseen jätettiin pois. Tarkkeet ehkä lisättiin kynällä. Saatettiin myös käyttää näppäintä, joka siirtää kirjoituskohdan merkin verran taaksepäin, ja lyödä lisämerkki tarkkeeksi. Esimerkiksi kirjoittamalla u, siirto taaksepäin ja " (kirjoituskonemerkistön lainausmerkki) saatiin aikaan u", jonkinlainen ü-kirjaimen jäljitelmä. Koska merkit olivat samanlevyisiä, kohdistus vaakasuunnassa meni melko hyvin. Sen sijaan on selvää, ettei ulkoasu muuten ollut kovin kummoinen, ja etenkin versaalin päälle lyötäessä syntyi lähinnä sotkua. Tässä on yksi syy siihen, miksi tarkkeiden käyttöä versaalien yhteydessä on vältetty.
Tietokoneissa tilanne oli aluksi pitkälti sama. Kustannussyistä merkkivalikoima pidettiin pienenä, ja tarkkeelliset merkit ajateltiin tuotettavan samaan tapaan kuin kirjoituskoneilla – tosin vain paperille tulostettaessa. Alkuperäisiin ajatuksiin kuului, että treemaa jäljittelevä merkintä tuotetaan lainausmerkillä " ja akuuttia jäljittelevä suoralla heittomerkillä '. Lisäksi merkistöön otettiin edellä mainittu sirkumfleksi ^, gravis ` ja tilde ~. Niiden käyttö tarkkeiden esittämiseen jäi kuitenkin vähäiseksi. Sen sijaan ne otettiin erilaisiin teknisiin käyttötarkoituksiin, koska merkeistä oli pulaa ja esimerkiksi ohjelmoinnissa tarvittiin lisämerkkejä. Alkuperäinen ajatus hävisi taka-alalle. Sen sijaan näppäimiä, joissa on sirkumfleksi ym., ruvettiin käyttämään tarkkeellisten kirjainten kirjoittamiseen sen jälkeen, kun ne oli lisätty käsiteltävissä olevaan merkkivalikoimaan. – Myöhemmin tulivat mukaan akuutti ´ ja treema ¨, jotka eivät kuulu Ascii-merkistöön ja joille ei juurikaan ole tullut myöhemmin käyttöä; lähinnä niitä kirjoitetaan vahingossa!
Tilanne on siis hämmentävä. Seuraavassa on tiivistelmä keskeisistä ideoista esimerkin avulla:
Useimmiten tarke sijaitsee kirjaimen yläpuolella, mutta on myös monia tarkkeita, jotka kirjoitetaan kirjaimen alapuolella. Jotkin kirjoitetaan kirjaimen viereen tai esimerkiksi vasempaan tai oikeaan yläkulmaan. Tavallisesti tarke ei aivan kosketa sitä merkkiä, johon se liittyy. Poikkeuksen muodostaa mm. sedilji, joka tyypillisesti koskettaa kirjaimen alareunaa (esimerkiksi sedilji-c:ssä ç). Melko tavallista on, että versaali-Å:ssa ympyrä koskettaa kantamerkkiä A, mutta tätä voi pitää lähinnä typografisen suunnittelun erehdyksenä.
Tarkkeiksi ei kutsuta esimerkiksi erilaisia poikkiviivoja (englanniksi stroke), joita käytetään esimerkiksi puolan kielen poikkiviiva-L:ssä Ł (esimerkiksi nimessä Łódź). Tämä johtuu lähinnä siitä, että kansainvälisissä merkistöstandardeissa poikkiviivallisia kirjaimia pidetään täysin erillisinä merkkeinä, ei peruskirjaimen ja poikkiviivan yhdistelminä. Tämän taustalla taas on mm. se, että poikkiviiva menee todellakin kirjaimen poikki eikä näytä erilliseltä lisältä. Poikkiviivat ovat myös erimittaisia ja eri asennoissa (esim. Ł, đ, ø), joten niitä ei olisi kovin luontevaa tulkita saman tarkkeen eri ilmentymiksi. Poikkiviivallisia kirjaimia käsitellään luvussa 5.
Sähköpostitse tulevassa ns. roskapostissa (englanniksi spam) esiintyy usein englanninkielistä tekstiä, jossa sanat sisältävät niihin kuulumattomia tarkkeita, esimerkiksi Çircus Çasino – – The Rìchest Jàckpots! Kyse ei ole lapsellisesta leikistä vaan siitä, että roskapostin lähettäjä haluaa estää sen, että roskapostia torjuva ohjelma suodattaa viestin pois. Suodatus nimittäin usein perustuu sellaisiin sanoihin, joita tiedetään esiintyvän paljon roskapostissa.
Menetelmä on onneksi melko tehoton. Vaikka tietokoneohjelma normaalisti pitää merkkejä C ja Ç aivan eri merkkeinä, se voidaan kuitenkin ohjelmoida käsittelemään sanoja ikään kuin mitään tarkkeita ei olisi.
Vieraskielisten nimien kirjoittamista täsmälleen oikein tarkkeita myöten voidaan perustella seuraavilla syillä:
Kohteliaisuus. Nimen kirjoittaminen oikein on korrektia. Se tekee hyvän vaikutuksen etenkin silloin, kun se poikkeaa yleisestä väärinkirjoittamisesta.
Tiedonhaku. Nimen oikealla asulla löytyy usein paremmin tietoa esimerkiksi Internetin hakukoneilla.
Ääntämys. Vierasta kieltä edes hiukan tuntevalle tarkkeet antavat usein hyödyllistä tietoa siitä, miten nimi äännetään.
Erottavuus. Joskus tarke erottaa muutoin samanlaiset sanat toisistaan.
Tarkkeita pidetään usein pelkkinä koristeina, jotka voidaan jättää pois etenkin jos niiden kirjoittaminen on hankalaa. Varsinkin englanninkielisessä maailmassa ajatellaan vielä yleisesti näin. Linjana voi olla esimerkiksi, että tarkkeet säilytetään ”tuttujen” kielten kuten ranskan, espanjan, portugalin, saksan ja italian sanoissa, mutta ei muissa.
Taustalla on myös se, että englannin kielessä käytetään usein tarkkeita etenkin ranskalaisperäisissä sanoissa, esimerkiksi rôle ja fiancé, joskus (vanhahtavasti) myös sellaisissa sanoissa kuin coöperation, jossa pisteet toisen o:n päällä osoittavat, että peräkkäiset o:t ääntyvät erikseen. Tältä pohjalta on helppo ymmärtää, että tarkkeet koetaan lähinnä koristeiksi.
Suomalaisesta näkökulmasta on helpompi ymmärtää tarkkeiden merkitys, kun otetaan huomioon, että myös ä:n ja ö:n pisteet ovat muun maailman mielestä tarkkeita. Jos pidämme kohtuullisena, että nimi Hämäläinen kirjoitetaan oikein eikä Hamalainen tai Haemaelaeinen, niin miksi emme suhtautuisi vastaavalla tavalla meille vieraisiin nimiin? Kirjainten ”lisukkeiden” kirjoittaminen voi olla muille yhtä olennaista kuin meille ä:n pisteet.
Suomalaisen standardin SFS 4175:2006 (Numeroiden ja merkkien kirjoittaminen) mukaan on vieraissa nimissä pyrittävä säilyttämään kaikki niihin kuuluvat tarkkeet. Sama periaate on vahvistettu ja sitä on laajennettu ns. erikoiskirjaimiin (esimerkiksi þ ja ð) kielitoimiston tiedotuslehden Kielikellon merkistöaiheisessa teemanumerossa 2/2006. Maan johtava sanomalehti Helsingin Sanomat pyrkii nykyisin selvästikin noudattamaan näitä periaatteita, vaikka sillä on ymmärrettävästikin vaikeuksia toimittaja- ja avustajakunnan suuren määrän ja toimitustyön kiivaan rytmin takia. Silloin kun mikään todellinen kiire ei estä kirjoitusasun tarkistamista, voidaan tarkkeiden oikeaa käyttöä nykyisin pitää huolitellun kielenkäytön yhtenä perusvaatimuksena.
Oikeilla kirjoitusasuilla voi olla yllättävän suuri merkitys nykymaailmassa, suurempi kuin ennen. Kun haetaan tietoa Internetistä tai yleensä tietojärjestelmistä, löytyy oikealla asulla usein laadukkaampia osumia. Vaikka hakujärjestelmät osaisivat tehdä ns. sumeita hakuja eli etsiä myös väärin kirjoitettuja asuja, on tarkasti oikea asu kuitenkin paras lähtökohta.
Joissakin tapauksissa voisi tarkkeiden jättämistä pois perustella sillä, että tarkkeellinen muoto ei vastaa ääntämystä. Esimerkiksi nimessä Galápagos osoittaa akuutti espanjan käytännön mukaisesti painollisuutta. Koska suomalaiset ääntävät nimen kuitenkin niin, että paino on ensimmäisellä tavulla, olisi luonnollista käyttää kirjoitusasua Galapagos. Tämä voitaisiin käsittää sovinnaisnimeksi.
Tarkkeiden käytössä on kuitenkin otettava huomioon tekniset rajoitukset. Esimerkiksi sähköpostissa joudutaan usein käytännössä rajoittumaan suppeaan merkkivalikoimaan, jopa pelkkään Ascii-merkistöön. Tällöin yleensä jätetään tarkkeet pois. Sen selittäminen, mihin merkkeihin kuuluisi tarke, on yleensä häiritsevämpää kuin pelkkä yksinkertaistettu kirjoitus. Toisaalta tekee huonon vaikutuksen, jos esimerkiksi painotekstiin ei ole viitsitty kirjoittaa nimiä oikein.
Huolitellussa esityksessä kirjoitetaan siis vieraisiin sanoihin kaikki niihin kuuluvat tarkkeet, paitsi jos se on teknisesti mahdotonta. Länsieurooppalaisissa kielissä käytetyt tarkkeelliset merkit voidaan lähes aina kirjoittaa oikein suomalaisessa toimintaympäristössä. Sen sijaan esimerkiksi balttilaisissa kielissä tai vietnamissa käytetyt tarkkeet voivat tuottaa ongelmia. Niinpä ranskalaisen nimen François kirjoittaminen oikein on käytännössä lähes aina mahdollista, kun taas liettualainen nimi Žīgure joudutaan esimerkiksi sähköpostissa kirjoittamaan yksinkertaistetusti Žigure tai jopa Zigure.
Lyhyesti sanottuna tarkkeet yleensä voidaan kirjoittaa oikein muualla kuin sähköpostissa, Internetin keskustelufoorumeilla ja monissa tietokantapohjaisissa järjestelmissä. Niissä rajoittavana tekijänä on lähinnä se, miten hyvin tarkkeet välittyvät kirjoittajan käyttämästä ohjelmasta lukijoiden käyttämiin ohjelmiin, ei niinkään itse kirjoittaminen.
Sen sijaan esimerkiksi tekstinkäsittelyssä ja verkkojulkaisemisessa tarkkeiden oikea käyttö on lähes aina mahdollista, jopa helppoa, kun eräät perustekniikat tunnetaan. Painojulkaisuissa voi olla ongelmia, jotka johtuvat julkaisujärjestelmien rajoituksista. Ongelmat tulisi kartoittaa ennen kirjoitustyöhön ryhtymistä, yhdessä julkaisujärjestelmää tuntevan henkilön kanssa.
Myös versaalikirjaimiin tulee kirjoittaa niihin kuuluvat tarkkeet. Aiemmin tarkkeet on usein jätetty pois; on kirjoitettu esimerkiksi Rhône mutta RHONE eikä RHÔNE. On myös kehitelty sääntöjä, joiden mukaan versaalissa säilytetään vain osa tarkkeista. Syyksi on mainittu mm. se, että tarkkeet ovat rumia versaalissa. Lisäksi jos riviväli on liian pieni fontin ominaisuuksiin nähden, saattavat kirjainten yläpuolella olevat tarkkeet törmätä ylemmän rivin merkkeihin. Hyvin suunnitellussa fontissa tarkkeelliset versaalit ovat kuitenkin hyväksyttävän näköisiä, ja hyvin tehdyssä ladonnassa säädetään riviväli sopivaksi.
Muun muassa Ranskan akatemia on ottanut kannan, jonka mukaan ranskassa käytetään tarkkeita myös versaalissa. Vastaavan päätöksen espanjan osalta on tehnyt espanjan kielen akatemioiden yhteiselin.
Eri asia on, että tarkkeellisia versaaleja tarvittaisiin eniten silloin, kun teksti kirjoitetaan kokonaan versaalilla, mitä on syytä välttää.
Esimerkkejä: école ∼ École, François ∼ FRANÇOIS, Žīgure ∼ ŽĪGURE.
Tarkkeiden kirjoittamisessa oikein vaikeinta on yleensä sen selvittäminen, mitä tarkkeita nimeen kuuluu. Tämä on osa nimen oikean asun selvittämisen ongelmaa, jota käsitellään jäljempänä kohdassa 6.2.
Selvittelyssä on myös pystyttävä erottamaan toisistaan samantapaiset tarkkeet. Missään kielessä ei tiettävästi ole esimerkiksi sekä hattu-a:ta ǎ että lyhyysmerkki-a:ta ă, mutta pelkästä nimen kirjoitusasusta voi olla vaikea päätellä, kumpi tarke siinä on.
Jos teksti, jossa esiintyy tarkkeellinen kirjain tai muu vaikeaselkoinen merkki, on käytettävissä digitaalisessa (sähköisessä) muodossa, esimerkiksi verkkosivulla, sen identiteetin voi selvittää seuraavasti (Windows XP:ssä tai Vistassa). Kopioidaan merkki tai sen sisältävä teksti leikepöydän kautta Word- tai WordPad-ohjelmaan, napsautetaan kohtaa heti merkin jäljessä ja näppäillään Alt(x). Tällöin merkki korvautuu Unicode-koodiarvollaan, joka yksilöi merkin. Esimerkiksi hattu-a ǎ korvautuu koodilla 1CE (= U+01CE) ja lyhyysmerkki-a ă koodilla 103 (= U+0103).
Nimen tarkkeiden selvittäminen on osa laajempaa ongelmaa, nimen oikean asun selvittämistä. Tämä ongelma kokonaisuudessaan on tämän kirjan tavoitteiden ulkopuolella, mutta joitakin yleisiä ohjeita voi antaa. Jos tiedetään, mitä kieltä nimi on, tarkista luvusta 6, mitä merkkejä kielessä esiintyy. Tämä antaa usein aiheen epäillä, että joitakin tarkkeita voi puuttua. Voit myös etsiä Googlen sivulla www.google.fi/advanced_search olevalla hakulomakkeella, jossa voi rajata haun määrätynkielisiin sivuihin. Tällöin voi lähteä siitä, että esimerkiksi turkinkielisillä sivuilla turkinkieliset nimet ovat todennäköisemmin oikein kuin englanninkielisillä sivuilla. Google yleensä löytää myös sanan tarkkeelliset esiintymät, vaikka hakusanaan ei kirjoitettaisi tarkkeita.
Edellä jo viitattiin siihen, että joissakin tilanteissa kaikkien tarkkeiden kirjoittaminen on teknisesti mahdotonta. Toisentyyppistä mahdottomuutta on se, että ei kerta kaikkiaan ole aikaa selvittää nimen oikeaa asua; tämä tulee kyseeseen lähinnä sanomalehtityössä. On parempi jättää tarkkeet pois kuin ruveta arvailemaan niitä.
Kansainvälisesti tunnetut nimet esiintyvät usein asussa, josta on jätetty tarkkeet pois. Tämä johtuu lähinnä siitä, että tarkkeita on vaikea tai mahdoton tuottaa monissa tilanteissa. Lisäksi tarkkeet saattavat oudoksuttaa niihin tottumattomia. Niinpä esimerkiksi Vilho Väisälän perustama, kansainvälisesti tunnettu yritys on rekisteröity nimellä Vaisala, ja tätä asua on siten käytettävä myös suomenkielisessä tekstissä. Joskus on vaikea selvittää, onko jonkin nimen tarkkeeton kirjoitusasu vain englanninkielisen lehdistön yms. käyttämä yksinkertaistus vai virallinenkin nimi. Esiintyy esimerkiksi rinnakkain asuja Turkcell ja Türkcell. Näistä tarkkeeton on oikea, koska se esiintyy myös Turkcell-yhtiön turkinkielisillä sivuilla.
Sovinnaisnimessä eli vieraskielisen nimen täysin suomeen mukautuneessa muodossa ei tietenkään käytetä suomen kielelle vieraita tarkkeita. Kirjoitamme Meksiko, vaikka maan omakielinen nimi on México. Useimmiten nimessä tapahtuu tällöin muutakin kuin tarkkeen pois jääminen. Sovinnaisnimien määrä on melko pieni, ja nykyisen suuntauksen mukaan sitä ei haluta lisätä, pikemminkin vähentää.
Joissakin tapauksissa voisi tarkkeiden jättämistä pois perustella sillä, että tarkkeellinen muoto ei vastaa suomalaista ääntämystä. Esimerkiksi nimessä Galápagos osoittaa akuutti espanjan käytännön mukaisesti painollisuutta. Koska suomalaiset ääntävät nimen kuitenkin niin, että paino on ensimmäisellä tavulla, olisi luonnollista käyttää kirjoitusasua Galapagos. Tämä voitaisiin käsittää sovinnaisnimeksi.
Erisnimien johdoksista tarkkeet voitaneen jättää – kuten usein jätetään – pois ainakin silloin, kun tarke osoittaa painoa eikä paino alkuperäiskielessäkään ole johdoksissa samalla tavulla kuin itse nimessä. Esimerkiksi nimestä Perón johdetussa espanjan sanassa peronista ei ole akuuttia (koska johdoksessa paino on espanjan yleisten sääntöjen mukaan toiseksi viimeisellä tavulla), joten suomen sanassa peronisti ei myöskään liene syytä käyttää akuuttia (eikä ole tapana käyttää).
Eliölajien tieteellisissä nimissä, jotka on määritelty kansainvälisillä sopimuksilla ja käytännöillä, ei näiden sopimusten mukaan käytetä muita tarkkeita kuin treemaa e:n päällä (ë). Tämä pätee myös jos nimi on johdettu erisnimestä, joka sisältää tarkkeita. Suomenkielisessä nimessä tulee kuitenkin tarkkeet säilyttää.
Esimerkiksi eräs seepralaji, grévynseepra, on nimetty Ranskan presidentin Jules Grévyn mukaan. Suomenkielisessä nimessä siis säilytetään akuutti, mutta tieteellisessä nimessä ei; se on Equus grevyi.( Lajitietokeskuksen mukaan lajin nykyinen suomenkielinen nimi on isoseepra.)
Joissakin tapauksissa suomalaisen nimen kirjoitusasu on kuitenkin vakiintunut alkuperäisestä nimestä poikkeavaksi esimerkiksi tieteellisen nimen asun takia. Venäläinen tutkimusmatkailija Nikolai Prževalski löysi hevosen alalajin, joka nimettiin hänen mukaansa. Tieteelliseksi nimeksi tuli Equus caballus przewalskii (nykyisin Equus ferus przewalskii), jossa nimen kirjoitusasu on puolan mukainen, mikä on sikäli ymmärrettävää, että nimi on alkujaan puolalainen. Tämän takia suomalainenkin nimi kirjoitetaan samantyylisesti: przewalskinhevonen.
Seuraavassa taulukossa esitetään suomalaisesta näkökulmasta tärkeimmät tarkkeet. Näyte-sarakkeessa on a-kirjain, johon liittyy kyseessä oleva tarke. Koodi-sarakkeessa on se koodi, joka tarkkeella on Unicodessa yhdistyvänä tarkkeena.
Näyte |
Koodi |
Nimi englanniksi |
Nimi suomeksi |
---|---|---|---|
á |
U+0301 |
acute accent |
akuutti |
ă |
U+0306 |
breve |
lyhyysmerkki |
ǎ |
U+030C |
caron (hacek) |
hattu |
a̧ |
U+0327 |
cedilla |
sedilji |
â |
U+0302 |
circumflex accent |
sirkumfleksi |
a̦ |
U+0326 |
comma below |
alapilkku, alapuolinen pilkku |
ä |
U+0308 |
diaeresis |
treema |
ȧ |
U+0307 |
dot above |
yläpiste, yläpuolinen piste |
ạ |
U+0323 |
dot below |
alapiste, alapuolinen piste |
a̋ |
U+030B |
double acute accent |
kaksoisakuutti |
à |
U+0300 |
grave accent |
gravis |
ả |
U+0309 |
hook above |
koukku |
a̛ |
U+031B |
horn |
sarvi |
ā |
U+0304 |
macron |
pituusmerkki |
ą |
U+0328 |
ogonek |
ogonek |
å |
U+030A |
ring above |
(yläpuolinen) ympyrä |
ã |
U+0303 |
tilde |
tilde |
Verkkosivulla jkorpela.fi/merkit/tarkkeet.html on laajempi taulukko tarkkeista.
Tarkkeiden merkitykset vaihtelevat suuresti mm. kielen mukaan. Samassa kielessäkin saattaa samalla tarkkeella olla erilainen merkitys eri kirjainten yhteydessä. Esimerkiksi puolassa akuutti tarkoittaa palatalisoitumista eräiden konsonanttikirjainten yhteydessä (ć, ś, ź), mutta o-kirjaimen yhteydessä se osoittaa, että kirjain ääntyy u-äänteenä.
Usein tarkkeista, ainakin suomalaisille tutuimmista, puhutaan korkomerkkeinä, painomerkkeinä, aksentteina tms., mutta nimitykset antavat kovin yksipuolisen kuvan tilanteesta. Erityisesti vokaalin päällä olevalla tarkkeella voi olla mm. seuraavat merkitykset:
Akuutti on suomalaisille yleensä tunnetuin kirjaimesta é, joka esiintyy monissa ruotsinkielisissä nimissä. Akuutti esiintyy kuitenkin muidenkin vokaalien ja myös konsonanttien päällä, esimerkiksi á, í ja ć. Sen merkitys vaihtelee suuresti, kuten aiemmin on kuvattu. Vietnamissa ja kiinan pīnyīn-siirtokirjoituksessa akuutti tarkoittaa nousevaa sävelkulkua (toonia).
Akuutti on kirjaimen päällä oleva lyhyt suora viiva, joka on tyypillisesti noin 45 asteen kulmassa vaakatasoon nähden. Kaltevuus kuitenkin vaihtelee melkoisesti, lähes pystysuorasta miltei vaakasuoraan. Vaihtelu riippuu osittain eri kielten käytännöstä. Erityisesti puolassa akuutin (puolaksi kreska) pitäisi olla noin 75 asteen kulmassa. Tätä on vaikea järjestää muuten kuin fontin valinnalla, jos silläkään.
Akuuttina pidetään Unicode-standardissa myös kreikassa käytettyä peruspainomerkkiä, vanhan kreikan okseía t. oksía ja nykykreikan tónos, esimerkiksi kirjaimessa ά, vaikka se on perinteisesti melko pystysuora. Vertaa sirkumfleksin kuvauksessa esitettäviin huomautuksiin.
Nimi akuutti johtuu latinan sanasta acutus ’terävä’. Tämä on merkityslainaa kreikasta, sillä sanalla okseía on samanlainen merkitys. Terävyydellä on tarkoitettu painoa, alkujaan nimenomaan vanhan kreikan sellaisen tavun painollisuutta, jossa sävelkulku on nouseva, ”terävään päin”.
Akuutin virallinen suomenkielinen nimi on akuutti-korkomerkki (mm. Kielikellossa 2/2006). Se on kuitenkin paitsi epäkäytännöllisen pitkä myös harhaanjohtava, koska akuutti ei suinkaan aina osoita korkoa (painoa). Akuutista käytetään myös nimitystä akuutti aksentti.
Suomalaisessa näppäimistössä on akuutin lisäämistä varten oma näppäimensä, aksenttinäppäin. Näppäimistöasettelusta riippuu, mihin kaikkiin merkkeihin sen avulla voi lisätä akuutin.
Usein aksenttinäppäintä käytetään heittomerkin sijasta. Kun painetaan aksenttinäppäintä ja sitten välilyöntiä, syntyy akuutti erillisenä merkkinä, ´. Se muistuttaa joissakin suhteissa paremmin heittomerkkiä ’ kuin Ascii-heittomerkki '. Sen käyttö ei kuitenkaan ole suositeltavaa. Esimerkiksi tekstinkäsittelyohjelma ei yleensä osaa tunnistaa akuuttia heittomerkiksi. Suomalaisella monikielisellä näppäimistöllä saadaan heittomerkki (eli yksinkertainen lainausmerkki) aikaan näppäilyllä AltGr(,).
Alapiste eli alapuolinen piste (esimerkki; ẹ) esiintyy mm. vietnamissa, jossa se (vokaaliin liittyvänä) osoittaa määrätynlaista sävelkulkua. Lisäksi alapiste esiintyy muun muassa monien intialaisten kielten tarkassa tarkekirjoituksessa, jossa se osoittaa retrofleksisuutta eli kielen kärjen kaartumista taaksepäin. Myös arabian tieteellisessä tarkekirjoituksessa käytetään alapistettä, mutta siinä se tarkoittaa faryngaalista ääntämystä eli sitä, että konsonanttia äännettäessä kurkunpää on supistunut, jolloin äänne kuulostaa erityisen painokkaalta, emfaattiselta.
Suomalaisella monikielisellä näppäimistöllä alapiste saadaan seuraavan vokaalimerkin (a, e, i, o, u tai y) alle näppäilyllä AltGr(.). Tästä on kuitenkin suhteellisen vähän hyötyä, koska vietnamin kirjaimiin tarvittaisiin usein lisäksi toinen tarke (ks. vietnamin kuvausta luvussa 6) ja koska siirtokirjoitusjärjestelmissä taas pistettä käytetään yleensä konsonanttimerkin alla.
Tämän takia alapistettä käytettäessä tarvitaan usein alapisteellisten konsonanttien Unicode-koodiarvoja: Käytännön kirjoittamisessa saatetaan tarvita alapisteellisten konsonanttien Unicode-koodiarvoja: ḍ U+1E0D, ḥ U+1E25, ṇ U+1E47, ṛ U+1E5B, ṣ U+1E63, ṭ U+1E6D, ẓ U+1E93. (Versaalien koodiarvot ovat yhtä pienemmät, esimerkiksi Ḍ U+1E0C.)
Gravis, virallisemmin gravis-korkomerkki, kuuluu tavallaan suomenkin merkistöön ranskasta lainatussa pikkusanassa à. Gravis on kirjaimen päällä oleva lyhyt nouseva suora viiva, joka on tyypillisesti noin 45 asteen kulmassa vaakatasoon nähden. Se on muodoltaan suunnilleen akuutin peilikuva.
Tarkkeen nimi johtuu latinan sanasta gravis ’painava, raskas’. Gravis osoittaakin mm. italiassa painoa. Tavallisempaa kuitenkin on, että gravista käytetään osoittamaan vokaalin laatu (usein väljäksi) tai vain erottamaan toisistaan muuten samanlaiset sanat kuten ranskassa ou ’tai’ ja où ’missä’.
Vietnamissa ja kiinan pīnyīn-siirtokirjoituksessa gravis tarkoittaa laskevaa sävelkulkua (toonia).
Graviksena pidetään Unicode-standardissa myös vanhassa kreikassa käytettyä painomerkkiä, bareía eli varía, esimerkiksi kirjaimessa ὸ. Myös tämän tarkkeen nimi viittaa painavuuteen. Vertaa sirkumfleksin kuvauksessa esitettäviin huomautuksiin.
Suomalaista näppäimistöä käytettäessä voi graviksen lisätä seuraavan kirjaimen päälle näppäilyllä vaihto(´) eli käyttämällä aksenttinäppäintä yhdessä vaihtonäppäimen kanssa.
Kuten Š:n tarinassa kerrottiin, hattu tarkkeena on Jan Husin keksintö. Hatun nimi on tšekiksi háček, ja tätä jäljitellen englannissa usein käytetään nimeä hacek. Merkistöstandardeissa taas hatun nimenä on caron, jota ei juuri käytetä muissa yhteyksissä ja jonka alkuperä on tuntematon.
Hatun merkitys vaihtelee suuresti kirjaimen ja kielen mukaan. Kiinan pīnyīn-siirtokirjoituksessa hattu tavallaan muodollaan osoittaa merkitystään: se tarkoittaa sävelkulkua (toonia), jossa äänenkorkeus ensin laskee, sitten nousee.
Suomenkielisessä tekstissä hattua harvoin esiintyy paitsi kirjaimissa Š ja Ž, jota käsiteltiin luvussa 3 erikseen.
Hattu sekoitetaan usein sirkumfleksiin (esimerkiksi kirjaimessa â), jolle hattu-nimi sopisi oikeastaan paremmin.
Toinen sekaannus on hatun sekoittaminen lyhyysmerkkiin. Erona on lähinnä vain se, että hatussa on terävä kulma, kun taas lyhyysmerkki on kaareva. Vertaa esimerkiksi hattu-a:ta ja lyhyysmerkki-a:ta: ǎ ja ă. Käsin kirjoitettaessa eroa ei useinkaan ole, eikä myöskään painotekstin merkistä aina ole helppoa nähdä, kummasta tarkkeesta on kyse. Yleensä kussakin kielessä on käytössä joko lyhyysmerkki tai hattu, harvoin molempia ja tuskin koskaan saman kirjaimen yhteydessä. Luvussa 6 esitetyt kielikohtaiset tiedot auttavat päättelemään, kummasta on kyse vieraassa nimessä.
Suomalaisella monikielisellä näppäimistöllä voi hatun lisätä seuraavaan merkkiin näppäinyhdistelmällä AltGr('). Uusissa näppäimistöissä saattaa näppäinhatussa olla tähän viittaava merkintä.
Kirjaimeen d, l, L tai t liittyvä hattu on painotekstissä yleensä ulkoasultaan oikealla ylhäällä olevan pilkun tai heittomerkin kaltainen tarke: ď, ľ, Ľ, ť. Sen sijaan versaaleissa D ja T hattu on normaalin näköinen: Ď, Ť. Tämän syyt ovat vaikeaselkoiset. Kirjaimissa d, l, L ja t hattu nousisi melko korkealle, mutta sama ongelma on tietysti versaaleissakin. Merkkien ď ja ť osalta on ymmärrettävää, että niissä oleva tarke luokitellaan hatuksi (vrt. sediljin kuvaukseen). Vaikeampi on nähdä, miksi merkeissä ľ ja Ľ sanotaan olevan hattu eikä yläpilkkua; näitä merkkejä käytetään slovakin kielessä. Merkkejä ď, Ď, ť ja Ť käytetään sekä slovakissa että tšekissä.
Kaksoisakuutti on muodoltaan kaksi toisiaan lähekkäin olevaa akuuttia, mutta se tulkitaan erilliseksi tarkkeeksi, ei akuuttien yhdistelmäksi.
Kaksoisakuuttia käytetään unkarin kielessä. Kaksoisakuutti-o ő on pitkän ö-äänteen ja kaksoisakuutti-u pitkän y-äänteen merkki. Ks. unkarin kielen käytäntöjen kuvausta luvusta 6.
Suomalaisella monikielisellä näppäimistöllä kaksoisakuutti voidaan kirjoittaa seuraavan kirjaimen (o tai u) päälle näppäinyhdistelmällä AltGr(å). Tämän näppäilyn käyttö johtuu yhteensopivuudesta ruotsalaisen näppäimistöstandardin kanssa. Sille ei muutoin ole hyvää selitystä, paitsi se, että Å-näppäin on tarkenäppäimen vieressä.
Kaksoisakuutti sekoittuu usein treemaan. Tämän takia unkarilaisiin nimiin usein kirjoitetaan ö tai ü, kun pitäisi kirjoittaa ő tai ű.
Koukku (englanniksi hook) on kirjaimen yläpuolella oleva, ongenkoukkua tai alaosatonta kysymysmerkkiä muistuttava tarke, jota käytetään vietnamin kielessä, esimerkiksi a:n päällä Haiphong-nimen vietnaminkielisessä asussa Hải Phòng. Katso kuvausta vietnamin kirjoittamisesta luvusta 6.
Lyhyysmerkki, englanniksi breve, on nimetty tavallisimman merkityksensä mukaan: vokaalin päällä se useimmiten osoittaa, että vokaali on lyhyt. Sillä on kuitenkin muitakin merkityksiä. Se on pienehkö kaareva merkki kirjaimen yläpuolella, esimerkiksi ă.
Lyhyysmerkki on helppo sekoittaa hattuun, kuten hatun kuvauksessa kerrottiin.
Suomalaisella monikielisellä näppäimistöllä voi lyhyysmerkin lisätä seuraavaan merkkiin näppäinyhdistelmällä AltGr(vaihto((')).
Ogonek on vokaalin alla käytettävä tarke, joka esiintyy muun muassa puolassa ja balttilaisissa kielissä, esimerkiksi e:n alla nimessä Wałęsa. Ogonek on kehittynyt n-kirjaimesta ja osoittaa usein vokaalin nasaalisuutta tai pituutta. Ogonek lähtee kirjaimen alareunasta ja kaartuu oikealle, kun taas sedilji kaartuu vasemmalle.
Suomalaisella monikielisellä näppäimistöllä voi ogonekin lisätä seuraavaan merkkiin näppäinyhdistelmällä AltGr(vaihto(´)), missä ´ tarkoittaa aksenttinäppäintä.
Pituusmerkki on kirjaimen, yleensä vokaalin, päällä oleva vaakasuora viiva. Esimerkkejä: ā, ī, ū. Nimi pituusmerkki on virallisen suomalaisen nimistön mukainen mutta sikäli harhaanjohtava, että tämä tarke ei suinkaan aina osoita vokaalin pituutta. Esimerkiksi kiinan pīnyīn-siirtokirjoituksessa se osoittaa tasaista sävelkulkua. Englanninkielinen nimitys on macron, eikä se sisällä mitään viittausta tarkkeen merkitykseen.
Pituusmerkki-sanan sijasta saattaa siis olla käytännöllisempää käyttää jotain muuta nimitystä, joka viittaa vain tarkkeen muotoon, ei merkitykseen. Luonnollinen nimitys olisi viiva tai tarkemmin vaakaviiva.
Monissa kielissä pituusmerkki kuitenkin todella osoittaa vokaalin pituutta. Näin on esimerkiksi balttilaisissa kielissä. Lisäksi pituusmerkkiä käytetään usein ääntämismerkinnöissä osoittamassa vokaali pitkäksi. Tällainen merkintätapa ei kuulu IPA-kirjoitukseen, mutta se on Suomessa yleinen mm. siksi, että sitä on vanhastaan käytetty suomalais-ugrilaisessa tarkekirjoituksessa. Se on myös yleinen kirjoitettaessa latinaa niin, että vokaalien pituudet merkitään näkyviin (esimerkiksi laudātur) mm. sanakirjoissa ja kieliopeissa. Lisäksi se kuuluu kreikan tarkkaan translitteraatioon, jossa eeta η ja oomega ω merkitään ē:llä ja ō:lla.
Käytännössä pituusmerkki korvataan varsin usein sirkumfleksilla eli esimerkiksi ē:n sijasta kirjoitetaan ê. Tämä johtuu lähinnä siitä, että sirkumfleksilliset vokaalimerkit â, ê, î, ô ja û kuuluvat ISO Latin 1 -merkistöön ja ovat lisäksi yleensä helpommin kirjoitettavissa.
Suomalaisella monikielisellä näppäimistöllä pituusmerkin saa seuraavan kirjaimen päälle näppäilyllä AltGr(Vaihto(¨)). Tässä ”¨” tarkoittaa treemanäppäintä, johon on kaiverrettu ¨~^ ja tulevissa näppäimistöissä myös vaakaviiva ~-merkin yläpuolelle.
Sarvi (englanniksi horn) on kirjaimen oikeassa yläkulmassa oleva tarke, jota käytetään vietnamin kielessä, esimerkiksi o:n ja u:n yhteydessä nimessä Vương. Ulkonaisesti se muistuttaa kaarevaa heittomerkkiä mutta on lähes kiinni kirjaimessa, johon se liittyy. Katso kuvausta vietnamin kirjoittamisesta luvusta 6.
Sedilji, englanniksi cedilla, on perusmuodoltaan kirjaimen alla oleva eräänlainen koukku, kuten ç-kirjaimessa. Se on kehittynyt kirjaimen alle kirjoitetusta z-kirjaimesta, ja tästä sen nimikin (alkujaan zedilla ’pieni zeeta’) johtuu. Z-kirjaimella on alkujaan haluttu oletettavasti osoittaa s-mäistä ääntämystä.
Sediljin merkitys vaihtelee. Meille tutuimmassa tapauksessa, ranskan ç-kirjaimessa, se osoittaa, että c ääntyy s:nä tilanteessa, jossa ääntämys muutoin olisi k (nimittäin a:n, o:n tai u:n edellä). Sen sijaan liettuassa sedilji-k ķ on palatalisoituneen k-äänteen merkki, ja turkissa ja romaniassa sedilji-s tarkoittaa suhu-s:ää.
Gemena-g:hen liittyvä sedilji on ulkoasultaan g:n yläpuolella oleva c:n tapainen tarke. Sen sijaan versaali-G:ssä sedilji on normaalimman näköinen: Ģ. Taustalla on se, että g:n alaulokkeen takia merkki ulottuisi kovin alas, jos siinä vielä olisi sedilji. Merkki ģ luokitellaan kuitenkin sedilji-g:ksi, koska se on Ģ:tä vastaava gemenamerkki. On vähemmän kummallista pitää yläpuolella olevaa tarketta sediljinä kuin olisi sanoa, että muutettaessa tekstiä versaaliksi sedilji-g muuttuu esimerkiksi ylävenkura-G:ksi.
Suomalaisella monikielisellä näppäimistöllä sediljin saa liitetyksi seuraavaan kirjaimeen näppäilyllä AltGr(Vaihto(´)). Tässä ”´” tarkoittaa aksenttinäppäintä, johon on kaiverrettu akuutti ´ ja gravis ` sekä tulevissa näppäimistöissä myös (niiden oikealle puolelle) sedilji ¸ ja ogonek ˛. Myös sedilji-g ģ voidaan tuottaa tällä tavoin.
Word-ohjelmassa sedilji-c:n voi kirjoittaa näppäilyllä Ctrl(,)c. Näppäimistöasettelua suunniteltaessa harkittiin myös pilkkunäppäimen käyttöä vastaavalla tavalla, mutta siihen ei kuitenkaan menty, koska pidettiin tarpeellisempana käyttää sitä puolilainausmerkkien tuottamiseen: AltGr(,) = ’ (suomen puolilainausmerkki ja heittomerkki) ja AltGr(vaihto(,)) = ‘ (englannin vasemmanpuoleinen puolilainausmerkki).
Sirkumfleksi on kirjaimen päällä oleva, ylöspäin osoittava kulma, esimerkiksi kirjaimessa û. Se lienee suomalaisille tutuin monista ranskalaisista sanoista, kuten Rhône ja château.
Sirkumfleksi-sana johtuu latinan sanoista, jotka tarkoittavat ’ympäri taivutettu’. Tämä sana on ehkä alkujaan viitannut tilden tapaiseen tarkkeeseen, sellaiseen kuin kirjaimessa ã. Tilde ja sirkumfleksi saatetaan muutenkin sekoittaa toisiinsa.
Kun kreikan kielessä ruvettiin bysanttilaisella ajalla käyttämään tarkkeita, käytettiin peruspainomerkkinä nousevassa kulmassa olevaa okseíaa (esimerkiksi ό), erikoistilanteissa laskevassa kulmassa olevaa bareíaa (esimerkiksi ὸ) taikka aaltoviivan tai murtoviivan muotoista perispoménētä (esimerkiksi ῶ). Näillä osoitettiin paitsi painoa myös erilaisia sävelkulkuja, minkä takia tällaista kreikan kirjoittamisen muotoa kutsutaan usein polytoniseksi (moniääniseksi). Tosin sävelkulkujen erot hävisivät paljon ennen kuin nämä erilaiset painomerkit yksinkertaistettiin yhdeksi painomerkiksi, tónos, 1970-luvulla.
Unicode-standardia laadittaessa päätettiin tulkita, että okseía (oksia) ja tónos ovat keskenään sama merkki ja sama kuin latinalaisten aakkosten kanssa käytettävä akuutti. Vastaavasti bareía (varia) tulkitaan samaksi kuin gravis. Sen sijaan perispoménē tulkitaan erilliseksi tarkkeeksi, jota ei samasteta sen enempää sirkumfleksin kuin tildenkään kanssa, vaikka se yleensä vastaa ulkoasultaan jompaakumpaa niistä. (Esimerkiksi perispoménē-oomega on Everson Monossa ῶ, Tahomassa ῶ.)
Suomalaista näppäimistöä käytettäessä voi sirkumfleksin lisätä seuraavan kirjaimen päälle näppäilyllä vaihto(¨) eli käyttämällä treemanäppäintä yhdessä vaihtonäppäimen kanssa.
Tilde on kirjaimen päällä oleva aaltomainen viiva, esimerkiksi kirjaimessa ã. Suomessa tunnetaan ehkä parhaiten espanjassa käytetty tilde-n, joka esiintyy esimerkiksi sanassa mañana ’huomenna’. Tilden synnystä ja merkityksistä kerrottiin N:n tarinassa.
Suomalaista näppäimistöä käytettäessä voi tilden lisätä seuraavan kirjaimen päälle näppäilyllä AltGr(¨) eli käyttämällä treemanäppäintä yhdessä AltGr-näppäimen kanssa.
Treemasta käytetään myös monia muita nimiä: diereesi, umlaut, erokepisteet ym. Eri nimitykset heijastavat osittain eri merkityksiä.
Saksan kielessä treema kirjaimissa ä, ö ja ü esittää ns. Umlaut-ilmiötä eli sitä, että ääntämys on etuvokaalinen. Umlaut-sana viittaa usein nimenomaan taka- ja etuvokaalin vaihteluun taivutuksessa, esimerkiksi Hand : Hände ’käsi : kädet’. Suomen kielessä ei vastaavaa vaihtelua ole sanan vartalossa mutta kylläkin päätteessä; esimerkiksi illatiivin päätteellä on ns. vokaalisoinnun mukaisesti kaksi eri muotoa -ssa ja -ssä (esim. talossa ∼ kylässä).
Suomen kieleen on omaksuttu ä ja ö ruotsin kautta saksasta, kun taas y-äännettä merkitään ruotsin mukaisesti y:llä eikä ü:llä. Ruotsissa ja suomessa ä ja ö yleensä käsitetään selvemmin erillisiksi vokaaleiksi kuin saksassa, jossa Umlaut on vain eräänlainen taivutuksen ja sananjohdon oheisilmiö eikä kovin usein erottele sanoja toisistaan.
Kirjaimissa ä ja ö olevaa treemaa voidaan tietenkin kutsua vakiintuneeseen tapaan a:n ja o:n pisteiksi silloin, kun nämä kirjaimet tarkoittavat samantapaisia vokaaleita kuin suomessa.
Kokonaan toisentyyppinen merkitys treemalla on esimerkiksi ranskassa, jossa se osoittaa, että vokaali ääntyy erikseen eikä sitä tulkita digrafin (kahden kirjaimen yhdistelmän) osaksi.
Vanhinta tämäntapainen käyttö lienee latinan sellaisissa kirjoitustavoissa, joissa merkinnöillä aë ja oë osoitetaan, että e ääntyy erikseen, vastakohtana sille, että ae ja oe normaalisti molemmat ääntyvät pitkänä e:nä. Esimerkiksi latinan poena ’rangaistus’ ääntyy suunnilleen [ˈpeːna], mutta poëta [poˈeːta]. Treemaa ruvettiin käyttämään sen jälkeen, kun ae ja oe, jotka alkujaan olivat diftongeja, olivat yleisesti muuttuneet pitkäksi e:ksi, mutta joissakin sanoissa e piti ääntää erikseen. Tällaisia sanoja olivat aluksi lähinnä kreikkalaisperäiset sanat, esimerkiksi nimi Boëthius, myöhemmin muutkin, kuten keskiajalla arabialaiseen nimeen perustuva nimi Averroës. Treeman pois jättäminen tällaisista sanoista on nykyisin yleistä mutta antaa väärän käsityksen ääntämyksestä.
Vastaavasti esimerkiksi ranskalaisessa nimessä Anaïs treema ilmoittaa, että peräkkäiset a ja i ääntyvät erikseen eikä ai-yhdistelmä tarkoita eräänlaista e-äännettä kuten yleensä ranskassa.
Tyypillisesti tällaisessa käytössä treema on kahdesta peräkkäisestä vokaalista jälkimmäisen päällä. Se osoittaa myös, että vokaalit kuuluvat eri tavuihin, mistä kielitieteessä käytetään nimitystä hiatus ’aukko’, koska tavunrajan ajatellaan muodostavan ikään kuin aukon sanaan. Aukkoa tarkoittaa myös kreikan sana trẽma, josta nimi treema on peräisin. Sana diereesi (englannin diaeresis t. dieresis) puolestaan tarkoittaa erottamista, erilleen vetämistä.
Koska treema e:n päällä yleensä osoittaa, että e ääntyy erikseen, on ymmärrettävää, että sitä ruvettiin käyttämään myös sen osoittamiseen, että e ylipäänsä ääntyy. Englantilaisissa nimissä kuten Brontë treema tarkoittaa vain, että sananloppuinen e ääntyy eikä ole mykkä kuten englannissa yleensä. Sen äännearvo on tässä yhteydessä [i].
Treema-u koostuu u-kirjaimesta ja treemasta eli kahdesta pisteestä. Suomessa sitä usein kutsutaan saksalaiseksi y:ksi, mutta tämä nimitys on sopiva vain silloin, kun se todella ääntyy y-äänteenä. Näin on saksan lisäksi mm. virossa, turkissa ja kiinan pīnyīn-siirtokirjoituksessa.
Kirjain ü on syntynyt yhdistelmästä ue samaan tapaan kuin ä ja ö ovat syntyneet yhdistelmistä ae ja oe (ks. Ä:n tarinaa). Aluksi kirjoitettiin pieni e u:n yläpuolelle, ja myöhemmin e muuttui pisteiksi. Käsin kirjoitettaessa ja joskus fonteissakin ü:n pisteet ovat viivamaiset esimerkiksi kuten kaksoisakuutti-u:ssa ű. Sekaannuksen vaaraa tästä ei juuri aiheudu, paitsi unkarin kielessä, jonka merkistöön sekä ü että ű kuuluvat.
Saksaa kirjoitettaessa pidetään hyväksyttävänä korvata ü ue:llä, jos ü ei ole käytettävissä. Suomenkielisessä tekstissä siihen ei ole tarvetta, koska jos ä ja ö ovat käytettävissä, on ü:kin. Sen kirjoittaminen on hiukan vaativampaa mutta onnistuu tavallisella suomalaisella näppäimistöllä yhdistelmällä ¨u, missä ¨ tarkoittaa Å-näppäimen oikealla puolella olevan näppäimen (treemanäppäin) painamista.
Itse merkin nimeksi sopisi paremmin treema-u. Merkkiä käytetään muun muassa espanjan kielessä osoittamassa u-äännettä tilanteessa, jossa tavallinen u-kirjain jäisi ääntymättä. Espanjassa u on ei äänny yhdistelmissä gue ja gui, vaan se vain osoittaa, että g ääntyy kuten takavokaalin edellä, siis [g], eikä spiranttina, kuten se espanjassa yleensä ääntyy e:n ja i:n edellä. Siksi joissakin sanoissa käytetään yhdistelmää güe tai güi osoittamaan ääntämyksiä [gue] ja [gui].
Suomalaisessa aakkostuksessa ü on vanhastaan rinnastettu y:hyn. Käytännössä etenkin tietokoneella tehdyssä aakkostuksessa ü kuitenkin aakkostetaan kuten u, mikä vastaa saksan kielen käytäntöä.
Kreikan kielessä käytetään dialytiká-nimistä tarketta, esimerkiksi kirjaimessa ϊ (dialytiká-ioota). Se vastaa muodoltaan treemaa, ja käytöltään se vastaa treeman erokepistekäyttöä. Niinpä se onkin Unicode-standardissa samastettu treeman kanssa.
Suomalaista näppäimistöä käytettäessä voi treeman lisätä seuraavan kirjaimen päälle käyttämällä Å-näppäimen oikealla puolella olevaa treemanäppäintä.
Yläpiste eli yläpuolinen piste on kirjaimen yllä tarkkeena oleva piste, jota käytetään mm. balttilaisissa kielissä. Se esiintyy esimerkiksi e:n päällä nimessä Klaipėda.
Tavallisen i-kirjaimen pistettä ei pidetä tarkkeena. Sen sijaan turkissa ja azerissa esiintyy yläpiste versaali-i:n yläpuolella (İ), esimerkiksi nimissä İzmir, İskender ja İsmet İnönü. Ks. seuraavassa luvussa olevia huomautuksia pisteettömästä i:stä.
Suomalaisella monikielisellä näppäimistöllä voidaan yläpiste lisätä seuraavan merkin päälle yhdistelmällä AlrGr(vaihto(.)). Vertaa alapisteeseen, joka tuotetaan yhdistelmällä AltGr(.). Vaikka yläpistettä tarvitaan suomenkielisessä tekstissä esiintyvissä nimissä useammin kuin alapistettä, on yläpisteen kirjoittaminen siis hiukan hankalampaa: siihen tarvitaan vaihtonäppäintä. Tässä on haluttu käyttää intuitiivisesti selvempää sijoittelua: alapiste ”alemmalta tasolta”, yläpiste ”ylemmältä tasolta” eli vaihtonäppäimen avulla.
Ympyrä, virallisemmin yläpuolinen ympyrä, englanniksi ring (above), on kirjaimen yläpuolella tarkkeena käytettävä pieni ympyrä. Tavallisimmin sen ehkä näkee u:n päällä (ů) eräissä slaavilaisissa kielissä. Kirjain ů on syntynyt yhdistelmästä uo, ja se tarkoitti alkujaan tätä diftongia, joka myöhemmin kehittyi pitkäksi u:ksi.
Unicode-standardin kannalta myös ruotsalainen o å on ”ympyrä-a”, vaikka se sitä käyttävissä kielissä tulkitaankin itsenäiseksi kirjaimeksi. Sen synnystä kerrottiin Å:n tarinassa.
Suomalaisella monikielisellä näppäimistöllä voi ympyrän lisätä seuraavaan merkkiin näppäinyhdistelmällä AltGr(vaihto((å)). Esimerkiksi ů kirjoitetaan siis näppäimellä AltGr(vaihto((å))u. Toiminnon sijoittaminen Å-näppäimeen johtuu siitä, että Å-kirjaimessa itsessään on ympyrä. Se, että lisäksi tällöin tarvitaan vaihtonäppäintä, johtuu siitä, että AltGr(å) on määritelty kaksoisakuutin tuottavaksi – yhdenmukaisesti ruotsalaisen standardin kanssa!
Kielissä, joiden kirjoitusjärjestelmä perustuu latinalaiseen kirjaimistoon a, b, c jne., saattaa olla käytössä paitsi tarkkeellisia merkkejä kuten è ja â myös täydentäviä merkkejä kuten ð (eth) ja ß (kaksois-s). Osa näistä merkeistä on syntynyt kahden kirjaimen yhteen sulautumisesta, esimerkiksi œ-kirjain o- ja e-kirjaimen yhdistymisestä. Osa taas muistuttaa tarkkeellisia kirjaimia, esimerkiksi poikkiviivalliset kirjaimet, mutta poikkiviivaa ei pidetä tarkkeena. Jotkin lisämerkit on lainattu muista kirjoitusjärjestelmistä, esimerkiksi þ riimukirjoituksesta.
Vieraiden nimien kirjoitusasun tarkkuus on aina kuulunut huolitellun kielen periaatteisiin. Kielitoimiston tiedotuslehden merkkiaiheisessa laajassa teemanumerossa 2/2006 on otettu tiukka kanta latinalaisen kirjaimiston lisämerkkien säilyttämiseen:
”Tarkkeiden lisäksi eri kielissä on myös omia kirjainmerkkejä. Tällaisia ovat esimerkiksi islannin thorn þ ja eth ð (esimerkiksi nimessä Sigriður Anna Þórðardóttir), muun muassa tanskan, norjan ja eteläsaamen ø (o ja vinoviiva yli, esimerkiksi nimessä Knud Møller) ja turkin pisteetön i (esimerkiksi nimessä Recep Tayyıp Erdoğan). Tarkkeiden tapaan myös vieraskieliset kirjaimet tulisi pyrkiä säilyttämään tekstissä alkuperäkieltä kunnioittaen.”
Kuvaavaa tämän vaatimuksen vaativuudelle on, että ohjeessa itsessään on virhe pisteettömän i:n esimerkissä: nimeen Tayyip kuuluu tavallinen pisteellinen i.
Ohjeessa tarkoitetaan tietysti vain sellaisia kieliä, joita kirjoitetaan latinalaisin (latinalaiseen aakkostoon perustuvin) kirjaimin. Sen sijaan kreikan-, venäjän-, arabian- yms. kieliset nimet kirjoitetaan jonkin siirtokirjoituksen (translitteraation tai transkription) mukaan.
Aiemmin on usein korvattu esimerkiksi ð-kirjain d:llä ja þ-kirjain th:lla. Vaikka tämä antaa oikeansuuntaisen vihjeen ääntämyksestä, se on kyseenalaista muun muassa siksi, että islannin kielessä on ð:n lisäksi käytössä myös d-kirjain.
Useimmat yleisesti tarvittavat latinalaisen merkistön lisäkirjaimet voidaan kirjoittaa helposti laajennetulla suomalaisella näppäimistöllä, joka kuvataan luvussa 7. Seuraava taulukko kuvaa myös tällöin käytettävän ns. AltGr-näppäilyn. Yhdistelmän AltGr(§) sijasta voidaan käyttää myös yhdistelmää AltGr(l).
ae-kirjain |
æ |
AltGr(ä) |
tanskassa ja norjassa, ”tanskalainen ä” |
---|---|---|---|
eth |
ð |
AltGr(d) |
islannissa |
häntä-z (ezh) |
Ʒ |
AltGr(z) |
koltansaamessa ja ääntämisohjeissa |
kaksois-s |
ß |
AltGr(s) |
saksassa, esim. Strauß |
kraa |
ĸ |
AltGr(k) |
grönlannissa |
oe-kirjain |
œ |
AltGr(o) |
ranskassa, esim. cœur |
pisteetön i |
ı |
AltGr(i) |
turkissa, esim. Elazığ |
poikkiviiva-d |
đ |
AltGr(§) d |
saamessa, kroatiassa ym. |
poikkiviiva-g |
ǥ |
AltGr(§) g |
saamessa |
poikkiviiva-h |
ħ |
AltGr(§) h |
maltassa |
poikkiviiva-l |
ł |
AltGr(§) l |
puolassa, esim. Wojtyła |
poikkiviiva-o |
ø |
AltGr(ö) |
tanskassa ja norjassa, ”tanskalainen ö” |
poikkiviiva-t |
ŧ |
AltGr(§) t |
saamessa |
švaa |
ə |
AltGr(a) |
ääntämisohjeissa, azerissa ym. |
thorn |
þ |
AltGr(t) |
islannissa |
äng |
ŋ |
AltGr(n) |
saamessa ja ääntämisohjeissa |
Kirjain æ (versaalina Æ) on syntynyt ilmeisellä tavalla kirjainten a ja e yhdistelmästä. Sen alkuperä on siis samantapainen kuin ä:n (ks. Ä:n tarinaa). Kirjain tuli käyttöön tanskan, norjan ja fäärin kielessä ja muinaisenglannissa. Suomen kielessä siitä käytetään usein nimitystä ”tanskalainen ä”.
Suomenkielisessä tekstissä æ on usein korvattu ä:llä, koska sitä ei ole osattu kirjoittaa. Nykyisin tähän ei ole mitään syytä. Esimerkiksi suomalaisella monikielisellä näppäimistöllä voi æ:n kirjoittaa suoraan näppäilyllä Alt(ä).
Suomessa myytävien kannettavien tietokoneiden näppäimistöissä saattaa olla Ä-näppäimessä lisäkaiverrus Æ ja Ö-näppäimessä lisäkaiverrus Ø. Lisäksi on usein vielä tämän kanssa ristiin menevät lisäkaiverrukset: Ä:ssä Ø ja Ö:ssä Æ. Nämä kaiverrukset eivät yleensä vielä johdu suomalaisesta monikielisestä näppäimistöstä vaan siitä, että koneet on tehty yleisesti pohjoismaisille markkinoille. Lisäkaiverrusten ansiosta näppäimistöjä voi helposti käyttää myös tanskalaisella ja norjalaisella näppäinasettelulla.
Nykyenglannissa æ esiintyy toisessa merkityksessä, nimittäin ae-yhdistelmän typografisena muunnelmana, ligatuurina, latinalaisperäisissä sanoissa, esimerkiksi encyclopædia = encyclopaedia ja Cæsar = Caesar. Tällaista käyttöä esiintyy lähinnä brittienglannissa, eikä se ole nykyisin kovin yleistä. Se jatkaa vanhaa, jo keskiajalla syntynyttä latinan kirjoittamistavan perinnettä. Sen mukaisia asuja esiintyy muuallakin kuin englannissa. Esimerkiksi Carl von Linnén nimen latinankielinen muoto on usein kirjoitettu Carolus Linnæus (= Linnaeus).
Suomeen kieleenkin æ:tä on vakavasti ehdotettu. Tunnetuin ehdottaja oli suomalaisuuden harrastaja Wolmar Schildt (1810–1893), kirjailijanimeltään V. Kilpinen. Hän ehdotti ja julkaisussaan käyttikin ns. venykekirjoitusta, jossa ä-äänteen merkkinä oli æ (ja ö-äänteen merkkinä œ) ja jossa pitkä vokaali merkittiin sirkumfleksilla (esim. â) eikä kahdentamalla vokaali (esim. aa). Schildtin mukaan pitkää ä:täkin merkittäisiin æ:llä, jonka päällä on sirkumfleksi, mutta ilmeisesti käytännön syistä hän kuitenkin kirjoitti ææ. Schildtin perusteena sirkumfleksin käytölle oli lähinnä lyhyys, kun taas æ:n ja œ:n käyttöä hän perusteli sillä, että ne ovat ”latinaisia kirjaimia”.
Eth-kirjain tarkoittaa samaa äännettä kuin englannin th ääntyessään soinnillisena, esimerkiksi sanassa the. (Vertaa thorn-kirjaimeen.) Ethiä käytetään myös tämän äänteen IPA-merkkinä, [ð]. Ethiä käytetään Suomessa myös melko usein sellaisissakin ääntämisohjeissa, joissa ei muuten käytetä IPAa. Syynä on mm. se, että eth on laajasti käytettävissä: se kuuluu ISO Latin 1 -merkistöön.
Ethiä käytetään islannissa ja fäärissä, ja se oli käytössä myös muinaisenglannissa. Sen alkuperä on epäselvä: se saattaa olla alkujaan d:n tai deltan ð muunnelma tai peräisin riimukirjoituksesta.
Versaali-eth on muodoltaan D, jossa on poikkiviiva: Ð. Se on kuitenkin eri merkki kuin versaali poikkiviiva-D, vaikka nämä merkit ovat käytännössä samannäköiset todennäköisesti kaikissa fonteissa! Ne pidetään erillään lähinnä siksi, että vastaavat gemenat ovat eri merkit. Ellei versaalissa tehtäisi eroa, ei tiedettäisi, pitääkö tekstiä versaalista gemenaksi muunnettaessa korvata Ð ethillä ð vai poikkiviiva-d:llä đ.
Ethin voi kirjoittaa suomalaisella monikielisellä näppäimistöllä yhdistelmällä AltGr(d).
Häntä-z ʒ lienee kehittynyt käsialakirjoituksessa ja vanhoissa kirjasintyypeissä käytetystä z-kirjaimen muodosta, jota kuvattiin Z:n tarinassa. Muoto muistuttaa ensi näkemältä numeroa 3 etenkin, kun numeron ylempi osa on varsinkin käsin kirjoitettaessa kulmikas. Kirjainta on kutsuttu myös nimellä pitkä z, koska se on muodoltaan kuin venytetty z.
Häntä-z:aa käytetään foneettisessa IPA-kirjoituksessa soinnillisen suhuässän merkkinä eli samassa merkityksessä kuin suomen kirjoitusjärjestelmän hattu-z:aa ž. Häntä-z:aa käytettiin foneettisena merkkinä lienee jo Isaac Pitmanin ja Alexander John Ellisin vuonna 1845 julkaisemassa aakkostossa phonotypic alphabet, joka oli tarkoitettu englannin kirjoittamiseen äänteenmukaisesti.
Lisäksi häntä-z:aa käytetään joidenkin kielten (koltansaamen ja eräiden afrikkalaisten kielten) varsinaisessa kirjoitusjärjestelmässä. Se on siis päätynyt foneettisesta merkistä myös ”tavalliseksi” kirjaimeksi.
Koltansaamessa häntä-z ʒ ei tarkoita samaa äännettä kuin IPAssa, vaan affrikaattaa [ʣ̥], missä alapuolinen ympyrä tarkoittaa soinnittomuutta. Koltansaamessa käytössä myös hatullinen häntä-z ǯ, joka tarkoittaa affrikaatan palatalisoitunutta versiota [ʣ̥ʲ]. Hatullista häntä-z:aa käytetään myös joissakin karjalan kielen kirjoitustavoissa.
Suomalaisella monikielisellä näppäimistöllä hattu-z voidaan kirjoittaa yhdistelmällä AltGr(z).
Versaali-hattu-z Ʒ on käytännössä muodostettu gemenamuodosta, sitä suurentamalla. Joissakin fonteissa saattaa versaali-hattu-z ulottua kirjainten peruslinjan alapuolelle.
Hattu-z puuttuu joistakin tärkeistä fonteista, kuten leipätekstissä usein käytetyn Times New Romanin vanhoista versioista.
Unicode-standardissa gemena-hattu-z ʒ tulkitaan samaksi merkiksi kuin erään vanhan, aiemmin apteekeissa käytetyn paino- ja tilavuusyksikön dramin eli drakhman symboli; 1 ʒ oli noin 3,888 grammaa.
Saksan kielessä käytetyn kaksois-s:n (englanniksi sharp s, saksaksi Esszett) synnystä on esitetty useita käsityksiä. Yhden käsityksen mukaan se on syntynyt yhdistelmästä sz, toisen mukaan yhdistelmästä ss. Molemmat ovat ilmeisesti sikäli oikeita, että ß:llä on kahtalainen alkuperä. Kummassakin tapauksessa on ensimmäinen kirjain ollut fraktuuran pitkä s, siis ſ. Yhdistelmistä ſs ja ſz, jotka kirjoitettiin ligatuureiksi (fraktuurafontilla: ſs, ſz) on melko ymmärrettävästi päädytty ß-muotoon (fraktuurafontilla: ß) Myös vanhassa, fraktuuralla painetussa kirjasuomessa on joskus käytetty ß-kirjainta.
Usein väitetään, että ß olisi poistettu saksan oikeinkirjoituksesta. Huhu on perätön. Se on saanut alkunsa lähinnä siitä, että 1990-luvulla saksan virallisessa kirjoitusjärjestelmässä vähennettiin ß:n käyttöä. Nykyisten sääntöjen mukaan sitä käytetään vain pitkän vokaalin tai diftongin jäljessä. Se siis säilytettiin esimerkiksi sanoissa groß (jossa o ääntyy pitkänä) ja heißt, mutta monille saksanlukijoille tutut daß ’että’ ja ißt ’syö’ kirjoitetaan nyt dass ja isst.
Henkilönnimiin uudistus ei vaikuta, ja niissä esiintyy erilaisia käytäntöjä. Periaatteessa jokaisen nimen asu on selvitettävä erikseen. Esimerkiksi nimen Strauss lisäksi esiintyy myös nimi Strauß. Selvitystehtävää vaikeuttaa, että esimerkiksi suomalaisissa hakuteoksissa usein käytetään ss-yhdistelmää silloinkin, kun ß olisi oikein.
Paikannimistä huomattakoon, että nykyisen oikeinkirjoituksen mukaan ß-kirjainta käytetään sanassa Straße ’katu’, joka usein esiintyy kadunnimien jälkiosana. EU:n hallinnossa keskeisen kaupungin nimi on nykysaksaksi Straßburg; toisaalta suomenkielisessä tekstissä käytetään nykyisin yleisesti ranskankielistä asua Strasbourg.
Sveitsissä ja Liechtensteinissa on jo melko pitkään ollut sallittua ja yleistä korvata ß aina ss:llä, mutta tämä ei päde Saksassa. Suomalaisesta näkökulmasta ß on saattanut näyttää käytöstä poistetulta kirjaimelta sen takia, että suomalaisissa julkaisuissa, jopa sanakirjoissa, se on usein korvattu ss:llä.
Muutamissa sanoissa ss:n ja ß:n ero on ainoa, joka erottaa toisistaan muutoin samoin kirjoitettavat sanat, esimerkiksi Masse ’joukko’ ja Maße ’määrät’ (sanan Maß monikko). Näiden ääntämyksessä on siis se ero, että ß:n edellä vokaali on pitkä.
Kaksois-s esiintyy alkujaan vain gemenassa. Jos sana kirjoitetaan kokonaan versaalilla, tulee ß:n tilalle SS. Esimerkiksi sana heißt on versaalilla HEISST. Jos tietokoneohjelmassa on toiminto, jolla teksti muutetaan versaaliksi, ohjelma ei suinkaan välttämättä osaa käsitellä ß:ää lainkaan, joten voi syntyä vääriä muotoja kuten HEIßT.
Nykyisin Unicodessa on myös versaali-kaksois-s ẞ (U+1E9E). Sen käyttö on vähäistä, mutta sitä voidaan käyttää erottamaan esimerkiksi nimet Strauss ja Strauß silloin, kun ne kirjoitetaan versaalilla: STRAUSS, STRAUẞ.
Suomalaisella monikielisellä näppäimistöllä ß:n voi kirjoittaa yhdistelmällä AltGr(s).
Grönlannin kielessä (omakielinen nimi: kalaallisut) käytetty kraa-kirjain on samannäköinen kuin versaali-K pienennettynä ja kyrillinen kaa-kirjain. Se tarkoittaa samaa kuin [q] IPA-merkistössä eli soinnitonta uvulaarista klusiilia, siis eräänlaista ”taka-k:ta”. Useimmiten kraa korvataan q-kirjaimella, ja vuoden 1973 oikeinkirjoitusuudistuksessa tämä vahvistettiin periaatteeksi. Kraasta on olemassa vain gemenamuoto. Versaalissa käytetään tavallista K:ta ja käänteistä heittomerkkiä; tällainen yhdistelmä K‘ korvataan nykyisin Q:lla. Esimerkiksi Thulen grönlanninkielinen nimi kirjoitettiin ennen K‘ânâĸ, nykyisin Qaanaaq.
Kyseessä on siis varsin harvinainen kirjain. Sitä tulisi käyttää vain grönlanninkielisissä sanoissa, jotka jostain syystä halutaan kirjoittaa vanhan kirjoitusjärjestelmän mukaan. Kraa on kuitenkin otettu mukaan suomalaiseen monikieliseen näppäimistöön, jossa sen voi tuottaa näppäilyllä AltGr(k). Syynä on periaate, jonka mukaan kyseisellä näppäimistöllä on voitava kirjoittaa pohjoismaisia kieliä laajassa mielessä.
Oe-kirjainta (œ, Œ) käytetään ranskassa, ja ääntämykseltään se muistuttaa suomen ö:tä, mutta on väljempi, IPAssakin [œ]:llä merkitty äänne. IPA käyttää myös versaali-Œ:tä, ja [Œ] tarkoittaa vieläkin väljempää ö:n tapaista äännettä. Latinalaisperäisissä sanoissa œ kuitenkin tarkoittaa ranskassa äännettä [e].
Oe-kirjain on ymmärrettävästikin kehittynyt o:n ja e:n yhdistelmästä (vrt. Ö:n tarinaan). Sitä kutsutaankin usein oe-ligatuuriksi, vaikka kyse on erillisestä merkistä, joka ei Unicodessa ole hajotettavissa muiksi merkeiksi.
Vaikka œ usein korvataan kirjainparilla ”oe”, tällainen pari on ranskassa yleensä virheellinen asu. Joissakin tapauksissa pitää olla ”oë” (esimerkiksi Noël), jolloin treema (kaksi pistettä) osoittaa sitä, mitä ranskassa yleensäkin eli sitä, että vokaali ääntyy erillisenä, siis ”o” ja ”e” ääntyvät erikseen. Muissa tapauksissa taas pitää olla oe-kirjain œ (esim. cœuer, ei coeur). Se on ranskassa oma kirjaimensa ja kuvaa ö:n tapaista äännettä. Huomattakoon kuitenkin, että ranskalaisilla on myös muista kielistä peräisin olevia nimiä, joissa saattaa esiintyä oe-yhdistelmä, esimerkiksi Loeb. Lisäksi joissakin latinalaisperäisissä co-alkuisissa sanoissa on oe-yhdistelmä, esimerkiksi coercion, coexistence.
Suomalaisella monikielisellä näppäimistöllä œ voidaan kirjoittaa yhdistelmällä AltGr(o). Koska œ on tavallaan ”ranskalainen ö”, yhdistelmä AltGr(ö) olisi ehkä tuntunut luonnollisemmalta, mutta se päätettiin varata tärkeämmäksi arvioidulle kirjaimelle, tanskalaiselle ö:lle ø.
Pisteetöntä i:tä käsiteltiin jo I:n tarinassa. Se on turkin kieleen kehitetty ja myöhemmin myös azeriin otettu niin sanotun taka-i:n merkki. Ks. myös turkin kielen kuvausta.
Pisteettömän i:n voi kirjoittaa suomalaisella monikielisellä näppäimistöllä yhdistelmällä AltGr(i).
Pisteetöntä i:tä ı vastaava versaalikirjain on meidän tavallinen I:mme. Turkissa ja azerissa toisaalta tavallista i:tä vastaava versaalikirjain on yläpiste-I İ, jota ei käytetä muissa kielissä. Se voidaan kirjoittaa muiden tarkkeellisten kirjainten tavoin: suomalaisella monikielisellä näppäimistöllä sen saa aikaan yhdistelmällä AltGr(vaihto(.)) vaihto(I).
Vieraiden kirjainten säilyttämisen periaatetta lienee tulkittava niin, että turkin- ja azerinkielisissä nimissä säilytetään pisteellisen i:n (i, İ) ja pisteettömän i:n (ı, I) välinen ero. Jos esimerkiksi teksti kirjoitetaan kokonaan versaalilla, olisi i:n tilalle kirjoitettava İ; esimerkiksi İzmir olisi versaalilla İZMİR. Jos taas pisteettömällä I:llä alkavasta turkkilaisesta nimestä muodostetaan johdos, jolloin alkukirjain muuttuu gemenaksi, tulisi kirjaimen pysyä pisteettömänä: Ihlara – ıhlaralainen. (Tällaiset nimet ovat harvinaisia. Turkissa pisteellinen İ on sanan alussa tavallisempi kuin pisteetön I.)
Kuten edellä on kuvattu, eräiden kirjainten rakenneosana on poikkiviiva, englanniksi stroke. Se ei merkistöstandardien kannalta ole erotettavissa erilliseksi osaksi, eikä poikkiviivallisilla merkeillä ole muodollisesti muuta yhteistä Unicoden kannalta kuin se, että niiden nimessä on sanat with stroke.
Poikkiviivanäppäin on suomalaisessa monikielisessä näppäimistössä apunäppäin, jolla tuotetaan erilaisia poikkiviivan sisältäviä merkkejä: poikkiviiva-d (Đ, đ), poikkiviiva-g (Ǥ, ǥ), poikkiviiva-h (Ħ, ħ), poikkiviiva-l (Ł, ł) ja poikkiviiva-t (Ŧ, ŧ), periaatteessa myös poikkiviiva-o eli tanskalainen ö (ø, Ø). Kyseessä ei ole varsinainen tarkenäppäin, koska poikkiviiva ei ole merkistöstandardien kannalta tarke, vaan niissä poikkiviivalliset merkit ovat itsenäisiä kirjaimia, jotka eivät ole hajotettavissa osiin.
Poikkiviivanäppäin ei ole erillinen fyysinen näppäin vaan toiminto, joka saadaan aikaan yhdistelmällä AltGr(§) tai AltGr(l). Uusissa näppäimistöissä saattaa olla §-näppäin đ:n tapainen lisämerkintä osoitukseksi poikkiviivanäppäinkäytöstä. Tämä näppäin valittiin tarkoitukseen lähinnä siksi, että se on helppo löytää näppäimistön vasemmasta yläkulmasta ja se on muutoin aika vähän käytetty. Koska tämä näppäin puuttuu useista kannettavien tietokoneiden näppäimistöistä, annettiin sama merkitys yhdistelmälle AltGr(l). Tämä on helppo muistaa siitä, että ł (Ł) on Suomessa yleensä tunnetuin poikkiviivallinen merkki, koska on yleinen puolankielisissä nimissä.
Esimerkiksi poikkiviiva-d voidaan siis kirjoittaa suomalaisella monikielisellä näppäimistöllä yhdistelmällä AltGr(§)d tai yhdistelmällä AltGr(l)d.
Poikkiviiva-d đ on eri merkki kuin eth ð, vaikka näiden merkkien versaalit ovat käytännössä keskenään samanlaiset (Đ). Poikkiviiva-d:tä käytetään kirjoitettaessa serbokroatian eri muotoja (kroatia, serbia, bosnia, montenegro) latinalaisin kirjaimin ja makedonian translitteraatiossa sekä lisäksi sloveenissa, vietnamissa ja eräissä saamen kielissä: inarinsaame, pohjoissaame ja koltansaame. Kyseessä ovat siis aivan eri kielet kuin ne, joissa esiintyy eth (islanti ja fääri).
Serbokroatian eri muodoissa đ tarkoittaa affrikaattaa, jota voidaan karkeasti merkitä yhdistelmällä džj ja tarkemmin, IPA-merkein kuvattuna [ʤʲ] tai ehkä oikeammin [ʥ]. Mainittuja kielimuotoja kirjoitettaessa on đ:n sijasta käytetty myös kirjainyhdistelmää dj. Esimerkiksi entisessä Jugoslavissa toiminut poliitikko ja kirjailija Milovan Đilas tunnetaan Suomessa lähes yksinomaan nimellä Milovan Djilas.
Esiintyy myös kirjoitusasuja, joissa đ korvataan pelkällä d:llä. Jopa tietosanakirjoissa esiintyy sellaisia nimiasuja kuin Dakovica, oikeammin Đakovica (tai edes Djakovica).
Poikkiviiva-g (ǥ, Ǥ) on varsin harvinainen merkki: sitä käytetään vain koltansaamessa. Merkki puuttuu useista muutoin melko kattavistakin fonteista. Poikkiviivan sijainti on erilainen eri fonteissa. Se voi olla peruslinjan yläpuolella tai sen alapuolella tai jopa peruslinjalla. Antiikvafonteista se yleensä puuttuu, mutta seuraava kuva osoittaa, millaiseksi poikkiviiva-g voidaan suunnitella.
Poikkiviiva-h (ħ, Ħ) esiintyy maltan kielessä, jossa se tarkoittaa eräänlaista kurkku-h:ta, nielussa ääntyvää h:n tapaista hankausäännettä, soinnitonta faryngaalista frikatiivia, jonka IPA-merkkinäkin sitä käytetään.
Poikkiviiva-l:ää (Ł, ł) käytetään etenkin puolan kielessä, jossa se tarkoittaa samanlaista puolivokaalia kuin englannin w (ja IPA-merkki [w]). Puolan kielessä esiintyy myös tavallinen, l‑äännettä tarkoittava l‑kirjain, joten eron tekeminen on olennaista. Poikkiviiva-l esiintyy myös kašubissa sekä ala- ja yläsorbissa.
Poikkiviiva-l on poikkiviivallisista kirjaimista ehkä tunnetuin, ainakin jos ei oteta huomioon ø:tä, joka on aika erityyppinen. Tämän takia suomalaisessa kansainvälisessä näppäimistöasettelussa poikkiviivan seuraavaan kirjaimeen lisäävänä näppäilynä on käytettävissä Alt(§):n lisäksi myös Alt(l). Poikkiviiva-l voidaan siis kirjoittaa näppäilyllä Alt(l)l.
Poikkiviiva-o:ta (ø, Ø) käytetään tanskassa, norjassa, fäärissä ja grönlannissa ö-äänteen merkkinä, ja sen nimikin on suomessa yleensä ”tanskalainen ö”. Se on alkujaan kehittynyt oe-yhdistelmästä, kuten Ö:n tarinassa kuvattiin.
Suomalaisella monikielisellä näppäimistöllä poikkiviiva-o on yhtenäisyyden vuoksi tuotettavissa myös poikkiviivanäppäimen avulla, AltGr(§)o tai AltGr(l)o, vaikka sen saa aikaan helpomminkin: AltGr(ö).
Poikkiviiva-o ø on eri merkki kuin halkaisijan merkki ⌀ (U+2300), jota käytetään sentapaisissa ilmauksissa kuin ⌀22 mm ’halkaisijaltaan 22 millimetriä’. Vaikka poikkiviiva-o:ta usein käytetään halkaisijan merkin korvikkeena, merkeillä on selvä ero mm. siinä, että halkaisijan merkissä on aina täydellinen ympyrä, kun taas poikkiviiva-o:n o-osa on useissa fonteissa hiukan soikea ja viivanpaksuudeltaan vaihteleva.
Versaali poikkiviiva-o Ø on eri merkki kuin joukko-opissa käytetty tyhjän joukon merkki ∅ (U+2205). Tässäkin on olennainen ero pyöreydessä: tyhjän merkin joukossa on täydellinen ympyrä, jonka halki menee viiva 45 asteen kulmassa.
Švaa-kirjain ə (englanniksi schwa) on kehitetty alkujaan foneettiseksi merkiksi, joka tarkoittaa švaa-vokaalia eli neutraalivokaalia eli suun keskiosassa ääntyvää vokaalia, jota voisi hiukan epämääräisesti luonnehtia eri vokaalien keskiarvoksi. Se esiintyy esimerkiksi englannissa sanan about alussa ja artikkelin a tavallisessa, painottomassa ääntämyksessä.
Neutraalivokaali on usein hyvin lyhyt vokaali, joka voi jäädä kokonaan pois nopeassa puheessa. Tämä ei kuitenkaan kuulu tämän äänteen määritelmään, vaan se voi ääntyä myös normaalin mittaisena ja painollisena.
Švaa-kirjainta käytetään suomessa melko usein ääntämismerkinnöissä silloinkin, kun niissä muutoin yritetään tulla toimeen suomen kirjaimilla ja ääntämyksen karkealla kuvailulla. Tämä on perusteltua, koska kyseessä on usein esiintyvä äänne ja koska se poikkeaa äänteellisesti kaikista suomen vokaaleista. Juuri neutraalisuutensa (tai ”epämääräisyytensä”) takia se erottuu, koska suomen vokaalit ovat muutoin melko ”kirkkaita” ja ”puhtaita”.
Myöhemmin on ə-merkki otettu myös kirjaimeksi joidenkin kielten varsinaiseen kirjoitusjärjestelmään.
Azerin ja tataarin kirjoitusjärjestelmään ə on otettu äänteen [æ] merkiksi eli samaan tehtävään kuin suomessa ä-kirjain. Tässä tehtävässä sitä käytetään myös tšetšeenin kielessä, kun sitä kirjoitetaan latinalaisin aakkosin.
Kirjaimen virallinen suomenkielinen nimi on švaa, vaikka se siis ei suinkaan aina äänny švaa-äänteenä. Nimestä käytetään nykyisin myös asua svaa, joka voidaan tulkita viralliseksikin.
Švaa on lainattu myös kyrilliseen kirjoitusjärjestelmään, ja kyrillinen švaa (U+04D9) on samannäköinen kuin latinalainen. Periaatesyistä sitä kuitenkin pidetään eri merkkinä, koska kyse on kahdesta eri aakkostosta.
Muodoltaan ə-kirjain on 180 astetta käännetty e-kirjain. Toisin sanoen jos paperiarkki kiepautetaan ylösalaisin, e muuttuu ə:ksi ja ə e:ksi. Taustalla on ehkä se, että mm. englannissa ja ranskassa e-kirjain usein ääntyy švaana.
Jos ə-kirjain valitaan merkistötaulukosta, esimerkiksi Windowsin Merkistö-ohjelmalla, on oltava tarkkana. IPA-merkkien joukossa on nimittäin ə:n (U+0259) lisäksi myös peilikuva-e (reversed e) ɘ (U+0258). Lisäksi on aivan ə:n näköinen merkki käänteis-e (U+01DD), jota käytetään eräissä afrikkalaisissa kielissä ns. yleisnigerialaisessa aakkostossa. Sitä pidetään erillisenä merkkinä, koska sitä vastaava versaalikirjain Ǝ (U+018E) on aivan erilainen kuin versaali-švaa Ə (U+0185), joka on käytännössä muodostettu gemenamuodosta, sitä suurentamalla.
Nämä sekaannusmahdollisuudet vältetään, kun ə kirjoitetaan näppärimmällä tavalla: suomalaista monikielistä näppäinasettelua käyttäen yhdistelmällä AltGr(a). Sijoittaminen a-näppäimeen johtuu siitä, että AltGr(e) on jo melko pitkään ollut varattuna euron merkin € kirjoittamiseen, ja muista vokaaleista juuri a:n voinee helpoimmin mielessään yhdistää švaahan. Se on helppo muistaa englannin sanoista a ja about.
Sanalla švaa tai švaavokaali tarkoitetaan usein myös toista asiaa: ns. loisvokaalia, joka kehittyy konsonanttien väliin ääntämyksen helpottamiseksi. Esimerkiksi suomen yleiskielen sana kolme esiintyy monissa murteissa muodossa kolome, jossa toinen o-äänne on loisvokaali. Suomen murteissa konsonanttien väliin muodostuva loisvokaali on yleensä laadultaan sama kun ensimmäistä konsonanttia edeltävä vokaali (halvalla ∼ halavalla, pilkku ∼ pilikku, kylmä ∼ kylymä jne.), joskin yleensä tavallista lyhyttäkin vokaalia lyhyempi. Se ei siis ole švaa-äänteen kaltainen.
Thorn-kirjain tarkoittaa samaa äännettä kuin englannin th ääntyessään soinnittomana, esimerkiksi sanassa think. (Vertaa eth-kirjaimeen.) Tämän äänteen IPA-merkki on kreikkalainen theeta-kirjain, [θ]. Thornia käytetään joskus myös ääntämisohjeissa, koska se on laajasti käytettävissä: se kuuluu ISO Latin 1 -merkistöön.
Thornia käytetään islannin kielessä, ja se oli käytössä myös muinaisenglannissa. Se on peräisin riimukirjaimistosta, jossa vastaava merkki, muodoltaan lähinnä ᚦ, tunnetaan nimellä thurizas, thurs tai thorn.
Thornin erikoisuuksiin kuuluu myös se, että gemena-thornissa þ on sekä ylä- että alauloke. Lisäksi versaali-thorn Þ (”iso thorn”) on joissakin fonteissa pienempi kuin gemena-thorn þ (”pieni thorn”). Ne erottaa toisistaan kuitenkin koosta riippumatta siitä, että versaalikirjain on kirjainten perusviivan yläpuolella, kun taas gemenakirjain siis ulottuu perusviivan alapuolelle.
Thornin voi kirjoittaa suomalaisella monikielisellä näppäimistöllä yhdistelmällä AltGr(t).
Äng-kirjainta ŋ käytetään eräissä saamen kielissä ja joissakin Euroopan ulkopuolisissa kielissä sekä ääntämisohjeissa äng-äänteen merkkinä. Esimerkki: kenkä [keŋkæ]. Sen alkuperää ja käyttöä käsiteltiin edellä kohdassa Äng-äänne ja äng-kirjain.
Tässä luvussa kuvataan kirjainten käytön perussääntöjä sellaisten kielten osalta, jotka ovat suomalaisesta näkökulmasta tärkeitä. Pääpaino on sillä tavoitteella, että osaisimme kirjoittaa oikein vieraskieliset nimet, joita käytämme suomenkielisessä tekstissä. Siksi mukana on etenkin eurooppalaisia kieliä. Osittain käsitellään vain sitä, mitä kirjaimia kussakin kielessä käytetään, mutta tämäkin usein auttaa olemaan varuillaan mm. sen suhteen, mitä tarkkeita nimen kirjoitusasusta saattaa puuttua jopa muuten luotettavissa hakuteoksissa. Ääntämystä ei käsitellä mitenkään järjestelmällisesti, mutta siitä annetaan eräitä tietoja, joilla on merkitystä kirjoittamisen kannalta. Ääntämys voi nimittäin vaikuttaa sanan päätteisiin suomen kielessä ja sanan jakamiseen eri riveille.
Esitystapa pyrkii olemaan sellainen, että keskeisen asiasisällön voi ymmärtää, vaikka ei tuntisi käsiteltävää kieltä. Toisaalta kuvauksista on hyötyä myös kieliä opiskeleville tai niitä jo osaaville, koska merkkien käytön ongelmat on opetuksessa usein sivuutettu liian vähällä.
Yksinkertaisuuden vuoksi kuvataan vain ne lisämerkit, joita kielessä käytetään latinalaisten perusaakkosten a–z lisäksi. Lisämerkkejä ovat tällöin sekä tarkkeelliset merkit että latinalaiset lisäaakkoset kuten þ.
Huomautukset sanojen jakamisesta eri riveille koskevat lähinnä konsonanttiyhdistelmien jakamattomuutta. Hyvin monet vokaalien yhdistelmät ovat myös sellaisia, joita ei saa jakaa, mutta jakamisesta ei yleensä ole vaaraa, tekipä tavutuksen ihminen tai tietokoneohjelma. Sen sijaan käy helposti niin, että suomen kielen sääntöjen mukaan tavuttava ohjelma jakaa esimerkiksi nimen Gontšarov osiin Gont- ja šarov, vaikka tš on kyseisessä kielessä yhden äänteen merkki. Vokaalien välistä jakaminen on suomen sääntöjen mukaan yleisesti vältettävää, joskin pakkotilanteissasiihen voidaan joutua. Vieraissa sanoissa sitä on syytä erityisesti välttää, koska se helposti johtaa omituisiin jakoihin kuten Je-an. (Ranskalainen nimi Jean ääntyy yksitavuisena.) Osoitteessa www.ushuaia.pl/hyphen/ on verkkopalvelu, joka tavuttaa varsin monien kielten sanoja ja joka vaikuttaa melko luotettavalta. Sitä voi siis käyttää, jos on tarvetta tavuttaa nimenomaan vieraan kielen sääntöjen mukaan, kuten esimerkiksi vieraskieliset lainaukset olisi syytä tavoittaa.
Joitakin huomautuksia esitetään siis myös ääntämyksestä, etenkin suomalaiselle outojen kirjainten äännearvoista. Varsinaiset ääntämisohjeet on kuitenkin katsottava muista lähteistä kuten kielten oppikirjoista. Yleiskuvauksen useiden kielten ääntämisestä esittää kirja The World’s Writing Systems (Oxford University Press, 1996). Perustietoja monien kielten kirjoittamisesta ja ääntämisestä löytyy verkkosivustosta www.omniglot.com/writing/. Toisentyyppinen, eurooppalaisten kielten kirjaimistoihin keskittyvä sivusto on www.evertype.com/alphabets/.
Nimien kirjoitusasussa on usein paljon vaihtelua, ja englanninkielinen tiedonvälitys yleisesti karkeistaa ja muuten muuntaa erikielisiä nimiä. Vieraan nimen oikea kirjoitusasu ei anna useimmille lukijoille tarkkaa tietoa nimen ääntämyksestä, koska he eivät tunne kyseisen kielen kirjainten ja kirjainyhdistelmien äännearvoja. Toisaalta oikea ääntämys olisi usein outo, koska ihmiset ovat tottuneet kuulemaan tavanomaisen väärän ääntämyksen.
Kun siis yleisesti kirjoitetaan Walesa ja (Suomessa) äännetään [valesɑ], niin onko järkevää vaatia, että pitäisi kirjoittaa Wałęsa? Tiedämmehän, että tämä kirjoitusasu on vaikeampi tuottaa – joskin nykyisin vain vähän vaikeampi – ja että alkukielen mukainen ääntämys [vaˈwẽsa] hämmästyttäisi kuulijoita eikä nimeä ehkä edes tunnistettaisi siitä.
Vieraiden nimien oikea kirjoitusasu on kuitenkin tärkeä muutenkin kuin kohteliaisuuden takia. Juuri alkuperäinen kirjoitusasu on nimessä muuttumattominta. Ääntämys voi vaihdella, mutta asiakirjoissa ja yleensä kirjoitetussa kielessä asu on vakaa. Sen perusteella tiedot ovat löydettävissä, ja tämän asian merkitys on korostunut, kun tiedonhaku tietokoneella on muodostunut keskeiseksi.
Tieto saattaa olla löydettävässä väärää kirjoitusasua käytettäessäkin. Tietotekniikassa on toteutettu hakutoimintoja, jotka etsivät ”suunnilleen” annettua sanaa vastaavia sanoja. Tämä on olennaista senkin takia, että tietoaineistossa nimi saattaa olla väärin kirjoitettu, vieläpä usealla eri tavalla väärin kirjoitettu. Tällöinkin oikea asu on keskeinen, koska siihen vertaamalla tiedonhakija voi arvioida, mitkä sanat ovat todennäköisesti sen vääriä kirjoitustapoja ja mitkä vain satunnaisesti samannäköisiä.
Alkuperäisaineistossa kirjoitusasu on yleensä alkuperäinen. Vakavassa tiedonhaussa on tarvittaessa mentävä alkuperäislähteisiin. Vaikka englanninkielisessä tiedonvälityksessä kirjoitusasu Walesa on vallitseva, puolankielisissä alkuperäisemmissä tietolähteissä asu on varmaankin lähes aina Wałęsa.
Tästä seuraa, että oikean asun käyttäminen auttaa lukijaa etsimään tietoa ja lisäksi luo luotettavuuden vaikutelmaa. Tottuminen oikeiden asujen käyttöön johtaa myös siihen, että automaattisesti kirjoitamme nimet oikein virallisissa yhteyksissä, liikekirjeenvaihdossa yms., jolloin asun oikeellisuus on tärkeää kohteliaisuuden ja vaikutelman vuoksi.
Nimet kannattaa kirjoittaa oikein senkin takia, koska pienetkin virheet saattavat aiheuttaa suurta ärtymystä. Jos yksi lukija sadasta ärsyyntyy, hän saattaa olla erityisen tärkeä lukija, usein päättäjä, joka ei pidä siitä, että hänen nimensä on kirjoitettu väärin. Erityisesti tämä koskee ihmisten nimiä, mutta myös mm. laitosten, yritysten, tavaramerkkien ja paikkojen nimiä. Vielä nykyaikanakin elää vahvana ajatus, että nimi on paljon enemmän kuin vain sovinnainen tapa viitata johonkin. Jos kirjoituksen koetaan loukkaavan nimeä, vaikkapa vain kirjoitusvirheellä, sen saatetaan kokea loukkaavan nimen kantajaa. Silloin selitys, ettei nimen tarkistamiseen ollut aikaa, saattaa jopa pahentaa tilannetta.
Kirjoitusasun oikeellisuus on siis myös tyylikysymys. Pohjimmiltaan se kertoo kirjoittajan yleisestä taustasta. Hiukan kärjistäen voisi sanoa, että kirjoitusasu kielii, mitä kirjoittaja lukee. Yleensä ihmisen kirjalliset tuotokset ovat asultaan hiukan sen tason alapuolella, jolla hänen päivittäin lukemansa tekstit ovat. Oikeinkirjoitusasioiden opiskelulla ja huolellisuudella (tärkeitä tekstejä kirjoitettaessa) voi tasoa jonkin verran nostaa.
Usein henkilönnimen kirjoitusasu on tarkoituksellisesti valittu poikkeavaksi, jotta ihminen tai sukuhaara erottuisi muista, joiden nimi lausutaan samalla tavoin. Käytetään ehkä asua Wirtanen tai Anderson (eikä Andersson) tai Browne (eikä Brown) tai Bronté (eikä Brontë). Silloin, kun kyseessä on asianomaisen virallinen nimi, on tietysti syytä noudattaa sen mukaista kirjoitusasua.
Nimillä myös tehdään politiikkaa sanan laajassa merkityksessä. Ihminen saattaa ottaa uuden nimen merkiksi kääntymyksestään tai elämäntilanteensa muutoksesta. Valtioiden ja paikkojen nimiä on muuteltu, jotta annettaisiin viesti tilanteen muuttumisesta. Usein tämä on merkinnyt sitä, että siirtomaa-ajasta muistuttavaksi koettu nimi on korvattu toisella. Myös pelkkä poliittisen vallan vaihtuminen halutaan usein kruunata uudella maannimellä. Esimerkiksi Burman sotilashallitus on ottanut maan nimeksi Myanmar, ja sen tahtoa on ruvettu noudattamaan monissa maissa.
Nimiä todellisuudessa pidetään monella tavoin pyhinä. Tämä asenne esiintyy nykyisin yleensä verhoutuneena erilaisiin järkiperusteisiin tai muodollisiin perusteisiin kuten jonkin asun virallisuuteen. Kirjoittajan kannattaa ottaa tämä huomioon, olipa hänen oma suhtautumisensa miten käytännöllinen tahansa.
Vieraat nimet ja muut vieraat sanat kirjoitetaan yleensä tarkasti alkukielen mukaan. Jos alkukieltä ei kirjoiteta latinalaisin aakkosin, sovelletaan sopivaa siirtokirjoitusmenettelyä (translitterointia tai transkriptiota).
Usein kuitenkin kirjoitusasua yksinkertaistetaan mukavuussyistä. Nykyisten sääntöjen mukaan sellainen ei ole hyväksyttävää suomen kielessä: vieraissa sanoissa on säilytettävä kaikki niihin kuuluvat tarkkeet ja (latinalaisen merkistön) vieraat kirjaimet, esimerkiksi Dalí (ei Dali) ja Møller (ei Möller). Käännöstyössä on kuitenkin varauduttava siihen, että esimerkiksi englanninkielisessä tekstissä ei erikielisiä nimiä useinkaan ole edes pyritty kirjoittamaan oikein.
Erisnimet tulisi siis kirjoittaa mahdollisimman oikeassa muodossa, sellaisina kuin ne ovat vakiintuneet ja ehkä jopa virallisesti rekisteröity. Niinpä käytössä on yhä sanomalehden nimi Hufvudstadsbladet, vaikka kirjoitusasu hufvud on ruotsissa korvattu asulla huvud.
Alkuperäisestä kirjoitusasusta kuitenkin poiketaan, jos kyseessä on niin sanottu sovinnaisnimi. Tällä tarkoitetaan asua, jonka nimi on saanut jossain muussa kielessä kuin siinä, mistä se on peräisin. On tavallista, että eri kielissä sovinnaisnimiä mm. naapurimaille, niiden paikoille, tunnetuille rakennuksille jne. Joskus sovinnaisnimestä käytetään (varsinkin paikannimistä puhuttaessa) nimitystä eksonyymi.
Esimerkiksi Ruotsin pääkaupungin nimi on ruotsiksi Stockholm mutta islanniksi Stokkhólmur, liettuaksi Stokholmas, espanjaksi Estocolmo jne.
Useimmiten sovinnaisnimi on muodostunut alkuperäisestä nimestä sen sopeutuessa toisen kielen äännejärjestelmään, sanojen rakenteeseen ja kirjoitustapaan. Esimerkiksi Stockholm-sanan alussa on konsonanttiyhdistelmä, joka on hankala monien kielten puhujille. Espanjalaiset ovat ratkaisseet asian lisäämällä alkuun e-vokaalin, suomalaiset taas pudottamalla s:n pois.
Joskus sovinnaisnimi on peräisin jostain aivan muualta kuin alkuperäinen, esimerkiksi jonkin maan valtaväestön maastaan käyttämä nimi. Tunnettu tapaus on Saksa, saksaksi Deutschland, jota eri kielissä kutsutaan hyvin erilaisilla nimityksillä kuten Germany tai Allemagne.
Sovinnaisnimet heijastavat vanhoja historiallisia ja kulttuurisia yhteyksiä. Käytämme esimerkiksi Aleksanteri-nimeä Venäjän tsaareista, joiden venäjänkielisen nimen translitterointi on Aleksandr. Vastaavasti tulisi Etelämantereen lähellä olevaa saarta, jonka nimi on venäjäksi Zemlja Aleksandra I ja englanniksi Alexander island, kutsua suomeksi nimellä Aleksanteri I:n saari tai lyhyemmin Aleksanterinsaari, ei siis Alexanderinsaari. Ukrainan pääkaupungin nimi on suomeksi Kiova, vaikka venäjänkielinen nimi on Kijev ja ukrainankielinen Kyjiv; Kiev taas on englantia.
Vieraan nimen käytössä olennaisin valinta on, käytetäänkö alkukielen mukaista asua sellaisenaan vai suomeen mukautunutta asua eli ns. sovinnaisnimeä. Oikeastaan mukautumisessa ei useinkaan ole kyse vain kirjoitusasusta, vaan suomalaistunut asu saattaa sekä ääntämykseltään että kirjoitusasultaan poiketa suurestikin alkukielisestä. Esimerkiksi Ranskan Ludvig-kuninkaiden ranskankielinen nimi on Louis, lausuttuna suunnilleen [luíi]. Jos päädytään käyttämään alkukielistä asua, on yleensä pyrittävä kirjoittamaan se mahdollisimman tarkoin juuri siten kuin alkukielessä; ks. kohtaa Sitaattilainan kirjoitusasu. Tosin esimerkiksi vietnamilaisten nimien kirjoittaminen tämän mukaisesti on sekä hankalaa että harvinaista, koska niissä pitäisi käyttää monia, usein vaikeasti tuotettavissa olevia tarkkeita.
Sovinnaisnimiä on vanhastaan käytetty tutuimmista paikoista, alueista ja muista maantieteellisistä kohteista. Lisäksi niitä on jossain määrin käytetty henkilöistä: sovinnaismuoto on ollut lähinnä hallitsijoiden ja paavien nimillä (esim. Kustaa Vaasa, Johannes Paavali II) ja suomalaisten suurmiesten etunimillä, joiden alkuperäinen asu on ruotsinkielinen (esim. Sakari Topelius). Muut sovinnaisnimet ovat harvinaisuuksia eikä niitä edes yleensä mainita kielenoppaissa, esimerkiksi Venäjän historiassa merkittävän sota-aluksen nimi Aurora (oik. Avrora).
Kielenhuollon linja vieraiden nimien suhteen on esitetty viimeksi (Kielikello 1/2004) seuraavasti (käytännössä paikannimiä käsitellen, mutta ilmeisesti yleisemmäksikin kannanotoksi tarkoitettuna):
Ulkomaisten nimien nykyiset kirjoitussuositukset
YK:n paikannimikonferenssit ovat suosittaneet paitsi kansallisten paikannimien saamista kansainväliseen käyttöön myös kansallisten sovinnaisnimien määrän harkittua karsimista eli palaamista alkuperäisten nimien käyttöön. Tämä on helpointa nimiasuissa, jotka eroavat toisistaan vain vähän. Suomen kielessä sellaisia muutoksia ovat esim. Upsala → Uppsala; Vermlanti → Värmlanti ∼ Värmland ja Skoone → Skåne.
Ilmeisesti suositusta on tulkittava niin, että vakiintunut joennimi Amazon olisi korvattava nimellä Amazonas, jota on vanhastaan käytetty Amazonin alueesta (joka tosin nykyisin tunnetaan tavallisimmin nimellä Amazonia). Asu Strasbourg on ranskankielinen muoto. Suomessa on usein käytetty saksankielistä asua Strassburg. Paikannimikonferenssien päätöksistä kannattaa huomata, että ne ovat todellisuudessa melko huonosti tunnettuja. Kansainvälinen tiedonvälitys soveltaa monia, usein niistä poikkeavia erilaisia käytäntöjään.
Suomen kielessä on vanhastaan mukautettu -land-loppuisia nimiä -lanti-loppuisiksi. Hiukan epäjohdonmukaisesti on tällöin usein säilytetty kirjoitusasu muuten alkukielen mukaisena, siis esimerkiksi Shetlanti. Nykyisin siis kehotetaan käyttämään alkukielistä asua kuten Shetland tai ilmeisesti pikemminkin sen sisältävää yhdyssanaa Shetlandsaaret. Toisaalta muutosta ei ainakaan toistaiseksi uloteta vakiintuneisiin yhdyssanoihin kuten shetlanninlammaskoira ja shetlanninponi. Tämä on yhdenmukaista sen kanssa, että esimerkiksi kissarodun nimi burmankissa on edelleen käytössä, vaikka maannimi Burma olisi korvattu nimellä Myanmar.
Henkilönnimistä esittää kielitoimiston verkkosivu Charles vai Kaarle? sen periaatteen, että vanhoja suomen kieleen mukautettuja asuja käytetään edelleen, mutta uusia mukautuksia ei enää tehdä. Kuten sivulla mainitaan, historiantutkijat ovat kuitenkin ryhtyneet käyttämään hallitsijoiden nimiäkin niiden alkukielisessä asussa. Esimerkiksi kansallisbiografia sisältää ruotsinmukaisen asun Ulrika Eleonora eikä vanhaa ja hakuteoksissa edelleen useimmiten esiintyvää asua Ulriika Eleonoora. Historioitsijat käyttävät usein ruotsinmukaisia asuja jopa tutuimmista suomalaisista suurmiehistä.
Sovinnaisnimien käyttöön on toisaalta joka tapauksessa tehtävä tärkeä poikkeus: jos alkukielinen nimi on osa laajempaa vieraskielistä nimeä tai sitä käytetään muussa kuin alkuperäisessä merkityksessä, käytetään suomessa yleensä alkuperäistä nimeä eikä sovinnaisnimeä. Jos esimerkiksi jonkin venäläisen tuotteen nimi on Moskva, käytetään tätä nimeä eikä kaupungin nimen suomalaista asua Moskova. Hiukan tulkinnanvaraisempi on esimerkiksi Tromsø Tromssasta kotoisin olevan joukkueen nimenä. Jos merkitys on selvästi ’joukkue, jolle on annettu nimi…’ eikä ’Tromssan joukkue’, on alkukielisen nimen käyttö perusteltua.
Vanhoja sovinnaisnimiä on melko vähän, ja kielenhuolto siis suhtautuu nykyisin torjuvasti niiden lisäämiseen. Ollaan jopa vaatimassa suomen kieleen vakiintuneiden nimien (esimerkiksi Sakari Topelius ja Skoone) palauttamista alkukieliseen muotoon (esimerkiksi Zachris Topelius ja Skåne). Usein tähän liittyy ns. poliittista oikeaoppisuutta: etenkin vieraiden maiden nimiä halutaan herkästi muutella niiden kulloistenkin vallanpitäjien tahdon mukaan. Niinpä vanha tuttu Ceylon on nykyisin (ainakin valtiona) yleensä jo Sri Lanka, ja Burma on usein Myanmar.
Toisaalta käyttöön on tullut suuri määrä uusia sovinnaisnimiä, joiden perusta ei ole suomen kieleen mukautumisessa vaan englanninkielisessä (tai ranskankielisessä) kansainvälisessä tiedonvälityksessä. Kun nimet tulevat Suomessa tunnetuiksi käännetyistä uutisteksteistä, ne vakiintuvat yleensä englannin mukaiseen asuun. Uutisten kääntäjät eivät useinkaan ehdi, osaa tai viitsi tarkistaa, mikä on nimen alkukielinen asu ja miten se pitäisi suomalaisen järjestelmän mukaan siirtokirjoittaa, jos sitä ei kirjoiteta latinalaisin aakkosin.
Niinpä tunnemme esimerkiksi kirjoitusasut Aristoteles Onassis ja Omar Sharif. Niitä myös on syytä käyttää, vaikka kirjoittamalla alkuperäiset nimet suomalaisen siirtokirjoituksen mukaan päädyttäisiin eri tuloksiin. ”Oikeita” asuja kummasteltaisiin, tai niitä ei lainkaan ymmärrettäisi. Asiaan vaikuttaa sekin, että usein julkisuuden henkilö tunnetaan maailmalla aivan yleisesti englannin mukaisella nimensä asulla. Lisäksi hän on saattanut asettua asumaan esimerkiksi Yhdysvaltoihin ja ottaa kyseisen nimiasun käyttöönsä virallisesti.
Maailmassa laajasti tunnetut nimien (etenkin henkilönnimien) asut on siis syytä ajatella sovinnaisnimiksi. Rajanveto on kuitenkin vaikeaa. Pitäisikö esimerkiksi urheilutuloksissa käyttää urheilijoiden nimistä niitä asuja, joita uutissähkeet ja ehkä kilpailunjärjestäjien tiedotteetkin sisältävät? Nimethän eivät enimmäkseen ole laajasti tunnettuja. Tässä on lähinnä kysymys käytännöllisistä edellytyksistä. On parempi kirjoittaa kaikki nimet samoilla periaatteilla väärin (siis englannin mukaan) kuin sekavasti milloin oikein, milloin väärin ja usein vielä tavalla, joka ei vastaa mitään käytäntöä vaan johtuu epäonnistuneesta pyrkimyksestä noudattaa alkuperäistä asua.
Kun sovinnaisnimeä ei ole käytössä, on ratkaistava, minkä kielen mukaista nimiasua käytetään. Usein vastaus on selvä, koska alueella, johon nimi liittyy, on yksi hallitsevassa asemassa oleva kieli. Euroopan ulkopuolella eivät valtioiden rajat kuitenkaan ole selviä kansallisuus- ja kielirajoja. Tosin silloin voidaan ehkä pitää maan virallista kieltä kielenä, jonka mukaan paikannimet kirjoitetaan suomenkielisessä tekstissä. Lisäksi Euroopassakin on alettu tunnustaa monia alueellisia kieliä, jotka on ennen leimattu kansalliskielen murteiksi. Lisäksi valtioiden rajat saattavat muuttua.
Aivan mahdottomuuksiin päädytään, jos esimerkiksi joen eri kohdista pitäisi käyttää eri nimiä sen mukaan, minkäkielisen alueen halki se missäkin virtaa. Kuitenkin kielitoimisto aivan tosissaan esittää Nimistöneuvonnan kysytyimmät -sivuillaan: ”Vltava yhtyy Pohjois-Tšekissä jokeen, jonka nimi on tšekiksi Labe. Kun joki virtaa valtakunnan rajan yli Saksan puolelle, sen nimi on Elbe. Saksassa Dresdenissä siis tulvii Elbe.” (Vltava on joki, joka Suomessa vanhastaan tunnetaan Moldau-nimellä.) Tonava ja Veiksel sentään katsotaan vakiintuneiksi sovinnaisnimiksi.
Käytännössä nimien muuttelu on seurannut enemmän rajojen ja poliittisten järjestelmien kuin kieliolojen muutoksia. Esimerkiksi Danzigin vaihtaminen Gdanskiksi (oikeastaan Gdańsk) suomenkielisessäkin tekstissä johtui ennen muuta kaupungin siirtymisestä Puolalle. Vanhoja nimiä, kuten Königsberg (nyk. Kaliningrad), käytetään tietysti historiallisissa esityksissä, mutta nykyajasta puhuttaessa ne epäilemättä koettaisiin oudoiksi, jopa paheksuttaviksi. Tämä on kuitenkin osittain hiukan vinoutunutta; esimerkiksi italiasta peräisin oleva nimi Nizza on hyväksytty ja suositeltu, vaikka kaupunki on nykyisin Ranskaa ja sen ranskankielinen nimi on Nice.
Neuvostoliiton hajoamisen myötä on ruvettu käyttämään paikoista mm. niiden ukrainan- tai valkovenäjänkielisiä nimiä. Niinpä ennen Lvov-nimellä tunnettua ukrainalaista kaupunkia ovat jotkut ruvenneet kutsumaan ukrainankielisellä Lviv-nimellä. Ei liene virallista yleistä kannanottoa siihen, missä määrin venäjästä tulleet nimien muodot voidaan katsoa suomen kieleen vakiintuneiksi. Kuitenkin esimerkiksi Valko-Venäjän pääkaupunki on virallisesti suomeksi Minsk kuten venäjässä, ei Mensk kuten valkovenäjässä. Pienemmille ja vähemmän tunnetuille paikoille ruvettaneen kuitenkin käyttämään alueen valtakielen mukaisia nimiä, vaikka ne mm. vanhoissa kartoissa esiintyvät venäjänkielisillä nimillä.
Mitä tärkeämmästä tekstistä on kyse, sitä olennaisempaa on tarkistaa nimien kirjoitusasu hakuteoksista tai muista luotettavista lähteistä. Erityisen tärkeitä tekstejä ovat oppikirjat ja käsikirjat sekä uutisluonteiset lehtikirjoitukset, koska niiden kautta nimien asut leviävät yleiseen käyttöön.
Usein nimelle on vahvistettu virallinen kirjoitusasu. Vieraiden nimien osalta tämä tarkoittaa yleensä alkukielen mukaista asua. Virallinen tai vahvistettu nimiasu on yleensä laitoksilla ja yrityksillä mutta myös tuotteilla
Tunnetun paikan, organisaation, henkilön tms. nimen asun tarkistaminen kannattaa usein aloittaa tietosanakirjasta. Suomessa on vahva hyvien tietosanakirjojen perinne. Niissäkin on toki virheitä. Tavallisempi ongelma on, että nimeä ei löydy, koska se ei ole ollut riittävän tärkeä silloin, kun tietosanakirja tehtiin. Eihän tietosanakirjassa voi luetella esimerkiksi kaikkien yhdistysten tai tavaramerkkien nimiä.
Hyvä vaihtoehto painetun tietosanakirjan rinnalle tai tilalle on cd-tietosanakirja. Etenkin jos tyytyy muutaman vuoden takaiseen versioon, hankinta on edullinen. Suomenkielisen lisäksi tai ohella voi hankkia englanninkielisen. Siinä tosin erisnimien asu voi poiketa alkukielisestä ja suomen kielessä käytetystä, mutta tämä koskee suhteellisen pientä osaa nimistä.
Laaja kooste erisnimien alkuperäisiä asuja, englannin kielessä yleisesti käytetyn asun mukaan järjestettyinä, löytyy O. T. Fordin verkkosivulta Multilingual glossary to native forms . Sivun hyödyllisyyttä heikentää mm. se, että siinä käytetyt nimien siirtokirjoituksen menetelmät poikkeavat monelta osin standardien mukaisista, joskin ne on sivustossa dokumentoitu (Transcription protocols).
Wikipedia verkkosivusto on perimmäisestä epäluotettavuudestaan (muutoksia siihen voi tehdä ”kuka tahansa”) huolimatta usein hyödyllinen lähde, kun etsitään vieraan nimen oikeaa asua. Wikipediaan on nimittäin saattanut kirjoittaa myös joku, joka puhuu kyseistä kieltä ja joka muutenkin oikeasti tuntee asiaan. Esimerkiksi hyvästäkin suomalaisesta hakuteoksesta saattaa löytyä sellainen turkkilainen nimi kuin Ismet Inönü, mutta Wikipediasta löytynee ainakin turkinkielisestä osasta asu İsmet İnönü, jossa siis on pisteet I-kirjainten päällä. Tämä sattuu olemaan oikein, oletettavasti siksi, että joku turkkilainen on kirjoittanut sivun tai korjannut sitä. Wikipedian sivulta ehkä myös löytyy linkki johonkin viralliseen tai muuten luotettavaan sivustoon, josta tiedon voi tarkistaa.
Myös kielenkäytön oppaissa on usein luetteloita nimien asuista, jotka olivat (ainakin jonkun mielestä) oikeita, kun opas kirjoitettiin. Nykyisin nimiä muutetaan niin usein, että sellaiset luettelot eivät ole kovin luotettavia.
Maantieteelliset nimet kuten maiden ja kaupunkien nimet ovat usein poliittisestikin kiistanalaisia. Eri tahoilla on erilaisia käsityksiä siitä, mikä on oikea asu ja kuka sen päättää. Varsin virallisena tietolähteenä voidaan pitää kielitoimiston koostetta Maat, pääkaupungit ja kansalaisuudet”. Lisätietoja maiden nimistä löytyy sivun Maailman maat – nimet, koodit, kuvauksia kautta.
Vaikka esimerkiksi maannimistä siis on saatavilla normeja, maantieteelliset nimet yleisesti ovat varsin ongelmallisia. On selvää, että kaikille nimille ei voida vahvistaa virallisia suomessa käytettäviä asuja. Yleiset säännöt ovat osittain varsin tulkinnanvaraisia. Vanhan hyvän Nykysuomen sivistyssanakirjan liitteenä on tavallisimpien maantieteellisten nimien luettelo, mutta se on osittain vanhentunut. Laajahko kooste nimistä on Kerkko Hakulisen Maailman paikannimet: oikeinkirjoitusopas (toinen, uusittu painos 1996), mutta sekään ei kaikessa ole uusimpien suositusten mukainen.
Myös uusia karttoja voi käyttää tietolähteenä, joskin karttojen laatutaso vaihtelee suuresti tässäkin suhteessa. On hyvä käyttää tunnetun kustantajan julkaisemaa varsinaista karttakirjaa. Verkossakin on monia kartastoja, joissa on tietoja (ulkomaidenkin) kadunnimien tasolle asti, joskin taso ja luotettavuus vaihtelevat melkoisesti.
Seuraavassa on joitakin tärkeitä tapauksia esimerkkeinä siitä, mitä erilaisia poliittisiakin ongelmia maantieteellisiin nimiin saattaa liittyä.
Ahvenanmaa ∼ Åland. Suomenkieliseen tekstiin kuuluu normaalisti suomenkielinen asu, siitä riippumatta, mikä alueen valtakieli tai virallinen kieli on. Ruotsinkielisen asun käytöllä saatetaan kuitenkin haluta korostaa, että Ahvenanmaan ainoa virallinen kieli on ruotsi.
Alankomaat ∼ Hollanti. Näistä Alankomaat on virallisempi nimi.
Burgundi ∼ Bourgogne. Näistä Burgundi on vanhastaan käytetty nimitys, joka perustuu alueen saksankieliseen muotoon. Kielenhuolto tuntuu suosittelevan ranskankielistä Bourgogne-muotoa, koska alue kuuluu nykyisin Ranskaan. Kuitenkin kannanoton mukaan Burgundi-nimeä ”voi käyttää mm. historiaa koskevissa teksteissä” (Kielikello 1/2004).
Burma ∼ Myanmar. Maan vanha nimi on Burma (tai Birma), mutta sotilashallitus antoi v. 1989 maalle nimen Myanmar. Tämä nimi esiintyy yleensä myös virallisissa valtioiden nimien luetteloissa, mutta monilla tahoilla se liitetään sotilashallitukseen ja sen tilalla käytetään Burma-nimeä.
Elsass ∼ Alsace ja Lothringen ∼ Lorraine. Aiemmin käytettiin saksankielisiä asuja, ja historiankirjoissa edelleenkin saattaa esiintyä Elsass-Lothringen. (Elsass oli itse asiassa sikäli mukautettu asu, että ennen 1990-luvulla aloitettua saksan oikeinkirjoituksen uudistusta nimi kirjoitettiin saksaksi Elsaß.) Koska alue kuuluu pääosin Ranskalle, on ranskankielisiä asuja ruvettu pitämään oikeina, ja käytännössäkin näyttää jo olevan tavallisempaa kirjoittaa Alsacesta ja Lorrainesta. Kielenhuolto on erikseen ottanut kannan, jossa suositellaan Lorraine-nimeä (Kielikello 1/2004).
Georgia ∼ Gruusia. Suomen kielessä käytettiin aiemmin Gruusia-nimitystä, mutta sitä on pidetty vältettävänä, koska se perustuu maan venäjänkieliseen nimeen (Gruzija). Tilalle on enimmäkseen tullut Georgia-nimitys ainakin virallisessa kielenkäytössä.
Kiova ∼ Kiev. Aikoinaan pidettiin eräissä piireissä poliittisista syistä vanhaa suomalaista nimiasua Kiova sopimattomana ja sen tilalla käytettiin asua Kiev. Kuitenkin Kiev on englanninkielinen asu, ei venäjänkielinen (Kijev) saati maan virallisen kielen ukrainan mukainen (Kyjiv).
Kongo. Entisen Belgian Kongon ja entisen Ranskan Kongon itsenäistyttyä on ollut sekaannuksia, kun molemmat ovat käyttäneet Kongo-nimitystä, joskin toinen käytti välillä Zaire-nimeä. Yleensä pelkkä Kongo-sana riittää viittaamaan maista suurempaan (ent. Belgian Kongo), ja toisesta voidaan käyttää nimitystä Brazzavillen Kongo pääkaupungin mukaan. Virallisimpia tekstejä varten on tarkistettava kulloisenkin tilanteen mukainen virallisin nimikäytäntö.
Peking ∼ Beijing. Kiinan pääkaupungin nimi on suomeksi vanhastaan Peking. Asu Beijing on Kiinan nykyisin virallisen transkriptiojärjestelmän (pīnyīnin) mukainen asu, ja monet pitävät sitä oikeana. Käytännössä Peking-muoto on edelleen tavallinen, ja se voitaisiin tulkita vakiintuneeksi suomenkieliseksi asuksi, johon transkription muutokset eivät vaikuta. Tällainen kanta otetaan myös kielitoimiston verkkosivulla Peking ja Beijing.
Portugal ∼ Portugali. Useimmissa kielissä nimessä ei ole i:tä lopussa, mutta suomenkieliseen nimeen se kuuluu vanhan käytännön ja kielitoimiston kannan mukaan. Kuitenkin i:tön asu lipsahtaa aika virallisiinkin teksteihin.
Viro ∼ Eesti. Näistä Viro on suomessa vanhastaan käytetty ja mm. kielitoimiston suosittama.
Soul ∼ Söul. Suomen kielen lautakunta päätti jo v. 1986 suosittaa suomen kieleen asua Soul.
Yhdistynyt kuningaskunta ∼ Iso-Britannia ∼ Britannia ∼ Englanti. Yhdistynyt kuningaskunta on maan virallisen nimen lyhyt muoto. Pitkä muoto, jota käytetään virallisimmissa yhteyksissä, kun puhutaan valtiosta valtio-oikeudellisena toimijana, on Ison-Britannian ja Pohjois-Irlannin yhdistynyt kuningaskunta. Iso-Britannia on siis varsinaisesti vain osa Yhdistynyttä kuningaskuntaa, Englanti taas Ison-Britannian osa, ja Britannia on epävirallinen lyhentymä nimestä Iso-Britannia. Näitä kaikkia kuitenkin yleisesti käytetään myös Yhdistynyttä kuningaskuntaa tarkoittamassa. Jaakko Anhava on perustellut (Kielikellossa 3/2006), miksi etuliite ”Iso-” on asiallisesti turha: se on vain kaikua ranskasta, jossa on todellinen tarve erottaa toisistaan Bretagne (tietty Ranskan alue) ja Grande-Bretagne (Britannia). Virallisissa yhteyksissä on hyvä kuitenkin ottaa huomioon, mitä EU:n tekstinlaadinnan ohjeissa sanotaan EU:n jäsenvaltioiden nimistä: Jäsenvaltiosta tulee käyttää nimeä Yhdistynyt kuningaskunta.
Useissa maissa on paikkoja nimetty uudestaan erilaisista poliittisista syistä. Usein on haluttu korvata vanhoja siirtomaavallan antamia nimiä omakielisillä, osittain taas on. Jos käytetään jotakin tällaista uudehkoa nimeä, on yleensä syytä mainita vanha nimi sulkeissa, jos kyseessä on alue tai paikka, joka laajasti tunnetaan tällä nimellä. Muutoinhan suuri osa lukijoista ei ymmärrä, mitä tarkoitetaan. Esimerkkejä: Sri Lanka (Ceylon), Mumbai (Bombay), Kolkata (Kalkutta). Jos pelätään, että tällainenkin koetaan epäkorrektiksi, voidaan erikseen mainita vanha nimi entiseksi: Sri Lanka (ent. Ceylon). Ceylon-nimeä on joka tapauksessa perusteltua käyttää saaren nimenä esimerkiksi luonnonmaantieteessä, vaikka valtiota kutsuttaisiin Sri Lankaksi. – Kalkutta-nimeä kielitoimisto pitää suomeen vakiintuneena sovinnaismuotona, joka on taivutukseltaankin sopeutunut suomeen (Kalkutta : Kalkutassa).
Henkilönnimet tulisi yleensä kirjoittaa mahdollisimman tarkoin alkukielen mukaisesti. Tässä kuitenkin tehdään paljon virheitä, pieniä ja isoja. Markus Lång on koonnut laajahkon kokoelman henkilönnimiä, jotka yleisesti kirjoitetaan väärin: Oops… you did it again! ”http://www.elisanet.fi/markus.lang/oops.html”.
Vain joukkoa hyvin tunnettuja tai muuten merkittäviä vieraita henkilönnimiä käytetään suomalaistetussa asussa, ja suomalaistaminen koskee yleensä vain etunimeä. Aiemmin sellaisia asuja käytettiin paljon useammista nimistä (esim. Yrjö Washington). Tilanne on osittain epävakaa muun muassa siksi, että kielilautakunta on päättänyt, ettei uusia hallitsijannimiä enää suomalaisteta. Jos kielenkäyttäjät hyväksyvät tämän, voi syntyä outoja tilanteita, koska vanhojen nimien asuja ei muuteta. Nykyisin suomeen mukautettuja asuja käytetään seuraavien henkilöiden nimistä:
Henkilönnimien mukauttaminen on tavallista muissakin kielissä. Esimerkiksi englannissa se on varsin yleistä. Tästä aiheutuu noloja virheitä, jos esimerkiksi kääntäjän yleissivistys tai tarkkaavaisuus ei ole riittävä. Jos englanninkielinen teksti käsittelee henkilöä nimeltä John Calvin, pitää kääntäjän selvittää, onko kyseessä kuuluisa uskonpuhdistaja, jolloin suomen kielessä on käytettävä alkuperäistä, ranskankielistä asua Jean Calvin. Noloa on myös, jos suomenkieliseen tekstiin lipsahtaa Plato, kun tarkoitetaan muinaisen Kreikan filosofia (Platon).
Henkilönnimissä on otettava huomioon, että vieraiden kulttuurien nimikäytännöt voivat poiketa suomalaisesta paljonkin. Esimerkiksi unkarissa kirjoitetaan sukunimi ennen etunimeä (esimerkiksi Nagy Imre), mutta unkarilaisetkin vaihtavat nimien järjestyksen, kun kirjoittavat muulla kielellä. Muissa kielissä unkarilaiset nimet kirjoitetaan niin, että etunimi on ensin (esimerkiksi Imre Nagy). Niinpä jos nimen asu tarkistetaan unkarinkielisestä lähteestä, saatetaan päätyä väärään järjestykseen, ellei oteta huomioon nimikäytäntöjen eroa. Erilaisia käytäntöjä kuvaa mm. Kotuksen julkaisema kirjanen Sukunimi? Etunimi? Maahanmuuttajien nimijärjestelmistä.
Albaniassa lisämerkkejä ovat sedilji-c ç ja treema-e ë. Niiden äännearvot ovat [ʧ] ja [ə]. Seuraavista yhdistelmistä kukin on yhden äänteen merkki: dh, gj, ll, nj, rr, sh, th, xh ja zh.
Arabiasta on useita muotoja, joita voisi pitää myös erillisinä kielinä. Yleensä kirjoitetaan vain kielimuotoa, joka on arabiankielisten yhteinen kirjakieli ja josta käytetään nimityksiä yleisarabia, kirja-arabia, standardiarabia ja klassillinen arabia. Viimeksi mainittu on kuitenkin ehkä parempi varata tarkoittamaan Koraanissa käytettyä kielimuotoa, josta nykyinen yleisarabia on kehittynyt.
Arabiaa kirjoitetaan erityisillä arabialaisilla kirjaimilla, joita toisaalta käytetään useiden muidenkin kielten kirjoittamiseen. Toissijaisesti arabiaa kirjoitetaan myös siirtokirjoituksella latinalaisin merkein. Arabialaisten kirjainten historiaa ja suhdetta latinalaisiin kirjaimiin käsiteltiin jossain määrin luvussa 3 esitetyissä kirjainten tarinoissa.
Maltan saarella puhuttua arabian muotoa kirjoitetaan latinalaisin kirjaimin. Osittain tästäkin syystä sitä pidetään yleensä omana kielenään, maltan kielenä.
Muutoin ei arabian muita kuin yleisarabiaa juurikaan kirjoiteta, vaan ne ovat käytössä vain puhekielinä. Arabiankielisissä maissa ihmiset osaavat toisaalta maan tai alueen puhuttua arabian muotoa, toisaalta ainakin jossain määrin yleisarabiaa. Nämä kielimuodot eroavat toisistaan usein melkoisesti. Vastaava tilanne, josta käytetään nimitystä diglossia, vallitsi osittain Länsi-Euroopassa keskiajalla, jolloin monissa maissa puhuttiin latinasta kehittynyttä (romaanista) kieltä ja oppineisto osasi myös latinaa.
Arabialaisia kirjaimia käytetään myös muiden kielten kuin arabian, esimerkiksi persian eli farsin, kirjoittamiseen. Sellaisten kielten sanojen siirtokirjoituksesta ei ole suomalaista standardia. Yleensä käytetään samoja kirjoitusasuja kuin englannissa tai ranskassa.
Arabiaa kirjoitetaan oikealta vasemmalle. Jos latinalaisin kirjaimin kirjoitetun tekstin joukossa on arabialaisin kirjaimin kirjoitettuja sanoja (tai toisinpäin), muuttuu siis tekstin lukusuunta, eli lukijan on osattava hypätä arabialaisen tekstijakson loppuun, lukea se oikealta vasemmalle ja sitten hypätä sen jälkeisen tekstin alku. Siirtokirjoitettu teksti kuitenkin kirjoitetaan vasemmalta oikealle.
Tietokoneohjelma, joka pystyy käsittelemään arabialaisia kirjaimia, täytyy osata kirjoittaa ne oikealta vasemmalle automaattisesti. Ohjelman käyttäjä siis kirjoittaa kirjaimet samassa järjestyksessä kuin ne esiintyvät puhutussa kielessä, ja ohjelma valitsee kirjoitussuunnan automaattisesti oikein. Tämä perustuu siihen, että kirjoitussuunta on kirjaimeen (mm. Unicode-standardissa) liitetty ominaisuus.
Arabialaisella merkillä voi olla useita ulkoasuja sen mukaan, millaisessa kohtaa sanaa se esiintyy: itsenäisenä, sanan alussa, sanan sisällä vai sanan lopussa. Siirtokirjoituksessa näitä eroja ei oteta huomioon. Merkistötaulukoissa yms. merkit esitetään yleensä itsenäisessä (erillisessä) muodossa. Nämä muodot ovat normaalikirjoituksessa suhteellisen harvinaisia.
Arabialainen kirjoitus on kaunokirjoitustyyppistä eli merkit liittyvät toisiinsa yleensä ”juoksevasti”. Tämä saavutetaan paljolti sen ansiosta, että useimpien kirjainten sanansisäinen muoto on suunniteltu viereisiin kirjaimiin liittyväksi.
Arabiankielisiä nimiä ja sanoja, joskus myös pitempiä tekstijaksoja, voidaan siirtokirjoittaa latinalaisin kirjaimin. Tähän on olemassa hyvinkin monia menetelmiä – sekä tarkkoja säännöstöjä (kaavoja) että suurpiirteisempiä käytäntöjä. Vaihtelua on senkin mukaan, minkä maan nimistöstä on kyse. Terho Itkosen Uusi kieliopas kuvailee:
Useimpien arabimaiden nimistöntuntijat ovat sopineet englannin mukaisesta arabialaisnimien kirjoitustavasta, mutta erityisesti läntisimmissä arabimaissa on vanhastaan käytetyllä ranskan mukaisella kirjoitustavalla vankka jalansija.
Arabiassa kirjoitetaan normaalisti vain konsonanttien ja pitkien vokaalien merkit, ja eikä konsonanttien kahdennusta yleensä merkitä. Arabian perusmerkistöön kuuluukin vain 28 konsonanttikirjainta, joista kolmea käytetään myös pitkien vokaalien merkkeinä.
Lukijan edellytetään osaavan lukea sanat oikein kielentuntemuksensa perusteella. Käytännössä on usein tunnistettava sanan asema lauseyhteydessä, jotta voidaan lukea siihen oikeat vokaalit.
Koraanin (al-Qurʾān) tekstissä ja joissakin muissa yhteyksissä teksti vokalisoidaan eli siihen merkitään myös lyhyet vokaalit ja konsonanttien kahdennus konsonanttikirjaimiin liitettävillä lisämerkeillä. Näitä ei pidä sekoittaa itse konsonanttikirjainten sisältämiin, kirjaimen pääosasta erillään oleviin osiin, kuten pistekolmikkoon, joka erottaa šīn-kirjaimen sīn-kirjaimesta.
Siirtokirjoitus tehdään yleensä ikään kuin alkuteksti olisi vokalisoitu eli sisältäisi lyhyiden vokaalien ja konsonanttien kahdennuksen merkit. Periaatteessa ISO 233:n mukainen siirtokirjoitus on kuitenkin puhdas translitteraatio: vain alkutekstissä todella olevilla merkeillä on vastineet. Täten esimerkiksi sana مغرب (Maghrib ’Marokko’) translitteroidaan Mġrb. Ymmärrettävistä syistä tällaista translitterointia käytetään lähinnä vain tieteellisissä yhteyksissä.
Seuraavassa käsitellään eräitä menetelmiä, nimittäin kansainvälisen standardin ISO 233 mukaista menetelmää, joka siis on puhdas translitteraatio (merkki merkiltä siirtäminen) ja kahta suomalaisen standardin SFS 5755 mukaista menetelmää, joista ensimmäinen on tarkoitettu lähinnä tieteelliseen käyttöön, toinen yleiskieliseen käyttöön. Jälkimmäinen on osittain paljonkin epätarkempi. Käytännössä esimerkiksi sanomalehdissä ja yleensä kirjoissakin käytettävä arabian siirtokirjoitus noudattaa jotakin englanninkielisen maailman monista käytännöistä. Tavallisesti se muistuttaa SFS 5755:n mukaista yleiskieleen tarkoitettua menetelmää mutta š:n tilalla on sh ja usein alif ja ʿayn jätetään merkitsemättä (eli merkkejä ʾ ja ع ei käytetä), ja lisäksi pitkien vokaalien merkintä voi olla toisenlainen.
Seuraava taulukko esittää arabian konsonanttien vastineet mainituissa siirtokirjoituksissa.
merkki |
UCS |
nimi |
ISO |
tiet. |
yl. |
IPA |
---|---|---|---|---|---|---|
ا |
0627 |
alif (alef) |
ʾ |
ʾ ∼ – |
ʔ |
|
آ |
0622 |
alif madda (alef with madda above) |
ʾâ |
ʾā |
ʾa |
ʔa: |
ء |
0621 |
hamza (hamza) |
ˈ ∼ ˌ |
ʾ ∼ – |
ʔ |
|
ب |
0628 |
bāʾ (beh) |
b |
b |
||
ت |
062A |
tāʾ (teh) |
t |
t |
||
ث |
062B |
thāʾ (theh) |
ṯ |
th |
θ |
|
ج |
062C |
jīm (jeem) |
ǧ |
j ∼ g |
ʤ |
|
ح |
062D |
ḥāʾ (hah) |
ḥ |
h |
ħ |
|
خ |
062E |
khāʾ (khah) |
ẖ |
kh |
x |
|
د |
062F |
dāl (dal) |
d |
d |
||
ذ |
0630 |
dhāl (thal) |
ḏ |
dh |
ð |
|
ر |
0631 |
rāʾ (reh) |
r |
r |
||
ز |
0632 |
zāy (zain) |
z |
z |
||
س |
0633 |
sīn (seen) |
s |
s |
||
ش |
0634 |
šīn (sheen) |
š |
ʃ |
||
ص |
0635 |
ṣād (sad) |
ṣ |
s |
s̴ |
|
ض |
0636 |
ḍād (dad) |
ḍ |
d |
d̴ |
|
ط |
0637 |
ṭāʾ (tah) |
ṭ |
t |
t̴ |
|
ظ |
0638 |
ẓāʾ (zah) |
ẓ |
z |
z̴ |
|
ع |
0639 |
ʿayn (ain) |
ʿ |
ʕ |
||
غ |
063A |
ghayn (ghain) |
ġ |
gh |
ɣ |
|
ف |
0641 |
fāʾ (feh) |
f |
f |
||
ق |
0642 |
qāf (qaf) |
q |
q |
||
ك |
0643 |
kāf (kaf) |
k |
k |
||
ل |
0644 |
lām (lam) |
l |
l |
||
م |
0645 |
mīm (meem) |
m |
m |
||
ن |
0646 |
nūn (noon) |
n |
n |
||
ه |
0647 |
hāʾ (heh) |
h |
h |
||
ة |
0629 |
tāʾ marbūṭa (teh marbuta) |
ẗ |
– ∼ t |
(t) |
|
و |
0648 |
wāw (waw) |
w |
w ∼ ū |
w ∼ u |
w |
ي |
064A |
yāʾ (yeh) |
y |
y ∼ ī |
y ∼ i |
j |
ى |
0649 |
alif maqṣūra (alef maksura) |
ỳ |
ā |
a |
a: |
Taulukon sarakkeet ovat seuraavat:
Huomautuksia:
Tildeoperaattori ”∼” tarkoittaa taulukossa vaihtoehtoisuutta, joka riippuu siirtokirjoitettavasta sanasta.
Ajatusviiva ”–” tarkoittaa taulukossa sitä, että arabian merkillä ei ole siirtokirjoituksessa mitään vastinetta.
Alifin vastine tieteellisessä siirtokirjoituksessa on ilmeisesti tulkittava Unicode-merkiksi modifier letter right half ring (U+02BE), ks. kooditaulukkoa Spacing Modifier Letters, joka kuvaa merkkiä sanoilla ”transliteration of Arabic hamza (glottal stop)”. Toisaalta SFS 5755 sanoo alaviitteessä (sulkeissa viitataan esimerkkisanaan Raʾs): ”Merkki on korvattavissa myös puolilainausmerkillä (Ra's) tai heittomerkillä (Ra´s).” Esitysasu on sellainen, ettei siitä voi yksiselitteisesti päätellä, mitä merkkejä tässä tarkoitetaan. Mahdollisesti on tarkoitettu, että alifin normaali vastine olisikin suomen kielen mukainen yksinkertainen lainausmerkki eli heittomerkki ’ ja sen korvikkeina voisi käyttää Ascii-heittomerkkiä ja akuuttia, joita standardissa kutsutaan nimillä ”puolilainausmerkki” ja ”heittomerkki”.
Hamza voi esiintyä myös alifin päälle kirjoitettuna, yhdistelmämerkkinä أ (U+0623). Se käsitellään siirtokirjoituksessa kuten alif, jota seuraa hamza.
Alifin, alif maddan ja hamzan käsittelyn kuvaus SFS 5755:ssä on hyvin sekava ja ristiriitainen. Ilmeisesti on tarkoitettu, että ne jätetään ilman mitään vastinetta sanan alussa, yleiskielisessä siirtokirjoituksessa myös sanan lopussa. (Mutta ks. huomautuksia vokaalien merkitsemisestä jäljempänä.)
ʿAyn-kirjaimen vastine tieteellisessä siirtokirjoituksessa on ilmeisesti tulkittava Unicode-merkiksi modifier letter left half ring (U+02BF). SFS 5755 esittää kuitenkin esimerkkeinä yleiskielisestä siirtokirjoituksesta eri vaihtoehtoja: Saʿd ja Sa’d sekä toisesta nimestä ʿAli, ’Ali ja Ali. Se selittää alaviitteessä: ”Kaikissa asemissa suositellaan ʿ-merkin käyttöä tai ainakin sen korvaamista merkeillä ’, ' tai ´. Sanan alussa merkki voidaan yleiskielisessä translitteraatiossa kuitenkin jättää vaille vastinetta. Vokaalin kahdentamista (esim. Saad) ei suositella.” (Standardissa ei ole selvennetty, mitä merkkiä varsinaisesti tulisi käyttää, ja mahdollisesti siinä tarkoitetaan yksinkertaista vasemmanpuoleista lainausmerkkiä.)
Jīm-kirjaimen vastine on SFS 5755:n mukaan yleensä j (ääntyy dž) mutta ”egyptiläisissä nimissä Kairossa noudatettavan ääntämistavan mukaisesti” g (esim. Gamal, ei Jamal). ISO 233:n mukainen vastine on hattu-g ǧ.
Šīn-merkin vastine on SFS 5755:n mukaan š, mutta kaksoiskirjainta sh voidaan käyttää, ”mikäli tarkemerkin toteuttaminen on teknisesti mahdotonta”. Käytännössä sh-yhdistelmä on erittäin yleinen arabian siirtokirjoituksessa niin englannin- kuin suomenkielisissäkin teksteissä.
Wāw-kirjaimen vastineena on SFS 5755:n mukaan w silloin, kun se tarkoittaa konsonanttia, u silloin, kun se tarkoittaa pitkää vokaalia. Toisaalta mainitaan, että yleiskielisessä siirtokirjoituksessa sekä ”aw” että ”au” ovat mahdollisia. Taustalla on, että tällaisissa tapauksissa w on arabiassa tulkittava lähinnä konsonantiksi, mutta suomalainen helposti tulkitsee ja ääntää sen diftongin jälkikomponentiksi.
Yāʾ-merkin vastineena on SFS 5755:n mukaan y silloin, kun se tarkoittaa konsonanttia, i silloin, kun se tarkoittaa vokaalia (pitkää i:tä). Lisäksi yleiskielisessä siirtokirjoituksessa sekä ”ay” että ”ai” ovat mahdollisia. Vertaa edelliseen kohtaan. On hyvä noudattaa yhtenäistä linjaa niin, että käytetään johdonmukaisesti joko kaikissa sanoissa kirjoitustapaa ”aw” ja ”ay” tai kaikissa sanoissa kirjoitustapaa ”au” ja ”ai”, kuitenkin joidenkin nimien sovinnaisasut huomioon ottaen. Kirjoitustapa ”au” ja ”ai” sopii paremmin yleistajuisiin teksteihin.
Alapisteellisten konsonanttien kirjoittaminen on usein hankalaa. Ks. luvussa 4 olevia ohjeita alapisteestä.
Arabian kielen määräävä artikkeli ال siirtokirjoitetaan SFS 5755:n mukaan ”al” ääntämyksestä riippumatta. Monissa yhteyksissä se kuitenkin kirjoitetaan ääntämyksen mukaisesti ottaen huomioon, että konsonantti assimiloituu ns. aurinkokonsonantin edellä tämän konsonantin kaltaiseksi, esim. al-Šams kirjoitetaan aš-Šams. (Aurinkokirjaimet ovat ne, jotka esitetään yleiskielisessä siirtokirjoituksessa merkillä t, th, d, dh, r, z, s, š, l tai n.) Näin menetellään usein kartoissa mm. siksi, että tällainen käytäntö on Yhdistyneiden kansakuntien paikannimiä koskevan suosituksen mukaista. ISO 233:n mukaan artikkelin translitteraatio on ”ʾˈal”, eikä tällöin käytetä yhdysmerkkiä artikkelin ja pääsanan välissä.
Usein artikkeli kirjoitetaan puhutun arabian mukaan el. Esimerkiksi 2. maailmansodan historiassa mainitaan yleensä El Alamein, joka on egyptinarabian mukainen asu. Yleisarabialaisesta asusta siirtokirjoitettuna nimi olisi al-Alamain tai al-Alamayn.
Yleisarabiassa on vain kolme vokaaliäännettä, a, i ja u, joista kukin voi esiintyä lyhyenä tai pitkänä. Pitkillä vokaaleilla on omat merkkinsä, kun taas lyhyet vokaalit jätetään yleensä merkitsemättä arabialaisessa kirjoituksessa. Ne kuitenkin merkitään kirjaimiin liittyvillä, niistä erilleen kirjoitetuilla pienillä lisämerkeillä silloin, kun ääntämyksen osoittamista pidetään tärkeänä. Lyhyet vokaalit merkitään yleensä mm. oppikirjoissa ja sanakirjoissa sekä Koraanissa.
Arabian muissa muodoissa – jotka ovat pääosin vain puhekieliä – on muitakin vokaaleja. Monet arabialaisperäiset nimet ja muut sanat esiintyvät milloin yleisarabian, milloin jonkin puhutun arabian mukaisessa muodossa. Tästä johtuu suurin osa siitä vaihtelusta, jota esiintyy kirjoitettaessa niitä latinalaisin kirjaimin, esimerkiksi Muhammed ∼ Muhammad.
Myös yleisarabian vokaaleissa on itse asiassa vaihtelua niin, että kielessä on kolme vokaalifoneemia mutta ne voivat toteutua hyvinkin eri tavoin eri äänneympäristöissä. Esimerkiksi a:lla merkitty vokaali voi ääntyä [ɑ] (kuten suomen a) tai [ʌ] tai [a] tai [æ] (kuten suomen ä). Useimmiten se ääntyy enemmänkin suomen ä:n kuin suomen a:n kaltaisena, ja tästä osaltaan johtuu nimitys ähläm sähläm.
Arabian siirtokirjoitusta kutsutaan yleensä translitteraatioksi, vaikka siinä lähes aina (joitakin tieteellisiä asiayhteyksiä lukuun ottamatta) merkitään myös lyhyet vokaalit, vaikka niille ei ole vastinetta normaalissa arabialaisessa kirjoitusasussa.
Jos teksti vokalisoidaan eli lyhyet vokaalit merkitään arabialaisessa kirjoituksessa, esitetään konsonanttia seuraava a-äänne konsonanttikirjaimen päällä olevalla, hiukan akuutin (´) tapaisella lisämerkillä. Lyhyt i-äänne esitetään vastaavalla konsonanttikirjaimen alla olevalla lisämerkillä. Lyhyt u-äänne esitetään konsonanttikirjaimen päällä olevalla toisenlaisella lisämerkillä. Käytetään myös pyöreähköä merkkiä, joka osoittaa, että konsonantin jälkeen ei tule vokaalia; se jätetään siirtokirjoituksessa yleensä merkitsemättä, mutta ISO 233:ssa sen vastineena on pieni ympyrä. Näiden lisämerkkien nimet ovat fatḥa, kasra, ḍamma ja sukūn. Seuraavassa luettelossa on nämä merkit liitetty dāl-kirjaimeen (د).
دَ da
دِ di
دُ du
دْ d (d˚)
Kirjaimia ا (alif), ي (yāʾ) ja و (wāw), jotka alkujaan olivat vain konsonanttien merkkejä, käytetään myös pitkän a:n, pitkän i:n ja pitkän u:n merkkeinä. Sanan lopussa voi pitkän a:n merkkinä olla myös ى (alif maqṣūra). Siirtokirjoituksessa käytetään tällöin a:ta, i:tä ja u:ta siten, että tieteellisessä siirtokirjoituksessa vokaalin päällä on pituusmerkki (vaakaviiva). Englanninkielisessä maailmassa käytetään kuitenkin usein menettelyä, jossa pitkä vokaali merkitään kahdella vokaalimerkillä, usein aa (=ā), ee (=ī) ja oo (=ū), esim. Al Jazeera eikä al-Jazira. Ajatuksena on antaa englantia puhuvalla karkea käsitys vokaalin ääntämyksestä.
Esimerkiksi با (bāʾ ja alif, jotka arabian oikeinkirjoituksessa tällöin kirjoitetaan yhteen, ligatuuriksi) luetaan ”baa” ja siirtokirjoitetaan ”bā” yleiskielisessä esityksessä ”ba”. Vokalisoidussa kirjoituksessa kuitenkin merkitään lisäksi vokaalia osoittava lisämerkki (tässä siis fatḥa), esimerkiksi باَ.
Yleisemmin sanottuna käytetään vokalisoidussa kirjoituksessa vokaalia osoittavaa lisämerkkiä edeltävän konsonantin yhteydessä, vaikka kyseessä oleva vokaali olisi pitkä ja esitettäisiin jollakin edellä mainituista merkeistä (alif, yāʾ, wāw ja alif maqṣūra). Lisämerkkiä ei tällöin oteta huomioon siirtokirjoituksessa, paitsi ISO 233:n mukaisessa translitteraatiossa. Esimerkiksi دِي (dāl kasra yāʾ) kirjoitetaan ISO 233:n mukaan diy mutta SFS 5755:n mukaan dī tai di.
Jos lyhyen a-vokaalin merkillä varustetun kirjaimen jäljessä on yāʾ tai wāw, niiden tulkitaan olevan konsonanttimerkkejä, joten siirtokirjoituksessa käytetään y:tä tai w:tä. Kuitenkin SFS 5755:n mukaisessa yleiskielisessä menetelmässä voidaan käyttää myös i:tä tai u:ta. Esimerkiksi سيف (vokalisoituna سيَف) voidaan siirtokirjoittaa joko Sayf tai Saif.
Vokaalia tarkoittava lisämerkki esiintyy joissakin tapauksissa sanan lopussa kaksoismerkkinä, esimerkiksi دً. (Ne ovat Unicodessa erilliset merkit U+064B, U+064D ja U+064C.) Kaksoismerkillä on erikoismerkitys: se tarkoittaa sananloppua, joka
Vokalisoidussa kirjoituksessa esiintyy joskus myös lisämerkki ٰ (U+0670, arabic letter superscript alef), joka tarkoittaa pitkää a:ta silloin, kun tätä ei merkitä alifilla. ISO 233:ssa se translitteroidaan aina ā:lla, mutta SFS 5755:n mukaan sitä käsitellään kuten alifia (esim. دٰ = dā tieteellisessä, da yleiskielisessä siirtokirjoituksessa). Sitä ei kuitenkaan merkitä erikseen, jos sitä seuraa alif maqṣūra (jota vastaa siirtokirjoituksessa ā tai a), eli esim. دٰى käsitellään kuten دٰ.
Arabialaisessa kirjoituksessa kaksoiskonsonantti merkitään yleensä yhdellä konsonanttimerkillä. Vokalisoidussa kirjoituksessa merkitään kaksoiskonsonanttia esittävän kirjaimen päälle lisämerkki ّ (šadda, U+0651), jota voidaan käyttää yhdessä edellä mainittujen lyhyitä vokaaleita tarkoittavien lisämerkkien kanssa, esimerkiksi دَّ = dda. ISO 233:ssa tätä lisämerkkiä vastaa kirjaimen päällä oleva pituusmerkki eli vaakaviiva, esim. d̄a. Tällaisen merkinnän aikaansaaminen on usein tietoteknisesti huomattavan vaikeaa.
Standardi SFS 5755 ei mainitse asiasta mitään. Sen esimerkeistä on kuitenkin pääteltävissä, että sen mukaisessa siirtokirjoituksessa käytetään kahta konsonanttimerkkiä, jos kirjain ääntyy kaksoiskonsonanttina, olipa alkutekstissä ilmaistu tämä lisämerkillä tai ei. Tämä on myös englanninkielisissä teksteissä yleinen käytäntö.
Usein esiintyy asuja, joissa on ss-yhdistelmä, esimerkiksi Hussein, Nasser tai Yasser (tai puoliksi suomalaistettuna Jasser). Vaikka arabiassa esiintyy myös kaksois-s, useimmiten tällaiset asut johtuvat vain, että siitä englantilaisen tai ranskalaisen siirtokirjoituksen mukaan [s] merkitään vokaalien välissä ss:llä, jotta sitä ei lausuttaisi soinnillisena äänteenä [z]. Monet tällaiset asut ovat siinä määrin vakiintuneet, että niitä on syytä käyttää suomen kielessäkin.
Arabialaisessa kirjoituksessa siis sanan merkit yleensä ovat kiinni toisissaan, ikään kuin ne olisi kirjoitettu kynää nostamatta. Muutamat kirjaimet kuten د (dāl) kuitenkin aiheuttavat pienen katkon, koska niillä ei ole erillistä sanansisäistä, juoksevaan kirjoitukseen sopivaa muotoa. Tällainen väli ei mitenkään vaikuta siirtokirjoitukseen.
Sanojen välissä on arabialaisessa kirjoituksessa hiukan tyhjää, ja vastaavasti käytetään siirtokirjoituksessa välilyöntiä sanojen välissä. Kuitenkin arabialaisessa kirjoituksessa liitetään eräät sanaa edeltävät pikkusanat (artikkelit, prepositiot) kiinni sanaan. Siirtokirjoituksessa niitä ei liitetä suoraan pääsanaansa, vaan välissä käytetään yhdysmerkkiä. Tätä ei erikseen sanota esimerkiksi SFS 5755:ssä, mutta artikkelin osalta periaate ilmenee esimerkeistä kuten al-Quds. Samalla tavoin saatetaan käsitellä myös pikkusanat wa-, fa-, ta-, bi-, li-, ka-, la-, sa- ja a-.
Arabian kielessä ei eroteta versaalia ja gemenaa (”isoja” ja ”pieniä” kirjaimia), mutta arabiankielisten nimien siirtokirjoituksessa on tapana noudattaa sitä yleistä periaatetta, että erisnimi aloitetaan versaalilla.
Jonkin verran esiintyy horjuntaa sen suhteen, kirjoitetaanko nimeen kuuluva määräävä artikkeli ”al” versaalialkuisena (esim. al-Ahram ∼ Al-Ahram). SFS 5855 ei erikseen sano asiasta mitään, mutta esimerkeissä on kaikissa gemena (esim. al-Quds).
Arabialaisperäisistä nimistä ja sanoista osa tulkitaan ns. sovinnaisnimiksi tai lainasanoiksi. Ne perustuvat usein arabian johonkin puhuttuun muotoon, joka poikkeaa yleisarabiasta. Lisäksi niihin on vaikuttanut englannissa tai ranskassa käytetty kirjoitusasu, josta yleensä johtuu edellä mainittu ss-yhdistelmä. Saattaa myös esiintyä sananloppuista h:ta, joka johtuu vain englannin käytännöstä (esimerkiksi nimissä Sarah, Aminah ja Hafsah ja sanassa mullah). Toisaalta sananloppuista h:tä ei pidä summittaisesti jättää pois, koska usein se perustuu todelliseen arabiankieliseen asuun, esimerkiksi Jumalan nimessä Allah. Melko usein esiintyy myös ranskasta peräisin olevaa u-äänteen merkitsemistä ou:lla, esimerkiksi nimessä Sousse (arabiaksi Sus), sekä aw au:n ja ay ai:n tilalla.
Standardi SFS 5755 mainitsee esimerkkeinä sovinnaisnimistä seuraavat henkilönnimet ja paikannimet (tässä arabiankielinen asu esitetään yleiskielisen siirtokirjoituksen mukaan):
sovinnaisnimi |
arabiankielinen asu |
---|---|
Nasser |
Nasir |
Gaddafi |
Qaddhafi |
Hussein |
Husain |
Jordan |
Urdunn |
Kairo |
al-Qahira |
Marokko |
Maghrib |
Sana, joka tarkoittaa Muhammedin (Muḥammadin) pakoa Mekasta (Makka) Medinaan (Madina) v. 622 (islamilaisen ajanlaskun alkukohtaa), kirjoitetaan suomessa yleensä lainasanana muodossa hidžra (tai hidzhra), mutta arabiankielisen sanan siirtokirjoitettu asu on hijra.
Arabiankielisessä maailmassa käytetään henkilönnimien järjestelmää, jossa on etunimi ja isännimi, mahdollisesti myös sukunimi. Sukunimi on yleensä ainakin alkujaan kuvannut syntymäpaikkaa tai alkuperää ja alkaa tavallisesti määräävällä artikkelilla al. Isännimen jäljessä voi olla myös isoisän nimi ja pitempikin ketju esi-isien nimiä, yleensä vain etunimiä. Lisäksi käytetään vielä epävirallisia kutsumanimiä, jotka usein annetaan ensimmäisen lapsen mukaan, esimerkiksi Abu Muhammad ’Muhammadin isä’ tai Umm Ali ’Alin äiti’.
Isännimen edessä on usein poikaa tarkoittava sana ibn, bin tai ben taikka tytärtä tarkoittava sana bint. Sen käyttö ja muoto vaihtelevat maittain. Niinpä kirjoitetaan milloin ibn Ladin, milloin bin Laden. Usein kyseinen apusana kirjoitetaan versaalialkuisena etenkin kun se ja sitä seuraava isännimi ymmärretään sukunimeä vastaavaksi, esimerkiksi Bin Laden.
Esimerkiksi nimi Abu Muhammad Abdallah ibn ʾAbd al-Rahman al-Darimi voidaan selittää näin: Muhammadin isä Abdallah, ʾAbd al-Rahmanin poika, darimilainen’.
Azeri eli azerbaidžani on Suomessa melko vähän tunnettu kieli, mutta sen puhujia saattaa olla jopa 30 miljoonaa (tiedot ovat epävarmoja). Se on kiinnostava myös siksi, että sitä kirjoitetaan kolmella eri kirjaimistolla: Iranissa arabialaisilla kirjaimilla, Azerbaidžanissa nykyisin virallisesti latinalaisilla kirjaimilla mutta edelleen myös kyrillisillä kirjaimilla.
Azeri on läheistä sukua turkille, ja aiemmin sitä pidettiinkin turkin muotona. Latinalaista aakkostoa käytettäessä kirjoitusjärjestelmäkin on varsin samanlainen kuin turkissa. Siihen kuuluvat ç, ğ, ı, ö, ş ja ü kuten turkissa ja lisäksi švaa-kirjain ə, jonka äännearvo on [æ] eli sama kuin suomen ä:n. Kirjaimen j äännearvo on [ʒ] (suunnilleen suomen oikeinkirjoituksen ž), ja c:n äännearvo on [ʤ] (suunnilleen dž).
Azerinkielisten nimien kirjoitusasuissa saattaa olla vaihtelua mm. siksi, että arabialaisia tai kyrillisiä kirjoitusasuja on translitteroitu eri järjestelmien mukaan. Esimerkiksi kyrillisen ы:n vastineena on nykyisessä latinalaisessa kirjoitusjärjestelmässä pisteetön i ı, mutta translitterointivastineena saattaa olla y, joka taas nykyisin on j-äänteen merkki. Sekaannuksia on aiheuttanut myös se, että vuonna 1991 käyttöön otettu latinalainen kirjoitusjärjestelmä poikkeaa jossain määrin vanhemmasta, vuosina 1929–1939 käytetystä.
Suomessa on aiemmin käytetty azerinkielisissä nimissä (sinänsä luonnollisesti) ä:tä ə:n tilalla sekä š:ää ş:n ja ž:aa j:n tilalla. Hakuteoksissa saatetaan esimerkiksi ilmoittaa Azerbaidžanin omakieliseksi nimeksi Azärbaidžan, vaikka se on nykyortografian mukaan Azərbaycan.
Baskin eli euskaran kieltä puhutaan Pohjois-Espanjassa ja Lounais-Ranskassa, eikä sen tiedetä olevan sukua millekään muulle kielelle. Sitä kirjoitetaan latinalaisin aakkosin, ainoana tarkkeellisena kirjaimena ñ, jolla on sama äännearvo kuin espanjassa. Yhdistelmät dd, ll, rr, ts, tt, tx ja tz ovat yhden äänteen merkkejä, joten niitä ei pidä jakaa.
Burman kieltä kirjoitetaan erityisellä burmalaisella kirjaimistolla, jonka siirtokirjoituksesta ei ole standardia eikä yleistä käytäntöä. Käytetyt siirtokirjoitustavat yrittävät yleensä jotenkin kuvata ääntämystä englannin kirjoitusjärjestelmän mukaan.
Burman valtion nimestä on syntynyt iso ongelma, koska maan sotilashallitus on vaatinut nimiasun Myanmar käyttöä. Tässä loppu-r johtuu pyrkimyksestä sanoa englantia osaaville, että sanan loppuvokaali ääntyy a:n tapaisena vokaalina eikä epämääräisenä neutraalivokaalina. Kyseisen nimiasun käyttö on toisaalta laajasti myös torjuttu. Ne, jotka käyttävät perinteistä nimeä Burma, käyttävät myös maan suurimmasta kaupungista vanhaa nimeä Rangoon eikä maan hallituksen käyttämää asua Yangon. Kielen nimi on joka tapauksessa burma.
Seuraavassa esimerkissä on burmalaisin kirjaimin Burman kaupungin nimi, jonka siirtokirjoitettu asu on Dawei:
Bulgariaa kirjoitetaan kyrillisin aakkosin samalla kirjainvalikoimalla kuin venäjää. Siirtokirjoituksessa käytetään kuitenkin osittain eri sääntöjä. Lisäksi bulgariankin osalta on käytössä eri siirtokirjoitusjärjestelmiä, joten englanninkielisessä tekstissä oleva bulgariankielisen nimen asu ei aina ole se, jota suomen kielessä tulisi käyttää. Periaatteessa pitäisi selvittää kyrillisin aakkosin kirjoitettu asu ja translitteroida se suomalaisen standardin (SFS 4900) mukaan.
Suomalaisen standardin mukaisessa yleiskielisessä bulgarian translitteroinnissa käytetään latinalaisten perusaakkosten a–z lisäksi kirjaimia š, ž ja ă. Kirjain ă on lyhyysmerkki-a (U+0103), joka on eri merkki kuin hattu-a ǎ (U+01CE).
Kirjaimella ă translitteroidaan merkki ъ, joka on bulgariassa säilyttänyt merkityksensä vokaalimerkkinä; venäjässä se on ns. kova merkki. Esimerkiksi Казанлък on translitteroituna Kazanlăk. Äännearvoltaan ă on lyhyt neutraali vokaali, švaa, foneettisesti merkittynä [ə], kuten esimerkiksi a-kirjaimella merkitty äänne englannin sanassa about. Käytännössä ǎ:n tilalla käytetään esimerkiksi sanomalehdissä yleensä tavallista a-kirjainta. On esiintynyt myös â-kirjaimen käyttöä.
Suomalaisen standardin mukaan bulgariaan translitteroidaan kuten venäjää seuraavin poikkeuksin:
Englannin kieltä voidaan kirjoittaa latinalaisilla perusaakkosilla a–z, mutta vastoin yleistä luuloa englannissa käytetään usein muitakin kirjaimia. Niiden käyttö on yleisempää britti- kuin amerikanenglannissa ja riippuu muutenkin kielimuodosta, tyylistä ja teknisistä mahdollisuuksista:
Luonnollisestikin eri kielistä tulleissa lainasanoissa voi esiintyä muitakin tarkkeellisia kirjaimia, esimerkiksi à la carte, façade, noël, fête, vicuña.
Englannin kielestä on vaikea antaa täsmällistä luetteloa siitä, mitkä kaikki kirjainyhdistelmät ovat yhden äänteen merkkejä. Yleisesti englannin tavutuksessa on syytä olla varovainen, ellei sanan ääntämystä tiedetä varmasti. Esimerkiksi yhdistelmät ch, ph, sh ja th on tietysti syytä pitää jakamattomina. Koska englannin sanat ovat yleensä lyhyitä, sanan jakamiseen on harvoin tarvetta.
Englannissa sananloppuinen -e, ei yleensä äänny, paitsi jos se on sanan ainoa vokaali. Niinpä sellaiset nimet kuin Moore ääntyvät yksitavuisina, joten ei ole mitään hyväksyttävää tapaa tavuttaa niitä. Tosin suomen kielen tavutussääntöjä voi tulkita niin, että tällaiset nimet saisi tavuttaa ikään kuin ne luettaisiin suomen mukaan (Moo-re), mutta sellainen on varsin epäloogista. Taivutusmuodot sen sijaan ovat loppupäästään tavutettavissa, koska ne ovat monitavuisia: Moo-ren, Moo-rel-le.
Espanjan kielessä käytetään latinalaisten peruskirjainten a–z lisäksi kolmea tarketta:
Akuuttia käytetään espanjassa monitavuisessa silloin, kun paino on muulla tavulla kuin sillä, jolla se olisi eräiden yleisten sääntöjen mukaan.
Jos akuutti on sanan viimeisellä kirjaimella, kirjain tulkitaan suomen taivutuksen kannalta pitkäksi. Taivutetaan siis esimerkiksi Gaudí : Gaudíhin.
Tarkkeet tulisi säilyttää espanjankielisissä nimissä, ellei nimestä ole käytössä suomeen mukautunutta ns. sovinnaismuotoa. Esimerkiksi espanjankielistä nimeä Andalucía vastaa sovinnaismuoto Andalusia, josta siis puuttuu akuutti ja jossa c on korvattu s:llä. Akuuttia käytetään silloinkin, kun nimeä ei käytännössä äännetä niin, että paino on akuutin ilmoittamalla tavulla. Niinpä kirjoitetaan Galápagossaaret, vaikka nimi varmaankin lähes aina äännetään niin, että paino on ensimmäisellä tavulla.
Kirjainyhdistelmät ch ja ll tarkoittavat espanjassa kumpikin yhtä äännettä, joten tällaista yhdistelmää ei tule jakaa eri riveille.
Sananloppuinen d jää puhutussa espanjassa usein ääntämättä. Suomen kielessä tällaisia espanjan sanoja kuitenkin käsitellään konsonanttiloppuisina, esimerkiksi Madrid : Madridissa.
Numeroin ilmaistujen järjestyslukujen yhteydessä, joskus myös muissa merkinnöissä, käytetään espanjassa merkkejä ª ja º, joita käsiteltiin A-kirjaimen tarinassa. Esimerkiksi 2ª = segunda ’toinen’ (feminiinimuoto), 2º = segundo ’toinen’ (maskuliinimuoto).
Vielä 1900-luvun puolivälissä Espanjan akatemian oikeinkirjoitussäännöt erosivat nykyisistä. Vuoden 1952 oikeinkirjoitusuudistuksessa mm. pääosin luovuttiin akuutin käytöstä yksitavuisissa sanoissa. Muutos ilmenee myös paikannimissä kuten Santa Fe (aiemmin Santa Fé, kuten vastaava portugalinkielinen nimi edelleenkin kirjoitetaan).
Esperanto on vuonna 1887 julkistettu kansainvälinen apukieli (keinotekoinen kieli) ja tällaisista kielistä ehdottomasti laajimman suosion saanut. Kieltä hyvin osaavia arvioidaan olevan noin miljoona. Esperanton kehittäjä L. L. Zamenhof oli puolalainen ja käytti osittain puolan kirjoitusjärjestelmää pohjana.
Esperantossa käytetään lyhyysmerkkiä u:n päällä, ŭ, osoittamaan, että u muodostaa diftongin edeltävän vokaalin kanssa, ja sirkumfleksia eräiden konsonanttien päällä: ĉ, ĝ, ĥ, ĵ, ŝ. Koska nämä merkit ovat muutoin käytössä vain harvoissa kielissä jos lainkaan, niiden käyttö on ollut teknisesti hankalaa. Niinpä on yleisesti käytetty tarkkeen sijasta kirjaimen jälkeen kirjoitettavaa h:ta, x:ää tai heittomerkkiä (esim. ĉ:n tilalla ch, cx tai c’).
Fääri on Färsaarilla (fääriksi Føroyar ’lammassaaret’) puhuttu skandinaavinen kieli. Siinä käytetään seuraavia lisämerkkejä: á, ð, í, ó, ú, ý, æ, ø. Joskus ø:n tilalla käytetään ö:tä.
Georgia eli gruusia eli kartveli on kieli, jota puhutaan lähinnä Georgian eli Gruusian valtiossa Kaukasuksen alueella. Sitä kirjoitetaan erityisellä georgialaisella aakkostolla, josta käytetään nimitystä mxedruli, mhedruli ja mkhedruli. Kirjoitusasujen ero johtuu siitä, että georgian siirtokirjoituksessa on useita järjestelmiä.
Georgian siirtokirjoituksen kansainvälinen standardi on ISO 9984, mutta sitä käytetään lähinnä vain tieteessä ja joissakin kartoissa. Georgian tiedeakatemia on määritellyt oman siirtokirjoitustapansa. Kansainvälisessä viestinnässä esiintyy yleensä muita siirtokirjoitustapoja. Suomessa ei asiasta ole standardia, mutta jossain määrin on muodostunut eräitä käytäntöjä. Osittain käytännöt johtuvat siitä, että varsinkin aiemmin lähtökohtana oli georgialaisen nimen venäjässä käytetty kyrillinen asu, joka siirtokirjoitettiin kuten venäläiset nimet.
Seuraavassa taulukossa on kuvattu siirtokirjoitustapojen eroja. Georgialaisen käytännön mukaisessa siirtokirjoituksessa ja IPA-merkinnässä käytetty heittomerkki (esim. t’) tarkoittaa ejektiivisyyttä: konsonantin ääntämyksessä kurkunpää nousee nopeasti ylöspäin ja antaa ilmavirralle sysäyksen, jolloin konsonantti kuulostaa erityisen pontevasti äännetyltä. (ISO-standardin mukaisessa siirtokirjoituksessa taas heittomerkki osoittaa aspiraatiota.)
|
Unicode |
Nimi |
Georgial. |
ISO | Suom. | Ääntämys |
---|---|---|---|---|---|---|
თ |
U+10D7 |
tani |
t |
t’ |
t |
[t̪ʰ] |
კ |
U+10D9 |
k’ani |
k’ |
k |
k |
[kʼ] |
პ |
U+10DE |
p’ari |
p’ |
p |
p |
[pʼ] |
ჟ |
U+10DF |
zhani |
zh |
ž |
ž |
[ʒ] |
ტ |
U+10E2 |
t’ani |
t’ |
t |
t |
[t̪ʼ] |
ფ |
U+10E4 |
pari |
p |
p’ |
p |
[pʰ] |
ქ |
U+10E5 |
kani |
k |
k’ |
k |
[kʰ] |
ღ |
U+10E6 |
ghani |
gh |
ḡ |
g tai h |
[ɣ] |
ყ |
U+10E7 |
q’ari |
q’ |
q |
k |
[qʼ] |
შ |
U+10E8 |
shini |
sh |
š |
š |
[ʃ] |
ჩ |
U+10E9 |
chini |
ch |
č’ |
tš |
[tʃʰ] |
ც |
U+10EA |
tsani |
ts |
c’ |
ts |
[ʦʰ] |
ძ |
U+10EB |
dzili |
dz |
j |
dz |
[dz] |
წ |
U+10EC |
ts’ili |
ts’ |
c |
ts |
[ʦʼ] |
ჭ |
U+10ED |
ch’ari |
ch’ |
č’ |
tš |
[tʃʼ] |
ხ |
U+10EE |
khani |
kh |
x |
h tai kh |
[x] |
ჯ |
U+10EF |
jan |
j |
ĵ |
dž |
[dʒ] |
Esimerkiksi Stalinin alkuperäinen georgialainen sukunimi kirjoitetaan suomessa usein Džugašvili, georgialaisen siirtokirjoituksen mukaan Jugashvili mutta englannin kielessä yleensä Dzhugashvili.
Eskimokieliin kuuluvassa grönlannin kielessä käytetään nykyisin vain latinalaisia perusaakkosia. Aiemmin käytettiin eräitä tarkkeellisia vokaaleita ja kraa-kirjainta ĸ, mutta niistä luovuttiin vuoden 1973 uudistuksessa. Esimerkiksi grönlantilaisten postimerkkien maannimimerkintä Kalâtdlit Nunât muutettiin vuonna 1978 merkinnäksi Kalaatdlit Nunaat. Vanhan järjestelmän mukaisia kirjoitusasuja esiintyy kuitenkin edelleen joissakin yhteyksissä.
Jos grönlantilaisessa nimessä esiintyy å, æ tai ø, kyseessä on tanskankielinen nimi. Esimerkiksi Grönlannin pääkaupungin tanskankielinen nimi on Godthåb (tanskan vanhan kirjoitusjärjestelmän mukaan Godthaab), grönlanninkielinen Nuuk (grönlannin vanhan kirjoitusjärjestelmän mukaan Nûk). Kielitoimisto suosittaa suomessa käytettäväksi grönlanninkielistä asua Nuuk.
Havaijin kielessä käytetään pituusmerkkiä osoittamaan vokaalin pituutta. Eri syistä pituusmerkit kuitenkin usein jätetään pois. Havaijiin kuuluu myös heittomerkin tapainen merkki, nimeltään ʻokina, joka on glottaaliklusiilin [ʔ] merkki ja joka lienee tulkittava Unicoden kannalta merkiksi modifier letter turned comma ʻ (U+02BB). Se esiintyy esimerkiksi havaijinkielisessä nimessä Oʻahu, joka meillä on kuitenkin totuttu kirjoittamaan englannin mukaisesti vain Oahu.
Heprea on arabian tavoin seemiläinen kieli, ja kirjoitusjärjestelmä noudattelee paljolti samoja periaatteita, vaikka merkistö onkin toinen. Heprealaisilla merkeillä on kuitenkin yleensä vain yksi muoto, eikä kirjoitus ole samalla tavoin ”juoksevaa” kuin arabialainen vaan selvästi erillisistä kirjaimista koostuvaa.
Heprealaisia nimiä esiintyy suomenkielisessä tekstissä toisaalta Raamatun nimistössä, toisaalta nykyaikaisessa, etenkin Israeliin liittyvässä nimistössä. Heprea nimittäin on Vanhan testamentin alkukieli ja pysyi juutalaisuudessa uskonnollisessa käytössä vaikka lakkasi olemasta elävä käyttökieli, mutta kieli elvytettiin etenkin Israelin valtion perustamisen yhteydessä.
Raamatulliset nimet kirjoitetaan yleensä jonkin raamatunsuomennoksen mukaisessa muodossa. Käytössä ovat edelleen laajasti 1930-luvun suomennoksen mukaiset asut (esimerkiksi Aabraham, Leea), vaikka vuoden 1992 suomennos muutti varsin monia kirjoitusasuja (esimerkiksi Abraham, Lea; ks. koosteen Suomen kielen normien muutoksia kohtaa Raamatulliset nimet). Molemmat suomennokset löytyvät verkosta osoitteen www.evl.fi/raamattu kautta, ja osoitteessa raamattu.uskonkirjat.net/ on kätevä hakutoiminto.
Raamatunsuomennosten nimiasut poikkeavat usein huomattavasti niistä asuista, joita käytetään nykyaikaisina niminä. Esimerkiksi raamatullinen nimi Iisak esiintyy nykyisin nimenä Yitzhak (yleisin kirjoitusasu; suomalaisen standardin mukainen asu olisi Yitshak).
Myös joillakin nykyisin käytössä olevilla paikannimillä on suomalainen sovinnaisasu, kuten Israel (hepreaksi Yisrael), Jerusalem (Yerushalayim), Jaffa (Yafo) ja Eilat (Elat).
Heprealaisen kirjaimiston translitteraatiota koskeva suomalainen standardi SFS 5824 määrittelee sekä ”tieteellisen” että ”yleiskielisen” menetelmän, joista yleensä vain yleiskielistä käytetään. Toisin kuin raamatullisissa nimissä, siinä ei vokaalin pituutta merkitä, vaan esimerkiksi a-kirjain voi tarkoittaa pitkää tai lyhyttä vokaalia. Se ei ole muutoinkaan kovinkaan tarkka, koska siinä useassa tapauksessa kahta eri heprealaista kirjainta vastaa sama latinalainen kirjain. Se yleensä vastaa melko hyvin niitä kirjoitusasuja, joita esiintyy kansainvälisessä, lähinnä englanninkielisessä tiedonvälityksessä. Horjuvuutta on lähinnä seuraavissa kohdissa:
Hindiä, Intian puhutuinta kieltä, ja useita muita intialaisia kieliä – mukaan lukien kielitieteessä tärkeä sanskrit – kirjoitetaan devanāgarī-kirjoituksella. Kirjoituksen ulkoasulle on ominaista noin x-korkeuden tasolla kulkeva vaakaviiva, koska kirjaimissa on tällä korkeudella osia, jotka on suunniteltu toisiinsa liittyviksi. Tästä sopii esimerkiksi Intian vaakunassa oleva sanskritinkielinen teksti, joka on translitteroituna satyam eva jayate ja joka tarkoittaa ’totuus yksin voittaa’:
Devanāgarī-kirjoituksen tarkassa translitteraatiossa, jota käytetään mm. tieteellisessä tutkimuksessa ja hyvissä hakuteoksissa, merkitään vokaalin pituus pituusmerkillä (esimerkiksi ā). Akuutti-s ś tarkoittaa suhu-s:ää (suomen oikeinkirjoituksen š). Lisäksi käytetään alapistettä eräiden konsonanttien (d, h, n, r, t) alla osoittamaan retrofleksisuutta; alapisteen kirjoittamisesta ks. lukua 4.
Suomessa käytetään uutistoiminnassa yms. yleensä englannista peräisin olevia intialaisten nimien asuja, joista on teknisistä tai muista syistä jätetty pois kaikki tarkkeet, paitsi että ś on korvattu sh:lla. Esimerkiksi Intian osavaltioiden nimissä esiintyvä sana Pradesh on tarkassa translitteraatiossa Pradēś.
Hollanti, jonka Belgiassa puhuttu muoto on flaami, ja hollannista Etelä-Afrikassa kehittynyt afrikaans mainitaan usein esimerkkeinä niistä harvoista kielistä, joita kirjoitetaan latinalaisin kirjaimin ilman tarkkeita ja lisämerkkejä. Tämä ei kuitenkaan pidä paikkaansa kummankaan kielen osalta. Afrikaansissa käytetään useita tarkkeita, samoin hollannissa.
Hollannissa käytetään akuuttia useaan tarkoitukseen. Ensinnäkin sillä voidaan painottaa sanaa. Jos sanassa on kaksi vokaalia, kumpaankin kirjoitetaan tällöin akuutti, esimerkiksi háár. Lisäksi käytetään akuuttia vokaalien päällä erottamaan sana één ’yksi’ epämääräisestä artikkelista een; tämäkin on tavallaan painottamista. Toisentyyppinen käyttö on prepositioiden vóór ja voor (tai saman preposition eri merkitysten) erottaminen toisistaan. Lisäksi käytetään akuuttia loppu-e:n päällä osoittamaan, että e ääntyy (pitkänä), etenkin ranskalaisperäisissä sanoissa: coupé, logé, oké (← englannin okay).
Huudahdussanassa hè käytetään gravis-e:tä. Lisäksi gravista käytetään usein painottamiseen akuutin sijasta, jos sanassa on lyhyt vokaali, esimerkiksi kàn, joskaan tämä ei enää ole virallisesti hyväksyttyä.
Hollannissa käytetään laajasti treemaa osoittamaan, että peräkkäiset vokaalit eivät äänny yhdessä, esimerkiksi België, coëfficiënt. Tämä johtuu siitä, että monilla vokaaliyhdistelmillä on hollannissa erityinen äännearvo; esimerkiksi oe ääntyy suunnilleen kuten suomen u.
Alkuperäiskieliseen asuun kuuluvia tarkkeita saatetaan säilyttää lainasanoissa, esimerkiksi sirkumfleksi ranskalaisperäisessä sanassa debâcle.
Hollannissa kirjainyhdistelmä ij on erikoisasemassa. Se tarkoittaa diftongia [ɛi] (kuten suomen ”ei”, mutta e-äänne on avoimempi, ä:hän vivahtava). Yhdistelmä toimii kirjoituksessa yhtenä kirjaimena siten, että kun se on esimerkiksi erisnimen alussa, kirjoitetaan sekä I että J versaalilla, esimerkiksi IJsselmeer.
Unicode-merkistöön otettu i:n ja j:n sekä I:n ja J:n yhdistelmät (”ligature ij”) myös erillisinä merkkeinä: U+0133 ja U+0132. Niitä myös jonkin verran käytetään hollannin kirjoittamisessa, vaikka vaikutus tekstin ulkoasuun on pieni tai olematon: IJsselmeer ∼ IJsselmeer (missä jälkimmäinen alkaa merkillä U+0132). Joissakin fonteissa, kuten Source Sans 3, ero kuitenkin saattaa olla selvä: IJsselmeer ∼ IJsselmeer. Suomenkielisessä tekstissä lienee paras välttää näiden yhdistelmämerkkien käyttöä. Tämä on hyvä ottaa huomioon, jos kopioi nimiä tietokoneella ns. leikepöydän kautta hollanninkielisestä tekstistä.
Hollannissa kirjoituksen ja ääntämyksen suhde on melko mutkikas. Edellä kuvatun ij:n lisäksi on yhden äänteen merkeiksi tulkittava myös ch, ng, nj, pf, sj, tj ja uw.
Hollannissa käytetään paljon heittomerkkiä, myös nimissä, jopa sanan alussa esimerkiksi Haagin hollanninkielisessä nimessä ’s Gravenhage. Heittomerkkiä ei kuitenkaan voida laskea kirjaimeksi.
Hollannin oikeinkirjoitusta on useaan otteeseen pyritty uudistamaan, mutta uudistukset ovat herättäneet kiistoja, vaikka muutokset ovat olleet melko pieniä. Vuoden 2005 uudistusta kuvailee artikkeli The recent history of Dutch Orthography (II). Problems solved and created by the 2005 reform.
Irlannissa puhuttua iirin kieltä on kirjoitettu sekä ns. vanhalla ortografialla että ns. uudella ortografialla. Koska iirin kieli on paljolti syrjäytynyt englannin tieltä, sen käyttö on osittain muodostunut kielenharrastukseksi, jossa on käytetty myös vanhaa ortografiaa. Uutta on käytetty 1200-luvulta alkaen, ja siihen tehtiin merkittäviä uudistuksia vuonna 1958.
Iirin uudessa ortografiassa käytetään latinalaisten perusmerkkien a–z lisäksi akuuttia vokaalien päällä (pituusmerkkinä), esimerkiksi sukunimessä Ó Donáill ja Irlannin iirinkielisessä nimessä Éire. Iirissä on monia äänneyhdistelmiä, joita ei tulisi jakaa eri riveille; mainittakoon erityisesti ll ja nn, jotka eivät tarkoita kaksoiskonsonantteja, vaan ns. uvulaarisia konsonantteja (IPAssa [ʟ] ja [ɴ] ).
Indonesia (bahasa indonesia) ja malaiji (bahasa malaysia) ovat käytännössä saman kielen eri muotoja. Ne kuuluvat niihin harvoihin kieliin, joita kirjoitetaan latinalaisin aakkosin ilman tarkkeita tai lisämerkkejä. Tosin kielen oppikirjoissa käytetään akuutti-e:tä é, koska kielessä on kaksi olennaisesti erilaista e-äännettä, joita ei tavallisessa kirjoituksessa eroteta toisistaan.
Islannin kieli on sukua norjalle, tanskalle ja ruotsille mutta poikkeaa niistä melko lailla. Myös kirjaimistossa on erikoisuuksia. Latinalaisten perusaakkosten lisäksi käytetään akuuttia vokaalien a, i, o, u ja y päällä, kirjaimia æ (ääntyy [ai]) ja ö sekä leimallisesti islantilaisia kirjaimia ð (eth) ja þ (thorn).
Akuutti ei osoita painoa vaan vokaalin pituutta tai diftongiääntämystä hiukan epäjohdonmukaisella tavalla: á [au], í [iː], ó [ou], ú [uː], ý [iː].
Yhdistelmä hj ovat yhden äänteen [ç] merkki.
Usein eth ja thorn korvataan d:llä ja th:lla mm. englanninkielisessä tekstissä. Yhdistelmää th ei esiinny islannissa, joten se voitaisiin suoraan korjata þ:ksi, mutta d esiintyy islannissa, joten d:tä ei suinkaan pidä tarkistamatta korjata ð:ksi.
Islannin pääkaupungin nimi on islanniksi Reykjavík, mutta suomessa jätetään yleisesti akuutti pois i:n päältä.
Henkilönnimet koostuvat Islannissa lähes aina etunimestä (tai -nimistä) ja isännimestä, esimerkiksi Björn Ólafsson ’Björn Ólafinpoika’ ja Anna Ólafsdóttir ’Anna Ólafintytär’. Jälkimmäinen osa ei siis ole sukunimi eikä sitä Islannissa käytetä yksinään henkilönnimenä. Suomenkieliseen tekstiin suositellaan samaa käytäntöä eli kirjoitetaan esimerkiksi Björn Ólafssonista tai Björnistä mutta ei vain Ólafssonista.
Italian kielessä käytetään latinalaisten perusmerkkien lisäksi vokaaleja, joissa on gravis: à, è, ì, ò, ù. Gravista käytetään osoittamassa, että paino on sanan viimeisellä vokaalilla, esimerkiksi città, più, ja muutamissa yksitavuisissa sanoissa erottamassa muuten samanlaisia sanoja toisistaan, esimerkiksi sì ’kyllä’, si ’itseään’. Huomaa, että painomerkki on gravis (`), ei akuutti (´) kuten esimerkiksi espanjassa.
Jos sanan viimeinen kirjain on vokaali, jossa on gravis, se tulkitaan suomen taivutuksen kannalta pitkäksi vokaaliksi, siis kuten suomen aa jne. Tällä on vaikutusta eräiden taivutusmuotojen (partitiivin ja illatiivin) kirjoitusasuunkin. Taivutetaan esimerkiksi Niccolò : Niccolòta : Niccolòhon. Muutoin italian sanojen loppuvokaalit ovat lyhyitä, esimerkiksi Bari : Baria : Bariin. Poikkeuksen muodostavat (harvat) yksitavuiset nimet kuten Po : Pota : Pohon, jonka sijasta on selvempää käyttää pitempää nimeä Pojoki : Pojokea : Pojokeen. (Nykyisten sääntöjen mukaan tällaisissa nimissä ei käytetä yhdysmerkkiä kuten ennen: Po-joki; tätä sääntöä voi ehkä selvyyden vuoksi harkitusti rikkoa.)
Painon merkitseminen ei ole italiassa johdonmukaista. Paino on yleensä toiseksi viimeisellä tavulla. Jos paino on viimeisellä tavulla, se siis merkitään graviksella. Jos paino on kolmanneksi (tai neljänneksi) viimeisellä tavulla, sitä ei yleensä merkitä, vaan se vain pitää tietää.
Kuitenkin joskus käytetään vokaalin päällä gravista muuallakin kuin viimeisessä tavussa silloin, kun paino vaikuttaa sanan merkitykseen, esimerkiksi sanassa princìpi erotuksesi sanasta principi. Tämä ei kuitenkaan ole kielen sääntöjen mukaan mitenkään pakollista. Sanakirjoissa saattaa paino olla merkittynä muutenkin (esimerkiksi pòvero), mutta tämä on siis vain joihinkin sanakirjoihin yms. kuuluva käytäntö.
Italiassa käytetään myös akuuttia e:n päällä osoittamassa, että se ääntyy suppeampana [e]:nä, asemassa, jossa se muutoin ääntyisi väljempänä [ɛ]:nä. Lisäksi se osoittaa vokaalin painolliseksi. Näiden vokaalien ero voi olla italiassa olennainen, mutta sitä ei merkitä mitenkään johdonmukaisesti. Kuitenkin jos sanan viimeisen tavun vokaali on painollinen e-äänne, käytetään akuuttia, jos e ääntyy suppeana, esimerkiksi perché ’koska; miksi’, ja gravista muutoin. Tosin varsin yleisesti kirjoitetaan perchè, osittain siksi, että sanan loppu-e:n laatu on italian eri murteissa erilainen.
Myös o:n päällä käytetään joskus akuuttia (ó) vastaavalla tavalla, erottamaan suppeampi o avoimemmasta. Tämä on kuitenkin harvinaisempaa.
Italian kielessä on joitakin kirjainyhdistelmiä, joita ei pidä tavutuksessa jakaa, koska yhdistelmä on yhden äänteen merkki tai sen viimeinen kirjain vaikuttaa olennaisesti edeltävän osan ääntämykseen: ch, gh, gl, gn, zz. Vokaalin edellä yhdistelmä gli kokonaisuudessaan on yhden äänteen merkki. Lisäksi sc on yhden äänteen merkki e:n ja i:n edellä, samoin sci, jota seuraa vokaali. Esimerkiksi sanan prosciutto [proˈʃutto] hyväksyttävä tavutus on pro-sciut-to, eikä nimeä Nizza pitäisi jakaa lainkaan.
Japanin kieltä kirjoitetaan osittain kiinalaisperäisillä sanamerkeillä eli kanji-merkeillä, osittain kahdella erilaisella tavukirjoitusjärjestelmällä, hiragana ja katakana. Lisäksi saatetaan käyttää latinalaisia kirjaimia vieraiden sanojen kirjoittamiseen. Samassa tekstissä esiintyy usein eri järjestelmien merkkejä. Tämä tekee japanin opiskelun aluksi melko vaikeaksi.
Suomenkielisessä tekstissä kirjoitetaan japaninkieliset sanat jonkin siirtokirjoitusjärjestelmän mukaan. Tällöin ei periaatteessa ole merkitystä sillä, mitä kirjoitusjärjestelmää japanissa käytetään, koska siirtokirjoitus on ääntämyksen mukaista (transkriptiota).
Japaninkielisten sanojen siirtokirjoituksessa käytetään suomessa nykyisten ohjeiden mukaan noudattaa länsimaissa yleisesti sovellettua Hepburnin järjestelmää eli hebonshikia. Sitä voidaan kuvata kuten monia muitakin transkriptioita: vokaalit kuten italiassa (ja suomessa), konsonantit kuten englannissa.
Vokaalien pituuden merkitsemisessä on horjuvuutta. Esimerkiksi pitkän o-äänteen suositeltava merkintä on o, jonka päällä on pituusmerkki (ō), mutta usein käytetään vanhempaa ô-merkintää (joka on usein helpompi tuottaa teknisesti) ja vielä useammin pelkkää o:ta; myös kirjoitusasua ou esiintyy.
Suomessa noudatettiin aiemmin melko yleisesti kielilautakunnan v. 1957 antamaa suositusta, jonka mukaan Hepburnin järjestelmän eräät kirjaimet ja kirjainparit vaihdetaan toisiin alla olevan taulukon mukaan. Tällöin kirjoitusasu paremman vastaa ääntämystä, kun kirjaimet luetaan suomalaisten äännearvojen mukaan. Esimerkiksi Hepburn-järjestelmän mukainen Fujiyama on tarkoitettu luettavaksi niin, että konsonantit ääntyvät englannin sääntöjen mukaan, kun taas Fudžijama sopii luettavaksi suomen sääntöjen mukaan. Seuraava taulukko kuvaa Hepburnin järjestelmän ja sen suomalaisen muunnelman erot.
Hepburn |
Suom. |
Esimerkkejä |
---|---|---|
ch |
tš |
Chiba ∼ Tšiba |
j |
dž |
Iwojima ∼ Ivodžima |
sh |
š |
Hiroshima ∼ Hirošima |
w |
v |
Kawasaki ∼ Kavasaki |
y |
j, i |
Kyushu ∼ Kiušu, Yamamoto ∼ Jamamoto |
Hepburnin järjestelmän mukaiset asut ovat kuitenkin yleistyneet suomessa muun muassa siksi, että ne ovat tuttuja monista yhteyksistä, sekä englanninkielisistä teksteistä että niistä poimituissa sanoissa esimerkiksi uutisissa. Tunnettujen japanilaisten henkilöiden, yritysten ja tuotemerkkien nimet esiintyvät lähes yksinomaan Hepburnin järjestelmän mukaisina (esimerkiksi Kurosawa, Toyota ja Mitsubishi), samoin monet maantieteelliset nimet (esimerkiksi Iwojima). Toisaalta esiintyy usein myös monenlaisia sekamuodosteita. Sekaannusten vaara on toisaalta melko vähäinen, koska käytännössä vain j-kirjaimen lukutapa voi jäädä epäselväksi.
Pääkaupungin nimi Tokio käsitetään sovinnaisnimeksi, joka kirjoitetaan aina i:llisenä eikä Tokyo tai Tokjo, samoin yleensä Jokohama, joka siis kirjoitetaan yleisesti j:llisenä (eikä Yokohama) silloinkin, kun muuten käytetään alkuperäistä Hepburnin järjestelmää.
Englanninkielisessä tekstissä käytetään usein akuuttia e:n päällä japanilaisissa sanoissa, esimerkiksi pokémon ja saké. Tarkoitus on ilmoittaa englantia puhuville, että e-kirjain ääntyy e-äänteenä eikä esimerkiksi jää kokonaan ääntymättä sanan lopussa kuten yleensä englannissa. Suomen kielessä tällaiseen ei ole syytä. Toisaalta jotkin é:n sisältävät japanilaisperäiset sanat ovat luonteeltaan tavaramerkkejä tai muita erisnimiä.
Karjalan kieli on suomen lähin sukukieli, jota puhutaan lähinnä Venäjän Karjalassa. Sitä ei pidä sekoittaa suomen kielen kaakkoismurteisiin eli ”karjalaismurteisiin”, joita puhuttiin lähinnä luovutetussa Karjalassa. Useimmat evakot puhuivat näitä murteita, eivät karjalan kieltä. Suomessa asuu myös karjalaa osaavia useita tuhansia, mutta tiedot määrästä ja karjalan käytöstä ovat epätarkkoja.
Karjalan kielestä käytetään myös nimitystä karjala-aunus, kun halutaan korostaa, että tähän kieleen luetaan myös aunuksen murre. Kirjakieltä on pyritty kehittämään toisaalta varsinaiskarjalan, toisaalta aunuksen murteen (eli aunuksenkarjalan eli livvin) pohjalta. Kuvaa mutkistaa myös se, että karjalaa puhutaan myös Moskovan lähellä sijaitsevalla Tverin alueelle, ja tverinkarjalastakin on olemassa kirjoitettu muoto.
Karjalaa on aiemmin pidetty myös suomen murteisiin kuuluvana, ”rajakarjalaismurteena”. Seuraava näyte karjalan kielestä havainnollistaa sitä, että siinä on suomea puhuvalle paljon tuttua, mutta myös paljon outoa: Svuadboiz lähtin iäres, annettih minul jiähine hebo, nagrehine saduli, hernehine plet’t’i. Minul annettih kozloovoit kengät da puhoovoi šliäppy.
Karjalan kielessä on vahvahko venäjän vaikutus, mutta sitä kirjoitetaan latinalaisin kirjaimin. Siinä käytetään ä:tä ja ö:tä sekä hattukirjaimia š ja ž kuten suomen virallisessa oikeinkirjoituksessa ja lisäksi kirjainta č affrikaatan merkkinä. Jos hattua ei voida käyttää, se on tapana korvata kirjaimen jälkeen kirjoitetulla h:lla; esimerkiksi meččä ’metsä’ kirjoitetaan tällöin mechchä. Aunuksen- ja tverinkarjalaa kirjoitettaessa käytetään ü-kirjainta y:n sijasta. Joissakin kirjoitustavoissa käytetään hattu-ezhää ǯ soinnillisen affrikaatan merkkinä, mutta sen tilalla käytetään usein yhdistelmää dž.
Karjalassa esiintyy palatalisoituneita konsonantteja (kuten myös suomen savolaismurteissa). Palatalisoituminen merkitään konsonantin jälkeen kirjoitettavalla heittomerkillä, esimerkiksi d’uuri ’juuri’.
Katalaani on lähinnä Espanjassa, etenkin Kataloniassa, puhuttu romaaninen kieli. Sen nimi sekoitetaan melko usein nimeen castellano, joka on espanjan kielen omakielinen nimitys (nimen español ohella).
Katalaanissa käytetään latinalaisten perusaakkosten lisäksi
Akuutti osoittaa samalla vokaalin suppeaksi (suljetuksi), gravis väljäksi (avoimeksi); a on aina väljä, ja i ja u ovat aina suppeita.
Lisäksi katalaanissa käytetään rivinkeskistä pistettä (·, U+00B7) l-kirjainten välissä eräissä tapauksissa, esimerkiksi sanassa col·legio ja nimessä Avel·lí. Yhdistelmä l·l ääntyy l-äänteenä, kun taas ll ääntyy palataalisena l:nä ([λ]). Yhdistelmä l· voidaan esittää myös yhtenä Unicode-merkkinä (ŀ, U+0140), jolloin ulkoasu voi olla typografisesti toisenlainen (esimerkiksi Aveŀlí), mutta tämä merkki ei sisälly fontteihin yhtä yleisesti kuin rivinkeskinen piste. Rivinkeskisestä pisteestä käytetään myös nimitystä ”lentävä piste”.
Seuraavat kirjainparit ovat katalaanissa yhden äänteen merkkejä: gu, ll, ny, qu, tg, tj, tx.
Katalaaninkielisten nimien tilalla käytetään usein vastaavia espanjankielisiä muotoja. Tämä on kuitenkin muuttumassa, kun yleisesti tunnustetaan, että romaanisia kieliä on muitakin kuin ne, jotka ovat nousseet valtioiden virallisiksi kieliksi.
Kiinaa kirjoitetaan erityisillä kiinalaisilla kirjoitusmerkeillä, joita on kymmeniä tuhansia erilaisia. Kukin merkki tarkoittaa yhtä tavua. Usein sanotaan, että kiinassa tavu muodostaa sanan, mutta tavujen yhdistelmä voi olla niin kiinteä, että sitä saatetaan pitää yhtenä sanana.
Ääntämys vaihtelee suuresti kiinan eri muodoissa. Voidaankin sanoa, että ellei yhteistä kirjoitusjärjestelmää olisi, kiinan monia muotoja olisi pidettävä erillisinä kielinä, kuten usein tehdäänkin. Kiinan puhujamäärältään suurinta ja asemaltaan virallisinta muotoa kutsutaan mandariinikiinaksi (tai lyhyemmin mandariiniksi).
Kiinalaisten merkkien siirtokirjoitus on väistämättä sovinnaista. Kukin merkki korvataan latinalaisten merkkien yhdistelmällä, jonka on tarkoitus antaa jonkinlainen käsitys (mandariinikiinan) ääntämyksestä. Vastaavuus on kuitenkin summittainen jo sen takia, että kiinan äänteet ovat paljolti erilaisia kuin latinalaisin kirjaimin kirjoitettavissa kielissä yleensä.
Kiinankielisten sanojen transkriptiossa on käytetty useita eri järjestelmiä. Nykyisin Kiinan kansantasavallassa virallinen järjestelmä on pīnyīn, joka poikkeaa merkittävästi siitä, mitä suomenkielisissä teksteissä ja muuallakin aiemmin yleisesti käytettiin (Waden ja Gilesin järjestelmä). Esimerkiksi aikoinaan hyvin tunnettu nimi Mao Tse-tung (tai Mao Tsetung) kirjoitetaan pīnyīnin mukaan Mao Zedong.
Pīnyīnissä käytetään latinalaisten peruskirjainten lisäksi kirjainta ü, joka tarkoittaa y‑äännettä kuten saksassa.
Taiwanissa ei käytetä pīnyīniä vaan vanhemman järjestelmän mukaisia tai siitäkin poikkeavia asuja. Hongkongissa taas käytetään yleensä kantoninkiinan mukaista ääntämistapaa vastaavia kirjoitusasuja.
Pīnyīniin kuuluu oikeastaan myös toonin eli sävelkulun merkitseminen vokaaleihin liitettävillä tarkkeilla tai yläindekseillä, mutta niitä ei yleensä käytetä, paitsi ehkä tieteellisessä esityksessä. Myös sana pīnyīn kirjoitetaan useimmiten pinyin. Tämä on ongelmallista, koska tooni erittäin usein on ainoa ääntämyksen piirre, joka erottaa muuten samoin ääntyvät sanat toisistaan. Esimerkiksi sukunimet Lĭ, Lì ja Lí ovat aivan eri nimiä, mutta yleensä kaikki kirjoitetaan Li.
Seuraavassa taulukossa on esitetty kiinan toonit ja niiden merkintätavat pīnyīnissä. Ensisijainen merkintätapa on vokaalin päälle kirjoitettava tarke. Toinen, monissa yhteyksissä helpommin toteutettava tapa on vokaalin jälkeen yläindeksiksi kirjoitettava numero. Kumpikin tapa aiheuttaa teknisiä ongelmia: osa tarvittavista tarkkeellisista vokaaleista ei kuulu tavallisten fonttien merkkivalikoimaan, ei myöskään yläindeksi 4.
Tooni |
Tarke |
Näppäily |
Numero |
Esimerkki |
---|---|---|---|---|
korkea tasainen |
U+0304 pituusmerkki |
AltGr(Vaihto(¨)) |
1 |
ā, a1 |
korkea nouseva |
U+0301 akuutti |
´ |
2 |
á, a2 |
matala laskeva-nouseva |
U+030C hattu |
AltGr(') |
3 |
ǎ, a3 |
korkea laskeva |
U+0300 gravis |
Vaihto(´) |
4 |
à, a4 |
Tarkassa kiinan siirtokirjoituksessa jokainen tavu sisältää toonimerkin. Tämä poikkeaa vietnamin kirjoituksesta, jossa yksi tooneista on ”oletustooni”, joka jätetään merkitsemättä.
Kaikki kiinan toonimerkkeinä käytetyt tarkkeet voidaan kirjoittaa melko helposti suomalaisella monikielisellä näppäimistöllä. Edellä olevan taulukon kolmannessa sarakkeessa on se näppäily, joka tarvitaan ennen vokaalin kirjoittamista, jotta sen päälle saadaan haluttu tarke. Teknisten rajoitusten takia tällä tavoin ei kuitenkaan voi kirjoittaa tarketta ü:n päälle. Tarkkeelliset ü:t saadaan aikaan käyttämällä jotakin luvussa 7 kuvattavaa tapaa kirjoittaa merkki sen Unicode-koodiarvon perusteella. Seuraavassa on tarvittavat koodiarvot: ǖ (01D6), ǘ (01D8), ǚ (01DA), ǜ (01DC).
Vertaa vietnamin kielen kuvauksessa esitettyihin huomautuksiin siinä käytettävien tarkkeiden kirjoittamisesta.
Kiinalainen henkilönnimi koostuu sukunimestä, joka on yleensä yksitavuinen ja kirjoitetaan ensin, ja etunimestä, joka on yksi- tai kaksitavuinen. Pīnyīniä käytettäessä on suotavaa kirjoittaa etunimen tavut yhdeksi sanaksi, esimerkiksi Hu Jintao (ei Hu Jin-tao eikä Hu Jin Tao) tai tarkemmin Hú Jǐntāo. Sen sijaan Taiwanissa ja Hongkongissa käytetään etunimen tavujen välissä yhdysmerkkiä, esimerkiksi Ng Siu-ming.
Tunnetuimmat kiinalaiset nimet säilytetään vakiintuneessa sovinnaisasussa, joka usein on vanhan siirtokirjoitusjärjestelmän mukainen. Se saattaa myös perustua muuhun kuin kiinankieliseen nimeen. Epäselvää on kuitenkin, mitkä kaikki nimet katsotaan sovinnaisnimiksi. Niitä ovat lähinnä muutamat historialliset henkilönnimet kuten Konfutse (eli Kungfutse) ja Sun Jat-sen sekä maantieteelliset nimet kuten Peking, Kanton ja Hongkong. Näistäkin jotkut käyttävät kiinalaisia pīnyīnin mukaisia muotoja kuten Pekingistä nimeä Beijing (harvemmin tarkasti Běijīng).
Vakiintuneeksi lienee siis katsottava muun muassa nimi Hongkong. Suomen kielessä käytetään vanhastaan tätä yhteen kirjoitettua asua, ei asua Hong Kong kuten englannissa. Kiinankielisen nimen pīnyīn-transkriptio Xianggang (oikeammin Xiānggǎng) on suomenkielisissä teksteissä varsin harvinainen, joskin kielitoimiston maannimiluettelo sanoo Hongkongista: ”Nyk. virallinen kirjoitusasu: Xianggang.”
Kiinalaisten nimien kirjoittamisesta on laajahko artikkeli Kielikellossa 3/2006. Siinä kuvataan myös, mitkä nimet suositellaan jätettäviksi vakiintuneeseen sovinnaisasuun.
Pīnyīn on otettu Kiinassa viralliseksi järjestelmäksi v. 1958. Vuonna 1979 suomen kielen lautakunta päätti suosittaa sen käyttöä myös suomenkielisessä tekstissä, kuitenkin niin, että historiallisista nimistä ja tutuimmista paikannimistä voidaan käyttää vakiintuneita sovinnaismuotoja kuten Peking. Epäselvyyksiä on aiheuttanut, miten laajasti sovinnaismuotojen käyttöä suositellaan tai sallitaan.
Kielikellossa 3/2006 Elina Wihuri esittää aiheesta kannanottoja, jotka voitaneen katsoa kielenhuollon jonkinasteisiksi suosituksiksi. Yleisiä linjauksia siinä ovat:
Erityisissä kannanotoissa esitetään seuraavien sovinnaisasujen säilyttäminen (sulkeissa pīnyīn-asu): Etelä-Kiinan meri (Nan Hai), Formosansalmi eli Taiwaninsalmi (Taiwan Haixia), Hongkong (Xianggang), Iso kanava (Da Yunhe), Itä-Kiinan meri (Dong Hai), Jangtse (Chang Jiang), Kanton (Guangzhou), Keltainenjoki (Huang He), Keltainenmeri (Huang Hai), Kiina (Zhongguo), Kiinan muuri (Wanli Changcheng), Konfutse (Kongfuzi, Kong Qu), Laotse (Laozi), Peking (Beijing), Sisä-Mongolia (Nei Monggol), Sun Yat-sen (Sun Zhongshan), Taipei (Taibei), Tšiang Kai-šek (Jiang Jieshi). Kannanotto ei tosin ole aivan selvä, vaan se voidaan lukea pikemminkin listaksi sallituista kuin suositelluista sovinnaisasuista.
Asu Konfutse ei varsinaisesti ole vakiintunut. Se on suomen kielessä vanhastaan käytetty asu, mutta nykyisin sen rinnalle ja sitä yleisemmäksi on muodostunut Kungfutse.
Kannanotossa mainitaan pīnyīnillä korvattaviksi seuraavat asut (tässäkin sulkeissa pīnyīn-asu): Huan Kuo-feng (Hua Guofeng), Jynnan (Yunnan), Keng Piao (Geng Biao), Kiangsi (Jiangxi), Kiangsu (Jiangsu), Kirin (Julin), Kuangtung (Guandong), Kueitšou (Guizhou), Mao Tse-tung (Mao Zedong), Nanking (Nanjing), Šanghai (Shanghai), Setšuan (Sichuan), Sinkiang (Xinjiang), Teng Hsiao-ping (Deng Xiaoping), Tshou En-lai (Zhou Enlai).
Taiwanissa käytetään pīnyīnin muunnelmaa, joka jossain määrin poikkeaa Kiinan kansantasavallan virallisesta järjestelmästä. Suomessa ei ole otettu kantaa tähän kysymykseen. Joissakin tapauksissa voidaan kannanotto välttää käyttämällä vanhoja, molemmista järjestelmistä poikkeavia nimiä, jotka voidaan tulkita sovinnaisnimiksi, kuten Taiwanin kaupunkien nimet Taipei, Taichung ja Ilan.
Epäselvää on, miten kiinalaiset nimet tulisi ääntää, kun niitä esiintyy suomenkielisessä puheessa. Ääntämys voi tuskin olla kovin tarkasti kiinan mukainen, koska tooneja ei yleensä merkitä eivätkä useimmat osaisi soveltaa toonimerkintöjä. Lisäksi esimerkiksi pīnyīnin d tarkoittaa äännettä, joka on lähempänä suomen t:tä kuin d:tä. Kuitenkin suomalaisten enemmistölle ainoa toimiva ratkaisu lienee ”lukea niin kuin kirjoitetaan”. Tällöin voi huoleti lukea z:n ts:ksi, koska pīnyīnin z on äännearvoltaan lähinnä ”ts” tai ”tz”.
Seuraavassa taulukossa esitetään pīnyīnin mukaiset kirjaimet ja kirjainyhdistelmät ja niiden perusäännearvot, joihin on joitakin poikkeuksia. Toisessa sarakkeessa on vertailun vuoksi Waden ja Gilesin järjestelmän mukainen kirjoitustapa. Äännearvo on kolmannessa sarakkeessa IPA-merkeillä esitettynä ja neljännessä sarakkeessa yksinkertaistettuna, suomenkieliseen puheeseen ehkä sopivana. Sana ”suomalaisittain” tarkoittaa, että b:n, d:n ja g:n voi lausua kuten ne useimmiten lausutaan vieraissa sanoissa suomessa, vain lievästi soinnillisina tai kokonaan soinnittomina, siis miltei kuten p, t ja k.
pīnyīn |
W.–G. |
IPA |
Ääntämyksen karkea kuvaus |
---|---|---|---|
a |
a, e |
[a] |
a |
b |
p |
[b̥] |
b (”suomalaisittain”) |
c |
tz‘, ts‘ |
[ʦʰ] |
ts |
ch |
ch‘ |
[tʂʰ] |
tš |
d |
t |
[d̥] |
d (”suomalaisittain”) |
e |
e, ê, eh, o |
[ɤ] |
e |
f |
f |
[f] |
f |
g |
k |
[g̥] |
g (”suomalaisittain”) |
h |
h |
[χ] |
h (tai ns. kurkku-h) |
i |
i, ih, ŭ |
[i] |
i |
j |
ch |
[d̥ʐ] |
dž |
k |
k‘ |
[kʰ] |
k (”kova”) |
l |
l |
[l] |
l |
m |
m |
[m] |
m |
n |
n |
[n] |
n |
ng |
ng |
[ŋ] |
äng-äänne |
o |
o, u |
[ɤ] |
o |
p |
p‘ |
[pʰ] |
p (”kova”) |
q |
ch‘ |
[ʨʰ] |
tsj |
r |
rh, j |
[ɹ] |
r (tärytön, l:ää muistuttava) |
s |
s, ss, sz |
[s] |
s |
sh |
sh |
[ʂ] |
š |
t |
t‘ |
[t] |
t (”kova”) |
u |
u, ü |
[u] |
u |
ü |
ü |
[y] |
y |
w |
w |
[w] |
w (kuten englannissa) |
x |
hs |
[ɕ] |
hsj |
y |
y |
[j] |
j |
z |
ts, tz |
[d̥z] |
dz |
zh |
ch |
[d̥ʒ] |
ž |
Vokaalien ääntämyksessä on huomattavaa vaihtelua äänteellisen yhteyden mukaan. Esimerkiksi o voi ääntyä myös o:na tai u:na. Suomalaisen lienee yksinkertaisinta lukea pīnyīnin vokaalit kuten suomessa, paitsi jos yrittää puhua kiinaa tai lausua kiinalaisen nimen hyvin arvokkaassa tilaisuudessa.
Osa edellä annetuista yksinkertaistetuista ohjeista on melko kaukana kiinan ääntämyksestä. Esimerkiksi j ei äänny dž:nä vaan soinnittomana d:nä, jota seuraa retrofleksinen (kielen kärki taaksepäin käännettynä äännettävä) z (soinnillinen s). Tämä on kuitenkin suomalaiselle varsin vaikea äänne, joten j:n ääntäminen kuten englannissa on yleensä tarpeeksi hyvä ääntämys. Suomalaisen on vaikea tuottaa kiinan äänteitä oikein, mutta taulukko tarjoaa erään järjestelmällisen tavan ääntää niin, että äänteet ovat toisistaan erotettavissa.
Komin kieltä puhuvat komit, vanhemmalta nimeltään syrjäänit, jotka ovat suomensukuinen kansa Venäjällä, lähellä Uralia. Kieltä kirjoitetaan kyrillisin kirjaimin eräitä lisämerkkejä käyttäen (kyrilliset i, ö). Sille sopiva siirtokirjoitusmenettely on standardiin ISO 9 perustuva (kuten myös Suomessa käytetty venäjän siirtokirjoitus) ja sisältää mm. seuraavat vastaavuudet: ë → ë, ж → ž, i → ï, ö → ö, ц → c, ч → č, щ → šč, ъ → ʺ, ь → ʹ, э → è. (Kirjan The World’s Writing Systems mukaan.)
Koreaa kirjoitetaan osittain kiinalaisten kirjoitusmerkkien (han-merkkien) korealaisilla muunnelmilla (hanja), osittain erityisellä koreaa varten kehitetyllä hangul-kirjoituksella. Hangul perustuu äänteitä esittäviin kirjainmerkkeihin, joita yhdistetään järjestelmällisellä tavalla tavumerkeiksi.
Koreankielisten nimien siirtokirjoitukseen latinalaisiksi kirjaimiksi käytetään erilaisia järjestelmiä. Englannin kielessä yleisesti noudatetussa Yalen järjestelmässä käytetään vain latinalaisia peruskirjaimia a–z. Sen sijaan McCunen–Reischauerin järjestelmä käyttää myös heittomerkkiä (’) ja lyhyysmerkkiä. Heittomerkki esiintyy eräiden konsonanttien jäljessä aspiraation osoittamiseen ja joissakin tapauksissa n:n ja g:n välissä (n’g). Lyhyysmerkki (ei hattu) voi esiintyä o:n ja u:n päällä. Se ei tarkoita lyhyyttä, vaan sen avulla osoitetaan vokaalin laatu toiseksi kuin peruskirjaimella merkityn vokaalin (nimittäin ŏ = [ʌ] ja ŭ = [ɨ]).
Etelä-Koreassa nykyisin virallinen järjestelmä tunnetaan yleensä englanninkielisellä nimellään Revised Romanization of Korean. Se on kehitetty McCunen–Reischauerin järjestelmästä siten yksinkertaistamalla, että siinä ei käytetä heittomerkkiä eikä tarkkeita. Aspiroituneita konsonantteja merkitään kirjaimilla k, p ja t sekä kirjainparilla ch, kun taas vastaavien aspiroitumattomien konsonanttien merkit ovat g, b, d ja j. Kirjainten ŏ ja ŭ sijasta käytetään kirjainpareja eo ja eu.
Järjestelmien eroja kuvaa esimerkiksi se, miten hangul-kirjoitusjärjestelmää tarkoittava korean sana kirjoitetaan niiden mukaan: Hankul, Han’gŭl, Hangeoul.
Korean siirtokirjoitusjärjestelmissä varsin moni kirjainyhdistelmä (esimerkiksi ”kk”, ”ch” ja ”eo”) on yhden äänteen merkki, joten koreankielisten sanojen tavutusta on syytä välttää.
Etelä-Korean pääkaupungin suomenkielinen nimi on Soul. Aiemmin jonkin verran käytetty asu Söul johtunee McCunen–Reischauerin järjestelmän mukaisesta asusta Sŏul. Etelä-Korean virallisen järjestelmän mukainen asu, jota käytetään monissa kielissä, on Seoul.
Koreankielisten henkilönnimien kirjoitusasussa on melko paljon vaihtelua paitsi eri siirtokirjoitusjärjestelmien takia myös siksi, että versaalin käyttö ja nimen osien yhteen tai erikseen kirjoittaminen vaihtelee. Yleensä suomessa käytetään englannista omaksuttua, lähinnä Yalen järjestelmän mukaista asua kuten Kim Il Sung (tai Kim Il-sung); muiden järjestelmien mukaiset asut ovat Kim Ilsŏng ja Gim Il-seong. Lisäksi nimen toinen osa saatetaan kirjoittaa kahdeksi sanaksi (Kim Il Sung), suoraan yhdeksi sanaksi (Kim Ilsung) tai yhdysmerkkiä käyttäen, jolloin sen jälkiosa saattaa olla myös gemena-alkuinen (Kim Il-Sung tai Kim Il-sung).
Suomen kielessä on enimmäkseen käytetty ensin mainittua tyyppiä, esimerkiksi Kim Il Sung, Kim Jong Il, Park Chung Hee ja Chun Doo Hwan. Ne lienee myös totuttu ääntämään tämän mukaisesti kolmena sanana eli niin, että kaikki osat ovat painollisia. Muut asut edellyttäisivät, että viimeinen tavu on vain sivupainollinen.
Etenkin kansainvälisissä yhteyksissä korealaisia nimiä kirjoitetaan usein tavalla, jonka on tarkoitus olla luettavissa englannin kielen sääntöjen mukaan ja joka ei välttämättä vastaa mitään edellä esitetyistä järjestelmistä. Esimerkiksi vuonna 2007 YK:n pääsihteeriksi tulleen korealaisen nimi kirjoitetaan yleensä Ban Ki Moon (tai Ban Ki-moon tms.), missä oo:n on tarkoitus kuvata u-äännettä kuten englannissa. Etelä-Korean virallisen järjestelmän mukainen asu olisi Ban Gi-mun, McCunen–Reischauerin järjestelmän mukaan taas Pan Kimun. Koreankielinen ääntämys taas on [pan.gi.mun].
Kohdassa 2.4 Kreikkalaiset aakkoset esitettiin perustaulukko näiden kirjainten siirtokirjoittamisesta. Vanhaa kreikkaa yleensä siirtokirjoitetaan kirjain kirjaimelta (translitteraatio), nykykreikkaa taas kirjoitetaan latinalaisin kirjaimin tavalla, joka pyrkii ottamaan huomioon ääntämyksen melko hyvin (transkriptio). Vanhalla kreikalla tarkoitetaan tässä paitsi antiikin kreikkaa myös Bysantin ajan kreikkaa aina Itä-Rooman valtakunnan häviöön (Konstantinopolin valloitukseen v. 1453) asti.
Muinaiskreikan aspiraattamerkki ῾ (dasia, spiritus asper), jota nykykreikassa ei nykyisin lainkaan käytetä, translitteroidaan h:lla sanan alussa. Muutoin se jätetään merkitsemättä.
Painomerkki (kreikaksi ”tonos”) vokaalin päällä osoittaa painoa. Esimerkiksi nykykreikan τριάντα ’kolmekymmentä’ ääntyy siten, että toinen tavu on selvästi painokkaampi kuin muut, [triˈanda]. Vaikka paino on kreikassa hyvin tärkeä, sitä ei translitteraatiossa eikä transkriptiossa useinkaan osoiteta mitenkään.
Esimerkiksi Kreetan pääkaupungin nimen Ηράκλειον (vanhempi kirjoitusasu Ἡράκλειον, jossa ensimmäiseen kirjaimeen siis liittyy aspiraattamerkki) translitteraatio on Hērakleion tai Hērákleion, joissa siis kutakin kreikkalaista kirjainta vastaa yksi latinalainen kirjain ja vieläpä aspiraattamerkilläkin on vastine (H). Tällaisia translitteraatioita esiintyy myös kartoissa. Sen sijaan transkriptio vastaa suunnilleen sitä, miten sana ääntyy nykykreikassa: Iraklion. (Tosin loppu-n jää usein ääntymättä, ja joskus se jätetään pois transkriptiostakin.)
Vanhan kreikan translitteraatio on periaatteessa yksinkertaista. Käytännön ongelmana on usein se, että ē ja ō on vaikea kirjoittaa tietokoneella. Niiden tilalla on joskus käytetty helpommin tuotettavia merkkejä ê ja ô.
Nykykreikan transkriptiossa on koko joukko poikkeussääntöjä, jotka pyrkivät ottamaan huomioon ääntämyksen paremmin kuin alkuperäinen kreikkalainen kirjoitusasu ottaa. Nämä säännöt on selostettu verkkosivulla Nykykreikan ääntämys sekä kreikan translitterointi ja transkriptio. Kuitenkin osittain sääntöjen mutkikkuuden, osittain englannissa noudatettujen transkriptiotapojen vaikutuksesta on suomalaisen standardin mukainen transkriptio nykyisin harvinainen.
Sekä translitteroinnissa että transkriptiossa tehdään usein virheitä. Etenkin nykyajan ja lähihistorian henkilönnimissä, jotka ovat tuttuja lähinnä kansainvälisistä tiedotusvälineistä, käytetään yleisesti englannin tai ranskan mukaisia transkriptioita. Syynä on useinkin vain se, ettei kääntäjä ole tiennyt transkriptiojärjestelmien eroista tai ei ehdi tarkistaa asiaa. Jos kreikkalaissyntyinen henkilö itse haluaa, että hänen nimensä kirjoitetaan latinalaisin kirjaimin jollakin erityisellä tavalla, muut usein menettelevät näin.
Tavallisimpia virheitä on ξ-kirjaimen translitteroiminen tai transkriboiminen x:llä eikä ks:llä (esim. Alexis eikä Aleksis). Joskus esiintyy myös f:n tilalla ph, h:n tilalla kh, k:n tilalla c jne.
Yhdistelmä ου (omikron ypsilon) oli muinaiskreikassa alkujaan diftongin merkki mutta kehittyi vanhassa kreikassa pitkäksi u-vokaaliksi, myöhemmin lyhyeksi. Se translitteroidaan suomalaisen standardin mukaan ū:lla tai u:lla ja transkriboidaan u:lla. Hyvin tavallista kuitenkin on sen transkriboiminen ou:lla (esim. Papadopoulos eikä Papadopulos, Papandreou eikä Papandreu, Diamantopoulou eikä Diamantopulu) ranskan ja englannin mukaisesti. Tämä on myös omiaan johtamaan virheelliseen ääntämykseen (ou eikä u). Virheellinen kirjoitusasu on niin tavallinen, että siitä poikkeaminen eli oikean asun käyttö voi jo herättää kielteistä huomiota!
Sekä translitteroinnissa että transkriptiossa on ρ-kirjaimen vastineena r-kirjain, ei rh. Kuitenkin rh on varsin tavallinen muiden translitterointijärjestelmien ja käytäntöjen mukaan, osittain latinan vaikutuksesta, esimerkiksi Pyrrhos, Rhodos (vaikka suomen kielen lautakunta on erikseen lausunut, että asu Rodos on suositeltava). Myös kirjaimen nimessä on rh: rhoo.
Monet tunnetut nimet kirjoitetaan aivan yleisesti siten, kuin ne esiintyvät englanninkielisissä teksteissä. Suomeksi kirjoittava toimittaja ei yleensä edes tiedä kreikkalaista kirjoitusasua saati että hän osaisi käyttää oikeaa transkriptiota. Niinpä käytetään asua Aristoteles Onassis, vaikka standardinmukainen transkriptio olisi Aristotelis Onasis.
Joillakin kreikkalaisilla nimillä on suomen kielessä vakiintunut suomeen mukautunut asu, jota käytetään kreikankielisen nimen translitteraation sijasta. Niistä ei ole syytä luopua, joskin translitteroitua asua tietysti käytetään, jos nimi esiintyy kreikankielisessä tekstikatkelmassa. SFS 5807 mainitsee vakiintuneiksi asuiksi nimet Ateena ja Kreeta. Tulkinnanvarainen on esimerkiksi nimi Akhilleus, joka varsin yleisesti esiintyy suomalaistuneessa asussa Akilles (ainakin yleisnimessä akillesjänne).
Esimerkiksi Ksantippa on tavallisempi kuin säännönmukainen translitteraatio Ksanthippa.
Kreikasta peräisin olevien lainasanojen asu poikkeaa osittain kreikan siirtokirjoituksesta. Lainasana mukautetaan suomen äänne- ja kirjoitusjärjestelmään. Tämä poikkeaa klassillisen kreikan translitteroinnista siten, että khiitä χ vastaa k (ei kh), theetaa θ t (ei th) ja zeetaa yleensä ts (ei z). Esimerkkejä erisnimistä ja lainasanoista:
Kuten edellä mainittiin, rhoo-kirjaimen (ρ) vastineena on suomalaisen standardin mukaisessa siirtokirjoituksessa aina pelkkä r. Sama koskee vielä suuremmalla syyllä lainasanoja. Kuitenkin lainasanoissakin käytetään myös rh:ta. Jopa Suomen kielen perussanakirjassa on kirjoitusasu rhododendron.
Käytettäessä kreikasta latinaan otettuja nimiä tai muita sanoja suomen kielessä on kirjoitusasu tietysti latinan mukainen, esim. Sappho, Theophilus, pharynx. Sama koskee eliöiden tieteellisiä nimiä, joiden kirjoitusasu ei riipu tekstin kielestä, esim. Phylloscopus, Macacus rhesus, Rhododendron. Mars-planeetan toisen kuun nimi kirjoitetaan yleensä Phobos, koska se ajatellaan latinasta lainatuksi, kun taas Kreikan mytologian nimenä se kirjoitetaan Fobos.
Kroatia on slaavilainen kieli, jota kirjoitetaan latinalaisin kirjaimin. Kroatian suhteesta serbiaan kerrotaan jäljempänä serbian kuvauksessa. Kroatiassa käytetään seuraavia tarkkeita ja lisämerkkejä:
Yhdistelmät dž, lj ja nj ovat yhden äänteen merkkejä ([ʤ], [λ], [ɲ]), joten niitä ei tulisi jakaa.
Kurdia puhutaan laajalla alueella useissa maissa, ja sen kirjoitusjärjestelmiäkin on useita: arabialainen (persialaista muistuttava, nimeltään soraní), kyrillinen (kyrillinen kurmanjí) ja kaksi latinalaista (yekgirtú ja latinalainen kurmanjí).
Latinalaisista kirjoitusjärjestelmistä yekgirtú käyttää tarkkeellisia kirjaimia é, í ja ú merkitsemään laadultaan toisenlaisia vokaaleita kuin tarkkeettomat, ja siinä kirjainyhdistelmät sh ja jh ovat suhuäänteiden merkkejä. Latinalainen kurmanjí taas käyttää tarkkeellisissa vokaaleissa sirkumfleksia (ê, î, û), ja suhuäänteiden merkit ovat ş ja j. Erona on vielä se, että affrikaattojen (suunnilleen suomen oikeinkirjoituksen tš ja dž) merkit ovat yekgirtússa c ja j mutta kurmanjíssa ç ja c.
Kuten luvussa 2 kuvattiin, latinaa kirjoitettiin alun perin versaalikirjaimilla. Nykyisin latinaa kirjoitetaan samaan tapaan kuin nykykieliäkin, käyttäen versaalia yleensä vain virkkeen ja erisnimen alussa.
Latinaa kirjoitetaan latinalaisin perusaakkosin a–z. Kirjain w esiintyy vain uuslatinassa erisnimissä, jotka on mukautettu latinankieliseen muotoon.
Kuitenkin käytetään usein treemaa e:n päällä (ë, esimerkiksi aër ’ilma’) osoittamassa, että e ääntyy erikseen eikä yhdessä edeltävän a:n tai o:n kanssa. Muutoin yhdistelmät ae ja oe ääntyvät joko pitkänä e:nä tai (enemmän klassista ääntämystä tavoiteltaessa) diftongeina ai ja oi (tai jopa diftongeina ae ja oe). Tämän osoittamiseksi ne saatetaan kirjoittaa ligatuurin tavoin kirjaimilla æ ja (harvoin) œ. Tätä tapaa käytetään varsinkin latinan sanojen tai latinalaisperäisten sanojen hiukan vanhahtavassa kirjoitustavassa brittienglannissa, esimerkiksi encyclopædia, Cæsar.
Eläin-, kasvi- ja muiden eliölajien tieteelliset nimet kuten Homo sapiens ovat muodoltaan latinaa, ja niitä usein sanotaankin latinalaisiksi nimiksi. Niiden aineksista kuitenkin noin puolet on otettu muinaiskreikasta ja merkittävä osa nykykielistä. Tieteellisten nimien kirjoitussääntöjen mukaan nimissä ei käytetä muita tarkkeita kuin treema e:n päällä silloinkaan, kun sana on johdettu erisnimestä, jossa on tarke. Esimerkiksi Ranskan presidentin Jules Grévyn mukaan.nimetyn seepralajin, grévynseepran, tieteellinen nimi on Equus grevyi ilman tarketta.
Toisaalta käytetään eräitä ääntämystä osoittavia tarkkeita mm. latinan sanakirjoissa, kieliopeissa ja oppikirjoissa samoin kuin esitettäessä tieteellisiä nimiä esimerkiksi kasviopin kirjoissa. Nämä tarkkeet eivät kuulu itse latinan kirjoitukseen, vaan ne ovat verrattavissa sanan jälkeen annettavaan erilliseen ääntämisohjeeseen:
Pituusmerkkiä ja akuuttia voidaan käyttää yhdessäkin, esimerkiksi bonṓrum. Tämä tuottaa usein isoja teknisiä ongelmia, koska kaikki tällaiset yhdistelmät eivät edes kuulu Unicodeen erillisinä merkkeinä vaan ne on muodostettava ns. yhdistyvien tarkkeiden avulla, jolloin ulkoasu on usein typografisesti huono.
Latinassa esiintyy kirjainyhdistelmiä ch, ph, rh ja th lähinnä kreikkalaisperäisissä lainasanoissa. Niiden ääntämys on vaihdellut ja osittain kiistanalainen, mutta kaikissa tilanteissa kukin niistä on syytä tulkita yhden äänteen merkiksi, jota ei saa jakaa. Esimerkiksi tieteellisen nimen Platyrhynchos hyväksyttävät jakokohdat ovat: Pla-ty-rhyn-chos.
Latviassa käytetään latinalaisten perusaakkosten lisäksi seuraavia tarkkeita:
Yhdistelmät dz ja dž ovat yhden äänteen merkkejä.
Aiemmin käytettiin myös sedilji-r:ää ŗ (palataalistuneen r:n merkkinä), mutta vuonna 1957 se virallisesti korvattiin r:llä. Samalla korvattiin yhdistelmä ch h:lla. Näitä muutoksia ei kaikkialla hyväksytty.
Liettuassa käytetään latinalaisten perusaakkosten lisäksi seuraavia tarkkeita:
Seuraavat yhdistelmät ovat yhden äänteen merkkejä: ch, dz, dž.
Makedonia on slaavilainen kieli, joka on sukua serbialle ja bulgarialle. Se on aivan eri kieli kuin antiikin Makedoniassa puhuttu kreikansukuinen kieli, josta on säilynyt vain vähän tietoja ja jota myös kutsutaan makedoniaksi.
Suomalaisen standardin määrittelemä makedonian translitterointi noudattelee samoja periaatteita kuin serbian, mutta makedoniassa käytetään eräitä kirjaimia, joita serbiassa ei käytetä, mm. dzee, joka on aivan latinalaisen s:n näköinen mutta äännearvoltaan affrikaatta [ʣ].
Tarkemmin sanoen makedonian translitterointi on sama kuin venäjän seuraavin poikkeuksin ja lisäyksin:
ѓ translitteroidaan g’ (merkki ’ on tässä tulkinnanvarainen)
е translitteroidaan aina e:llä
ѕ (U+0455) translitteroidaan dz
ј (U+0458) translitteroidaan j
љ translitteroidaan lj
њ translitteroidaan nj
ќ translitteroidaan k’ (merkki ’ on tässä tulkinnanvarainen)
ц translitteroidaan c
ч translitteroidaan č
џ translitteroidaan dž.
Translitteraatiostandardin mukaan ’ (heittomerkki) jätetään merkitsemättä. Tämä on sikäli epäjohdonmukaista, että г’ ja к’ ovat kirjainten ѓ ja ќ vanhemmat kirjoitusasut.
Kyrillisissä kirjaimissa è, ѝ ja ô esiintyviä tarkkeita (joilla vain erotetaan toisistaan muuten samanlaiset sanat) ei oteta huomioon translitteroinnissa.
Montenegrossa puhuttua kielimuotoa ei ole aiemmin pidetty omana kielenään vaan serbokroaatin, myöhemmin serbian muotona. Poliittisista syistä, etenkin Montenegron itsenäistyttyä omaksi valtiokseen, on alkanut esiintyä pyrkimyksiä luokitella se kieleksi. Joka tapauksessa sitä on syytä translitteroida serbiaa koskevien sääntöjen mukaan.
Sama koskee bosniaa, josta on ruvettu puhumaan omana kielenään jo aiemmin, Bosnia-Hertsegovinan itsenäistymisen jälkeen.
Serbian, montenegron ja bosnian osalta ei oikeastaan ole kyse translitteraatiosta vaan kielen vaihtoehtoisen kirjoitusjärjestelmän käytöstä. Näitä kielimuotoja nimittäin kirjoitetaan myös latinalaisin kirjaimin, noudattaen edellä kuvattuja vastaavuuksia. Käytännössä tämä merkitsee, että tällöin käytetään samaa kirjoitusjärjestelmää kuin kroatiassa.
Malta on lähinnä Maltan saarella puhuttu kieli, joka on kehittynyt arabiasta, joskin siinä on paljon mm. italian vaikutusta. Malta voitaisiin luokitella arabian muodoksi, mutta kulttuurisyistä sitä pidetään omana kielenään. Toisin kuin yleisarabiaa, maltaa kirjoitetaan latinalaisin kirjaimin. Siinä käytetään kirjainten a–z lisäksi yläpisteellisiä kirjaimia ċ, ġ ja ż sekä poikkiviiva-h:ta ħ. Yhdistelmä għ on yhden äänteen merkki, joten sitä ei tulisi jakaa. Huomattakoon, että q voi esiintyä yksinään (se on glottaaliklusiilin merkki), ilman seuraavaa u:ta.
Maorikielessä käytetään pituusmerkkiä osoittamaan vokaalin pituutta, esimerkiksi Māori. Eri syistä pituusmerkit kuitenkin usein jätetään pois.
Norjan kielessä käytetään latinalaisten perusaakkosten lisäksi kirjaimia å, æ ja ø. Å:n tilalla esiintyy etenkin vanhoissa nimissä vielä aa, esim. Haakon (Håkon); ks. Å:n tarinaa.
Yhdistelmät sj ja sk ovat etuvokaalin edellä yhden äänteen [ʃ] merkkejä.
Persiaa eli farsia puhutaan lähinnä Iranissa eli entisessä Persiassa. Sitä kirjoitetaan arabialaisin kirjaimin, joihin on lisätty merkkejä sellaisille äänteille, joita ei esiinny arabiassa. Siirtokirjoituksessa on käytössä useita eri tapoja, eikä aiheesta ole suomalaista standardia. Usein käytetään kansainvälisessä tiedonvälityksessä esiintyviä kirjoitusasuja, jotka pyrkivät kuvaamaan ääntämystä englantia tai ranskaa puhuville. Käytössä on myös tarkempia siirtokirjoitusjärjestelmiä, joista yhdessä (UniPers) käytetään latinalaisten perusaakkosten lisäksi tarkkeellisia kirjaimia â, š ja ž.
Portugali on romaaninen eli latinasta kehittynyt kieli ja kuuluu puhujamäärältään maailman suurimpiin kieliin. Portugalissa puhuttu muoto poikkeaa mm. oikeinkirjoitukseltaan jonkin verran Brasiliassa puhutusta muodosta.
Portugalin kielessä käytetään latinalaisten perusaakkosten lisäksi seuraavia kirjaimia:
Lisäksi käytetään ü-kirjainta samaan tapaan kuin espanjassa. Käytäntö on virallisesti hylätty Portugalissa, mutta se esiintyy edelleen Brasiliassa.
Portugalissa ch, lh ja nh ovat yhden äänteen merkkejä.
Puolan kieltä kirjoitetaan latinalaisin kirjaimin käyttäen seuraavia merkkejä kirjainten a–z lisäksi:
ą (ogonek-a), äännearvo usein nasaali-o, [õ]
ć (akuutti-c), äännearvo [ʦʲ]
ę (ogonek-e), äännearvo usein nasaali-e, [ẽ]
ł (poikkiviiva-l), äännearvo [w]
ń (akuutti-n), äännearvo [nʲ]
ó (akuutti-o), äännearvo [u]
ś (akuutti-s), äännearvo [sʲ]
ź (akuutti-z), äännearvo [zʲ]
ż (yläpiste-z), äännearvo [ʒ].
Luettelossa mainitut äännearvojen kuvaukset ovat suuntaa-antavia. Tarkemmassa kuvauksessa voitaisiin esimerkiksi ń kuvata pikemminkin palataalikonsonantiksi [ɲ] jne.
Puolankielisten nimien suhteen on siis syytä olla tarkkana. Esimerkiksi kansainvälisen viestinnän teksteissä saattaa kirjaimista a, c, e, l, o, s ja z puuttua tarkkeita. Tyypillinen esimerkki on nimi Wałęsa, jossa siis tulee olla poikkiviiva-l ja ogonek-e. Toinen esimerkki: nimessä Białowieża on poikkiviiva-l ja yläpiste-z.
Puolassa ei käytetä v-kirjainta (paitsi joissakin nuorissa lainasanoissa). Sen sijaan w-kirjaimella merkitään v-äännettä.
Seuraavat kirjainyhdistelmät tarkoittavat puolassa kukin yhtä äännettä, joten niitä ei tule jakaa eri riveille: ch, cz, dz, dź, dż, rz, sz. Poikkeuksen muodostavat yhdistelmät cz, dz, dż ja rz silloin, kun niiden kirjaimet kuuluvat yhdyssanan eri osiin.
Puolan rahayksikön puolankielinen nimi on złoty. Usein se kuitenkin kirjoitetaan muutoin sitaattilainan tavoin mutta poikkiviiva-l:n tilalla käytetään tavallista l:ää (zloty).
Ranskassa käytetään latinalaisten peruskirjainten lisäksi tarkkeellisia kirjaimia à, â, ç, è, é, ê, ë, ï, î, ô, ù, û, ü, ÿ sekä oe-kirjainta œ.
Oe-kirjaimen œ korvikkeena tosin usein käytetään kirjainparia oe. Oikein kirjoitetussa ranskassa ei yhdistelmää oe sellaisenaan yleensä ole, vaan useimmiten kyseessä on œ (esim. œuvre, cœur) tai e:n päällä on treema (esim. Noël); ks. oe-kirjaimen kuvausta kohdasta 5.7.
Tarkkeita käytetään Ranskan akatemian ohjeiden mukaan myös versaalikirjaimissa (À, Â jne.). Jos siis esimerkiksi nimi Rhône kirjoitetaan versaalilla, oikea asu on RHÔNE, ei RHONE.
Ranskassa vokaalien päällä olevat tarkkeet eivät osoita painoa, vaan paino on aina sanan tai yhden sanan tavoin ääntyvän sanajonon viimeisellä tavulla. Osittain tarkkeet osoittavat vokaalin laatua; esimerkiksi é on suppea e-äänne [e], è laveampi [ɛ]. Kirjaimissa à ja ù käytetään gravista vain erottamaan muutoin samanlaiset sanat toisistaan. Treema (ë, ï, ü, ÿ) osoittaa, että vokaali ääntyy erillisenä.
Ranskan kielilautakunta (le Conseil supérieur de la langue française) määritteli vuonna 1990 ranskan oikeinkirjoituksen uudistuksen, joka on suhteellisen pieni ja luonteeltaan lähinnä joidenkin epäsäännöllisyyksien poistamista. Käytännössä muutos on yhä kesken – ja kenties jääkin kesken. Osittain uudistuksia vesitettiin: päätettyjen uusien asujen rinnalla sallitaan myös vanhat, jotka ovat säilyneet yleisempinä. Arvostettu Ranskan akatemia otti puolinaisen kannan: se hyväksyi uudistuksen mutta korosti, että se on suositus ja että sitä ei pidä ajaa hallinnollisilla määräyksillä.
Suomalaisesta näkökulmasta ehkä olennaisinta on, että uudistuksen mukaan sirkumfleksi jätetään lähes kaikissa tapauksissa pois i- ja u-kirjaimesta eli î ja û korvataan î:llä ja û:lla. Tätä kuitenkin koskee periaate, jonka mukaan sirkumfleksi voidaan säilyttää. Niinpä voidaan kirjoittaa ragout tai ragoût, fraiche tai fraîche jne. Toisaalta suomen kielessä ei liene mitään syytä käyttää sirkumfleksia, kun käytetään ranskalaisia sanoja sitaattilainoina, koska se vain mutkistaa kirjoitusasua eikä ole ranskan uudistuksen mukaista. Muut tarkkeet on tietenkin säilytettävä, esimerkiksi crème fraiche. Lisäksi uudistuksen sääntöjen mukaan sirkumfleksi u:n tai i:n päällä on säilytettävä eräissä verbinmuodoissa sekä muutamissa tapauksessa, joissa sirkumfleksi erottaa muuten samanlaiset sanat toisistaan (dû, mûr, sûr, jeûne, eräät croitre-verbin muodot).
Muita muutoksia ovat:
Tietoja uudistuksesta on ranskaksi sivustossa orthographe-recommandee.info.
Sananloppuinen -s, -t, -x tai -z jää yleensä ääntymättä, samoin usein -r. Loppukonsonantin ääntymättömyys on otettava huomioon, kun sanaa taivutetaan suomenkielisessä tekstissä. Suomen sääntöjen mukaan käytetään päätteen edellä heittomerkkiä, jos kirjoitusasu päättyy konsonanttiin mutta ääntöasu vokaaliin, esimerkiksi Bordeaux : Bordeaux’ssa. Sen sijaan taivutetaan esimerkiksi Cannes : Cannesissa, sillä vaikka loppu-s jää ääntymättä, samoin jää kirjoitusasun muu loppu niin, että ääntöasu on n-loppuinen.
Sellaisissa nimissä kuin Versailles on kahdenlaista käytäntöä sen mukaan, tulkitaanko ääntöasun päättyvän vokaaliin i (Versailles : Versailles’ssa) vai konsonanttiin j (Versailles : Versaillesissa). Edellinen tulkinta on ollut vallitseva, mutta jälkimmäinen lienee tulkittava virallisemmaksi.
Ranskassa sananloppuinen -e, johon ei liity mitään tarketta, ei yleensä äänny, paitsi jos se on sanan ainoa vokaali. Myös sananloppu -es jää yleensä ääntymättä. Niinpä sellaiset nimet kuin Somme ja Charles ääntyvät yksitavuisina, joten ei ole mitään hyväksyttävää tapaa tavuttaa niitä. Tosin suomen kielen tavutussääntöjä voi tulkita niin, että tällaiset nimet saisi tavuttaa ikään kuin ne luettaisiin suomen mukaan (Som-me, Char-les), mutta sellainen on varsin epäloogista. Taivutusmuodot sen sijaan ovat loppupäästään tavutettavissa, koska ne ovat monitavuisia: Sommel-la, Char-lesil-le.
Kirjainyhdistelmät ch, gn ja ph ovat yhden äänteen merkkejä.
Romanian kieli on romaaninen eli latinasta kehittynyt kieli, jonka kirjoituksessa käytetään latinalaisten perusaakkosten lisäksi kirjaimia ă, â, î, ş, ţ.
Lyhyysmerkki-a ă tarkoittaa švaa-vokaalia [ə]. Se on eri merkki kuin hattu-a ǎ (joka ei esiinny romaniassa).
Sirkumfleksi-a â ja sirkumfleksi-i î tarkoittavat samaa äännettä, ”keski-i:tä” [ɨ] (= venäjän ”taka-i:ksi” sanottu ы).
Tarkkeellinen s ş tarkoittaa suhu-s:ää [ʃ] (suomen š) ja tarkkeellinen t ţ affrikaattaa [ʦ] (suunnilleen kuin suomen ts). Nämä kirjaimet sisältävän Romanian standardointijärjestön kannan mukaan alapuolisen pilkun, ei sediljiä. Taustalla lienee lähinnä se, että sedilji on koettu vieraaksi (ranskalaiseksi) vaikutteeksi. Unicodessa voidaan periaatteessa erottaa toisistaan alapilkku-s ja sedilji-s, mutta yleensä niin ei tehdä, vaan käytetään sediljiä. Tämä johtuu mm. siitä, että sedilji-s ş ja sedilji-t ţ kuuluvat huomattavasti useampaan fonttiin kuin alapilkku-s ja alapilkku-ţ.
Suomalaisella monikielisellä näppäimistöllä voidaan tuottaa sedilji-s ja sedilji-t tarkenäppäimen ja AltGr-näppäimen avulla. Vastaavat pilkulliset kirjaimet jouduttaisiin tuottamaan muilla, hankalammilla tavoilla.
Esimerkkejä sanoista, joissa on sedilji: Ceauşescu, Constanţa.
Kirjainyhdistelmiä ch ja gh ei pidä jakaa, koska kumpikin niistä on yhden äänteen merkki.
Jos sanan viimeinen kirjain on vokaali, se on romaniassa yleensä lyhyt, joten suomen illatiivin päätteenä on vokaalin pidennys ja n, esimerkiksi Brăila : Brăilaan. Kirjain j ääntyy sanan lopussakin konsonanttina ([ʒ]). joten taivutetaan esimerkiksi Cluj : Clujin (ei Cluj’ssa tms.). Toisaalta Clujin kaupungin nykyinen virallinen nimi on Cluj-Napoca.
Romanien eli mustalaisten kieltä puhutaan ja kirjoitetaan eri maissa eri tavoilla. Sitä ei pidä sekoittaa romanian kieleen, vaikka nämä kielet ovatkin keskenään kaukaista sukua (kuuluvat indoeurooppalaiseen kielikuntaan).
Suomessa käytetyn romanikielen suositellussa kirjoitusjärjestelmässä käytetään latinalaisten peruskirjainten lisäksi kirjaimia ȟ, š, ž, ö. Kirjaimia š ja ž käytetään vain yhdistelmissä tš ja dž, jotka ovat affrikaattojen merkkejä, joten niitä ei tulisi jakaa eri riveille. Näitä affrikaattoja merkitään romanikielen muissa kirjoitustavoissa merkeillä ja merkkipareilla č, dš, dz, ǧ ja tš. Kirjain ȟ on käytännössä varsin ongelmallinen, koska se toistaiseksi puuttuu lähes kaikista fonteista. Sen tilalla käytetään muissa kirjoitustavoissa kirjainta x tai merkkiparia ch.
Suositellussa kirjoitusjärjestelmässä pitkät vokaalit merkitään kuten suomessa eli kahdentamalla vokaali: aa, ee jne. Käytössä on myös tapa, jossa pituus ilmaistaan pituusmerkillä: ā, ē jne.
Muualla käytetyistä romanikielen kirjoitusjärjestelmistä on tietoa verkkosivulla www.omniglot.com/writing/romani.htm.
Ruotsin kielessä käytetään latinalaisten peruskirjainten lisäksi kirjaimia é, å, ä, ö. Akuutti-e esiintyy lainasanoissa, esimerkiksi idé, ja monissa nimissä, esimerkiksi Linné. Lisäksi akuutti-a á esiintyy ruotsalaisissa nimissä (esim. Collán) sen verran usein, että sekin on joskus haluttu tulkita ruotsin kirjoitusjärjestelmään kuuluvaksi.
Monista Suomessa ja Ruotsissa käytetyistä sukunimistä on käytössä sekä tarkkeeton että tarkkeellinen versio. Esimerkiksi Linden-nimisiä on Suomen väestörekisterissä noin 2 100, Lindén-nimisiä noin 2 300. Kirjoitusasu on periaatteessa tarkistettava kunkin henkilön osalta erikseen.
Kirjainyhdistelmistä dj, lj, sj, stj ja tj kukin on ruotsissa yhden äänteen merkki, eikä niitä siis saa jakaa eri riveille.
Ruotsinkieliset nimet ovat usein helposti tunnistettavissa yhdyssanoiksi. Tällöin niitä on luonnollista käsitellä tavutuksessa yhdyssanoina ja jakaa esimerkiksi mieluummin Wahl-sten kuin Wahls-ten.
Suomenruotsin ja riikinruotsin (ruotsinruotsin) välillä ei juuri ole eroja sanojen oikeinkirjoituksessa mutta kylläkin joissakin merkintätavoissa. Riikinruotsissa käytetään esimerkiksi rahasummissa ainakin virallisten ohjeiden mukaan kaksoispistettä, esimerkiksi 12:50, suomenruotsissa taas suomalaisen käytännön mukaan pilkkua, esimerkiksi 12,50. Tällaisia merkintäeroja on käsitelty Kielikello-lehden numerossa 2/2006 artikkelissa Merkit ruotsiksi.
Ruotsin viranomaisille annetut kirjoitusohjeet eli Ruotsin virkakielen kirjoitussäännöt, Myndigheternas skrivregler, jotka päivitetään aika ajoin (viimeksi v. 2016).
Saamen kielet ovat suomen kielen sukukieliä. Niitä on noin kymmenen; määrä riippuu osittain siitä, mitkä muodot katsotaan omiksi kielikseen, osittain siitä, mitkä kielet katsotaan vielä eläviksi. Ne ovat keskenään varsin erilaisia, vaikka niistä on aiemmin käytetty yhteisnimitystä saamen kieli tai lapin kieli. Myös kirjoitusjärjestelmissä on huomattavia eroja.
Tiivistelmä saamen kielten kirjaimistoista ja kirjainten perusäännearvoista on verkkosivulla www.omniglot.com/writing/saami.htm.
Suomessa puhutuin saamen kielistä on pohjoissaame. Lisäksi puhutaan inarinsaamea ja koltansaamea. Seuraavassa on tiivistelmä siitä, mitä kirjaimia näissä kielissä käytetään latinalaisten perusaakkosten lisäksi:
Saamenkieliset nimet kirjoitetaan usein eri tavoin typistetyissä muodoissa. Yksi syy on, että monet Suomessa käytetyt tietojärjestelmät – jopa väestörekisteri – eivät mahdollista kaikkien tarvittavien merkkien käyttöä. Suomalainen monikielinen näppäimistö on kuitenkin suunniteltu sellaiseksi, että sillä voi kirjoittaa kaikki Suomessa puhuttujen saamen kielten kirjaimet. Fonttien kirjainvalikoimien kannalta ongelmallisimmat merkit ovat koltansaamen kirjaimet poikkiviiva-g ǥ, hattu-g ǧ, hattu-k ǩ, ezh ʒ ja hattu-ezh ǯ.
Pohjoissaamessa seuraavat yhdistelmät ovat yhden äänteen merkkejä: hj, hl, hn, hr, lj, llj, nj, nnj.
Saksan kielessä käytetään latinalaisten perusaakkosten lisäksi kirjaimia ä, ö, ü ja ß.
Kirjaimet ä, ö ja ü tulkitaan siinä määrin a:n, o:n ja u:n muunnelmiksi, Umlaut-kirjaimiksi, että niitä käsitellään aakkostuksessa samoin. Jos näitä kirjaimia ei voida käyttää, on yleisenä tapana korvata ne yhdistelmillä ae, oe ja ue. Vanhoissa nimissä on usein vaihtelua oe ∼ ö, ja tämäntapaisten nimien oikeinkirjoitus on tarkistettava erikseen.
Kaksois-s:n ß käytön säännöt ovat vaihdelleet melko lailla. Vuonna 1901 vahvistettiin saksan oikeinkirjoituksen säännöt, mutta 1990-luvulla aloitetussa uudistuksessa (Rechtschreibreform) muutettiin mm. ß:n käytön sääntöjä ja versaalin käyttöä sanojen alussa. Uudistusta ei ole kaikkialla hyväksytty, joten kirjavuutta esiintyy yhä. Lisäksi uudistus ei vaikuta henkilönnimiin, vaan niissä voi esiintyä vanhoja kirjoitusasuja.
Sääntöjä ja niiden vaikutusta kuvataan kohdassa Kaksois-s.
Yhdistelmä sch on saksassa suhu-s:n (suomen oikeinkirjoituksen š) merkki.
Muutoin yhdistelmä ch on äänneympäristön mukaan ”ach-äänteen” [x] tai ”ich-äänteen” [ç]) merkki.
Serbiaksi kutsutaan serbokroaatin muotoa, jota puhutaan lähinnä Serbiassa. Aiemmin serbokroaatti käsitettiin yhdeksi kieleksi, jonka eri muotoja ovat serbia ja kroatia, tärkeimpänä erona se, että serbiaa kirjoitettiin kyrillisin ja kroatiaa latinalaisin kirjaimin. Poliittisista syistä kutsutaan serbiaa ja kroatiaa nykyisin eri kieliksi, ja niitä on tietoisesti pyritty kehittämään toisistaan eroaviksi.
Suomalaisen standardin määrittelemä serbian translitterointi on sama kuin venäjän seuraavin poikkeuksin ja lisäyksin:
ҕ translitteroidaan đ (U+0111, poikkiviiva-d, versaalina Đ); kirjaimen đ korvaamisesta dj:llä ks. kuvausta poikkiviiva-d:stä luvussa 5
е translitteroidaan aina e:llä
ј (U+0458) translitteroidaan j
љ translitteroidaan lj
њ translitteroidaan nj
һ (U+04BB) translitteroidaan ć (U+0107, akuutti-c)
ц translitteroidaan c
ч translitteroidaan č
џ translitteroidaan dž
Montenegrossa puhuttua kielimuotoa ei ole aiemmin pidetty omana kielenään vaan serbokroaatin, myöhemmin serbian muotona. Poliittisista syistä, etenkin Montenegron itsenäistyttyä omaksi valtiokseen, on alkanut esiintyä pyrkimyksiä luokitella se kieleksi. Joka tapauksessa sitä on syytä translitteroida serbiaa koskevien sääntöjen mukaan.
Sama koskee bosniaa, josta on ruvettu puhumaan omana kielenään jo aiemmin, Bosnia-Hertsegovinan itsenäistymisen jälkeen.
Serbian, montenegron ja bosnian translitteraatio on oikeastaan vain kielen vaihtoehtoisen kirjoitusjärjestelmän käyttöä. Näitä kielimuotoja nimittäin kirjoitetaan myös latinalaisin kirjaimin, noudattaen edellä kuvattuja vastaavuuksia. Käytännössä tämä merkitsee, että tällöin käytetään samaa kirjoitusjärjestelmää kuin kroatiassa.
Slovakki on slaavilainen kieli, joka on läheistä sukua tšekille. Sitä puhutaan Slovakiassa, entisen Tšekkoslovakian itäosassa, eikä sitä pidä sekoittaa sloveeniin. Sekaannuksia aiheuttaa mm. se, että Slovakian nimi slovakiksi ja tšekiksi on Slovensko.
Slovakkia kirjoitetaan latinalaisin aakkosin käyttäen lisäksi seuraavia tarkkeita:
Yhdistelmä ch on slovakissa yhden äänteen [x] merkki. Yhdistelmät dz ja dž käsitetään affrikaatoiksi, joten niitäkään ei ole syytä jakaa.
Sloveeni on slaavilainen kieli, jota puhutaan Sloveniassa, joka oli aiemmin Jugoslavian osavaltio. Sloveenia kirjoitetaan latinalaisin aakkosin käyttäen vain yhtä tarketta, hattua. Se voi esiintyä c:n, s:n tai z:n päällä, ja se osoittaa ”suhahtavaa” ääntämystä: č ääntyy [ʧ] eli suunnilleen kuten suomen tš, ja š ja ž ääntyvät suunnilleen kuten suomessa. Yhdistelmä dž käsitetään affrikaataksi, joten sitä ei pitäisi jakaa.
Somalin kieltä kirjoitetaan nykyisin latinalaisin aakkosin, joskin aakkosjärjestys on arabian aakkostoon perustuva ja aivan toinen kuin meidän käyttämämme. Latinalaisten peruskirjainten lisäksi käytetään heittomerkkiä ’ konsonanttikirjaimena, osoittamassa glottaaliklusiilia (IPA-merkki: [ʔ]). Yhdistelmät dh, kh ja sh ovat yhden äänteen merkkejä.
Somalilaisten nimien kirjoitusasu vaihtelee, koska niitä kirjoitetaan myös muiden kielten (etenkin entisten siirtomaaisäntien kielten) järjestelmän mukaan. Suomessakin nimiä käytetään eri muodoissa, esimerkiksi jättäen c (hankausäänteen [ʕ] merkki) kokonaan pois ja korvaten x (hankausäänteen [x] merkki) h:lla.
Suahili on itäafrikkalainen kieli, jonka äidinkielisiä puhujia on vain viitisen miljoonaa mutta jota käytetään laajalla alueella yhteisenä kielenä. Kielen nimi on suomessa vanhastaan suahili, mutta nykyisin virallinen suositus on englannin mukainen kirjoitusasu swahili.
Suahilia esiintyy myös länsimaissa tehdyissä elokuvissa nimissä ja lausahduksissakin, kuten hakuna matata ’ei huolia’. Esimerkiksi sana simba on suahilia ja tarkoittaa leijonaa.
Suahili on niitä harvoja kieliä, joita kirjoitetaan latinalaisin peruskirjaimin ilman tarkkeita. Siinä kuitenkin käytetään heittomerkkiä sanan sisällä tarkkeenomaisesti erottamassa toisistaan ng (ääntyy kuten englannissa) sanan sisällä ja ng’ (ääntyy pelkkänä äng-äänteenä ilman g:tä). Seuraavat yhdistelmät ovat yhden äänteen merkkejä: dh, gh, ny, sh, th.
Tagalog on Filippiineillä puhuttu kieli, jonka standardoidusta muodosta käytetään pilipino-nimeä. Tagalogin kirjoitusjärjestelmään kuuluu akuutti, gravis ja sirkumfleksi, joskin on tavallista jättää ne pois, vaikka ne osoittavat olennaisia ääntämyksen piirteitä. Akuutti osoittaa painoa, gravis vokaalin jälkeistä glottaaliklusiilia ja sirkumfleksi molempia yhdessä.
Tanskassa käytetään seuraavia lisämerkkejä: æ, ø, å. Niistä æ ja ø ovat tanskalle niin tyypillisiä, että niitä kutsutaan tanskalaiseksi ä:ksi ja ö:ksi. Sen sijaan å on ruotsista vasta vuonna 1948 omaksuttu kirjain, ja usein nimissä käytetään vielä sen tilalla aa-yhdistelmää, esimerkiksi Ålborg ∼ Aalborg (ks. Å:n tarinaa). Se ääntyy kuten ruotsissa eli o-äänteenä, ja sanan lopussa se tulkitaan pitkäksi, joten taivutetaan esimerkiksi Åbenrå : Åbenråhon.
Tanskalaisten paikannimien virallinen luettelo on verkkosivustossa Autoriserede stednavne i Danmark.
Kansainvälisessä uutistoiminnassa yms. saattavat tanskalaiset nimet esiintyä sellaisina, että æ, ø ja å on korvattu yhdistelmillä ae, oe ja aa.
Tanskan kirjoituksen ja ääntämyksen suhde on melko epäsäännöllinen, joten tanskalaisia nimiä on varminta olla tavuttamatta, jottei tule jakaneeksi yhden äänteen merkkinä toimivaa yhdistelmää. Sananloppuinen konsonantti jää useissa tapauksissa ääntymättä, mutta tällaiset tapaukset tulkitaan yleensä suomen taivutuksen kannalta niin, että konsonantti ääntyy. Vaikka esimerkiksi Ålborg ääntyy tanskassa vokaaliloppuisena, se on tapana suomessa käsitellä niin, että g ääntyy ainakin taivutetuissa muodoissa, joten kirjoitetaan Ålborg : Ålborgin : Ålborgissa jne.
Thaimaassa eli entisessä Siamissa puhuttua thaikieltä kirjoitetaan erityisin thaikirjaimin. Sen siirtokirjoituksessa käytetään jossain määrin vaihtelevia menetelmiä; kansainvälistä tai suomalaista standardia aiheesta ei ole. Lähimmäs standardia tulee Thaimaan oma virallinen siirtokirjoitusjärjestelmä RTGS (Royal Thai General System of Transcription).
Useimmissa siirtokirjoitusmenetelmissä, tieteessä käytetyt pois lukien, käytetään vain latinalaisia peruskirjaimia a–z. Konsonanttia seuraava h-kirjain osoittaa konsonantin aspiroituneeksi, joten yhdistelmää ch, kh, ph tai th ei pidä jakaa h:n edeltä, jos sana joudutaan jakamaan.
Tšekki on slaavilainen kieli, joka on läheistä sukua slovakille. Kirjoitusjärjestelmätkin ovat varsin samanlaiset. Tšekkiä kirjoitetaan latinalaisin aakkosin käyttäen lisäksi seuraavia tarkkeita:
Yhdistelmä ch on tšekissä yhden äänteen [x] merkki.
Turkin kieltä on kirjoitettu monilla eri aakkosilla: muinaisturkkilaisilla (riimukirjainten tapaisilla), arabialaisilla, latinalaisilla, kreikkalaisilla ja kyrillisillä aakkosilla. Vuodesta 1928 alkaen on Turkissa käytetty latinalaisia kirjaimia ja seuraavia lisämerkkejä:
Englanninkielisessä tiedonvälityksessä kaikki tarkkeet jäävät usein pois. Vielä yleisemmin esiintyy (suomenkielisissä hakuteoksissakin) ı:n tilalla i ja İ:n tilalla I, eli pisteellisen ja pisteettömän i:n välillä ei tehdä eroa. Esimerkiksi İnönü esiintyy usein asussa Inönü tai Inonu. Ks. myös I-kirjaimen tarinassa esitettyä kuvausta pisteettömästä i:stä. Nimi Istanbul on kuitenkin katsottava ns. sovinnaisnimeksi, jota suomessa käytetään turkinkielisen nimen İstanbul sijasta.
Lyhyysmerkki-g ğ (”pehmeä g”, ”lyhyt g”) kuvataan usein niin, että se ei koskaan äänny vaan vain osoittaa edeltävän vokaalin pitkäksi. Toisten kuvausten mukaan se ääntyy takavokaalin edellä heikkona g:n tapaisena hankausäänteenä (soinnillisena velaarispiranttina [ɣ]), etuvokaalin edellä j-äänteenä. Sanan lopussa tai konsonantin edellä se ei yleensä äänny vaan (nykykielessä) vain osoittaa edeltävän vokaalin pitkäksi. Tämän takia esimerkiksi nimeä Erdoğan ei pitäisi jakaa Erdo-ğan. Koska ğ:hen loppuva sana ääntyy pitkään vokaaliin loppuvana, sen taivutuksessa suomen kielessä käytetään heittomerkkiä, esimerkiksi Elâzığ : Elâzığ’n : Elâzığ’hın (tai, jos tuntuu liian oudolta käyttää suomalaisessa päätteessä suomen kirjaimiin kuulumatonta kirjainta, Elâzığ’hin).
Englanninkielisissä teksteissä esiintyy käytäntöä, jossa turkin ”hankalia” lisämerkkejä korvataan latinalaisilla perusaakkosilla tai niiden yhdistelmillä seuraavasti: ğ → gh, ç → ch, ş → sh, ü → u tai ue. Lisäksi saatetaan latinalaisia peruskirjaimiakin korvata toisilla, joiden oletetaan antavan englantia puhuvalle paremman käsityksen ääntämyksestä: c → j tai dzh, j → zh, e → a, ae (tai e).
Laadukasta asiatekstiä kirjoitettaessa on syytä tarkistaa kaikkien turkinkielisten nimien kirjoitusasu. Epäluuloon on aihetta, jos sana näyttää rikkovan turkin vokaalisointua, jonka mukaan sanassa on joko vain takavokaaleja (a, ı, o ja u) tai vain etuvokaaleja (e, i, ö ja ü). Tosin yhdyssanat ja nuoret lainasanat voivat rikkoa vokaalisointua kuten suomessakin. Esimerkkejä ainakin näennäisesti vokaalisointua rikkovista nimistä: Atatürk, Üsküdar, Tayyip.
Jos näkee esimerkiksi suomenkielisessä tekstissä asun Odzil, on syytä olla epäluuloinen. Nimen oikea asu onkin Özdil, mutta nimi oli oletettavasti kopioitu englanninkielisestä tekstistä. Kirjoitusasut, joissa on sekä pisteellinen että pisteetön i, ovat myös yleensä virheellisiä; esimerkiksi Izmir pitää kirjoittaa İzmir. Kuitenkin esimerkiksi kaupunginnimi Diyarbakır sisältää kummankinlaisen i:n.
Turkin kielessä pääpaino on tavallisesti sanan viimeisellä tavulla, mutta erisnimissä yleensä ensimmäisellä.
Kun turkille kehitettiin latinalainen kirjoitusjärjestelmä 1900-luvulla, tehtiin muutamia hiukan erikoisia ratkaisuja kuten pisteettömän i:n käyttöönotto. Se aiheuttaa erikoisongelmia tekstinkäsittelyssä.
Ukrainaa translitteroidaan suomalaisen standardin mukaan samoin kuin venäjää seuraavin poikkeuksin:
г translitteroidaan h
е translitteroidaan aina e:llä
є translitteroidaan je
и translitteroidaan y (ei i kuten venäjässä)
і translitteroidaan i
ї translitteroidaan ji
х translitteroidaan h’ (merkki ’ on tässä tulkinnanvarainen)
ь jätetään merkitsemättä
’ (heittomerkki) jätetään merkitsemättä
ґ (U+0491) translitteroidaan g.
Ukrainassa pätee й-kirjaimeen olennaisesti sama sääntö kuin venäjässä: vastineena on j sanan alussa ja і:n (venäjässä и:n) jäljessä, muun vokaalin jäljessä i, ja sanan lopussa se jätetään kokonaan merkitsemättä.
Monista paikannimistä käytetään ns. sovinnaisasuja, jotka on omaksuttu suomeen ja joita ei ole syytä muuttaa. Tällaisia ovat esimerkiksi Kiova, Harkova ja Pultava. Sen sijaan esimerkiksi Lvov-nimen asema vaikuttaa uhatulta: tämä venäjän mukainen, suomessa yleisesti käytetty muoto on usein jo korvattu ukrainankielisellä asulla Lviv.
Ukrainan pääkaupungin nimi on siis suomeksi Kiova, ukrainaksi Kyjiv, venäjäksi Kijev, englanniksi Kiev. Vanhaa suomalaista nimeä ei ole mitään syytä vältellä, ja vielä vähemmän on syytä käyttää englanninkielistä nimeä suomenkielisessä tekstissä.
Ukrainan ja Valko-Venäjän rajalla sijaitseva laaja suoalue tunnetaan suomessa vanhastaan nimellä Pripetin suot. Sen halki virtaava joki tunnettiin nimellä Pripet sen toisen venäjänkielisen nimiasun mukaan. Tšernobylin onnettomuus toi joen ja sen varrella sijaitsevan kaupungin uutisiin nimellä Pripjat, joka perustuu vaihtoehtoiseen venäjänkieliseen asuun. Joen ja kaupungin ukrainankielinen nimi on Prypjat (Прип’ять), valkovenäjänkielinen Prypjats (Прыпяць).
Muut nimet kuin sovinnaisnimet tulisi kirjoittaa sen kielen mukaisesti, johon nimen on katsottava kuuluvan. Täten ukrainankielinen nimi translitteroidaan alkuperäisestä eikä venäjänkielisestä asusta. Rajanveto on kuitenkin joskus vaikeaa, varsinkin historiallisten nimien osalta.
Unkari on suomen etäinen sukukieli. Vaikka se sanastoltaan ja kieliopiltaankin kaukana suomesta, unkarinkielisestä puheesta saattaa saada hiukan samantapaisen vaikutelman kuin suomenkielisestä. Kummassakin kielessä paino on aina sanan ensimmäisellä tavulla ja toisaalta pitkiä vokaaleja esiintyy myös painottomissa tavuissa.
Unkarin kielessä käytetään latinalaisten perusaakkosten a–z lisäksi
Kirjain ü ääntyy kuten suomen y ja kirjain ö kuten suomen ö (foneettinen merkki [ø]). Kirjain y ei esiinny unkarissa vokaalin merkkinä paitsi vieraissa nimissä, mutta se esiintyy palataalisuuden merkkinä konsonanttiyhdistelmissä gy, ly, ny ja ty. Näitä yhdistelmiä ei siksi pidä jakaa eri riveille, eikä esimerkiksi nimeä György ole loogista jakaa lainkaan, koska se ääntyy yksitavuisena. Myöskään seuraavia yhdistelmiä ei pidä jakaa, koska niistä kukin on yhden äänteen merkki: cs, dz, dzs, sz ja zs. Esimerkiksi Unkarin omakielisen nimen Magyarország mahdolliset tavutuskohdat ovat siis Ma-gya-ror-szág tai, jos nimen yhdyssanaluonne otetaan huomioon, Ma-gyar-or-szág.
Akuutti osoittaa vokaalin pitkäksi. Kaksoisakuutti vastaa treeman (kahden pisteen) ja akuutin yhdistelmää eli ű on ü:n ja ő on ö:n pitkä vastine. Pitkät vokaalit ääntyvät unkarissa osittain erilaatuisinakin kuin lyhyet. Lyhyt a ääntyy suunnilleen kuin suomen a mutta huulet pyöristettyinä eli labiaalisina, kun taas pitkä á on etuvokaalinen, lähellä ä:tä, eikä lainkaan labiaalinen. Lyhyt e on väljähkö, [ɛ], siis suomalaisen korviin omalla tavallaan ä:tä muistuttava, kun taas pitkä é on suppeahko, suomen e:n tapainen.
Sanan loppuvokaalin pituus vaikuttaa taivutukseen, mikä on muistettava taivutettaessa esimerkiksi sellaisia nimiä kuin Gerő : Gerőtä : Gerőhön.
Kun tarkistetaan henkilönnimiä unkarinkielisistä lähteistä, on huomattava, että unkarissa mainitaan sukunimi ennen etunimeä, esimerkiksi Nagy Imre. Muissa kielissä unkarinkieliset nimet esitetään yleensä toisin päin, sukunimi ensin: Imre Nagy.
Valkovenäjää translitteroidaan suomalaisen standardin mukaan samoin kuin venäjää seuraavin poikkeuksin:
ё translitteroidaan aina jo:lla
і translitteroidaan i
ў translitteroidaan u
г translitteroidaan h’ (merkki ’ on tässä tulkinnanvarainen)
ь jätetään merkitsemättä
’ (heittomerkki) jätetään merkitsemättä.
Muut nimet kuin sovinnaisnimet tulisi kirjoittaa sen kielen mukaisesti, johon nimen on katsottava kuuluvan. Täten valkovenäjänkielinen nimi translitteroidaan alkuperäisestä eikä venäjänkielisestä asusta. Tilanne on kuitenkin osittain epäselvä mm. siksi, että Valko-Venäjä käyttää julkisessa tiedottamisessaan laajasti venäjää valkovenäjän sijasta. Esimerkiksi Valko-Venäjän presidentti Aljaksandar Lukašenka käyttää englanninkielisillä verkkosivuillaan asua Alexander Lukashenko, joka on englantiin sovitettu muoto venäjänkielisestä asusta.
Venäjän kieltä kirjoitetaan kyrillisin kirjaimin, mutta venäläiset nimet kirjoitetaan yleensä siirtokirjoituksella, kun niitä käytetään latinalaisin aakkosin kirjoitetussa tekstissä. Siirtokirjoitusjärjestelmiä on hämmentävän monia, ja esimerkiksi englannin kielessä yleensä käytetty järjestelmä poikkeaa suomen kielessä käytetystä melko tavalla.
Suomalainen standardi SFS 4900 määrittelee, miten kyrillisiä kirjaimia siirtokirjoitetaan latinalaisin kirjaimin, kun kyse on slaavilaisesta kielestä. Se määrittelee sekä ns. kansallisen kaavan että ns. tieteellisen kaavan, joka on kansainvälisesti standardoitu mutta melko vähän käytetty. Kansallisessa kaavassa käytetään latinalaisia perusaakkosia a–z sekä kirjaimia š ja ž. Kaavojen pääkohdat kuvattiin kohdassa 2.4 Kyrilliset kirjaimet; hiukan yksityiskohtaisemmin ne on kuvattu verkkosivulla Venäjän ja muiden slaavilaisten kielten translitterointi, joka selostaa myös eräitä muualla käytettyjä venäjän siirtokirjoituksen tapoja.
Jos käytetään tieteellistä kaavaa, on usein syytä mainita sulkeissa lukijoille ehkä vielä tutumman translitteraation mukainen kirjoitusasu, esim. suomenkielisessä tekstissä ”Elʹcin (Jeltsin)” tai englanninkielisessä ”Elʹcin (Yeltsin)”.
Venäjänkielisten nimien translitteroinnissa korvataan esimerkiksi suhu-s:ää tarkoittava kirjain ш englannissa sh:lla (esim. Pushkin), saksassa sch:lla (esim. Puschkin), ranskassa ch:lla jne., kunkin kielen oman kirjoitusjärjestelmän mukaan. Lisäksi mm. englannissa on käytössä useita osittain erilaisia translitterointeja. Standardilla ISO 9 on pyritty yhtenäistämään käytäntöä, mutta se on saavuttanut melko vähäisen suosion. Sitä käytetään lähinnä tieteessä, kartoissa ja monikielisissä aineistoissa.
Tämän takia vieraskielisissä teksteissä esiintyvien venäläisten nimien tulkitseminen ja käsitteleminen käännöksissä vaatii kyseisessä kielessä käytettyjen translitteraatiotapojen tuntemista. Seuraavassa on esimerkki vaihtelusta. Taulukkoon on koottu joukko nimen Ющенко (ISO 9:n mukainen translitteraatio: Ûŝenko) translitteraatioita, joita käytetään eri kielissä. (Nimi on ukrainankielinen, mutta se translitterointisäännöt ovat sen osalta samat kuin venäjässä.)
afrikaans |
Joesjtsjenko |
englanti |
Yushchenko |
espanja |
Yúshenko |
hollanti |
Joesjenko, Joesjtsjenko |
islanti |
Jústénko, Jútsjenkó |
italia |
Yushenko, Yushchenko |
puola |
Juszczenko |
ranska |
Iouchtchenko |
romania |
Iuscenko |
ruotsi |
Jusjtjenko |
saksa |
Juschtschenko |
suomi |
Juštšenko, Jushtshenko |
tšekki |
Juščenko |
turkki |
Yuşçenko |
unkari |
Juscsenko |
Suomalainen standardi esittää joukon rajoituksia translitteroinnin soveltamiseen.
Henkilönnimistä sanotaan (kohdassa 7.1): ”Useat julkisuuden henkilöt kirjoittavat tai ovat kirjoittaneet nimensä latinalaisin kirjaimin aina samalla tavalla joko englannin, ranskan tai saksan ortografian tai oman harkintansa mukaan. Osalle nimistä on muodostunut ns. sovinnainen muoto, joka varsinkin etunimien osalta saattaa olla sama kuin ko. nimen muissa kielissä käytössä oleva muoto (esim. Maria). Standardin esittämästä tavasta poiketen voidaan kirjoittaa esim.: Anastasia, Nikolajeff, Sinebrychoff, Brailowsky, Cherkassky, Horowitz.”
Listaan voidaan lisätä myös yleisesti käytetty asu Josif Stalin, sillä venäjästä yleisten sääntöjen mukaan translitteroituna etunimi olisi Iosif (kyrillinen asu: Иосиф).
Käytännössä tällaista menettelyä sovelletaan usein muihinkin kuin julkisuuden henkilöihin, varsinkin Venäjältä muualle muuttaneisiin ja heidän jälkeläisiinsä. Periaatteen luonteesta seuraa, että nimen kirjoitusasu, esim. Jeremenko tai Eremenko, voi riippua henkilöstä. Täysin vakiintunut on esimerkiksi joidenkin historian henkilöiden nimiasu. Kirjoitetaan esimerkiksi Aleksanteri-tsaareista, vaikka nimen venäläisen asun translitterointi on Aleksandr.
Edellä mainitussa kohdassa standardi käytännössä hyväksyy sen vallitsevan käytännön, että naisten etunimet, jotka olisivat kansallisen kaavan mukaan translitteroituina -ija-loppuisia (ja ISO 9:n mukaan -iâ-loppuisia), kirjoitetaan -ia-loppuisina. Esimerkiksi nimi Анастасия translitteroidaan yleensä Anastasia eikä Anastasija. Muita esimerkkejä: Jevgenia, Maria, Natalia, Sofia. Nimet myös äännetään tämän mukaisesti. – Kielikellossa 3/2006 on kuitenkin esitetty ohjeena, että tällaiset nimet pitäisi kirjoittaa -ija-loppuisina. Samanlainen linja on piilotettuna Kielikellon 2/2003 artikkelissa, jossa vertailutaulukon sarakkeessa ”suomen transkriptio” mainitaan esimerkit Lidija ja Jevgenija.
Eräillä paikannimillä on vakiintunut suomenkielinen nimiasu. Standardi mainitsee seuraavat esimerkit: Moskova, Kiova, Sofia, Armenia. Venäjästä suomeen tulleiden -ia-loppuisten maan- ja alueennimien asua (-ija-loppuisuuden sijasta) voidaan perustella tällä periaatteella.
Standardin mukaan säännöistä poikkeavat myös jotkin laivojen nimet. Standardi ei tarkenna tätä, mutta siinä tarkoitettaneen lähinnä historiasta tuttua risteilijän nimeä Aurora (venäjäksi Avrora), kenties myös panssarilaiva Potemkinia (Potjomkin).
Venäjän kielessä kirjoitetaan yleensä vieraskieliset nimet kyrillisin kirjaimin ääntämyksen mukaan eli sovelletaan transkriptiota. Suomenkielisten nimien osalta se ei juurikaan poikkea translitteraatiosta, koska suomen kirjoitusjärjestelmä on varsin säännöllinen. Sen sijaan esimerkiksi englanninkielinen nimi saattaa muuttua muotoon, joka on varsin outo, ellei oteta huomioon ääntämystä. Lisäksi kirjoitusasu riippuu siitä, millaiseksi kirjoittaja kokee ääntämyksen. Esimerkiksi englanninkielisen nimen Walter saattaa joku transkriboida Вальтер, joku taas Уолтер. Jos joku translitteroi tällaisen nimen latinalaiseen aakkostoon tajuamatta, että nimi on alun perin englanninkielinen, tuloksena on hupaista Valter tai Uolter.
Suomalaisen standardin mukaan siirtokirjoitusta ei sovelleta nimiin, joiden kyrillinen asu ei ole alkuperäinen: ”Mikäli nimi on transskriboitu kyrilliseen asuunsa kielestä, jota kirjoitetaan latinalaisin kirjaimin, nimi pyritään kirjoittamaan alkuperäkielen mukaisesti. Esim.: Äyräpää (ei Jajurjapjaja), Hiiumaa (virol. paikannimi) (ei Khiuma eikä Hiuma), Hugo (ei Gjugo), Maugham (ei Moèm).”
Usein on käytännössä vaikeaa selvittää, onko kyse tällaisesta nimestä. Saattaa myös olla tulkinnanvaraista, onko katsottava alkujaan muusta kielestä peräisin olevan nimen muuttuneen esim. venäläiseksi. Standardi jättää avoimeksi, miten suhtaudutaan sellaisiin nimiin, jotka on transkriboitu kyrilliseen asuun muusta kuin latinalaisin kirjaimin kirjoitetusta asusta, esimerkiksi kartvelilaisesta (georgialaisesta, gruusialaisesta) tai arabialaisin kirjaimin kirjoitetusta asusta. Luonnollista olisi, että kirjoitettaessa ne latinalaisin kirjaimin otetaan lähtökohdaksi alkuperäinen asu. Tosin ei useinkaan ole olemassa suomalaista standardia siitä, miten tällöin menetellään, mutta silloin voitaneen soveltaa kansainvälistä standardia tai yleiseksi katsottavaa käytäntöä.
Käytännössä standardista poiketaan muillakin tavoin. Etenkin uutistoiminnassa ja siihen perustuvassa kirjoittelussa käytetään usein englanninkielisen tekstin mukaista translitteraatiota, koska asiaa ei ymmärretä, osata, viitsitä tai ehditä tarkistaa. On myös esitetty, että Suomessa pitäisikin siirtyä englannin mukaiseen translitteraatioon, koska sitä käytetään mm. Venäjän passeissa. Tämänsuuntainen mutta täsmentämätön ajatus on esitetty mm. Kielikellossa 3/2006. Osittaisesti toteutettuna ajatus toisi esimerkiksi Eremenkojen ja Jeremenkojen rinnalle Yeremenkoja. Jos passissa lukee sukunimenä Chekhov, niin pitäisikö käyttää tätä kirjoitusasua, vaikka kyseessä on aivan sama nimi kuin se, joka on totuttu suomessa kirjoittamaan Tšehov (tai Tshehov)? Asia on siis ratkaisematta, mutta jälkimmäistä tapaa voi perustella sillä, että se on kansallisen standardin ja tavan mukainen.
Vanhat nimet kuten Khrushchev (= Hruštšov) on suhteellisen helppo tunnistaa ja korjata, mutta uudet ja harvinaiset nimet voivat olla ongelmallisia. Ellei tiedon lähdettä tunneta eikä tekstissä ole riittävästi vertailukohtia, voi olla mahdotonta päätellä, pitäisikö venäläisen nimen kirjoitusasussa oleva ch korvata suomessa tš:llä, š:llä, h:lla vai jollain muulla.
Umpimähkäiseen korjailuun ei kannata ryhtyä. Kenties kirjoitusasu Chekhov on ainoa oikea. Venäläisten emigranttisukujen nimet ovat usein saaneet jonkin vakiintuneeksi katsottavan kirjoitusasun latinalaisessa merkistössä, eikä niitä pidä ruveta korjaamaan. Niinpä Suomessa Sinebrychoff pysyy vakiintuneena nimenä, vaikka alkuperäinen venäläinen nimi nykyisin translitteroitaisiin – ja translitteroidaan, jos sen kantajasta puhutaan – muodossa Sinebrjuhov.
Venäläisissä nimissä esiintyy myös vaihtelua š ∼ sh ja ž ∼ zh (ks. Š-kirjaimen tarinaa). Huomattakoon, että yhdistelmä сх on mahdollinen venäjässä, ja sen oikea translitterointi on tietysti sh.
Kyrillisen kirjaimiston pehmeä merkki (ь) on konsonantin jäljessä käytettävä merkki, joka osoittaa konsonantin palataalistuneeksi eli venäjän kieliopin termillä sanoen pehmeäksi. Pehmeä merkki on siis ääntämyksen kannalta merkitsevä, ja se voi jopa olla ainoa ero kahden sanan välillä. Kansallisen kaavan mukaan pehmeä merkki jätetään kokonaan merkitsemättä, mutta melko usein se halutaan jotenkin osoittaa. Tavallisimmin käytetään heittomerkkiä, esimerkiksi Русь = Rus’ (kansallisen kaavan mukaan Rus), joskus j-kirjainta, esimerkiksi Rusj.
Vaihtelu e ∼ jo ∼ o, joka kohdassa 2.4 jo mainittiin, esimerkiksi Fedor ∼ Fjodor ja Hruštšev ∼ Hruštšov, johtuu perimmältään venäjän oikeinkirjoituksen puutteista. Sama kirjain, e, voi tarkoittaa eri äänteitä. Asian korjaamiseksi kehitettiin uusi merkki, ë, jolla oli tarkoitus korvata e silloin, kun äännearvo on jo tai o. Se ei kuitenkaan tullut kovin laajaan käyttöön. Käytännössä ë esiintyy lähinnä kielen oppikirjoissa, kieliopeissa, sanakirjoissa ja joskus hakuteoksissa. Venäjäksi siis kirjoitetaan yleensä esimerkiksi Федор eikä Фёдор. Kumpaan asuun siirtokirjoitus tulisi perustaa? Kielitoimiston ohjeen mukaan jälkimmäiseen, eli tällaisissa tapauksissa tulisi käyttää ääntämystä vastaavaa jo:ta tai o:ta eikä e:tä.
Melko usein esiintyy venäläisten nimien kirjoittamisessa x:ää englannin esikuvan mukaan (Maxim, Felix). Suomalaisessa siirtokirjoituksessa on kuitenkin käytettävä ks:ää (Maksim, Feliks).
Siirtokirjoituksessa kirjainyhdistelmät ts, tš ja štš vastaavat kukin yhtä kyrillistä kirjainta ja yhtä venäjän äännettä. Niitä ei tämän takia pidä jakaa, jos nimi joudutaan jakamaan eri riveille. Nimen Tuhatševski jako Tuhat-ševski ei ole hyväksyttävä, Tuha-tševski on – joskin ehkä lukijoita hämmentävä. Vastaavasti jaetaan Hru-štšov eikä Hrušt-šov, joskin mieluiten nimi jätetään kokonaan jakamatta.
Jos siirtokirjoitetussa asussa on konsonantin jäljessä j-kirjain, sanaa ei pitäisi jakaa eri riveille sen edeltä. Se nimittäin ei yleensä äänny lainkaan vaan osoittaa edeltävän konsonantin palataalistuneeksi. Esimerkiksi nimeä Miljukov ei pitäisi jakaa Mil-jukov vaan (monia varmaankin oudoksuttavasti) Mi-ljukov. Jako Milju-kov on tietysti ongelmaton.
Tosin joissakin nimissä, esimerkiksi Objedkin (Объедкин) konsonantin jälkeinen j ääntyy ja sana voidaan jakaa sen edeltä, esimerkiksi Ob-jedkin. Tällaisten tapausten tunnistaminen vaatii kuitenkin yleensä nimen kyrillisen asun tuntemista. Kyse on tapauksista, joissa konsonantin jäljessä on kyrillisessä kirjoituksessa ns. kova merkki (ъ), jota ei kansallisen kaavan mukaan merkitä lainkaan.
Suomalaisten nimien kirjoittaminen venäjänkielisessä tekstissä (kyrillisin kirjaimin) on tavallaan kyrillisten kirjainten translitteroinnille käänteinen toimenpide. Venäjässä käytetään yleensä transkriptiota eli ääntämyksen mukaan kirjoittamista, ei translitterointia. Toisaalta suomesta siirtokirjoitettaessa näillä ei juuri ole eroa, koska suomessa kirjoituksen ja ääntämyksen suhde on melko yksinkertainen (yleensä yksi kirjain – yksi äänne).
Aiheesta ei ole standardia mutta melko vakiintuneita käytäntöjä. Yleensä suomalaiset nimet kirjoitetaan venäjässä translitterointitaulukkoa vastaavalla tavalla seuraavin poikkeuksin ja lisäyksin:
Suomen pitkät vokaalit kirjoitetaan yleensä kahdella vokaalikirjaimella (esimerkiksi aa), vaikka venäjässä kaksi vokaalia ei normaalisti tarkoitakaan pitkää vokaalia.
Horjuntaa on yhdistelmien j + vokaali kirjoittamisessa. Yksinkertaisin tapa on, että j:tä vastaa й ja että vokaali kirjoitetaan kuten muissakin asemissa. Toinen, tavallisempi ja luonnollisempaan asuun pyrkivä tapa on, että yhdistelmät ja, je, ji, jo, ju, jy, jä, jö korvataan kyrillisillä kirjaimilla я, е, и, ё, ю, ю, я, ё, jotka suunnilleen vastaavat niiden ääntämystä. Lisäksi saatetaan käyttää pehmeää tai kovaa merkkiä tällaisen kirjaimen edellä osoittamaan, että vokaalin edellä ääntyy j sen sijaan, että edeltävä konsonantti ääntyisi palataalistuneena. Esimerkiksi nimi Pirjo voidaan kirjoittaa yksinkertaisen tavan mukaan Пирйо tai venäläisemmän tuntuisesti Пирьё (tai joskus Пиръё).
Taustalla on pyrkimys antaa venäjää osaavalle oikeansuuntainen käsitys suomen sanan ääntämyksestä. Venäjässä ei ole suomen y:tä, ä:tä ja ö:tä vastaavia äänteitä, mutta venäjän ю, я ja ё ovat samantapaisia: ne palataalistavat edeltävän konsonantin (tai ääntyvät j-alkuisina), mutta myös vokaalin laatu muuttuu jonkin verran etisemmäksi. Toisaalta kuva ei ole kovinkaan osuva sellaisessa tapauksessa kuin Äyräpää = Яюряпяя, joka venäjän mukaan luettuna ääntyy useampitavuisena kuin suomessa, suunnilleen [jajurjapjaja].
Jos näin kirjoitettu nimi translitteroidaan, tulos usein poikkeaa alkuperäisestä. Tähän viitattiin jo edellä standardin poikkeusten käsittelyssä. Suomalaisen nimen venäjässä käytetystä asusta ei voi kaavamaisesti päätellä alkuperäistä asua, koska esimerkiksi ä-kirjainta ja ja-yhdistelmää vastaa sama kyrillinen merkki. Suomea osaava pystyy kuitenkin yleensä päättelemään suomenkielisen asun.
Vietnamin kieltä kirjoitetaan latinalaisin kirjaimin useita eri tarkkeita käyttäen. Tarkkeilla ilmaistaan toisaalta vokaalin laatu useissa tapauksissa, toisaalta tavun tooni eli sävelkulku. Tämän takia yhteen kirjaimeen voi liittyä kaksi tarketta. Lisäksi vietnamissa esiintyy poikkiviiva-d đ. Se tarkoittaa d-äännettä, kun taas poikkiviivaton d tarkoittaa vietnamin eri murteissa eri äänteitä (pohjoisessa lähinnä [z], etelässä lähinnä [j]).
Seuraavissa kirjaimissa tarke (lyhyysmerkki, sirkumfleksi tai sarvi) osoittaa vokaalin laatua: ă, â, ê, ô, ơ, ư. Esimerkki sanasta, jossa kahdessa vokaalissa on sarvi (engl. horn): Vương. Suomalaisella monikielisellä näppäimistöllä tällaiset kirjaimet voidaan kirjoittaa tarkenäppäinten avulla; lyhyysmerkki saadaan aikaa näppäilyllä AltGr(vaihto(')) ennen vokaalia, sarvi taas näppäilyllä AltGr(p) enne vokaalia. Sarven liittämiselle juuri p-näppäimeen ei ole muuta selitystä kuin että se on lähellä varsinaisia tarkenäppäimiä.
Tooneja vietnamissa on kuusi, joista ensimmäisellä (tasainen matala) ei ole merkkiä, eli ilman toonimerkkiä oleva tavu äännetään sen mukaan. Muut toonit ilmaistaan vokaalin yhteydessä (yllä tai alla) olevilla tarkkeilla seuraavan taulukon mukaan. Huomaa, että merkintätapa poikkeaa huomattavasti siitä, miten kiinan toonit merkitään pīnyīnissä.
Tooni |
Tarke |
Esimerkki |
---|---|---|
tasainen |
|
a |
korkea nouseva |
U+0301 akuutti |
á |
matala (laskeva) |
U+0300 gravis |
à |
laskeva-nouseva |
U+0309 koukku |
ả |
korkea nouseva glottalisoitunut |
U+0303 tilde |
ã |
matala glottalisoitunut |
U+0323 alapuolinen piste |
ạ |
Vaikka kaikki viimeisessä sarakkeessa mainitut kirjaimet voidaan kirjoittaa suoraan näppäimistöltä, kun käytetään suomalaista monikielistä näppäinasettelua, tämä ei riitä pitkällekään. Kyseisellä asettelulla ei nimittäin voida (ainakaan vielä) tuottaa merkkejä, joissa on useita tarkkeita. Sellaisia vietnamissa esiintyy hyvin usein, koska vokaaliin, jossa on laatua osoittava tarke, tulee siis toinenkin tarke, ellei tooni ole tasainen.
Kaksitarkkeinen merkki voidaan usein tuottaa Unicode-koodiarvonsa perusteella, kuten ệ koodin U+1EC7 avulla (esimerkiksi monissa ohjelmissa Windowsissa näppäilyllä 1EC7 Alt(x)), tai poimimalla se ns. merkistökartasta, kuten luvussa 7 kuvataan. Toinen, usein luontevampi keino on se, että kirjoitetaan ensin (jollakin tekniikalla, esimerkiksi tarkenäppäintä käyttäen) merkki, jossa on vokaalin laatua ilmaiseva tarke, esimerkiksi ê, ja sitten ns. kombinoituva tarke, jonka koodi on mainittu edellä olevan taulukon toisessa sarakkeessa. Näppäily olisi tällöin esimerkiksi ^e323 Alt(x). Tällöin riittää viiden tarkkeen koodin muistaminen tai tarkistaminen. – Periaatteessa nämä kaksi erilaista lähestymistapaa tuottavat merkin kahdella eri tavalla koodattuna, nimittäin ns. yhdistelmämerkkinä (kuten U+1EC7) tai kahtena Unicode-merkkinä, joista jälkimmäinen on kombinoituva tarke (kuten U+00EA U+1EC7). Ulkoasussa ja toimivuudessa voi olla eroa, jolloin yhdistelmämerkki yleensä tuottaa typografisesti paremman tuloksen ja toimii useammissa ohjelmissa.
Länsimaissa vietnamilaiset nimet kirjoitetaan usein ilman mitään tarkkeita, paitsi ehkä huolitelluimmissa hakuteoksissa ja tieteellisissä julkaisuissa. Tarkkeiden pois jättäminen on kuitenkin ongelmallista, koska tarkkeilla on suuri merkitys vietnamissa. Esimerkiksi ma, má, mà, mả, mā ja mạ ovat aivan eri sanoja, joilla on kullakin oma merkityksensä ja joiden ero ääntämyksessä on vietnamilaiselle selvä.
Länsimaisissa teksteissä myös poikkiviiva đ korvataan usein d:llä. Esimerkiksi taistelupaikkana tunnettu Dien Bien Phu on oikein kirjoitettuna Điện Biên Phủ.
Luotettavamman tietolähteen puuttuessa voi käyttää lähteenä vietnaminkielistä Wikipediaa ”http://vi.wikipedia.org”, jossa vietnamilaisten nimien kirjoitusasujen voi olettaa olevan yleensä oikeita.
Ilman tarkkeita on kuitenkin syytä kirjoittaa vakiintuneet sovinnaisasut kuten Vietnam (vietnamiksi Việt Nam), Hanoi (Hà Nội), Haiphong (Hải Phòng) ja Ho Chi Minh (Hồ Chí Minh), vaikka niitä ei yleensä ole mukautettu suomen kieleen, vaan käytämme englannista omaksuttuja asuja.
Vietnamin kielessä ei käytetä hattu-s:ää š, joten sitä ei ole syytä käyttää vietnamilaisissa nimissä myöskään suomenkielisessä tekstissä. Esimerkiksi Ho Chi Minhin keskimmäinen nimi on usein kirjoitettu Tši, Tshi tai Tsi, mutta tällaisia asuja on pidettävä virheellisinä.
Vietnamia kirjoitetaan yleensä yksitavuisin sanoin. Muissa kielissä vietnaminkielisen nimen osat kirjoitetaan usein kokonaan tai osittain yhteen (esimerkiksi Vietnam). Näin sopii tehdä lähinnä juuri sovinnaisasujen osalta.
Viron kielessä käytetään latinalaisten peruskirjainten a–z lisäksi kirjaimia š, ž, ä ja ö kuten suomessa ja lisäksi kirjaimia õ ja ü. Kirjainten š ja ž käyttöä virossa kuvattiin lyhyesti näiden kirjainten tarinoissa. Kirjaimilla ä ja ö on samat äännearvot kuin suomessa, mutta niiden käyttö on vähäisempää kuin suomessa: virosta puuttuu vokaalisointu, ja ä ja ö esiintyvät yhdistämättömässä sanassa vain ensimmäisessä tavussa. Esimerkiksi suomen sanaa hätä vastaa viron häda.
Joskus mainitaan myös č viron kirjaimistoon kuuluvana, mutta sitä käytetään vain samassa mielessä kuin suomessa: vieraissa nimissä, joiden alkuperäiseen asuun se kuuluu (esimerkiksi Čapek), ja tieteellisessä translitteraatiossa.
Kirjain õ esittää virolle ominaista vokaalia, ns. taka-e:tä. Suomalainen sekoittaa sen helposti sekä kirjoituksessa että ääntämyksessä ö:hön. Viron õ poikkeaa kuitenkin ö:stä selvästi. Õ:n ääntämyksessä ei ole lainkaan labiaalisuutta eli huulien pyöristystä, vaan se ääntyy lähinnä kuten e mutta suun takaosassa. Tosin õ:n on kuvattu olevan myös keskivokaali.
Viron õ-äänteen tarkka alkuperä on epäselvä. Mahdollisesti kielessä, josta suomi ja viro ovat kehittyneet, oli erikseen etuvokaalinen (”tavallinen”) e ja takavokaalinen e, jolloin viro olisi säilyttänyt alkuperäisen tilanteen, kun taas suomessa näiden äänteiden ero olisi kadonnut. Toinen selitys on, että e-äänne olisi virossa joissakin tilanteissa kehittynyt õ-äänteeksi. Tilanne on kuitenkin mutkikas, ja vaikka viron õ usein esiintyy suomen e:tä vastaavissa asemissa, esimerkiksi hõim ’heimo’ ja põld ’pelto’, se usein vastaa myös o:ta, esimerkiksi põlv ’polvi’.
Kirjain ü on tullut viroon saksasta, ja se on y-äänteen normaali merkki virossa, esimerkiksi sanassa üks ’yksi’. Y-kirjain ei kuulu viron varsinaiseen kirjoitusjärjestelmään lainkaan, vaan esiintyy vain sitaattilainoissa.
Verkossa on kokoelma viron kielen käsikirjoja sekä laaja kokoelma viron sanakirjoja, Sõnastikud.
Luettelo kokonaan tai osittain suomalaistetuista Viron paikannimistä Kielitoimiston ohjepankin sivulla Nimenvalinta: Viron paikannimet suomeen mukautettuina vai vironkielisinä?
Vironkielisiä nimiä on aiemmin mukautettu suomen kieleen myös niin, että suomen sanaa läheisesti muistuttavaa nimeä on taivutettu suomen sanan tavoin. Taivutettiin esimerkiksi Rand : Rannan, koska kyseinen nimi on samaa alkuperää kuin suomalainen nimi Ranta ja taipuu virossa samaan tapaan kuin suomessa. Linjaa kuitenkin muutettiin vuonna 2004, jolloin suomen kielen lautakunta antoi uuden suosituksen virolaisten nimien taivutuksesta suomessa. Periaatteet ovat seuraavat:
Walesissa, Ison-Britannian länsiosassa puhuttu walesin kieli eli kymri on kelttiläinen kieli ja sukua Irlannissa puhutulle iirille ja Skotlannissa puhutulle gaelille.
Walesin kielessä käytetään latinalaisten peruskirjainten a–z lisäksi sirkumfleksia pituusmerkkinä vokaalien päällä. Kirjain w on walesissa vokaali, joten käytetyt tarkkeelliset kirjaimet ovat: â, ê, î, ô, û, ŵ ja ŷ. Pituutta ei kuitenkaan merkitä kaikissa sanoissa vaan sellaisissa, joissa pituuden tietäminen tuottaisi vaikeuksia kieltä muuten osaaville, etenkin lainasanoissa.
Walesin kielessä on monia äänneyhdistelmiä, joita ei tulisi jakaa eri riveille, koska niistä kukin on yhden äänteen merkki: ch, dd, ff, ll, ng, ph, rh ja th.
Mainittakoon erityisesti, että ll ei tarkoita kaksoiskonsonanttia vaan ns. lateraalista frikatiivia, ”hankaus-l:ää”. (IPAssa [ɬ] ). Esimerkiksi nimi Lloyd on alkujaan walesia, vaikka englannissa sen Ll ääntyykin tavallisena l:nä.
Tässä luvussa esitetään melko laaja kuvaus merkkien kirjoittamisesta tietokoneella. Vielä perusteellisempi esitys on sivustossa Merkkien kirjoittamisen ohjeita.
Valtaosa kaikista teksteistä kirjoitetaan nykyisin tietokoneella. Käsin kirjoitetaan vain omia muistiinpanoja, lyhyitä viestejä ja henkilökohtaisia kirjeitä, ja näissäkin yhteyksissä tietokoneen käyttö yleistyy jatkuvasti. Kirjoituskoneet ovat jäämässä museotavaraksi.
Kuitenkaan tietokoneella kirjoittamista ei opeteta osana kansalaistaitoja ja työelämän yleisiä valmiuksia ollenkaan siinä määrin, kuin olisi tarpeen. Kyky tuottaa siistiä tekstiä tietokoneella on nykyisin paljon tärkeämpi kuin siisti käsiala. Tähän sisältyy paljon sellaista, jota ei tässä kirjassa käsitellä, kuten tekstinkäsittelyohjelman oikolukutoimintojen käyttö, fonttien valinta, rivinpituus, rivinkorkeus ja tekstipalstan muoto. Sen sijaan tässä käsitellään merkkien kirjoittamista tietokoneella.
Jokaisen, joka joskus kirjoittaa tietokoneella, eli käytännössä jokaisen kansalaisen, kannattaisi opetella ainakin kaksi tapaa kirjoittaa tarkkeellisia kirjaimia ja erikoismerkkejä: sujuva tapa ja yleispätevä tapa. Sujuva tapa tarkoittaa mahdollisimman nopeaa tapaa kirjoittaa usein tarvittavat merkit. Tyypillisesti tämä tarkoittaa merkin kirjoittamista vain muutamalla näppäimenpainalluksella. Yleispätevä tapa tarkoittaa tapaa, jolla voidaan kirjoittaa mikä tahansa Unicode-merkki. Tämä voi perustua esimerkiksi merkin valitsemiseen merkkitaulukosta tai merkin Unicode-koodiarvon käyttöön.
Tavallisen tietokonenäppäimistön peruskäyttö on useimmille tuttua, mutta vieraiden kirjainten tuottamisessa menee usein sormi suuhun. Tavallisimmat suomenkielisessä tekstissä tarvittavat tarkkeelliset kirjaimet kuten é, à, ü ja ô on kuitenkin helppo kirjoittaa ns. tarkenäppäinten avulla. Tästä esitettiin perusohjeita kohdassa 2.6. Tällä tavoin voidaan kirjoittaa useimmat länsi- ja pohjoiseurooppalaisissa kielissä esiintyvät tarkkeelliset kirjaimet. Ongelmiksi kuitenkin jäävät latinalaisen aakkoston lisämerkit kuten æ ja ß.
Lisäksi AltGr-näppäimen avulla voidaan tuottaa eräitä erikoismerkkejä, esimerkiksi AltGr(2) = @ ja AltGr(e) = €. Lisämerkeistä useimmat on merkitty näppäinhattuun vasempaan alakulmaan. Vanhoista näppäimistöistä saattaa kuitenkin puuttua €-merkki E-näppäimestä. Lisäksi ei yleensä ole merkitty, että AltGr(m) = µ (mikro-merkki).
Vuonna 2006 määriteltiin laajapohjaisessa ns. Kotoistus-hankkeessa uusi suomalainen näppäimistöasettelu. Vuonna 2008 se vahvistettiin kansalliseksi standardiksi (SFS 5966). Se on tarkoitettu
Käytännössä lähtökohdaksi otettiin Euroopan standardointijärjestön CENin työryhmän määrittelemä ns. eurooppalainen merkistö MES-2. Siitä otettiin latinalaiset kirjaimet, joista jätettiin pois eräät nykykielissä käyttämättömät kirjaimet ja johon toisaalta lisättiin eräitä vietnamissa käytettyjä kirjaimia.
Kyseessä on looginen näppäimistömäärittely eli -kaavio, joka on toteutettavissa tietokoneohjelmalla myös vanhaa suomalaista (tai oikeammin ruotsalais-suomalaista) fyysistä näppäimistöä käyttäen. Määrittely vain antaa merkityksiä joillekin näppäilyille, jotka aiemmin ovat olleet määrittelemättömiä (yleisellä tasolla; ohjelmakohtaisesti ne ovat saattaneet olla määriteltyjä). Käyttöä kuitenkin helpottaa, jos siirrytään uudempaan näppäimistöön, jonka näppäimiin on lisätty eräitä merkintöjä (kaiverruksia), jotta uudet merkitykset on helpompi muistaa ja jopa arvata.
Ohjeita näppäimistöasettelun lataamisesta, asentamisesta ja käyttöönotosta on sivulla jkorpela.fi/uusinappis.html.
Suomalaista monikielistä näppäinasettelua käytetään kuten vanhaa tuttua suomalaista asettelua, mutta monia lisämerkkejä voidaan tuottaa näppäinyhdistelmillä, joille ei ennen ollut käyttöä. Esimerkiksi akuutti-c ć kirjoitetaan samalla periaatteella, jolla on totuttu kirjoittamaan akuutti-e é, eli näppäilemällä ´e. Saksalainen kaksois-s ß voidaan kirjoittaa yhdistelmällä AltGr(s) samalla peruslogiikalla kuin on totuttu kirjoittamaan euron merkki € yhdistelmällä AltGr(e). Logiikka on se, että AltGr:n avulla tuotettavaksi merkiksi on määritelty sellainen, joka luonnollisella tavalla vastaa näppäimen tavallista merkitystä ja siinä olevaa merkintää.
Seuraava taulukko esittää näppäimistöllä tuotettavat uudet merkit. Tarkkeelliset ja poikkiviivalliset esitetään vain yhdellä esimerkillä. Viimeisessä sarakkeessa on esimerkki tai kommentti merkin käytöstä.
Merkintä AltGr(x) tarkoittaa, kuten aiemmin on selitetty, että AltGr-näppäin painetaan alas, sitten näpäytetään x-näppäintä ja lopuksi päästetään AltGr-näppäin ylös. Esimerkiksi hattu-s š kirjoitetaan siis näin: painetaan AltGr alas, näpäytetään heittomerkkinäppäintä ('), päästetään AltGr ylös ja lopuksi näpäytetään s-näppäintä. Versaaleja (suuraakkosia, isoja kirjaimia) kirjoitettaessa käytetään vaihto- eli shift-näppäintä silloin, kun kirjoitetaan peruskirjain. Esimerkiksi versaali hattu-s Š kirjoitetaan siis yhdistelmällä AltGr(') vaihto(s).
ajatusviiva |
– |
AltGr(-) |
suomessa, esim. 1–5 |
ajatusviiva, pitkä (m-viiva) |
— |
AltGr(vaihto(m)) |
amerikanenglannissa |
alapiste-e |
ẹ |
AltGr(.)e |
vietnamissa |
asteen merkki |
° |
AltGr(vaihto(0)) |
45°, 22 °C, 5 °F |
eth |
ð |
AltGr(d) |
islannissa |
ezh |
ʒ |
AltGr(z) |
saamessa |
hattu-s |
š |
AltGr(')s |
suomessa, esim. šeikki |
heittomerkki (kaareva) |
’ |
AltGr(,) |
suomen heittomerkki |
kaksoisakuutti-o |
ő |
AltGr(å)o |
unkarissa, esim. Petőfi |
kaksois-s |
ß |
AltGr(s) |
saksassa, esim. Strauß |
kertomerkki |
× |
AltGr(x) |
600 × 800 |
koukku-o |
ỏ |
AltGr(vaihto(p))o |
vietnamissa |
kraa |
ĸ |
AltGr(k) |
grönlannissa |
kulmalainausmerkki |
» |
AltGr(vaihto(3)) |
kirjoissa, »Hei!» |
kulmalainausmerkki, ”vasen” |
« |
AltGr(vaihto(4)) |
ranskassa, « Allo ! » |
lainausmerkki (kaareva) |
” |
AltGr(vaihto(2)) |
suomen lainausmerkki |
lyhyysmerkki-g |
ğ |
AltGr(vaihto('))g |
turkissa, esim. Erdoğan |
oe-kirjain |
œ |
AltGr(o) |
ranskassa, esim. cœur |
ogonek-e |
ę |
AltGr(vaihto(´))e |
puolassa, esim. Wałęsa |
pisteetön i |
ı |
AltGr(i) |
turkissa, esim. Elazığ |
pituusmerkki-i |
ī |
AltGr(vaihto(¨))i |
liettuassa, esim. Žīgure |
poikkiviiva-l |
ł |
AltGr(§)l |
puolassa, esim. Wojtyła |
promillemerkki |
‰ |
AltGr(5) |
tuhannesosa, esim. 1 ‰ |
rivinalinen lainausmerkki |
„ |
AltGr(vaihto(6)) |
saksassa, „Gut!“ |
rivinalinen yksink. lainausmerkki |
‚ |
AltGr(6) |
saksassa, pilkun näköinen |
rivinkeskinen piste |
· |
AltGr(vaihto(x)) |
mm. kertomerkkinä |
sarvi-o |
ơ |
AltGr(p)o |
vietnamissa |
sedilji-c |
ç |
AltGr(´)c |
ranskassa, esim. garçon |
sitova (yhdistävä) välilyönti |
|
AltGr(välilyönti) |
estää jaon eri riveille |
švaa |
ə |
AltGr(a) |
ääntämisohjeissa |
tanskalainen ä |
æ |
AltGr(ä) |
myös muissa kielissä |
tanskalainen ö |
ø |
AltGr(ö) |
myös muissa kielissä |
thorn |
þ |
AltGr(t= |
islannissa |
yläpiste-e |
ė |
AltGr(vaihto(.)e |
liettuassa, esim. Klaipėda |
ylösalainen huutomerkki |
¡ |
AltGr(vaihto(1)) |
espanjassa, ¡Allo! |
ylösalainen kysymysmerkki |
¿ |
AltGr(vaihto(+)) |
espanjassa, ¿Qué? |
ylösalainen lainausmerkki |
“ |
AltGr(vaihto(5)) |
englannissa, “Hi!” |
ylösalainen puolilainausmerkki |
‘ |
AltGr(vaihto(,)) |
englannissa, ‘Hi!’ |
ympyrä-u |
ů |
AltGr(vaihto(å))u |
tšekissä, esim. Martinů |
äng |
ŋ |
AltGr(n) |
saamessa ja ääntämisohjeissa |
Näppäimistöasettelulla voidaan kirjoittaa latinalaisten peruskirjainten lisäksi luvussa 5 kuvatut latinalaisen aakkoston lisäkirjaimet (æ ð ʒ ß ĸ œ ı đ ǥ ħ ł ø), eräitä erikoismerkkejä (ks. kuvaa edellä) sekä seuraavat tarkkeelliset kirjaimet (ja vastaavat versaalit):
á ć é í ĺ ń ó ŕ ś ú ẃ ý ź ǽ ǿ ǻ
ă ĕ ğ ĭ ŏ ŭ
ǎ č ď ě ǧ ȟ ǐ ǩ ľ ň ǒ ř š ť ǔ ž ǯ
ç ģ ķ ļ ņ ŗ ş ţ
â ĉ ê ĝ ĥ î ĵ ô ŝ û ŵ ŷ
ä ë ï ö ü ẅ ÿ
ḃ ċ ḋ ė ḟ ġ i (İ) ṁ ṗ ṡ ṫ ż
ạ ẹ ị ọ ụ ỵ
ő ű
à è ì ò ù ẁ ỳ
ả ẻ ỉ ỏ ủ ỷ
ơ ư
ā ē ī ō ū ǣ ǟ
ą ę į ǫ ų
å ů
ã ẽ ĩ ñ õ ũ ỹ
Jos tarkenäppäimen jälkeen ei paineta sellaista näppäintä, jonka kanssa tarke muodostaa jonkin edellä kuvatuista merkeistä, syntyy tarketta vastaava erillinen merkki ja sen jälkeen painetusta merkistä tuleva merkki. Esimerkiksi jos painetaan aksenttinäppäintä ja sitten x-näppäintä, syntyy merkkijono ´x (akuutti erillisenä merkkinä, U+00B4, ja x). Jos näppäilyä AltGr(§) tai AltGr(l) seuraava merkki ei ole sellainen, että sillä on poikkiviivallinen vastine edellä olevassa luettelossa, tulos on määrittelemätön; Microsoftin toteutuksessa tuloksena on tällöin negaation merkki ¬ (U+00AC).
Näppäimistöasettelu ei tietenkään estä kirjoittamasta merkkejä muilla tavoilla kuin suoraan näppäimistömäärittelyjen avulla. Esimerkiksi kohdissa 7.5 ja 7.6 kuvattavia menetelmiä voi käyttää muiden merkkien tuottamiseen.
Nykyaikaisissa tietokoneissa voidaan yleensä vaihtaa näppäimistöasettelua myös kesken kirjoittamisen. Tämä kuitenkin edellyttää, että tarvittavat asettelut on asennettu järjestelmään. Asentamiseen päästään Windowsissa avaamalla Käynnistä-valikosta Ohjauspaneeli ja sitten kohta ”Aluekohtaiset ja kieliasetukset” tai vastaava (tässä on eroa Windowsin versioiden välillä) – ei kohtaa ”Näppäimistö”, josta säädetään vain näppäimistön fyysisiä asetuksia.
Koska yksityiskohdissa on eroja järjestelmien välillä, on näppäimistöasettelun vaihto parasta opetella kokeilemalla tai sopivasta oppikirjasta tai esimerkiksi Käynnistä-valikosta löytyvän Ohje-toiminnon avulla. Seuraavassa on kuitenkin kuva eräästä keskeisestä asetusikkunasta eräässä Windowsin versiosta. Siihen päästään Tekstipalvelut ja syöttökielet -ikkunasta napsauttamalla Näppäimistöasetukset-painiketta ja sitten uudessa ikkunassa olevaa Vaihda näppäinyhdistelmä -painiketta. Näin päästään valitsemaan, millaisella näppäilyllä voidaan ottaa haluttu asettelu käyttöön kesken kirjoittamisen. Kuvassa ollaan asettamassa, että Alt(vaihto(5)) ottaa käyttöön kreikkalaisen asettelun. Lisäksi on mahdollista valita yksinkertaisempi yhdistelmä, kuten Alt(vaihto), joka vaihtaa näppäimistöasettelun seuraavaksi järjestelmässä olevaksi asetteluksi. Jos asetteluja on asennettu vain kaksi tai muutamia, Alt(vaihto) voi riittää hyvin, jolloin ei tarvitse painaa mieleen asetteluille antamiaan numeroita.
Windows esittää normaalisti kuvaruudussa alhaalla oikealla ns. ilmaisinpalkissa eräitä tilatietoja, joista yksi on käytössä olevan näppäimistöasettelun kieli. Se ilmaistaan kaksikirjaimisella kielikoodilla, esimerkiksi FI = suomi, EN = englanti, EL = kreikka ja RU = venäjä. Napsauttamalla tätä koodia hiiren kakkospainikkeella pääset vaihtamaan asetuksen, mutta yleensä on helpointa käyttää edellä mainittuja näppäinyhdistelmiä. Huomaa, että näppäimistöasettelu on ikkunakohtainen ja sen vaihtaminen vaikuttaa kulloinkin aktiivisena (valittuna) olevaan ikkunaan. Napsauta siis tarvittaessa ensin haluamasi ikkunan yläpalkkia.
Esimerkiksi nykykreikan kirjoittaminen onnistuu tavallisella suomalaisella näppäimistöllä melko helposti, kunhan otetaan käyttöön kreikkalainen näppäimistöasettelu. Edellä kuvatuilla tavoilla saadaan yleensä aikaan tilanne, jossa myös voidaan kesken kirjoittamisen vaihtaa näppäimistöasettelu suomalaisesta kreikkalaiseksi tai toisinpäin esimerkiksi näppäilyllä Alt(vaihto). Seuraava kuva esittää Microsoftin kreikkalaista näppäimistöasettelua havainnollisuuden vuoksi ja muistin tueksi. Siinä esimerkiksi α kirjoitetaan a-näppäimellä, β b-näppäimellä jne. Muutamalle merkille ei ole ollut luonnollista paikkaa, joten niiden sijainti (esimerkiksi sananloppuisen sigman ς sijainti w-näppäimisessä) on siis katsottava asettelua esittävästä kuvasta.
Valitettavasti esimerkiksi Microsoftin venäläinen näppäimistöasettelu ei ole samalla tavoin suomalaiseen näppäimistöön sopiva, vaan se on tehty Venäjällä käytettävien kirjoituskoneiden ja tietokonenäppäimistöjen näppäinjärjestyksen mukaiseksi. Sitäkin kuitenkin oppii käyttämään pienen harjoittelun jälkeen näppäimistöasettelun kuvan avulla – etenkin, jos osaa opetella kirjoittamaan ”sokkona”, katsomatta näppäinhattujen merkintöjä, koska ne lähinnä johtavat tällöin harhaan (q-näppäimestä tulee й, w-näppäimestä ц jne.).
Toinen vaihtoehto on hankkia jostain muualta toisentyyppinen, ns. foneettinen asettelu. Sellaisessa asettelussa suurin osa näppäimistä tuottaa kyrillisen kirjaimen, jonka translitterointivastine on näppäinhatussa oleva merkki. Esimerkiksi t-näppäin tuottaa kyrillisen т:n, r-näppäin kyrillisen р:n jne. Sivulta jkorpela.fi/rufi.html löytyy foneettinen asettelu, jolla voidaan venäjän lisäksi kirjoittaa muitakin kyrillisin aakkosin kirjoitettavia slaavilaisia kieliä kuten ukrainaa ja serbiaa.
On myös mahdollista tehdä omia näppäinasetteluja joko täysin tyhjästä aloittaen tai käyttäen jotain yleistä näppäinasettelua pohjana. Muutos voi olla vaikkapa vain yhden käyttäjälle tärkeän merkin lisääminen hänelle sopivaan paikkaan sellaisen merkin tilalle, jota hän ei tarvitse. Näppäinasettelujen tekeminen ei ole kovin vaikeaa mutta vaatii oman opettelunsa englanninkielisten ohjeiden avulla. Tarkoitukseen sopivan maksuttoman ohjelman Windowsia käyttävään tietokoneeseen löytää Internetistä hakukoneella, kun käyttää hakulauseketta "windows keyboard layout generator".
Tietokonejärjestelmässä on yleensä jokin menetelmä, jolla voidaan kirjoittaa periaatteessa mikä tahansa Unicode-merkki. Word-ohjelmassa voidaan käyttää toimintoa Lisää/Merkki ja valita Merkki-välilehti, jolla on laaja valikoima erikoismerkkejä.
Windowsin Merkistö-ohjelmalla (englanniksi CharMap) voidaan valita merkkejä ja kopioida be leikepöydälle, josta ne voidaan liittää esimerkiksi Ctrl(v):llä haluttuun tekstin kohtaan missä tahansa ohjelmassa. Tämä on tekstinkäsittelyssä hiukan hankalampaa kuin ohjelman oman Lisää/Merkki-toiminnon käyttö mutta tarjoaa usein monipuolisempia mahdollisuuksia. Mitä uudemmasta Windowsista on kyse, sen kehittyneempi Merkistö-ohjelma on.
Valitettavasti Merkistö-ohjelma on Windowsissa aika lailla piilotettuna. Esimerkiksi Windows 10:ssä se on Käynnistä-valikon kohdassa ”Windowsin apuohjelmat”. Voit kuitenkin helpottaa Merkistö-ohjelman käynnistämistä esimerkiksi tekemällä sille pikakuvakkeen työpöydälle.
Merkistö-ohjelman pääikkunassa näkyy kerrallaan 200 merkkiä. Merkit ovat Unicode-koodiarvon mukaisessa järjestyksessä, joka ei suinkaan aina vastaa merkkien luonnollista järjestystä. Käyttämällä oikealla olevaa vierityspalkkia saat esille merkkivalikoiman muita osia. Useimmat latinalaisen aakkoston merkit, tarkkeelliset mukaan lukien, ovat valikoiman alkupäässä. Alussa on Latin-1-merkistö, sitten Latinalaisen merkistön laajennusosa A (Wordin valikossa ”Latinalainen, laajennettu-A”), jossa ovat useimmat muut tarkkeelliset latinalaiset kirjaimet aakkosjärjestyksessä: Āā㥹Ćć jne.
Merkistö-ohjelman käyttö on melko selväpiirteistä: haetaan haluttu merkki taulukosta, kaksoisnapsautetaan sitä ja sitten napsautetaan Kopioi-painiketta, jolloin merkki (tai merkkien jono) kopioituu leikepöydälle. Tutustu kuitenkin Merkistö-ohjelman tarjoamiin mahdollisuuksiin etsiä merkki esimerkiksi tyypeittäisen luokittelun (”alialueet”) mukaan.
Vinkkejä Merkistö-ohjelman käyttöön:
Kun tunnetaan merkin Unicode-koodiarvo heksadesimaalisena, voidaan Word-ohjelmassa ja eräissä muissakin ohjelmissa kirjoittaa merkki Alt(x)-menetelmällä. Tämä tarkoittaa, että kirjoitetaan ensin koodiarvo ja sitten Alt(x) eli näpäytetään x-näppäintä niin, että Alt-näppäin on alas painettuna. Tällöin koodiarvo korvautuu itse merkillä. Jos esimerkiksi kirjoitetaan 141 Alt(x), saadaan merkki U+0141 eli poikkiviiva-L Ł.
Menetelmä toimii toiseenkin suuntaan: Jos tiedostossa on merkki etkä osaa päätellä sen Unicode-koodiarvoa, voit esimerkiksi Wordissa napsauttaa kohtaa merkin jäljessä niin, että kohdistin tulee