Kaunokirjallinen teksti koostuu lähes yksinomaan kirjaimin kirjoitetuista sanoista, sanaväleistä ja välimerkeistä. Muunlaisissa teksteissä, etenkin tieteellisissä ja teknisissä, käytetään sanojen asemesta myös monenlaisia symboleita. Tietysti sanatkin ovat symboleja, mutta seuraavassa tarkoitan symbolilla tekstissä olevaa merkintää, jota ei lueta samojen sääntöjen mukaan kuin tavallisia sanoja.
Symboli voi kyllä esittää sanaa, mutta kirjoitettuna muuten kuin sanan äänteitä esittävillä kirjaimilla. Esimerkiksi merkin ”§” voi sanoa esittävän sanaa pykälä.
Käsitteeseen siis sisältyy, että symbolien käyttö väistämättä merkitsee poikkeamista foneemiperiaatteesta. Symboleja tietysti tarvitaan. Suomen kielessä ne voivat aiheuttaa erityisiä ongelmia siksi, että niihin on voitava liittää taivutuspäätteitä.
Symboli voi olla kirjainjono, mutta sellainen, jota ei lueta ollenkaan foneemiperiaatteen mukaan, vaan kirjainlyhenteenä kirjaimittain eli sanomalla kirjainten nimet peräkkäin (VTKK luetaan [vee tee koo koo]). Tavallisesti kyseessä on alkukirjainlyhenne, eli se on muodostettu sanojen alkukirjaimista.
Symboli voi olla myös lyhenne tai tunnus, joka lukijan pitää osata ”avata” jonkin koodiston mukaan. Esimerkiksi mmluetaan [millimetri(ä)], mm. luetaan [muun muassa] ja MM luetaan [mailmanmestaruus]. Eri aloilla ja eri asiayhteyksissä voi olla erilaisia koodistoja, joten aivan sama lyhenne tai tunnus voi vaatia erilaisia lukutapoja. Esimerkiksi IL tarkoittaa lehdistä puhuttaessa Iltalehteä, laitoksista puhuttaessa Ilmatieteen laitosta ja kansainvälisenä maatunnuksena Israelia.
Symbolit saattavat myös sisältää aivan muita merkkejä kuin kirjaimia. Esimerkiksi © luetaan [kopirait] tai [tekijänoikeus], ja a + b luetaan [aa plus bee]. Myös numerot ovat symboleita, ja lukutapa riippuu tekstiyhteydestä ja lukijan harkinnastakin; esimerkiksi 505 voidaan lukea viisisataaviisi tai viisi nolla viisi.
Alkukirjainlyhenne voidaan periaatteessa lukea kolmella tavalla (tässä esimerkkinä entisen pankin nimen lyhenne SYP):
Mikään itse lyhenteessä ei kerro tarkoitettua lukutapaa. Lyhenteeseen liitetty taivutuspääte saattaa joissakin tapauksissa antaa vihjeen lukutavasta. Lyhenne saattaa olla sellainen, että sen lukeminen sanana ei ole mielekästä, esimerkiksi pelkästään konsonanteista koostuva. Tämä on kuitenkin tulkinnanvaraista, ja sana lukeminen voi olla ”luovaa”; esimerkiksi lyhenne EBCDIC lausutaan usein [ebsdik], vaikka missään kielessä c-kirjain ei äänny s-äänteenä konsonantin edellä.
Taivutuspäätteen merkitseminen riippuu ainakin periaatteessa lukutavasta, koska se puolestaan vaikuttaa siihen, mikä on taivutuspäätteen asu:
Lyhenteiden avaaminen luettaessa ja sen mukainen päätteen merkitseminen on harvinaista. Jos todella halutaan, että tekstiä luettaessa sanotaan Suomen Yhdyspankissa, niin yleensä myös kirjoitetaan näin.
Kokonaan versaalilla kirjoitetut lyhenteet luetaan usein kirjaimittain, mutta versaalin käyttö yksinään ei riitä osoittamaan lukutapaa. Esimerkiksi HUS luetaan sanana, [hus], ja USA luetaan vaihtelevasti joko kirjaimittain [uu ess aa] tai (lähinnä arkikielessä) sanana [usa].
Jos lyhenne luetaan aina tai yleisimmin sanan tavoin, voidaan jo puhua lyhennesanasta. Voi tapahtua, että alkuperäisestä nimestä luovutaan ja lyhennesana otetaan uudeksi nimeksi tai uuden nimen osaksi. Näin voi käydä silloinkin, kun lyhenne luetaan kirjaimittain. Esimerkiksi VR oli alkujaan nimen Valtionrautatiet lyhenne, mutta vanhaa nimeä ei enää käytetä, ja yhtymän nimessä VR-Yhtymä osa VR voidaan lukea vain [vee är].
Lyhenne esim. luetaan usein ”sellaisenaan” eikä avattuna sanaksi esimerkiksi. Se voisi kehittyä sanaksi, joka sitten tietysti kirjoitettaisiin ilman pistettä (esim).
Kirjaimen nimenä käytetään kirjoituksessa yleisimmin kirjainta itseään eikä sen äänneasua, siis esimerkiksi c eikä see. Molempia käytäntöjä voidaan perustella. Jälkimmäinen olisi foneemiperiaatteen mukainen, ja se on käytännöllisempi taivutusmuodoissa, esimerkiksi seetä eikä c:tä.
Jos kirjaimen nimi kirjoitetaan äänneasun mukaan, olisi konsonanttiin loppuvat nimet perusteltua kirjoittaa eri tavoin sen mukaan, alkaako seuraava sana vokaalilla. Esimerkiksi s-kirjaimen nimi on äs tai ässä, mutta jos mainitaan peräkkäin s- ja a-kirjain, niin lyhyempää nimeä käytettäessä äänneasun mukaista olisi kirjoittaa äss aa.
Taivutuspäätteiden liittäminen sellaisiin kirjoitetun kielen ilmaisuihin, joita ei lueta normaalien sanojen tapaan, tuottaa usein hankaluuksia sekä kirjoittajalle että lukijalle. Perussääntöhän on, että ilmaisuun liitetään kaksoispiste ja sen jälkeen taivutuspääte, esimerkiksi USA:ssa.
Jos kuitenkin päätteeseen kuuluu vokaalin pidentymä, kirjoitetaan kaksi vokaalimerkkiä, vaikka niistä oikeastaan ensimmäinen kuuluu sanan vartaloon. Tällainen tilanne voi esiintyä partitiivissa ja illatiivissa, esimerkiksi x:ää, IBM:ään.
Säännöt voivat olla hankalia sekä kirjoittajille että lukijoille. Kirjoittajan on tunnistettava, mikä ilmauksessa on päätettä, eikä tämä suinkaan aina ole selvää. Ääntämyksen ja kirjoituksen suhde on usein mutkikas, ja se riippuu myös ilmauksen perusmuodon äänneasusta, jota ei voi pelkistä kirjoitusmerkeistä päätellä. Esimerkiksi lyhenteen IBM normaali äänneasu on [ii bee äm], mutta taivutettua muotoa luettaessa on osattava tulkita, että viimeinen kirjain ääntyykin tässä [ämmä]. Siihen liitetään merkitty pääte ään ottaen huomioon edellä mainittu sääntö pitkän vokaalin merkinnästä, jolloin päädytään asuun [ii bee ämmään].
Myös numeroita voi pitää symboleina: ne eivät tarkoita äänteitä, vaan numero tai numeroiden jono luetaan yleensö lukusanoja käyttäen. Tämä on suurelta osin säännöllistä, joskin säännöt ovat melko mutkikkaat.
Lisäksi vain osa numerojonoista luetaan lukusanoina, osa (esimerkiksi puhelinnumerot) luettelemalla numerot peräkkäin; esimerkiksi 123 voidaan lukea [satakaksikymmentäkolme] tai [yksi kaksi kolme].
Erityisen poikkeaman säännöllisyydestä aiheuttaa se, että numerojono (tai numerojono, jota seuraa piste) luetaan lauseyhteyden mukaan joko perusmuodossa olevana lukusanana tai sellaisena, jonka sijamuodon määrää seuraava sana. Esimerkiksi 11 luetaan yleensä [viisitoista], mutta ilmauksessa 11 tapauksessa se luetaan [viidessätoista]. Tästä on se poikkeus, että partitiivin pääte merkitään aina, esimerkiksi 11:tä tapausta [yhtätoista tapausta]; ilmaus 11 tapausta luettaisiin [yhtätoista tapausta].
Poikkeama johtuu siitä, että on haluttu helpottaa lukuja sisältävien ilmausten kirjoittamista. Lukusanoja käytetään hyvin usein niin, että ne ovat samassa sijassa kuin seuraava sana, jota luku määrittää, esimerkiksi sadalla eurolla ja kahdelletoista hengelle. Päätteiden järjestelmällinen merkitseminen tuottaisi sellaisia ilmauksia kuin 100:lla eurolla ja 12:lle hengelle. Yleensä normien mukaiset asut 100 eurolla ja 12 hengelle ovat vaikeuksitta luettavissa, vaikka kirjoituksen ja ääntämisen suhde on hyvinkin epäsäännöllinen.
Joissakin tapauksissa kirjoitettua tekstiä on vaikea lukea siksi, ettei ole ilmeistä, tarkoittaako numeromerkintä lukusanaa, joka on seuraavan sanan mukaisessa sijamuodossa. Joskus 100 eurolla onkin lauseyhteydessä, jossa se on luettava [sata eurolla]. Kirjoitusjärjestelmässä ei kuitenkaan ole tapaa ilmaista, että numerot on luettava taivuttamattomana lukuna.
Joukko ongelmia vältettäisiin ja kirjoitus saataisiin paremmin ääntämistä vastaavaksi, jos numeroin merkittyyn lukuun aina liitettäisiin taivutuspääte, paitsi tietysti silloin, kun numerot on luettava perusmuotoisena lukuna. Tämä ei kuitenkaan ole realistinen ajatus, mutta voi kysyä, olisiko joissakin tilanteissa parempi merkitä pääte tyyliin 100:lla eurolla. Ei ole aivan selvää, sallivatko normit sen. Voidaan nimittäin tulkita, että säännöt vain sallivat päätteen merkinnän pois jättämisen, eivät vaadi sitä.
Kun numerot on luettava järjestyslukuna, merkitään kaksoispisteen jälkeen sekä järjestysluvun tunnus että sijapääte, esimerkiksi 8:nneksi [kahdeksanneksi]. Tällaiset merkinnät ovat hankalia kirjoittaa ja lukea, ja nykyisin esimerkiksi sellainen ilmaus kuin kahdeksanneksi paras kirjoitetaan lyhyesti 8. paras, vaikka tämä ei olekaan sääntöjen mukaista.
Joissakin tapauksissa lukuilmaus voidaan tulkita kahdella tavalla. Esimerkiksi 6:tta luetaan [kuudetta], joka voi olla perusluvun kuusi abessiivi (’ilman kuutta’) tai järjestysluvun kuudes partitiivi. Tässä siis merkitykset ovat erilaisia, mutta lukutapa sama. Sen sijaan 3:tta voidaan lukea joko [kolmetta] (perusluvun abessiivi) tai [kolmatta] (järjestysluvun partitiivi). Käytännössä abessiivit ovat harvinaisuuksia, joten tulkinta on yleensä selvä.
Roomalaiset numerot aiheuttavat oman ongelmansa, koska niissä käytetyt merkit ovat myös versaalikirjaimia. Esimerkiksi II voi olla myös nimi Ii versaaleilla kirjoitettuna tai alkukirjainlyhenne. Tästä on aiheutunut todellisia ongelmia, kun navigaattoriohjelmat saattavat sanoa [olet tiellä kehä ii] eikä [olet tiellä kehä kaksi].