Arabiasta on useita muotoja, joita voisi pitää myös erillisinä kielinä. Yleensä kirjoitetaan vain kielimuotoa, joka on arabiankielisten yhteinen kirjakieli ja josta käytetään nimityksiä yleisarabia, kirja-arabia, standardiarabia ja klassillinen arabia. Viimeksi mainittu on kuitenkin ehkä parempi varata tarkoittamaan Koraanissa käytettyä kielimuotoa, josta nykyinen yleisarabia on kehittynyt.
Arabiaa kirjoitetaan erityisillä arabialaisilla kirjaimilla, joita toisaalta käytetään useiden muidenkin kielten kirjoittamiseen. Toissijaisesti arabiaa kirjoitetaan myös siirtokirjoituksella latinalaisin merkein. Arabialaisten kirjainten historiaa ja suhdetta latinalaisiin kirjaimiin käsiteltiin jossain määrin luvussa 3 esitetyissä kirjainten tarinoissa.
Maltan saarella puhuttua arabian muotoa kirjoitetaan latinalaisin kirjaimin. Osittain tästäkin syystä sitä pidetään yleensä omana kielenään, maltan kielenä.
Muutoin ei arabian muita kuin yleisarabiaa juurikaan kirjoiteta, vaan ne ovat käytössä vain puhekielinä. Arabiankielisissä maissa ihmiset osaavat toisaalta maan tai alueen puhuttua arabian muotoa, toisaalta ainakin jossain määrin yleisarabiaa. Nämä kielimuodot eroavat toisistaan usein melkoisesti. Vastaava tilanne, josta käytetään nimitystä diglossia, vallitsi osittain Länsi-Euroopassa keskiajalla, jolloin monissa maissa puhuttiin latinasta kehittynyttä (romaanista) kieltä ja oppineisto osasi myös latinaa.
Arabialaisia kirjaimia käytetään myös muiden kielten kuin arabian, esimerkiksi persian eli farsin, kirjoittamiseen. Sellaisten kielten sanojen siirtokirjoituksesta ei ole suomalaista standardia. Yleensä käytetään samoja kirjoitusasuja kuin englannissa tai ranskassa.
Arabiaa kirjoitetaan oikealta vasemmalle. Jos latinalaisin kirjaimin kirjoitetun tekstin joukossa on arabialaisin kirjaimin kirjoitettuja sanoja (tai toisinpäin), muuttuu siis tekstin lukusuunta, eli lukijan on osattava hypätä arabialaisen tekstijakson loppuun, lukea se oikealta vasemmalle ja sitten hypätä sen jälkeisen tekstin alku. Siirtokirjoitettu teksti kuitenkin kirjoitetaan vasemmalta oikealle.
Tietokoneohjelma, joka pystyy käsittelemään arabialaisia kirjaimia, täytyy osata kirjoittaa ne oikealta vasemmalle automaattisesti. Ohjelman käyttäjä siis kirjoittaa kirjaimet samassa järjestyksessä kuin ne esiintyvät puhutussa kielessä, ja ohjelma valitsee kirjoitussuunnan automaattisesti oikein. Tämä perustuu siihen, että kirjoitussuunta on kirjaimeen (mm. Unicode-standardissa) liitetty ominaisuus.
Arabialaisella merkillä voi olla useita ulkoasuja sen mukaan, millaisessa kohtaa sanaa se esiintyy: itsenäisenä, sanan alussa, sanan sisällä vai sanan lopussa. Siirtokirjoituksessa näitä eroja ei oteta huomioon. Merkistötaulukoissa yms. merkit esitetään yleensä itsenäisessä (erillisessä) muodossa. Nämä muodot ovat normaalikirjoituksessa suhteellisen harvinaisia.
Arabialainen kirjoitus on kaunokirjoitustyyppistä eli merkit liittyvät toisiinsa yleensä ”juoksevasti”. Tämä saavutetaan paljolti sen ansiosta, että useimpien kirjainten sanansisäinen muoto on suunniteltu viereisiin kirjaimiin liittyväksi.
Arabiankielisiä nimiä ja sanoja, joskus myös pitempiä tekstijaksoja, voidaan siirtokirjoittaa latinalaisin kirjaimin. Tähän on olemassa hyvinkin monia menetelmiä – sekä tarkkoja säännöstöjä (kaavoja) että suurpiirteisempiä käytäntöjä. Vaihtelua on senkin mukaan, minkä maan nimistöstä on kyse. Terho Itkosen Uusi kieliopas kuvailee:
Useimpien arabimaiden nimistöntuntijat ovat sopineet englannin mukaisesta arabialaisnimien kirjoitustavasta, mutta erityisesti läntisimmissä arabimaissa on vanhastaan käytetyllä ranskan mukaisella kirjoitustavalla vankka jalansija.
Arabiassa kirjoitetaan normaalisti vain konsonanttien ja pitkien vokaalien merkit, ja eikä konsonanttien kahdennusta yleensä merkitä. Arabian perusmerkistöön kuuluukin vain 28 konsonanttikirjainta, joista kolmea käytetään myös pitkien vokaalien merkkeinä.
Lukijan edellytetään osaavan lukea sanat oikein kielentuntemuksensa perusteella. Käytännössä on usein tunnistettava sanan asema lauseyhteydessä, jotta voidaan lukea siihen oikeat vokaalit.
Koraanin (al-Qurʾān) tekstissä ja joissakin muissa yhteyksissä teksti vokalisoidaan eli siihen merkitään myös lyhyet vokaalit ja konsonanttien kahdennus konsonanttikirjaimiin liitettävillä lisämerkeillä. Näitä ei pidä sekoittaa itse konsonanttikirjainten sisältämiin, kirjaimen pääosasta erillään oleviin osiin, kuten pistekolmikkoon, joka erottaa šīn-kirjaimen sīn-kirjaimesta.
Siirtokirjoitus tehdään yleensä ikään kuin alkuteksti olisi vokalisoitu eli sisältäisi lyhyiden vokaalien ja konsonanttien kahdennuksen merkit. Periaatteessa ISO 233:n mukainen siirtokirjoitus on kuitenkin puhdas translitteraatio: vain alkutekstissä todella olevilla merkeillä on vastineet. Täten esimerkiksi sana مغرب (Maghrib ’Marokko’) translitteroidaan Mġrb. Ymmärrettävistä syistä tällaista translitterointia käytetään lähinnä vain tieteellisissä yhteyksissä.
Seuraavassa käsitellään eräitä menetelmiä, nimittäin kansainvälisen standardin ISO 233 mukaista menetelmää, joka siis on puhdas translitteraatio (merkki merkiltä siirtäminen) ja kahta suomalaisen standardin SFS 5755 mukaista menetelmää, joista ensimmäinen on tarkoitettu lähinnä tieteelliseen käyttöön, toinen yleiskieliseen käyttöön. Jälkimmäinen on osittain paljonkin epätarkempi. Käytännössä esimerkiksi sanomalehdissä ja yleensä kirjoissakin käytettävä arabian siirtokirjoitus noudattaa jotakin englanninkielisen maailman monista käytännöistä. Tavallisesti se muistuttaa SFS 5755:n mukaista yleiskieleen tarkoitettua menetelmää mutta š:n tilalla on sh ja usein alif ja ʿayn jätetään merkitsemättä (eli merkkejä ʾ ja ع ei käytetä), ja lisäksi pitkien vokaalien merkintä voi olla toisenlainen.
Seuraava taulukko esittää arabian konsonanttien vastineet mainituissa siirtokirjoituksissa.
merkki |
UCS |
nimi |
ISO |
tiet. |
yl. |
IPA |
---|---|---|---|---|---|---|
ا |
0627 |
alif (alef) |
ʾ |
ʾ ∼ – |
ʔ |
|
آ |
0622 |
alif madda (alef with madda above) |
ʾâ |
ʾā |
ʾa |
ʔa: |
ء |
0621 |
hamza (hamza) |
ˈ ∼ ˌ |
ʾ ∼ – |
ʔ |
|
ب |
0628 |
bāʾ (beh) |
b |
b |
||
ت |
062A |
tāʾ (teh) |
t |
t |
||
ث |
062B |
thāʾ (theh) |
ṯ |
th |
θ |
|
ج |
062C |
jīm (jeem) |
ǧ |
j ∼ g |
ʤ |
|
ح |
062D |
ḥāʾ (hah) |
ḥ |
h |
ħ |
|
خ |
062E |
khāʾ (khah) |
ẖ |
kh |
x |
|
د |
062F |
dāl (dal) |
d |
d |
||
ذ |
0630 |
dhāl (thal) |
ḏ |
dh |
ð |
|
ر |
0631 |
rāʾ (reh) |
r |
r |
||
ز |
0632 |
zāy (zain) |
z |
z |
||
س |
0633 |
sīn (seen) |
s |
s |
||
ش |
0634 |
šīn (sheen) |
š |
ʃ |
||
ص |
0635 |
ṣād (sad) |
ṣ |
s |
s̴ |
|
ض |
0636 |
ḍād (dad) |
ḍ |
d |
d̴ |
|
ط |
0637 |
ṭāʾ (tah) |
ṭ |
t |
t̴ |
|
ظ |
0638 |
ẓāʾ (zah) |
ẓ |
z |
z̴ |
|
ع |
0639 |
ʿayn (ain) |
ʿ |
ʕ |
||
غ |
063A |
ghayn (ghain) |
ġ |
gh |
ɣ |
|
ف |
0641 |
fāʾ (feh) |
f |
f |
||
ق |
0642 |
qāf (qaf) |
q |
q |
||
ك |
0643 |
kāf (kaf) |
k |
k |
||
ل |
0644 |
lām (lam) |
l |
l |
||
م |
0645 |
mīm (meem) |
m |
m |
||
ن |
0646 |
nūn (noon) |
n |
n |
||
ه |
0647 |
hāʾ (heh) |
h |
h |
||
ة |
0629 |
tāʾ marbūṭa (teh marbuta) |
ẗ |
– ∼ t |
(t) |
|
و |
0648 |
wāw (waw) |
w |
w ∼ ū |
w ∼ u |
w |
ي |
064A |
yāʾ (yeh) |
y |
y ∼ ī |
y ∼ i |
j |
ى |
0649 |
alif maqṣūra (alef maksura) |
ỳ |
ā |
a |
a: |
Taulukon sarakkeet ovat seuraavat:
Huomautuksia:
Tildeoperaattori ”∼” tarkoittaa taulukossa vaihtoehtoisuutta, joka riippuu siirtokirjoitettavasta sanasta.
Ajatusviiva ”–” tarkoittaa taulukossa sitä, että arabian merkillä ei ole siirtokirjoituksessa mitään vastinetta.
Alifin vastine tieteellisessä siirtokirjoituksessa on ilmeisesti tulkittava Unicode-merkiksi modifier letter right half ring (U+02BE), ks. kooditaulukkoa Spacing Modifier Letters, joka kuvaa merkkiä sanoilla ”transliteration of Arabic hamza (glottal stop)”. Toisaalta SFS 5755 sanoo alaviitteessä (sulkeissa viitataan esimerkkisanaan Raʾs): ”Merkki on korvattavissa myös puolilainausmerkillä (Ra's) tai heittomerkillä (Ra´s).” Esitysasu on sellainen, ettei siitä voi yksiselitteisesti päätellä, mitä merkkejä tässä tarkoitetaan. Mahdollisesti on tarkoitettu, että alifin normaali vastine olisikin suomen kielen mukainen yksinkertainen lainausmerkki eli heittomerkki ’ ja sen korvikkeina voisi käyttää Ascii-heittomerkkiä ja akuuttia, joita standardissa kutsutaan nimillä ”puolilainausmerkki” ja ”heittomerkki”.
Hamza voi esiintyä myös alifin päälle kirjoitettuna, yhdistelmämerkkinä أ (U+0623). Se käsitellään siirtokirjoituksessa kuten alif, jota seuraa hamza.
Alifin, alif maddan ja hamzan käsittelyn kuvaus SFS 5755:ssä on hyvin sekava ja ristiriitainen. Ilmeisesti on tarkoitettu, että ne jätetään ilman mitään vastinetta sanan alussa, yleiskielisessä siirtokirjoituksessa myös sanan lopussa. (Mutta ks. huomautuksia vokaalien merkitsemisestä jäljempänä.)
ʿAyn-kirjaimen vastine tieteellisessä siirtokirjoituksessa on ilmeisesti tulkittava Unicode-merkiksi modifier letter left half ring (U+02BF). SFS 5755 esittää kuitenkin esimerkkeinä yleiskielisestä siirtokirjoituksesta eri vaihtoehtoja: Saʿd ja Sa’d sekä toisesta nimestä ʿAli, ’Ali ja Ali. Se selittää alaviitteessä: ”Kaikissa asemissa suositellaan ʿ-merkin käyttöä tai ainakin sen korvaamista merkeillä ’, ' tai ´. Sanan alussa merkki voidaan yleiskielisessä translitteraatiossa kuitenkin jättää vaille vastinetta. Vokaalin kahdentamista (esim. Saad) ei suositella.” (Standardissa ei ole selvennetty, mitä merkkiä varsinaisesti tulisi käyttää, ja mahdollisesti siinä tarkoitetaan yksinkertaista vasemmanpuoleista lainausmerkkiä.)
Jīm-kirjaimen vastine on SFS 5755:n mukaan yleensä j (ääntyy dž) mutta ”egyptiläisissä nimissä Kairossa noudatettavan ääntämistavan mukaisesti” g (esim. Gamal, ei Jamal). ISO 233:n mukainen vastine on hattu-g ǧ.
Šīn-merkin vastine on SFS 5755:n mukaan š, mutta kaksoiskirjainta sh voidaan käyttää, ”mikäli tarkemerkin toteuttaminen on teknisesti mahdotonta”. Käytännössä sh-yhdistelmä on erittäin yleinen arabian siirtokirjoituksessa niin englannin- kuin suomenkielisissäkin teksteissä.
Wāw-kirjaimen vastineena on SFS 5755:n mukaan w silloin, kun se tarkoittaa konsonanttia, u silloin, kun se tarkoittaa pitkää vokaalia. Toisaalta mainitaan, että yleiskielisessä siirtokirjoituksessa sekä ”aw” että ”au” ovat mahdollisia. Taustalla on, että tällaisissa tapauksissa w on arabiassa tulkittava lähinnä konsonantiksi, mutta suomalainen helposti tulkitsee ja ääntää sen diftongin jälkikomponentiksi.
Yāʾ-merkin vastineena on SFS 5755:n mukaan y silloin, kun se tarkoittaa konsonanttia, i silloin, kun se tarkoittaa vokaalia (pitkää i:tä). Lisäksi yleiskielisessä siirtokirjoituksessa sekä ”ay” että ”ai” ovat mahdollisia. Vertaa edelliseen kohtaan. On hyvä noudattaa yhtenäistä linjaa niin, että käytetään johdonmukaisesti joko kaikissa sanoissa kirjoitustapaa ”aw” ja ”ay” tai kaikissa sanoissa kirjoitustapaa ”au” ja ”ai”, kuitenkin joidenkin nimien sovinnaisasut huomioon ottaen. Kirjoitustapa ”au” ja ”ai” sopii paremmin yleistajuisiin teksteihin.
Alapisteellisten konsonanttien kirjoittaminen on usein hankalaa. Ks. luvussa 4 olevia ohjeita alapisteestä.
Arabian kielen määräävä artikkeli ال siirtokirjoitetaan SFS 5755:n mukaan ”al” ääntämyksestä riippumatta. Monissa yhteyksissä se kuitenkin kirjoitetaan ääntämyksen mukaisesti ottaen huomioon, että konsonantti assimiloituu ns. aurinkokonsonantin edellä tämän konsonantin kaltaiseksi, esim. al-Šams kirjoitetaan aš-Šams. (Aurinkokirjaimet ovat ne, jotka esitetään yleiskielisessä siirtokirjoituksessa merkillä t, th, d, dh, r, z, s, š, l tai n.) Näin menetellään usein kartoissa mm. siksi, että tällainen käytäntö on Yhdistyneiden kansakuntien paikannimiä koskevan suosituksen mukaista. ISO 233:n mukaan artikkelin translitteraatio on ”ʾˈal”, eikä tällöin käytetä yhdysmerkkiä artikkelin ja pääsanan välissä.
Usein artikkeli kirjoitetaan puhutun arabian mukaan el. Esimerkiksi 2. maailmansodan historiassa mainitaan yleensä El Alamein, joka on egyptinarabian mukainen asu. Yleisarabialaisesta asusta siirtokirjoitettuna nimi olisi al-Alamain tai al-Alamayn.
Yleisarabiassa on vain kolme vokaaliäännettä, a, i ja u, joista kukin voi esiintyä lyhyenä tai pitkänä. Pitkillä vokaaleilla on omat merkkinsä, kun taas lyhyet vokaalit jätetään yleensä merkitsemättä arabialaisessa kirjoituksessa. Ne kuitenkin merkitään kirjaimiin liittyvillä, niistä erilleen kirjoitetuilla pienillä lisämerkeillä silloin, kun ääntämyksen osoittamista pidetään tärkeänä. Lyhyet vokaalit merkitään yleensä mm. oppikirjoissa ja sanakirjoissa sekä Koraanissa.
Arabian muissa muodoissa – jotka ovat pääosin vain puhekieliä – on muitakin vokaaleja. Monet arabialaisperäiset nimet ja muut sanat esiintyvät milloin yleisarabian, milloin jonkin puhutun arabian mukaisessa muodossa. Tästä johtuu suurin osa siitä vaihtelusta, jota esiintyy kirjoitettaessa niitä latinalaisin kirjaimin, esimerkiksi Muhammed ∼ Muhammad.
Myös yleisarabian vokaaleissa on itse asiassa vaihtelua niin, että kielessä on kolme vokaalifoneemia mutta ne voivat toteutua hyvinkin eri tavoin eri äänneympäristöissä. Esimerkiksi a:lla merkitty vokaali voi ääntyä [ɑ] (kuten suomen a) tai [ʌ] tai [a] tai [æ] (kuten suomen ä). Useimmiten se ääntyy enemmänkin suomen ä:n kuin suomen a:n kaltaisena, ja tästä osaltaan johtuu nimitys ähläm sähläm.
Arabian siirtokirjoitusta kutsutaan yleensä translitteraatioksi, vaikka siinä lähes aina (joitakin tieteellisiä asiayhteyksiä lukuun ottamatta) merkitään myös lyhyet vokaalit, vaikka niille ei ole vastinetta normaalissa arabialaisessa kirjoitusasussa.
Jos teksti vokalisoidaan eli lyhyet vokaalit merkitään arabialaisessa kirjoituksessa, esitetään konsonanttia seuraava a-äänne konsonanttikirjaimen päällä olevalla, hiukan akuutin (´) tapaisella lisämerkillä. Lyhyt i-äänne esitetään vastaavalla konsonanttikirjaimen alla olevalla lisämerkillä. Lyhyt u-äänne esitetään konsonanttikirjaimen päällä olevalla toisenlaisella lisämerkillä. Käytetään myös pyöreähköä merkkiä, joka osoittaa, että konsonantin jälkeen ei tule vokaalia; se jätetään siirtokirjoituksessa yleensä merkitsemättä, mutta ISO 233:ssa sen vastineena on pieni ympyrä. Näiden lisämerkkien nimet ovat fatḥa, kasra, ḍamma ja sukūn. Seuraavassa luettelossa on nämä merkit liitetty dāl-kirjaimeen (د).
دَ da
دِ di
دُ du
دْ d (d˚)
Kirjaimia ا (alif), ي (yāʾ) ja و (wāw), jotka alkujaan olivat vain konsonanttien merkkejä, käytetään myös pitkän a:n, pitkän i:n ja pitkän u:n merkkeinä. Sanan lopussa voi pitkän a:n merkkinä olla myös ى (alif maqṣūra). Siirtokirjoituksessa käytetään tällöin a:ta, i:tä ja u:ta siten, että tieteellisessä siirtokirjoituksessa vokaalin päällä on pituusmerkki (vaakaviiva). Englanninkielisessä maailmassa käytetään kuitenkin usein menettelyä, jossa pitkä vokaali merkitään kahdella vokaalimerkillä, usein aa (=ā), ee (=ī) ja oo (=ū), esim. Al Jazeera eikä al-Jazira. Ajatuksena on antaa englantia puhuvalla karkea käsitys vokaalin ääntämyksestä.
Esimerkiksi با (bāʾ ja alif, jotka arabian oikeinkirjoituksessa tällöin kirjoitetaan yhteen, ligatuuriksi) luetaan ”baa” ja siirtokirjoitetaan ”bā” yleiskielisessä esityksessä ”ba”. Vokalisoidussa kirjoituksessa kuitenkin merkitään lisäksi vokaalia osoittava lisämerkki (tässä siis fatḥa), esimerkiksi باَ.
Yleisemmin sanottuna käytetään vokalisoidussa kirjoituksessa vokaalia osoittavaa lisämerkkiä edeltävän konsonantin yhteydessä, vaikka kyseessä oleva vokaali olisi pitkä ja esitettäisiin jollakin edellä mainituista merkeistä (alif, yāʾ, wāw ja alif maqṣūra). Lisämerkkiä ei tällöin oteta huomioon siirtokirjoituksessa, paitsi ISO 233:n mukaisessa translitteraatiossa. Esimerkiksi دِي (dāl kasra yāʾ) kirjoitetaan ISO 233:n mukaan diy mutta SFS 5755:n mukaan dī tai di.
Jos lyhyen a-vokaalin merkillä varustetun kirjaimen jäljessä on yāʾ tai wāw, niiden tulkitaan olevan konsonanttimerkkejä, joten siirtokirjoituksessa käytetään y:tä tai w:tä. Kuitenkin SFS 5755:n mukaisessa yleiskielisessä menetelmässä voidaan käyttää myös i:tä tai u:ta. Esimerkiksi سيف (vokalisoituna سيَف) voidaan siirtokirjoittaa joko Sayf tai Saif.
Vokaalia tarkoittava lisämerkki esiintyy joissakin tapauksissa sanan lopussa kaksoismerkkinä, esimerkiksi دً. (Ne ovat Unicodessa erilliset merkit U+064B, U+064D ja U+064C.) Kaksoismerkillä on erikoismerkitys: se tarkoittaa sananloppua, joka
Vokalisoidussa kirjoituksessa esiintyy joskus myös lisämerkki ٰ (U+0670, arabic letter superscript alef), joka tarkoittaa pitkää a:ta silloin, kun tätä ei merkitä alifilla. ISO 233:ssa se translitteroidaan aina ā:lla, mutta SFS 5755:n mukaan sitä käsitellään kuten alifia (esim. دٰ = dā tieteellisessä, da yleiskielisessä siirtokirjoituksessa). Sitä ei kuitenkaan merkitä erikseen, jos sitä seuraa alif maqṣūra (jota vastaa siirtokirjoituksessa ā tai a), eli esim. دٰى käsitellään kuten دٰ.
Arabialaisessa kirjoituksessa kaksoiskonsonantti merkitään yleensä yhdellä konsonanttimerkillä. Vokalisoidussa kirjoituksessa merkitään kaksoiskonsonanttia esittävän kirjaimen päälle lisämerkki ّ (šadda, U+0651), jota voidaan käyttää yhdessä edellä mainittujen lyhyitä vokaaleita tarkoittavien lisämerkkien kanssa, esimerkiksi دَّ = dda. ISO 233:ssa tätä lisämerkkiä vastaa kirjaimen päällä oleva pituusmerkki eli vaakaviiva, esim. d̄a. Tällaisen merkinnän aikaansaaminen on usein tietoteknisesti huomattavan vaikeaa.
Standardi SFS 5755 ei mainitse asiasta mitään. Sen esimerkeistä on kuitenkin pääteltävissä, että sen mukaisessa siirtokirjoituksessa käytetään kahta konsonanttimerkkiä, jos kirjain ääntyy kaksoiskonsonanttina, olipa alkutekstissä ilmaistu tämä lisämerkillä tai ei. Tämä on myös englanninkielisissä teksteissä yleinen käytäntö.
Usein esiintyy asuja, joissa on ss-yhdistelmä, esimerkiksi Hussein, Nasser tai Yasser (tai puoliksi suomalaistettuna Jasser). Vaikka arabiassa esiintyy myös kaksois-s, useimmiten tällaiset asut johtuvat vain, että siitä englantilaisen tai ranskalaisen siirtokirjoituksen mukaan [s] merkitään vokaalien välissä ss:llä, jotta sitä ei lausuttaisi soinnillisena äänteenä [z]. Monet tällaiset asut ovat siinä määrin vakiintuneet, että niitä on syytä käyttää suomen kielessäkin.
Arabialaisessa kirjoituksessa siis sanan merkit yleensä ovat kiinni toisissaan, ikään kuin ne olisi kirjoitettu kynää nostamatta. Muutamat kirjaimet kuten د (dāl) kuitenkin aiheuttavat pienen katkon, koska niillä ei ole erillistä sanansisäistä, juoksevaan kirjoitukseen sopivaa muotoa. Tällainen väli ei mitenkään vaikuta siirtokirjoitukseen.
Sanojen välissä on arabialaisessa kirjoituksessa hiukan tyhjää, ja vastaavasti käytetään siirtokirjoituksessa välilyöntiä sanojen välissä. Kuitenkin arabialaisessa kirjoituksessa liitetään eräät sanaa edeltävät pikkusanat (artikkelit, prepositiot) kiinni sanaan. Siirtokirjoituksessa niitä ei liitetä suoraan pääsanaansa, vaan välissä käytetään yhdysmerkkiä. Tätä ei erikseen sanota esimerkiksi SFS 5755:ssä, mutta artikkelin osalta periaate ilmenee esimerkeistä kuten al-Quds. Samalla tavoin saatetaan käsitellä myös pikkusanat wa-, fa-, ta-, bi-, li-, ka-, la-, sa- ja a-.
Arabian kielessä ei eroteta versaalia ja gemenaa (”isoja” ja ”pieniä” kirjaimia), mutta arabiankielisten nimien siirtokirjoituksessa on tapana noudattaa sitä yleistä periaatetta, että erisnimi aloitetaan versaalilla.
Jonkin verran esiintyy horjuntaa sen suhteen, kirjoitetaanko nimeen kuuluva määräävä artikkeli ”al” versaalialkuisena (esim. al-Ahram ∼ Al-Ahram). SFS 5855 ei erikseen sano asiasta mitään, mutta esimerkeissä on kaikissa gemena (esim. al-Quds).
Arabialaisperäisistä nimistä ja sanoista osa tulkitaan ns. sovinnaisnimiksi tai lainasanoiksi. Ne perustuvat usein arabian johonkin puhuttuun muotoon, joka poikkeaa yleisarabiasta. Lisäksi niihin on vaikuttanut englannissa tai ranskassa käytetty kirjoitusasu, josta yleensä johtuu edellä mainittu ss-yhdistelmä. Saattaa myös esiintyä sananloppuista h:ta, joka johtuu vain englannin käytännöstä (esimerkiksi nimissä Sarah, Aminah ja Hafsah ja sanassa mullah). Toisaalta sananloppuista h:tä ei pidä summittaisesti jättää pois, koska usein se perustuu todelliseen arabiankieliseen asuun, esimerkiksi Jumalan nimessä Allah. Melko usein esiintyy myös ranskasta peräisin olevaa u-äänteen merkitsemistä ou:lla, esimerkiksi nimessä Sousse (arabiaksi Sus), sekä aw au:n ja ay ai:n tilalla.
Standardi SFS 5755 mainitsee esimerkkeinä sovinnaisnimistä seuraavat henkilönnimet ja paikannimet (tässä arabiankielinen asu esitetään yleiskielisen siirtokirjoituksen mukaan):
sovinnaisnimi |
arabiankielinen asu |
---|---|
Nasser |
Nasir |
Gaddafi |
Qaddhafi |
Hussein |
Husain |
Jordan |
Urdunn |
Kairo |
al-Qahira |
Marokko |
Maghrib |
Sana, joka tarkoittaa Muhammedin (Muḥammadin) pakoa Mekasta (Makka) Medinaan (Madina) v. 622 (islamilaisen ajanlaskun alkukohtaa), kirjoitetaan suomessa yleensä lainasanana muodossa hidžra (tai hidzhra), mutta arabiankielisen sanan siirtokirjoitettu asu on hijra.
Arabiankielisessä maailmassa käytetään henkilönnimien järjestelmää, jossa on etunimi ja isännimi, mahdollisesti myös sukunimi. Sukunimi on yleensä ainakin alkujaan kuvannut syntymäpaikkaa tai alkuperää ja alkaa tavallisesti määräävällä artikkelilla al. Isännimen jäljessä voi olla myös isoisän nimi ja pitempikin ketju esi-isien nimiä, yleensä vain etunimiä. Lisäksi käytetään vielä epävirallisia kutsumanimiä, jotka usein annetaan ensimmäisen lapsen mukaan, esimerkiksi Abu Muhammad ’Muhammadin isä’ tai Umm Ali ’Alin äiti’.
Isännimen edessä on usein poikaa tarkoittava sana ibn, bin tai ben taikka tytärtä tarkoittava sana bint. Sen käyttö ja muoto vaihtelevat maittain. Niinpä kirjoitetaan milloin ibn Ladin, milloin bin Laden. Usein kyseinen apusana kirjoitetaan versaalialkuisena etenkin kun se ja sitä seuraava isännimi ymmärretään sukunimeä vastaavaksi, esimerkiksi Bin Laden.
Esimerkiksi nimi Abu Muhammad Abdallah ibn ʾAbd al-Rahman al-Darimi voidaan selittää näin: Muhammadin isä Abdallah, ʾAbd al-Rahmanin poika, darimilainen’.