Merkistöt IA5, IRA ja GSM 03.38

des. okt. Ascii GSM
000NUL@
101STX£
202SOT$
303ETX¥
404EOTè
505ENQé
606ACKù
707BELì
808BSò
909HTÇ
100ALFLF
110BVTØ
120CFFø
130DCRCR
140ESOÅ
150FSIå
1610DLEΔ (U+0394)
1711DC1DC1 (tai _)
1812DC2Φ (U+03A6)
1913DC3Γ (U+0393)
2014DC4Λ (U+039B)
2115NAKΩ (U+03A9)
2216SYNΠ (U+03A0)
2317ETBΨ (U+03A8)
2418CANΣ (U+03A3)
2519EMΘ (U+0398)
261ASUBΞ (U+039E)
271BESCESC
281CFSÆ
291DGSæ
301ERSß
311FUSÉ
3220   (välilyönti)
3321!!
3422""
3523##
3624$¤
3725%%
3826&&
3927''
4028((
4129))
422A**
432B++
442C,,
452D--
462E..
472F//
483000
493111
503222
513333
523444
533555
543666
553777
563888
573999
583A::
593B;;
603C<<
613D==
623E>>
633F??
6440@¡
6541AA
6642BB
6743CC
6844DD
6945EE
7046FF
7147GG
7248HH
7349II
744AJJ
754BKK
764CLL
774DMM
784ENN
794FOO
8050PP
8151QQ
8252RR
8353SS
8454TT
8555UU
8656VV
8757WW
8858XX
8959YY
905AZZ
915B[Ä
925C\Ö
935D]Ñ
945E^Ü
955F_§
9660`¿
9761aa
9862bb
9963cc
10064dd
10165ee
10266ff
10367gg
10468hh
10569ii
1066Ajj
1076Bkk
1086Cll
1096Dmm
1106Enn
1116Foo
11270pp
11371qq
11472rr
11573ss
11674tt
11775uu
11876vv
11977ww
12078xx
12179yy
1227Azz
1237B{ä
1247C|ö
1257D}ñ
1267E~ü
1277FDELà

Matkapuhelinten tekstiviestien koodauksena käytetään yleisesti koodia GSM 03.38. Oikeastaan sen määrittelyn on korvannut 3GPP TS 23.038, mutta yleisesti puhutaan "GSM-merkistöstä", " 7-bit GSM default alphabet". Se poikkeaa Ascii-merkistöstä siten, että kun koodit 0:sta 31:een ovat Asciissa kontrollikoodeja, niin GSM-koodauksessa useimmat niistä on varattu symboleille, latinalaisen merkistön lisämerkeille (osajoukko ISO Latin 1 -merkistöstä) sekä muutamille isoille kreikkalaisille aakkosille. Poikkeus: LF, CR, DC1 ja ESC on säilytetty. Tosin DC1:n (koodi 17) on GSM 03.38:ssa vaakaviivamerkki (_).

Viestien hyötydatan pituus on 1120 bittiä, joten koodaus mahdollistaa 160 merkkiä pitkät viestit, kun taas kahdeksanbittisellä koodauksella pituus jäisi 140 merkkiin ja Unicoden UCS-2-koodauksella (16-bittinen) vain 70 merkkiin. (Ks. SMS and the PDU format.)

IA5 on ITU-T:n määrittelemä seitsenbittinen merkkikoodi. Usein (mm. tämän dokumentin aiemmassa versiossa) se virheellisesti samaistetaan GSM-merkistön kanssa. Lähtökohtaisesti IA5 vastaa Ascii-koodia mutta siinä on mekanismeja, joilla voidaan ottaa huomioon kansallisia merkkejä ja sovellusten erityistarpeita. IA5:n virallinen nimi on nykyisin IRA, ja sen määrittelee ITU-T Recommendation T.50: International Reference Alphabet (IRA) (Formerly International Alphabet No. 5 or IA5) - Information technology - 7-bit coded character set for information exchange.

GSM 03.38 käyttää ESC-koodia siihen, että yhdistelmällä ESC + jokin koodi esitetään suoraan esitettävien merkkien joukosta pois jätetyt Ascii-merkit ^{}\[~]| sekä euron merkki €.