Unicode-merkistö jakautuu lohkoihin (blocks). Tässä luetellaan ne käyttäen virallisia englanninkielisiä nimiä (Unicode-standardiin kuuluvan tiedoston Blocks.txt mukaan) sekä kirjoittajan ehdottamia suomennoksia. Mukana on Unicoden Basic Multilingual Plane (BMP, koodipaikat U+0000…U+FFFF).
Unicodessa lohko on koodialue eli joukko peräkkäisiä koodipaikkoja. Lohkojen koot vaihtelevat. Lohkoihin jakaminen heijastaa Unicoden kehitystä, jossa merkkivalikoimaa on useissa vaiheissa laajennettu. Siksi jako ei noudata mitään yksinkertaista ja yhtenäistä periaatetta. Esimerkiksi latinalaiseen kirjaimistoon kuuluvia merkkejä on useissa eri lohkoissa.
Lohkot on tässä ryhmitelty alueiksi (area) Unicode-standardin 2. luvussa General Structure esitetyn jaon mukaisesti. Alueiden nimet eivät ole varsinaisesti erisnimiä, vaan sama nimi voi esiintyä useasti.
Seuraavassa taulukossa englanninkielinen nimi on linkki lohkon kuvaukseen Unicode-standardissa, osassa Charts (merkistökartat). Suomenkielisen nimen jäljessä voi olla sulkeissa oleva selitys, joka ei siis ole ehdotetun nimen osa.
Englanninkielinen nimi | Suomenkielinen nimi | Microsoft-suomennos | Koodialue |
---|---|---|---|
ASCII & Latin-1 Compatibility Area –
Ascii ja Latin-1 -yhteensopivuusalue | |||
Basic Latin | Latinalainen perusmerkistö (Ascii) | Latinalainen, perus | 0000…007F |
Latin-1 Supplement | Latinalaisen merkistön täydennys Latin-1:ksi (Latin-1:n yläosa) | Latinalainen-1 (lisä) | 0080…00FF |
General Scripts Area – Yleinen kirjoitusjärjestelmien alue | |||
Latin Extended-A | Latinalaisen merkistön laajennus A | Latinalainen, laajennettu-A | 0100…017F |
Latin Extended-B | Latinalaisen merkistön laajennus B | Latinalainen, laajennettu-B | 0180…024F |
IPA Extensions | IPA-täydennyksiä (foneettisia merkkejä) | IPA-laajennukset | 0250…02AF |
Spacing Modifier Letters | Tarkekirjaimia (tarkkeen näköisiä erillisiä merkkejä) | Välinmäärityskirjaimet | 02B0…02FF |
Combining Diacritical Marks | Yhdistyviä tarkkeita | Yhdistetään diakriittiset merkit. | 0300…036F
|
Greek and Coptic | Kreikkalaisia ja koptilaisia merkkejä | Kreikkalaiset ja koptilaiset merkit | 0370…03FF |
Cyrillic | Kyrillisiä merkkejä | Kyrillinen | 0400…04FF |
Cyrillic Supplement | Kyrillisen merkistön täydennys | Kyrillinen (lisä) | 0500…052F |
Armenian | Armenialaisia merkkejä | Armenia | 0530…058F |
General Scripts Area (RTL) – Yleinen oikealta vasemmalle luettavien kirjoitusjärjestelmien alue | |||
Hebrew | Heprealaisia merkkejä | Heprea | 0590…05FF |
Arabic | Arabialaisia merkkejä | Arabia | 0600…06FF |
Syriac | Syyrialaisia merkkejä | Syyria | 0700…074F |
Arabic Supplement | Arabialaisen merkistön täydennys | Arabia (laajennus) | 0750…077F |
Thaana | Thaana | Thaana | 0780…07BF |
NKo | N’ko | N'Ko | 07C0…07FF |
Samaritan | Samarialaisia merkkejä | ? | 0800…083F |
Mandaic | Mandealaisia merkkejä | ? | 0840…085F |
Syriac Supplement | Syyrialaisen merkistön täydennys | ? | 0860…086F |
Arabic Extended-A | Arabialaisen merkistön laajennus A | ? | 08A0…08FF |
Devanagari | Devanagari | Devanagari | 0900…097F |
Bengali | Bengalilaisia merkkejä | bengali | 0980…09FF |
Gurmukhi | Gurmukhi | Gurmukhi | 0A00…0A7F |
Gujarati | Gudžaratilaisia merkkejä | Gudzarati | 0A80…0AFF |
Oriya | Orijalaisia merkkejä | Orija | 0B00…0B7F |
Tamil | Tamililaisia merkkejä | Tamili | 0B80…0BFF |
Telugu | Telugulaisia merkkejä | Telugu | 0C00…0C7F |
Kannada | Kannadalaisia merkkejä | Kannada | 0C80…0CFF |
Malayalam | Malajalamilaisia merkkejä | Malajalam | 0D00…0D7F |
Sinhala | Sinhalilaisia merkkejä | Sinhala | 0D80…0DFF |
Thai | Thailaisia merkkejä | Thai | 0E00…0E7F |
Lao | Laolaisia merkkejä | Lao | 0E80…0EFF |
Tibetan | Tiibetiläisiä merkkejä | Tiibet | 0F00…0FBF |
Myanmar | Burmalaisia merkkejä | Myanmar | 1000…109F |
Georgian | Georgialaisia merkkejä | Georgia | 10A0…10FF |
Hangul Jamo | Hangulin jamo-merkkejä | Hangul (Jamo) | 1100…11FF |
Ethiopic | Etiopialaisia merkkejä | Etiopia | 1200…137F |
Ethiopic Supplement | Etiopialaisen merkistön täydennys | Etiopia (laajennus) | 1380…13FF |
Cherokee | Cherokeelaisia merkkejä | Cherokee | 13A0…13FF |
Unified Canadian Aboriginal Syllabics | Kanadalaisten alkuperäiskansojen yhtenäistettyjä tavumerkkejä | Kanadan alkuperäiskansojen tavutus | 1400…167F |
Ogham | Ogham | Ogham | 1680…169F |
Runic | Riimukirjaimia | Riimukirjoitus | 16A0…16F0 |
Tagalog | Baybayin (tagalogin aik. kirjoitusjärjestelmä) | Tagalog | 1700…171F |
Hanunoo | Hanunó’olaisia merkkejä | Hanunoo | 1720…173F |
Buhid | Buhidilaisia merkkejä | Buhid | 1740…174F |
Tagbanwa | Tagbanwalaisia merkkejä | Tagbanwa | 1760…177F |
Khmer | Khmeriläisiä merkkejä | Khmer | 1780…17FF |
Mongolian | Mongolialaisia merkkejä | Mongoli | 1800…18AF |
Unified Canadian Aboriginal Syllabics Extended | Kanadalaisten alkuperäiskansojen yhtenäistetyn tavumerkistön laajennus | ? | 18B0…18FF |
Limbu | Limbulaisia merkkejä | Limbu | 1900…194F |
Tai Le | Tailelaisia merkkejä | Tai le | 1950…197F |
New Tai Lue | Uusi tailuelainen merkistö | Uusi tai lue | 1980…19DF |
Khmer Symbols | Khmeriläisiä symboleja | Khmer-merkit | 19E0…19FF |
Buginese | Bugilaisia merkkejä | Bufi | 1A00…1A1F |
Tai Tham | Taithamilaisia merkkejä | ? | 1A20…1AAF |
Combining Diacritical Marks Extended | Yhdistyvien tarkkeiden laajennus | ? | 1AB0…1AFF |
Balinese | Balilaisia merkkejä | ? | 1B00…1B7F |
Sundanese | Sundalaisia merkkejä | ? | 1B80…1BBF |
Batak | Batakilaisia merkkejä | ? | 1BC0…1BFF |
Lepcha | Lepchalaisia merkkejä | ? | 1C00…1C4F |
Ol Chiki | Ol Chiki | ? | 1C50…1C7F |
Cyrillic Extended-C | Kyrillisen merkistön laajennus C | ? | 1C80…1C8F |
Georgian Extended | Georgialaisen merkistön laajennus | ? | 1C90…1CBF |
Sundanese Supplement | Sundalaisen merkistön täydennys | ? | 1CC0…1CCF |
Vedic Extensions | Vedalaisia laajennuksia | ? | 1CD0…1CFF |
Phonetic Extensions | Foneettisia laajennuksia | Foneettiset laajennukset | 1D00…1D7F |
Phonetic Extensions Supplement | Foneettisten laajennusten täydennys | Foneettiset laajennukset (laajennus) | 1D70…1DBF |
Combining Diacritical Marks Supplement | Yhdistyvien tarkkeiden täydennys | Yhdistävät diakriittiset merkit (laajennus) | 1DC0…1DFF |
Latin Extended Additional | Latinalaisen merkistön lisälaajennuksia | Laajennettu latinalainen (lisä) | 1E00…1EFF
|
Greek Extended | Kreikkalaisen merkistön laajennus | Laajennettu kreikkalainen | 1F00…1FFF |
Punctuation and Symbols Area – Välimerkkien
ja symbolien alue | |||
General Punctuation | Yleisiä välimerkkejä | Yleiset välimerkit | 2000…206F
|
Superscripts and Subscripts | Ylä- ja alaindeksejä | Ylä- ja alaindeksit | 2070…209F |
Currency Symbols | Valuuttasymboleita | Valuuttamerkit | 20A0…20CF |
Combining Diacritical Marks for Symbols | Symbolien yhdistyviä tarkkeita | Yhdistävät diakriittiset merkit symboleille | 20D0…20FF |
Letterlike Symbols | Kirjaimenkaltaisia symboleita | Kirjainmerkit | 2100…214F |
Number Forms | Lukujen esitysmuotoja | Numeromuodot | 2150…218F |
Arrows | Nuolia | Nuolet | 2190…21FF |
Mathematical Operators | Matemaattisia operaattoreita | Matemaattiset operaattorit | 2200…22FF |
Miscellaneous Technical | Sekalaisia teknisiä merkkejä | Muut tekniset | 2300…23FF |
Control Pictures | Ohjausmerkkien symboleita | Ohjauskuvat | 2400…243F |
Optical Character Recognition | OCR-merkkejä (helposti optisesti luettavia) | OCR | 2440…245F |
Enclosed Alphanumerics | Ympäröityjä alfanumeerisia merkkejä | Liitetyt aakkosnumeeriset | 2460…24FF |
Box Drawing | Viivapiirrosmerkkejä | Kehyksenpiirtomerkit | 2500…257F |
Block Elements | Lohkoalkioita | Lohkon osat | 2580…259F |
Geometric Shapes | Geometrisia muotoja | Geometriset kuviot | 25A0…25FF |
Miscellaneous Symbols | Sekalaisia symboleita | Muut symbolit | 2600…26FF |
Dingbats | Dingbat-merkkejä | Dingbat-merkit | 2700…27BF
|
Miscellaneous Mathematical Symbols-A | Sekalaisia matemaattisia symboleita A | Muut matemaattiset symbolit - A | 27C0…27EF
|
Supplemental Arrows-A | Lisänuolia A | Nuolet, laajennettu - A | 27F0…27FF
|
Braille Patterns | Braille-merkkejä | Sokeainkirjoitus | 2800…28FF
|
Supplemental Arrows-B | Lisänuolia B | Nuolet, laajennettu - B | 2900…297F
|
Miscellaneous Mathematical Symbols-B | Sekalaisia matemaattisia symboleita B | Muut matemaattiset symbolit - B | 2980…29FF
|
Supplemental Mathematical Operators | Täydentäviä matemaattisia operaattoreita | Matemaattiset operaattorit (laajennus) | 2A00…2AFF
|
Miscellaneous Symbols and Arrows | Sekalaisia symboleita ja nuolia | Muut symbolit ja nuolet | 2B00…2BFF
|
General Scripts Area – Yleinen kirjoitusjärjestelmien alue | |||
Glagolitic | Glagolitsa (glagoliittinen kirjoitus) | Glagolitsa | 2C00…2C5F
|
Latin Extended-C | Latinalaisen merkistön laajennus C | ? | 2C60…2C7F
|
Coptic | Koptilaisia merkkejä | Koptinen | 2C80…2CFF
|
Georgian Supplement | Gruusialaisen merkistön täydennys | ? | 2D00…2D2F
|
Tifinagh | Tifinagh | Tifinagh | 2D30…2D7F
|
Ethiopic Extended | Etiopialaisen merkistön laajennus | Laajennettu etiopia | 2D80…2DDF
|
Cyrillic Extended-A | Kyrillisen merkistön laajennus A | ? | 2DE0…2DFF
|
Supplemental Punctuation Area –
Täydentävien välimerkkien alue | |||
Supplemental Punctuation | Välimerkkien täydennys | Välimerkit (laajennus) | 2E00…2E7F
|
CJK Miscellaneous Area
– Sekalaisten CJK-merkkien alue (CJK = Chinese-Japanese-Korean =
kiinalais-japanilais-korealainen)
| |||
CJK Radicals Supplement | CJK-juurimerkkien täydennys | CJK-radikaalit (laajennus) | 2E80…2EFF |
Kangxi Radicals | Kangxi-juurimerkkejä | Kangxi-radikaalit | 2F00…2FD5 |
Ideographic Description Characters | Logografisia kuvailumerkkejä | Ideografiset kuvausmerkit | 2FF0…2FFB |
CJK Symbols and Punctuation | CJK-symboleita ja -välimerkkejä | CJK-symbolit ja välimerkit | 3000…303F |
Hiragana | Hiragana | Hiragana | 3040…309F |
Katakana | Katakana | Katakana | 30A0…30FF |
Bopomofo | Bopomofo (kiinan aakkoskirjoitus) | Bopomofo | 3100…312F |
Hangul Compatibility Jamo | Hangulin jamo-yhteensopivuusmerkkejä | Hangul-yhteensopiva Jamo | 3130…318F |
Kanbun | Kanbun | Kanbun | 3190…319F |
Bopomofo Extended | Bopomofon laajennus | Laakennettu bopomofo | 31A0…31BF |
CJK Strokes | CJK-merkkien vetoja | CJK-piirrot | 31C0…31EF |
Katakana Phonetic Extensions | Katakanan foneettisia laajennuksia | Katakana, foneettiset laajennukset | 31F0…31FF |
Enclosed CJK Letters and Months | Ympäröityjä CJK-kirjaimia ja ‑kuukausimerkkejä | Liitetyt CJK-kirjaimet ja kuukaudet | 3200…32FF |
CJK Compatibility | CJK-yhteensopivuusmerkkejä | CJK-yhteensopiva | 3300…33FF |
CJKV Unified Ideographs Area – CJKV-logogrammien alue
(CJKV =
Chinese-Japanese-Korean-Vietnamese =
kiinalais-japanilais-korealais-vietnamilainen)
| |||
CJK Unified Ideographs Extension A | Yhtenäistettyjen CJK-logogrammien laajennus A | Yhdistetyt CJK-käsitemerkit, laajennus A | 3400…4DBF |
Yijing Hexagram Symbols | Yijing-heksagrammisymboleita | Yijing-heksagrammisymbolit | 4DC0…4DFF |
CJK Unified Ideographs | Yhtenäistettyjä CJK-logogrammeja | Yhdistetyt CJK-käsitemerkit | 4E00…9FFF |
General Scripts Area (Asia & Africa) – Yleinen aasialaisten ja afrikkalaisten kirjoitusjärjestelmien alue | |||
Yi Syllables | Yi-tavumerkkejä | Ji-tavut | A000…A48F |
Yi Radicals | Yi-juurimerkkejä | Ji-radikaalit | A490…A4CF |
Lisu | Lisu | Lisu | A4D0…A4FF |
Vai | Vai | Vai | A500…A63F |
Cyrillic Extended-B | Kyrillisen merkistön laajennus | Kyrillinen, laajennettu - B | A640…A69F
|
Bamum | Bamum | ? | A6A0…A6FF
|
Modifier Tone Letters | Toonikirjaimia | Sävynmäärityskirjaimet | A700…A71F
|
Latin Extended-D | Latinalaisen merkistön laajennus D | ? | A720…A7FF
|
Syloti Nagri | Syloti nagri | Syloti nagri | A800…A82F
|
Common Indic Number Forms | Yleisintialaisia lukumerkkejä | ? | A830…A83F
|
Phags-pa | Phags-pa | Phags-pa | A840…A87F
|
Saurashtra | Saurashtra | ? | A880…A8DF
|
Devanagari Extended | Devanagarin laajennus | ? | A8E0…A8FF
|
Kayah Li | Kayah Li | ? | A900…A92F
|
Rejang | Rejang | ? | A930…A95F
|
Hangul Jamo Extended-A | Hangulin jamo-merkkien laajennus A | ? | A960…A97F
|
Javanese | Jaavalaisia merkkejä | ? | A980…A9DF
|
Myanmar Extended-B | Burmalaisten merkkien laajennus B | ? | A9E0…A9FF
|
Cham | Cham | ? | AA00…AA5F
|
Myanmar Extended-A | Burmalaisten merkkien laajennus A | ? | AA60…AA7F
|
Tai Viet | Tai Viet | ? | AA80…AADF
|
Meetei Mayek Extensions | Meetei Mayekin laajennuksia | ? | AAE0…AAFF
|
Ethiopic Extended-A | Etiopialaisen merkistön laajennus A | ? | AB00…AB2F
|
Latin Extended-E | Latinalaisen merkistön laajennus | ? | AB30…AB6F
|
Cherokee Supplement | Cherokeelaisten merkkien laajennus | ? | AB70…ABBF
|
Meetei Mayek | Meetei Mayek | ? | ABC0…ABFF
|
Hangul Syllables Area – Hangul-tavumerkkien
alue | |||
Hangul Syllables | Hangul-tavumerkkejä | Hangul-tavut | AC00…D7A3 |
Hangul Jamo Extended-B | Hangulin jamo-merkkien laajennus B | ? | D7B0…D7FF
|
Surrogates Area – Laajennuskoodien alue | |||
High Surrogates | Laajennuskoodien ykkösosia | - | D800…DB7F |
High Private Use Surrogates | Laajennuskoodien ykkösosat sopimuskäyttöön | - | DB80…DBFF |
Low Surrogates | Laajennuskoodien kakkososia | - | DC00…DFFF |
Private Use Area – Sopimuskäytön alue | |||
Private Use | Sopimuskäytön lohko (käyttö sopimuksen mukaan) | Yksityiskäyttöalue | E000…F8FF |
Compatibility and Specials Area
– Yhteensopivuusmerkkien ja erikoiskoodien alue | |||
CJK Compatibility Ideographs | CJK-yhteensopivuuslogogrammeja | CJK-yhteensopivat käsitemerkit | F900…FAFF |
Alphabetic Presentation Forms | Kirjainten esitysmuotoja | Aakkoselliset esitysmuodot | FB00…FB4F |
Arabic Presentation Forms-A | Arabialaisten merkkien esitysmuotoja A | Arabialaiset esitysmuodot - A | FB50…FDFF |
Variation Selectors | Glyyfinvalitsimia (valitsee määrätyn ulkoasun edeltävälle merkille) | Muunnosvalitsimet | FE00…FE0F |
Vertical Forms | Pystysuoran kirjoituksen muotoja | Pystolomakkeet | FE10…FE1F |
Combining Half Marks | Yhdistyviä puolikastarkkeita | Yhdistävät puolimerkit | FE20…FE2F |
CJK Compatibility Forms | CJK-merkkien yhteensopivuusmuotoja | CJK-yhteensopivat muodot | FE30…FE4F |
Small Form Variants | Pienikokoisia muunnelmia | Pienimuotoiset muunnokset | FE50…FE6F |
Arabic Presentation Forms-B | Arabialaisten merkkien esitysmuotoja B | Arabialaiset esitysmuodot - B | FE70…FEFF |
Halfwidth and Fullwidth Forms | Puoli- ja täyslevyisiä esitysmuotoja | Kapeat ja leveät muodot | FF00…FFEF |
Specials | Erityiskoodeja | Erikoismerkit | FFF0…FFFF |
Tämä sivu on laadittu lähinnä siksi, että Microsoftin käyttämistä suomennoksista monet ovat harhaanjohtavuudessaan kelvottomia. Microsoftin suomennokset näkyvät esimerkiksi silloin, kun tarpeeksi uudella MS Wordillä kirjoitetaan erikoismerkkejä Lisää-valikon Merkki-kohdan kautta ja on tehty lisävalinta ”Lisää merkkejä”. Lohkojen nimet näkyvät Osajoukko-valikossa. Nimissä on jonkin verran vaihtelua Windowsin eri versioiden ja eri ohjelmienkin välillä.
Se, mitä lohkojen nimiä näkyy tässä tilanteessa, riippuu käytössä olevasta fontista: Word näyttää vain ne lohkot, joiden merkkejä kyseisessä fontissa on.)
Windowsin Merkistö-ohjelmassa (CharMap) voidaan valita merkkien ryhmittelyperusteeksi ”Unicode-alialue”. Tämä ei suoraan vastaa Unicode-lohkoa, vaan alialueeseen on saatettu yhdistää useita samaan kirjoitusjärjestelmään liittyviä lohkoja. Esimerkiksi kaikki latinalaisen merkistön lohkot on koottu Latinalainen-alialueeksi.
Lohkojen nimille ei ole standardoituja suomenkielisiä nimiä. Sellaiset nimet saatetaan jossain vaiheessa lisätä CLDR-tietokantaan (Common Locale Data Repository), jossa suomenkielisten nimien kokoelma sisältää jo muun muassa laajasti kielten nimiä ja kirjoitusjärjestelmien (scripts) nimiä. Tässä esitetyt lohkojen nimet on muodostettu yhteensopiviksi mainittujen nimistöjen kanssa.
Kuitenkin Filippiineillä puhutun tagalogin historiallisesta kirjoitusjärjestelmästä käytetään tässä nimitystä baybayin, jolla siihen yleisesti viitataan. (Nykyisin tagalogia kirjoitetaan latinalaisilla kirjaimilla.)
Nimet on tässä pyritty valitsemaan käytännöllisiksi, niin että ne mahdollisuuksien mukaan vastaisivat käytössä olevia nimiä tai olisivat sellaisten pohjalta ymmärrettävissä. Tarkoitus on, että lohkon niminä ne olisivat erisnimiä, jotka siis kirjoitetaan isolla alkukirjaimella ja mahdollisesti erityisellä kirjasinlajilla, esim. Latinalaisen merkistön laajennus A, tai lainausmerkkeihin.
Nimissä on vältetty nominatiivimuotoja kuten ”merkit” ja käytetty partitiiveja kuten ”merkkejä”. Esimerkiksi ”Yleiset välimerkit” voisi antaa sen virheellisen käsityksen, että kaikki yleisiksi välimerkeiksi laskettavat kuuluisivat kyseiseen lohkoon. Esimerkiksi piste ja pilkku eivät kuulu! Lisäksi muoto ”merkkejä” on perusteltu senkin takia, että se jättää avoimeksi, kuuluuko johonkin merkistöön myös sellaisia merkkejä, joita ei (vielä) ole otettu Unicodeen. Esimerkiksi kiinalaisista merkeistä vain osa on Unicodessa.
Kiinalaisperäisten merkkien yleisnimitys on hankala ongelma. Vaikka englanninkielisessä nimessä on sana ”ideograph”, kyseiset merkit eivät enimmäkseen ole ideografeja eli ideogrammeja eli käsitemerkkejä, vaan (yksitavuisen) sanan merkkejä. ”Sanamerkki” sopisi suomen kieleen paremmin, mutta sen haittana on ensinnäkin, että se tarkoittaa myös sellaista tavaramerkkiä; joka on sana. Tosin Nykysuomen sanakirja kuvaa sanaa ”sanamerkki” näin: ”kokonaista sanaa tarkoittava kirjoitusmerkki” ja esittää ensimmäisenä esimerkkilauseena seuraavan: ”Suurimmissa kiinan sanakirjoissa on n. 50.000 sanamerkkiä.” CJK-merkit eivät kuitenkaan varsinaisesti ole sanamerkkejäkään, vaan suurin osa niistä koostuu äännettyä tavua vastaavan symbolin ja merkitystä tarkentavan symbolin yhdistelmästä. Siksi tässä on käytetty sanaa ”logogrammi”. Vaikka sen voi tulkita tarkoittavan sanamerkkiä ahtaassa mielessä, sitä on käytetty myös laajemmassa merkityksessä.