Kielimerkkaus, luku 2 Kielimerkkauksen toteutus HTML:ssä ja XML:ssä (ja muissa järjestelmissä):

Kielimerkkaus muissa järjestelmissä

XSL

XSL (eXtensible Stylesheet Language) sisältää language ominaisuuden, jonka tarkoitettua käyttöä kuvastaa seuraava: "Specifies the language to be used by the formatter in language-/locale-coupled services, such as line-justification strategy, line-breaking, and hyphenation.".

SVG ja SMIL

SVG (Scaleable Vector Graphics) ja SMIL (Synchronized Multimedia Integration Language) ovat dataformaatteja, joihin voi sisältyä tekstiä ja informaatiota tekstin kielestä. Kieli ilmoitetaan systemLanguage-määritteellä. Se on tarkoitettu mahdollistamaan kielivalinta samaan tapaan kuin HTTP:n kielivalintamekanismissa mutta yhden dokumentin sisällä.

RTF

RTF-tiedostomuoto on eräänlainen merkkauskieli, joka useilla tavoilla muistuttaa HTML:ää. Siinä on käytössä kolme kieleen liittyvää merkkausta:

\deflangnnnn
Asettaa oletuskielen, default language.
\deflangfennnn
Asettaa oletuskielen Word-ohjelman aasialaisia versioita varten.
{langnnnn tekstiä}
Asettaa kyseisen tekstinosan kielen.

Tässä nnnn on luku, joka ilmaisee kielen. RTF:ssä ovat käytössä erityiset numeeriset kielikoodit.

DocBook

DocBook on SGML-pohjainen järjestelmä dokumenttien kirjoittamiseen. Siinä on lang-määrite, mutta sen merkitys ja muotokin on hiukan epäselvä. DocBook: The Definitive Guide sanoo siitä, kohdassa Common Attribute Parameter Entities:

Lang should be a language code drawn from ISO 639 (perhaps extended with a country code drawn from ISO 3166, as en_US). Use it when you need to signal your application to change hyphenation and other display characteristics.

Kuten seuraavassa kohdassa selostetaan, Internetissä käytetyssä kielikoodien järjestelmässä peruskielikoodin ja maakoodin välinen erotin on yhdysmerkki (-), ei alaviiva (_). Toisaalta poikkeamista tästä ei ehkä koeta ongelmaksi, koska DocBook-muotoisia dokumentteja ei juuri ole tarkoitus sellaisenaan levittää esimerkiksi Internetissä, vaan niistä tuotetaan ohjelmilla erilaisia esitysmuotoja.

Tämä osa käsittelee koodeja (tunnuksia), joita voidaan käyttää asiakirjan tai sen osan kielen ilmoittamiseen. Tämä on suhteellisen riippumaton aineiston varsinaisesta teemasta, kielimerkkauksesta, ja koskee kielikoodien käyttöä hyvinkin monenlaisissa yhteyksissä.

Sisältö:

Kirjoittamisen ajankohta: 2002-06-23. Päivitetty viimeksi 2007-12-03. Teknisiä korjauksia 2017-12-11.
Tämä sivu kuuluu Jukka "Yucca" Korpelan avoimeen tietosivustoon Datatekniikka ja viestintä.