Mittayksiköt, luku 19 Datamäärä ja informaatio:

Datamäärän yksiköitä

Datan tallennuksessa ja siirrossa käytetään useita yksiköitä ilmaisemaan datan määrää.

Datamäärän yksiköitä
SuomeksiEnglanniksiTunnus t. lyhenneMerkitys
bitti bit b, bit binaarinumero, yksi kahdesta vaihtoehdosta
tavu byte B, t 8 bittiä (aiemmin myös muunmittainen bittijono)
hartley [haatli] hartley Hart desimaalinumero, yksi 10:stä vaihtoehdosta; log2(10) bit

Bitin tunnus on standardin ISO 80000-13 mukaan ”bit”, mutta käytännössä yleensä ”b”, joka on standardin 1541-2002 ja Suomessa kielitoimiston lyhenneluettelon mukainen. Toisaalta ”b” voi joskus sekoittua tavun tunnukseen ”B”. Kielitoimiston lyhenneluettelokin mainitsee, että ”B” tarkoittaa tavua, mutta sen mukaan tavun suomalainen lyhenne on ”t”.

Tavun sijasta käytetään joskus sanaa ”oktetti”, englanniksi ”octet”, tunnus ”o”. Oktetin etuna on pidetty sitä, että se on aina tarkoittanut vain kahdeksan bitin yksikköä.

Hartleyn aiempia nimiä ovat ”ban” ja ”dit”.

Informaatioteoriassa käytetään bitin sijasta myös bittiä vastaavaa yksikköä shannon [šänən], tunnus Sh, joka on sekä informaation että entropian yksikkö. Sen määritellään olevan sellaisen tapahtuman informaatiomäärä, jonka todennäköisyys on 0,5. Informaatioteoriassa biteistä koostuvan datan informaation määrä on sama kuin sen bittien määrä, jos kaikki bittiyhdistelmät ovat yhtä todennäköisiä.

Informaatioteoriassa käytetään myös luonnollista informaation yksikköä, englanniksi natural unit of information, tunnus nat, jonka suuruus on 1/ln(2) shannonia.

Edellä mainituista yksiköistä muodostetaan kerrannaisia SI-etuliitteillä, esimerkiksi megatavu (MB). Tähän kuitenkin liittyy lähinnä periaatteellisia ongelmia, joita käsitellään seuraavassa kohdassa.