Unix-opas, luku 1 Lukijalle - lue ensin lukuohje:

Merkistöt ja merkinnät

Isot ja pienet kirjaimet

Unix-tietokoneiden käytön kannalta on olennaista muistaa, että näissä koneissa yleisesti ottaen isojen ja pienten kirjainten ero on merkitsevä. Jos oppaassa tai manuaalissa puhutaan esim. pine-komennosta, niin komentosana on kirjoitettava nimenomaan pine eikä esim. Pine tai PINE. Sama koskee muun muassa tiedostonnimiä: esimerkiksi sekä tkk että TKK ovat Unixissa mahdollisia tiedostonnimiä, mutta ne tarkoittavat aivan eri tiedostoja.

Tässä suhteessa Unix poikkeaa mm. Windowsista. Erittäin tavallinen ongelma siirrettäessä tiedostoja Windows-koneesta Web-palvelimena toimivaan Unix-koneeseen on se, että ei tiedetä tai ei muisteta, että tiedostonnimissä on Unixin puolella oltava tarkempana. Jos Web-sivuun on liitetty kuva rakenteella <img src="foo.gif" alt="">, niin Windowsissa se toimii, vaikka kuvatiedoston nimi olisi FOO.GIF, mutta Unixissa sen pitää olla tasan foo.gif. (Tällaisissa yhteyksissä kannattaa tiedostot yleensä nimetä niin, että kaikki kirjaimet ovat pieniä. Ks. Web-julkaisemisen oppaan kohtaa Web-osoitteet ja muut URLit.)

Toivottavasti lukijaa ei häiritse, että tässä oppaassa on noudatettu erisnimien oikeinkirjoitussääntöä. Niinpä ohjelmien nimet on kirjoitettu isolla alkukirjaimella (esim. Pine), vaikka komento, jolla ohjelma on käynnistettävä, on yleensä sellainen, jossa kaikki kirjaimet ovat pieniä (esim. pine). Yleisemmin on syytä huomata, että se komento, jolla ohjelma käynnistetään, voi olla muutenkin erilainen kuin se nimi, jolla ohjelmasta puhutaan.

Skandinaaviset kirjaimet ja erikoismerkit

Unix-tietokoneissa käytettiin pitkään ns. Ascii-merkistöä, jossa ei ole omia merkkejä skandinaavisille kirjaimille å, ä ja ö. Suomessa noudatettiin yleisesti sopimusta, jonka mukaan skandinaavisten kirjainten esittämiseen käytettiin merkkipaikkoja, jotka Asciissa vastaavat erikoismerkkejä. Seuraavassa taulukossa kukin rivi sisältää kirjaimen sekä erikoismerkin, jonka tilalla se on:

å  }  (oikea aaltosulku, right brace)
ä  {  (vasen aaltosulku, left brace)
ö  |  (pystyviiva, vertical line eli vertical bar)
Å  ]  (oikea hakasulku, right bracket)
Ä  [  (vasen hakasulku, left bracket)
Ö  \  (kenoviiva, backslash)

Tämä menettely, joka on vielä jossain määrin käytössä, on aiheuttanut paljon ongelmia etenkin kansainvälisissä yhteyksissä. Syynä on muun muassa se, että muissa maissa on toisenlaisia sopimuksia .

Yleisesti on (länsimaissa) siirrytty laajempaan merkkikoodiin ISO-Latin-1 (virallisimmalta nimeltään ISO 8859-1). Se on Ascii-koodin laajennus, jossa skandinaavisille kirjaimille on omat merkkipaikat. Se vastaa melko tarkoin Windowsissa käytettyä merkistöä.

Vaikka siirtyminen laajempaan merkistöön on erittäin tarpeellista, siitä on aiheutunut ja jossain määrin vieläkin aiheutuu monenlaista hankaluutta, koska monet ohjelmat (käyttöjärjestelmien komentotulkit, tietoliikenneohjelmat, sovellusohjelmat) sekä monet päätelaitteet on tehty Ascii-koodia ajatellen, eivätkä ne siksi toimi kunnolla ISO-Latin-1:tä käytettäessä ainakaan ilman muutostöitä. Edelleenkin monet tulevat vielä pitkään käyttämään edellä mainittuja erikoismerkkejä skandinaavisten kirjainten tilalla. Joudut siis luultavasti silloin tällöin näkemään t{llaista teksti{. Lisäksi saatat törmätä sellaisiin teksteihin, joissa skandinaavisten kirjainten tilalla on mitä kummallisimpia merkkejä, koska tekstit on kirjoitettu käyttäen jotakin merkkikoodia, joka ei ole Ascii eikä ISO-Latin-1, ja koska merkistönmuunnosta ei ole hoidettu kunnolla.

Toisaalta jos joudut käyttämään näppäimistöä, josta ei tunnu löytyvän sellaisia erikoismerkkejä kuin pystyviiva | (jota usein tarvitaan Unixin komennoissa), voit kokeilla käyttää skandinaavisia kirjaimia (kuten ö) niiden asemesta edellä olevan taulukon mukaan. On nimittäin mahdollista, että laite tällöin käyttää Ascii-merkistön suomalaistettua muunnelmaa, jolloin näppäinhatussa lukee ja ruudulla näkyy ö-kirjain mutta kyseinen merkki silti "oikeasti" on pystyviiva.

Vaikka skandinaavisten kirjaimien käyttö tiedostonnimissä on mahdollista, se on yhä epäsuositeltavaa, koska se voi aiheuttaa erilaisia ongelmia. Sen sijaan tiedostojen sisällössä niitä voi toki käyttää.

Kontrollimerkit

Unix-tietokoneiden käyttämisessä tarvitaan melko usein myös nk. kontrollimerkkejä (control characters). Niillä vaikutetaan käytetyn tietokoneen toimintaan eri tavoilla eli kontrolloidaan sitä, mitä kone tekee. Vaikutus on ohjelmakohtainen, mutta joitakin yleisiä käytäntöjä on vakiintunut. Tässä oppaassa on esitetty muutama kontrollimerkki, ja niistä on sellaisia merkintöjä kuin control-c. Muissa dokumenteissa kontrollimerkeistä saatetaan käyttää sentapaisia merkintöjä kuin CTRL-C, C-C tai ^C.

Esimerkiksi control-c saadaan aikaan siten, että painetaan control-näppäin alas ja pidetään se alaspainettuna kun painetaan c-näppäintä. (Control on se näppäin, jossa on merkintä CTRL tai CONTROL tms. ja joka usein on näppäimistön vasemmassa alakulmassa.) Ei siis tarvitse yrittää näpäyttää kyseisiä näppäimiä yhtä aikaa, eikä niitä pidä näpäyttää peräkkäin. Menettelytapa on siis samanlainen kuin isojen kirjainten kirjoittaminen tasonvaihtonäppäimen (SHIFT) avulla. Pelkkä control-näppäimen painallus ei vaikuta yksinään mitään, vaan sen pitäminen alhaalla muita näppäimiä paineltaessa muuttaa niiden merkitystä (esim. c-kirjaimesta control-c:ksi).

Sellaisia kontrollimerkkejä, joita Unixissa tarvitaan varsin yleisesti, ovat juuri edellä esimerkkeinä mainitut