UniPad: laajan merkkivalikoiman tekstieditori Windows-ympäristöön

UniPadillä voi tuottaa ja muokata erikielisiä, myös erikoismerkkejä sisältäviä tekstitiedostoja Windows-ympäristössä. Nimen alkuosa viittaa Unicodeen, ja ohjelma tukee periaatteessa koko Unicode-merkistöä, käytännössäkin varsin laajaa valikoimaa, esim. kreikkalaisia, kyrillisiä ja arabialaisia kirjaimia, hiragana- ja katakana-merkkejä sekä matemaattisia symboleita - ei kuitenkaan esim. kiinalaisia merkkejä. UniPadin käyttämät perustallennusmuodot ovat erilaisia Unicode-koodauksia, mutta se osaa tallentaa useissa muissakin muodoissa. Ja tarvittaessa tiedoston voi muuntaa muihinkin muotoihin Free recode -ohjelmalla.

Perustiedot Unipadistä

UniPad eli SC UniPad on Sharmahd Computing GmbH:n jakama ohjelma, jolla voi tuottaa ja muokata tekstejä, jotka sisältävät mitä tahansa Unicode-merkkejä. Tämä merkitsee erittäin laajaa merkkivalikoimaa.

UniPad on tekstieditori, ei siis tekstinkäsittelyohjelma kuten esim. MS Word. UniPadin mukana tulee laaja fontti, joten sillä voi kirjoittaa siitä riippumatta, mitä fontteja järjestelmässä muuten on. Kyseinen fontti on varsin yksinkertainen ja sopii siihen, että kirjoittaja näkee, mitä kirjoittaa - ei juuri muuhun. (Esim. UniPadistä suoraan paperille tulostettu dokumentti sisältää merkit pistematriisitasoisina.) Olennaista siis on, mitä aiot tehdä dokumentille, ottaen huomioon, että se on pelkkää tekstiä, siis sisältää informaation merkkeinä, ilman mitään viittausta ulkoasuun. UniPadillä tehtyjä dokumentteja voi mahdollisesti avata Wordillä - tämä riippuu mm. Wordin versiosta. Yleisesti niitä voi käyttää kaikkialla, missä ohjelmilla on perusvalmius lukea Unicode-tekstiä; tällainen ohjelma voi toki olla muunnosohjelma, joka konvertoi tekstin toiseen muotoon, joka on sitten jonkin toisen ohjelman näytettävissä tai muuten käsiteltävissä.

UniPad sopii esim. HTML-dokumenttien kirjoittamiseen Webiä varten. Siinä ei ole mitään erityistä tukea HTML-kielelle, vaan HTML-merkkaus kirjoitetaan normaalilta näppäimistöltä. Tekstisisällön osalta voidaan sitten hyödyntää UniPadin tarjoamaa merkkivalikoimaa. Ks. Web-julkaisemisen oppaan lukua Merkillisyyksiä.

UniPad toimii 32-bittisessä Windowsissa (Windows 95, Windows 98, Windows NT, Windows 2000).

UniPadin versio 0.9x oli vapaa (maksuton). Version 1.0 ilmoitettiin olevan vapaa ei-kaupalliseen käyttöön ja arviointitarkoituksiin. Toteutunut tilanne on, että maksuttomalla (rekisteröimättömällä) versiolla voi käsitellä enintään 1 000 merkin mittaista tiedostoa. Tämä rajoitus astuu voimaan 10 minuutin käytön jälkeen, joten isompaakin tiedostoa voi käsitellä, jos käynnistää ohjelman aika tiheästi uudestaan. Käytännössä UniPadin maksuton versio sopii koekäytön lisäksi pienimuotoisiin tehtäviin ja satunnaiseen tarpeeseen.

Seuraava kuva osasta UniPadin ikkunaa eräässä tilanteessa havainnollistanee sen ideaa:

[Osaikkuna, jossa näkyy tekstiä suomeksi, venäjäksi ja kreikaksi.
Toinen osaikkuna, jossa on kreikkalainen näppäimistö.]

Se, mikä näppäimistö kulloinkin on näytössä, on vaihdettavissa UniPadin valikoista. Sen lisäksi, että merkkejä voi kirjoittaa klikkaamalla kuvaruudussa olevan näppäimistön näppäimiä, voi myös käyttää fyysistä näppäimistöä. Esimerkiksi kreikkalaisen sigma-kirjaimen saa aikaan myös s-näppäimellä.

Imurointi, asennus ja käynnistys

UniPad on imuroitavissa osoitteesta
http://www.sharmahd.com/cgi/download?file=up.zip
Se on ns. zipatussa muodossa ja kooltaan noin 2 megatavua.

Imuroi tiedosto (nimeltään up.zip) uuteen väliaikaiseen hakemistoon ja unzippaa se siellä (esim. WinZipillä). Suorita sen jälkeen asennusohjelma upsetup.exe

UniPad voidaan sitten käynnistää kaksoisklikkaamalla sen kuvaketta. Tällöin se avaa uuden ikkunan, jonka sisään voi avata UniPadin omia ali-ikkunoita.

Peruskäyttö

UniPadin ikkunan ylälaidassa on Windows-ohjelmille tyypillinen valikko: File, Edit, Search, Options, Window, Help. Sen alla on työkalupalkki. Palkissa vasemmalla on painikkeet , joista voi avata uuden tyhjän ali-ikkunan tai olemassaolevan tiedoston uuteen ali-ikkunaan. Oikealla taas on työkaluja seuraavasti:

  1. valikko, josta voi valita näppäimistön asettelun eräillä kielille sopivaksi
  2. painike, joka avaa edellä mainitun näppäimistön ali-ikkunaan;
  3. painike, joka avaa ns. merkkikartan (Character Map), josta voi valita minkä hyvänsä Unicode-merkin.
Näppäimistöasetteluvalikossa on oletusarvona (System), joka tarkoittaa asettelua, joka vastaa fyysistä näppäimistöä. Muista vaihtoehdoista esimerkiksi espanjankielisessä näppäimistössä on ñ-näppäin (meikäläisen näppäimistön ö-näppäimen tilalla) sekä välineitä aksenttien liittämiseksi merkkeihin, ja venäläinen näppäimistö taas suunnilleen vastaa venäläisten kirjoituskoneiden näppäimistöä.

Muutoin käyttö on muistuttaa tavallisen editorin käyttöä. UniPadillä voi avata olemassaolevan tiedoston File-valikon Open-toiminnolla (Unicode-koodatut tiedostot) tai Import-toiminnolla (osaa useimmat tavalliset koodaukset, kunhan sille kerrotaan, mikä koodaus on kyseessä). Mainittakoon, että Search-toiminnossa voi haettavan merkkijonon kirjoittaa vain fyysiseltä näppäimistöltä (mutta ohjelma tulkitsee näppäinpainallukset senhetkisen näppäimistöasetuksen mukaan). Käyttöohjeita saa F1-funktionäppäimellä. Monet asetuksista ovat muutettavissa Options-valikon kautta.

Kun tiedosto halutaan tallentaa, on niin käytettäessä File-valikon Save-toimintoa on valittava jokin Unicode-koodauksista tallennusmuodoksi. Sopivin lienee UTF-8, koska se on niistä laajimmin tuettu. Mutta File-valikon Export-toimintoa käytettäessä voidaan tallennusmuoto valita useista muista vaihtoehdoista, esim. venäjänkieliselle tekstille KOI8-R. Lisäksi tallennettu tiedosto voidaan tarvittaessa muuttaa muihinkin koodauksiin jäljempänä kuvattavalla Free Recode -ohjelmalla.

Tallennusmuotona on tarjolla myös "ASCII+XML CharRefs (decimal)", joka on salaperäisen näköisestä nimestään huolimatta hyödyllinen: se tallentaa tiedoston tekstitiedostona, jossa kaikki muut merkit kuin ASCII merkit ovat merkkiviittauksina (entity references) kuten Σ. Tämä on kätevää silloin, kun halutaan liittää Web-sivuun lyhyt teksti, jossa on "eksoottisia" merkkejä. Teksti voidaan kirjoittaa UniPadillä, ja edellä mainittuun muotoon tallennettuna se sitten voidaan liittää sivun osaksi.

Aksentit ja muut diakriittiset merkit

Aksenttien ja muiden diakriittisten merkkien lisäämistä varten useissa näppäimistövaihtoehdoissa on erityisiä apunäppäimiä. Niissä on pisteviivalla esitetty ympyrä ja sen päällä tai alla diakriittinen merkki. Älä klikkaa näitä näppäimiä, vaan katso niiden vastineet fyysisestä näppäimistöstä ja käytä niitä apunäppäiminä samaan tapaan kuin shift-näppäintä käytetään! (Jos nimittäin klikkaat sellaista tai jos näpäytät vastaavaa fyysistä näppäintä, tulet lisänneeksi dataan merkin, joka on ns. combining diacritic, joka on kyllä hieno ajatus Unicodessa mutta jota vielä varsin harvat ohjelmat tukevat.)

Esimerkiksi kun kreikankielinen näppäimistö on valittuna, niin pienen alfan, jonka päällä on painomerkki, saa aikaan näin:

  1. Paina alas ö-näppäin fyysisestä näppäimistöstä; älä päästä sitä ylös. (Fyysisen näppäimistön ö-näppäin vastaa ruudussa näkyvän kreikkalaisen näppäimistön apumerkkiä, jolla lisätään painomerkki.) Siirry heti seuraavaan kohtaan, sillä jos pidät kyseistä näppäintä liian kauan alhaalla, saattaa ns. auto-repeat-toiminta sotkea suunnitelmasi.
  2. Näpäytä fyysisen näppäimistön a-näppäintä tai klikkaa ruudussa näkyvän näppäimistön alfa-näppäintä. (Jos haluaisitkin kirjoittaa ison alfan, johon liittyy painomerkki, niin tässä vaiheessa käyttäisit apuna shift-näppäintä tavalliseen tapaan.)
  3. Päästä ö-näppäin ylös.

Entä kun haluttua merkkiä ei löydy näppäimistöistä?

Vaikka UniPad tukee monille eri kielille sopivia näppäimistöjä, niin kaikkia Unicode-merkkejä ei toki saa niiden kautta aikaan. Esimerkiksi matematiikan erikoissymbolit pitää tuottaa muutoin.

Edellä mainittu merkkikartta (Character Map) sisältää kaikki Unicode-merkit. Tosin kaikkia ei voi järkevästi käyttää, koska UniPadin fontti ei sisällä esim. kiinalaisia merkkejä. Merkkikartassa on alasvetovalikko, josta voi valita Unicode-merkistön osan seuraavassa esimerkissä on merkkikartan yläosaa tilanteessa, jossa on valittu osa "Mathematical Operators":

1. rivi: Character Map; 
2. rivi: nuolet vasemmalle ja oikealle, tyhjä laatikko, Mathematical Operators;
3. rivi: 220 221 222 223 224 ... 22E 22F; 
4. rivi: 0 [kaikki-operaattori ja erilaisia muita matemaattisia symboleita]; 
5. rivi: 1 [erilaisia matemaattisia symboleita]; 
6. rivi: 2 [erilaisia matemaattisia symboleita]

Klikkaamalla symbolia voi lisätä sen tekstiin. Rivi 220 221 ... kertoo kunkin sarakkkeen merkkien Unicode-koodiarvojen kolme ensimmäistä numeroa, ja neljäs numero on vastaava vaakarivin numero. Esimerkiksi kaikki-operaattorin koodiarvo on siis 2200 (heksadesimaalisena) Tämän näkee myös viemällä kursorin kyseisen merkin kohdalle, jolloin UniPad näyttää näppäimistökartan alla vastaavan tiedon: U+2200 FOR ALL, jossa siis on myös merkin virallinen nimi.

Koodikartassa vasemmalla ylhäällä olevilla nuolilla voi siirtyillä Unicodessa pienempiin tai suurempiin koodiarvoihin. Kirjoittamalla niiden perässä olevaan tyhjään tilaan koodiarvo päästään suoraan merkistön osaan, jossa kyseinen merkki on. (Enteriä tai returnia ei tarvitse painaa, vaan riittää kirjoittaa neljä heksadesimaalinumeroa.) Nimen perusteella ei merkkiä voi etsiä, mutta siihen voi käyttää Indrek Heinin merkkitietokantapalvelua.

Niistä Unicode-merkistön osista, joita voi valita edellä mainitun valikon kautta, huomattakoon erityisesti seuraavat seikat:

Free recode

Free recode on François Pinardin tekemä ohjelma, jolla voi suorittaa hyvin monenlaisia merkkikoodimuunnoksia. Se käyttää sisäisesti Unicode-esitystä "välikielenä", jonka kautta muunnokset tapahtuvat.

Ohjelma on, kuten nimestä voi päätellä, vapaa eli vapaasti kopioitavissa ja käytettävissä. Ohjelman mukana tulee manuaali. Ohjelman DOS- ja Windows-versio on imuroitavissa valmiina .exe-tiedostona. Riittää siis ladata se sopivaan hakemistoon. Käytön helpottamiseksi voi huolehtia siitä, että kyseinen hakemisto on hakupolussa (path). Silloin ohjelmaa voi käyttää (komentoikkunassa) tähän tapaan:
recode dos..win juttu.txt
muuntaa tiedoston juttu.txt ns. tavallisesta DOS-koodauksesta ns. tavalliseen Windows-koodaukseen.

Jos on esimerkiksi kirjoitettu kreikankielinen tekstitiedosto paradeigma.txt ja tallennettu se UTF-8-koodattuna, niin seuraava muuntaa sen ISO 8859-7-koodaukseen:
recode utf-8..iso-8859-7 paradeigma.txt

Varoituksia: