Vinkkejä Nykysuomen sanakirjan digiversion käyttöön

Nykysuomen sanakirjan digitoitu versio julkistettiin 1.3.2021. Kuten julkistusuutinen kertoo, teos on verkossa vapaasti käytettävissä PDF-muodossa teksti­skannattuna näköis­julkaisuna, ja tämä mahdollistaa merkki­jono­hakujen tekemisen.

Käytännössä kirja on kuutena erittäin isona (577–723 megatavua) tiedostona, joissa sivut ovat skannattuina hyvä­laatuisina kuvina siten, että ikään kuin kuvan päällä on näkymätön sisältö myös tunnistettuna (OCR-skannattuna) tekstinä. Tämän takia kuvasta voi näennäisesti valita tekstiä hiirellä; todellisuudessa tällöin valitaan vastaava näkymätön teksti, jonka sitten voi liittää johonkin ohjelmaan näkyviin.

Pelkästään Nykysuomen sanakirjan lukemiseenkin digiversio on monin tavoin kätevämpi kuin painettu kirja: se on aina saatavilla, teksti on luettavampaa kuin painetussa kirjassa ja se on zoomattavissa.

Tiedostoista

Tekstisisällöstä

Tekstiskannaus on tehty hyvin, mutta tuloksessa on virheitä. Ne vaikuttavat myös tekstin löydettävyyteen haku­toiminnoilla. Virheitä on muun muassa seuraavanlaisia:

Dokumentissa Huomioita Nykysuomen sanakirjan verkkoversiosta (Word-asiakirja) on tarkempia huomioita skannaus­ yms. virheistä.

Muun muassa kirjan alussa olevissa taivutuskaavoissa on sattunut virheitä, ja lisäksi niiden taulukkomainen rakenne on hajonnut. Tämän takia olen tehnyt koosteet Nominien taivutus­tyypit Nykysuomen sanakirjassa ja Verbien taivutustyypit Nykysuomen sanakirjassa.

Vaikka tekstiä voi leikata ja liimata, tulos on syytä tarkistaa, jos esimerkiksi halutaan esittää lainaus. Myös lainaus- ja heitto­merkit ja ajatus­viivat on tarkistettava. Lisäksi leikkaamalla saadaan mukaan pelkkä teksti, ei muotoiluja (lihavointi, kursivointi, kapiteeli, harvennus, ala- ja yläindeksit).

Hakutoiminnot

Digiversion sisällön ongelmia

Usein sanotaan, että Nykysuomen sanakirjan kaikki versiot ovat täysin identtisiä, vaikka nidosasu onkin muuttunut. Tämä ei tarkkaan ottaen pidä paikkaansa.

Alkuperäisessä, vuosina 1951–1961 julkaistussa painoksessa, josta skan­naus on tehty, oli kunkin osan lopussa Oikaisuja-osasto ja vii­meisen osan lopussa lisäksi Täydennyksiä-osasto. Vuonna 1967 julkaistiin kolmena nidoksena ”lyhentämätön kansanpainos”. Sen jälkeen jul­kais­tiin useita painoksia, joista kuitenkin on Kansallis­bibliografiassa tietoa hy­vin sekavasti.

Kaikki painokset lienee tehty samoilla painolaatoilla, joihin kuiten­kin tehtiin muutoksia vuoden 1967 kansanpainoksessa siinä mielessä, et­tä alkuperäisen julkaisun osien lopussa esitetyt oikaisut tehtiin itse teks­tiin (ja osien lopusta tietysti poistettiin Oikaisuja-osastot) ja lisäksi Täy­dennyksiä-osasto otettiin huomioon siinä mielessä, että sanakirjan sisäl­töön lisättiin reunukseen merkinnät, joilla osoitetaan, mihin kohtiin on täydennyksiä.

Koska verkkoversio perustuu alku­peräiseen julkaisuun, se poikkeaa kaikista myöhemmis­tä: osien lopussa on suuri määrä korjauksia, jotka myöhemmin tehtiin varsinaiseen tekstiin Lisäksi Täydennyksiä-osastoon ole viittauksia sisällössä. Jos siis lukija haluaa varmistua esimerkiksi siitä, että jokin 1. osassa oleva kohta on oikein (siinä mielessä, että siihen ei ole oi­kaisua), hänen on käytävä läpi kaikkien osien Oikaisuja-osastot. Lisäksi on tietysti mah­dol­lis­ta, että siihen on tullut täydennys, kuten lisäys sanan merkityksiin, joka on vii­mei­sen tiedoston lopussa olevassa Täydennyksiä-osastossa.