Tässä kohdassa käsitellään lähinnä yleisnimien, etenkin termien, asun tarkistamista. Edellisessä kohdassa käsiteltiin erisnimiä.
Oikolukuohjelmat paljolti vapauttavat kirjoittajan sääntöjen muistelemisesta ja hakuteosten selaamisesta. Toisaalta ne eivät aina ole oikeassa, ja ne saattavat ohjata virallisten normien sokeaan noudattamiseen. Lisäksi niiden tuntema sanasto on kyllä yleensä varsin laaja, mutta rajoittuu yleiskieleen, eikä siinä useinkaan ole mukana yleiskielenkään uusinta sanastoa.
Seuraava kuva esittää Word-ohjelman erästä vanhahkoa versiota tilassa, jossa automaattinen oikeinkirjoituksen tarkistus on käytössä. Tässä esimerkissä Word huomauttaa useista sanoista. Käyttäjä on napsauttanut hiiren oikealla napilla ensimmäistä näistä sanoista, ”psygologia”, ja Word tarjoaa vaihtoehdoksi sanaa ”psykologia”. Jos käyttäjä valitsee tämän vaihtoehdon, Word korjaa tekstin sen mukaiseksi. Useimmiten Wordin tarjoama vaihtoehto on oikea. Tämä koskee myös sanaa ”piirrustus”, jolle Word tarjoaa vaihtoehtoa ”piirustus”. Sanan ”megalomania” (’suuruudenhulluus’) Word on myös merkinnyt, vaikka se on oikein kirjoitettu. Word vain ei tunne tätä sanaa lainkaan. Vastaavasti se ilmoittaa erisnimestä ”Zeppelin”.
Jos oikolukutoiminto on merkinnyt sanan ongelmalliseksi, niin kannattaa katsoa, tarjoaako se korjattua asua. Jos tarjoaa, se on yleensä oikea asu. Jos ei tarjoa tai jos kirjoittaja epäilee, ettei korjaus olisi oikea, on syytä tarkistaa sanan asu hakuteoksista.
Oikolukutoiminnoille voi yleensä ”opettaa” lisää sanoja. Kuvassa näkyvässä valikossa, jossa ensimmäinen vaihtoehto on ”psykologia”, vaihtoehto ”Lisää” tarkoittaa Wordin merkitsemän sanan lisäämistä Wordin käyttämään sanastoon. Tämä ei tietenkään olisi järkevää sanan ”psygologia” osalta, mutta kylläkin sanan ”megalomania” osalta, jos sitä käytetään tekstissä muuallakin. Tällöin Word pitää sitä oikein kirjoitettuna sanana eikä enää huomauttele siitä. Valitettavasti tällöin on kuitenkin yleensä lisättävä sanan eri muodot (megalomanian, megalomaniaa jne.) erikseen.
Riippuu kirjoittajan tottumuksista ja luonteestakin, onko parempi pitää oikeinkirjoituksen tarkistus koko ajan käytössä. Tätä mahdollisuutta kannattaa kokeilla. Monet oppivat sujuvasti korjaamaan kirjoitusvirheet saman tien. Silloin vältetään useimmat kirjoitusvirheet sellaisissakin teksteissä, joilla ei jakseta tehdä erillistä kielentarkistusta. Mutta jos se tuntuu häiritsevän keskittymistä asiaan ja luovuutta, voi valita toisen toimintatavan: kirjoitetaan teksti sisällöltään valmiiksi, ja sitten tehdään erillinen kieliasun tarkistus.
Sanojen kirjoitusasu ja merkitykset kannattaa tarkistaa suomen kielen sanakirjoista, ensisijaisesti Kielitoimiston sanakirjasta. Niitä voidaan pitää arvovaltaisimpina tietolähteinä, kun kyse on yleiskielen sanoista, ellei sitten jostakin asiasta ole erillistä kielitoimiston tai kielilautakunnan kannanottoa. Kielihän muuttuu jatkuvasti, ja myös sääntöjä muutetaan, joskin melko hitaasti. Ks. myös kohtaa Kielen sääntöjen alkuperä.
Sanakirjoihinkin on kuitenkin hyvä suhtautua kriittisesti. Esimerkkinä voi mainita lehtiuutisen, jossa oli käytetty sanaa ”erakkuus” ja joka tämän takia herätti hämmennystä. Sanan asu oli todennäköisesti tarkistettu Nykysuomen sanakirjasta, jossa todella on tällainen erakko-sanan johdos. Säännöllisempi johdos on kuitenkin ”erakkous”, ja se on myös sata kertaa yleisempi, vaikka mikään sanakirja ei sitä mainitsekaan.
Erikoisalojen sanasto on yleisissä sanakirjoissa paitsi suppeahko myös melko epäluotettava. Sanakirjojen laatijoilla ei useinkaan ole ollut riittävää erikoisalojen tuntemusta, ja siksi etenkin termien määritelmät saattavat olla puutteellisia tai yksipuolisia, jopa virheellisiä. Myös kirjoitusasu saattaa poiketa erikoisalalla todellisuudessa käytetystä esimerkiksi siksi, että sanakirjan tieto on vanhentunut.
Eri aloilla on laadittu hyvin paljon erikoissanastoja, joiden luonne ja arvovalta vaihtelee hyvin paljon. Kyse voi olla esimerkiksi yksityisen asianharrastajan pikaisesti kokoamasta sanaluettelosta taikka valtakunnallisen keskusjärjestön sanastotyöryhmän vuosien kuluessa laatimasta sanastosta. Tietoja Internetissä olevista erikoissanastoista on aihepiireittäin luokiteltuina sivulla Termisanastoja Webissä.
Uusimmat sanat eivät useinkaan ole ehtineet mihinkään sanastoon, tai niistä voi olla eri sanastoissa erilaisia kirjoitusasuja ja määritelmiä. Muutenkin on usein hyvä selvittää, miten muut kirjoittavat. Sanastotyöryhmän hyväkään sana ei ehkä ole levinnyt käyttöön, ja silloin sitä ei selittämättä ymmärrä asiantuntijakaan. Internetin hakutoiminnot, kuten Google ja Yahoo, auttavat saamaan nopeasti jonkinlaisen käsityksen kielenkäytöstä. Vaikka useimmat Internetin käyttäjät jo osaavat käyttää tällaisia välineitä, niiden eri ominaisuuksien tunteminen tehostaa työskentelyä merkittävästi. Aiheesta on tietoa Suomen yleisten kirjastojen sivuston tiedonhakuohjeissa <http://www.kirjastot.fi/tiedonhaku/>.
Ammattialan, tieteenalan tai harrastusalan sanaston ja yleensä kielenkäytön lähteinä kannattaa käyttää hyviä suomenkielisiä oppikirjoja ja käsikirjoja. Vaikka tuntisikin niiden asiasisällön, niistä voi katsoa, mitä termejä on käytetty, sillä yleensä kirjan tekijä on selvitellyt ja pohtinut myös nimityskysymyksiä. Lisäksi suositut oppikirjat vaikuttavat siihen, mitä sanoja lukijat tuntevat ja pitävät luonnollisina. Vaikka kirjassa ei olisikaan varsinaista sanastoa, siinä on usein hakemisto, josta saa yleiskuvan käytetystä sanastosta ja jonka kautta termien määritelmät löytyvät.
Virallisissa yhteyksissä on usein turvallisinta valita sellainen termi, jota käytetään lakitekstissä tai direktiivissä. Suomen lainsäädäntö on melko hyvin saatavilla valtion säädöstietopankista Finlexistä<http://www.finlex.fi>. Siinä on myös hakutoiminto, jolla voi hakea mm. sanan tai jopa sananosan esiintymiä laeissa.
Jos rupeaa miettimään, pitäisikö kirjoittaa ”pikapuolin” vai ”pikapuoliin”, niin hyvä vaihtoehto on katsoa Kielitoimiston sanakirjasta. Se kertoo, että molemmat ovat käytössä ja tarkoittavat samaa, mainitseepa vielä muodon ”pikapuoleen”, joka on päähakusanana. Sanakirja ei siis anna vastausta kysymykseen, kumpi kirjoitusasu on parempi. Ehkäpä haluaisimme varmuuden vuoksi käyttää sitä muotoa, jota useimmat käyttävät.
Joskus saatetaan haluta käyttää kahdesta muodosta yleisempää jopa silloin, kun se ei ole normien mukainen. Voi olettaa, että se aiheuttaa vähemmän hämmennystä ja se tunnetaan paremmin.
Sanakirjoilla on myös rajoituksensa. Kielitoimiston sanakirjasta puuttuu paljon erikoisalojen termejä ja myös aivan uusia sanoja, joita kieleen on tullut.
Yksi tapa lähestyä asiaa on käyttää jotakin Internetin hakujärjestelmistä, ”hakukoneista”, kuten Google-hakua. Näin saatavat tulokset eivät tietenkään anna edustavaa otosta kaikesta kirjoitetusta kielestä, vaan vain tietoja sanojen esiintymistä niillä web-sivuilla, jotka ovat Googlen tietokannassa.
Eräässä testissä käytettiin haussa ensin yhtä, sitten toista vaihtoehtoa hakusanana, ja Google kertoi, että ”pikapuolin” esiintyy noin 429 sivulla ja ”pikapuoliin” esiintyy noin 1 240 sivulla. Luvut tietysti muuttuvat ajan myötä ja ovat nyt paljon suurempia. Muotoa ”pikapuoliin” voidaan kuitenkin edelleen pitää selvästi yleisempänä.
Googleen ja muihin hakukoneisiin kannattaa kuitenkin suhtautua kriittisesti. Niiden toimintatavat ovat muuttuneet ja tulevat muuttumaan. Niiden ilmoittamat osumien määrät saattavat poiketa todellisesta paljonkin.
Mobiililaitteissa Google-haun tuloksissa ei ole tietoja osumien määristä. Tämä on tarkoituksellista ja saattaa ennakoida sitä, että Google jättää sellaiset tiedot pois muutoinkin. Nykyisin määrät näyttävät yleisesti puuttuvan Googlen antamista tuloksista myös muilla laitteilla, mutta tämä voi-olla riippua maasta, josta ollaan, tai erilaisista toiminta-asetuksista.
Muista hakukoneista ainakin Bing kertoo arvion osumien määristä, samoin vähemmän tunnettu Mojeek.
Vaikka Google-hauissa yleensä kannattaa käyttää sanan perusmuotoa (nominatiivia), saattaa tällainen haku aiheuttaa vinouman, jos kyseessä on uudehko termi. On mahdollista, että sana esiintyy sanakirjoissa ja -luetteloissa, mutta ei juurikaan todellisessa kielenkäytössä. Hyvä tapa etsiä todellisia käyttöesiintymiä on käyttää sellaisia taivutusmuotoja, joita voi odottaa esiintyvän, kun sanaa käytetään lauseissa, kuten genetiiviä ja partitiivia. Haku sanalla ”valtuustieto” saattaa löytää monia sanastoja, mutta ”valtuustiedon” tai ”valtuustietoja” löytää esiintymiä teksteistä, joissa sanaa oikeasti käytetään.
Tosin asioita mutkistaa se, että ainakin Google tunnistaa jossain määrin myös sanojen taivutusmuotoja. Yleensä se pyrkii löytämään sivut, joilla hakusana esiintyy ainakin jossain muodossa. Se ei kuitenkaan osaa esimerkiksi suomen taivutusta kunnolla, vaan tunnistaa vain osan muodoista.
Tarkastellaan esimerkkinä kysymystä, pitäisikö Kiinan pääkaupungin nimi kirjoittaa vanhaan tapaan ”Peking” vai uuteen tapaan ”Beijing”. Ongelmana on, että Google-järjestelmä on maailmanlaajuinen – se sisältää miljardeja sivuja, joista vain pieni osa on suomea. Vaikka haun voi periaatteessa rajoittaa suomenkielisiin sivuihin, rajoitus ei toimi kovin hyvin, koska Google ei aina tunnista sivun kieltä oikein. Niinpä tässä tapauksessa on parempi tehdä haku niin, että käytetään jotakin tavallista taivutusmuotoa, jota ei esiinny muissa kielissä kuin suomessa, esimerkiksi sanoja ”Pekingissä” ja ”Beijingissä”. Tällöin haku myös kohdistuu aidommin nimen käyttöön normaalissa tekstissä, ei sen esiintymiin luetteloissa, taulukoissa yms., joissa se on yleensä perusmuodossa.
Vuosia sitten tehty haku antoi tulokseksi, että ”Pekingissä” esiintyy noin 2 110 sivulla. Vastaava haku sanalla ”Beijingissä” antoi tuloksen 389. ”Äänestyksen” tulos on siis aika selvä: vanha muoto on edelleen selvästi yleisempi. Se on epäilemättä myös suuremmalle joukolle lukijoita tuttu ja ymmärrettävä. Eri asia on, että joissakin yhteyksissä saattaa olla jokin erityinen syy käyttää uutta kirjoitusasua.
Nyt vastaavat tulokset sisältävät kuitenkin satojatuhansia osumia. Syynä on, Google nykyisin löytää myös sanan esiintymiä muissa muodoissa kuin annetussa hakusanan muodossa. Tämän voi ainakin osittain estää kirjoittamalla sanan ympärille (pystysuorat) lainausmerkit, esimerkiksi "pekingissä". On kuitenkin epäselvää, mitä merkitsee esimerkiksi se tulos, että lausekkeella "beijingissä" löytyy 9 130 sivua, lausekkeella "pekingissä" 151 000 sivua. Jälkimmäinen luku ei liene todellinen. Ero on selvä ja Pekingin eduksi, mutta tuskin näin suuri.
Edellä esitetty esimerkkikin osoittaa, ettei Google-hakujen tuloksiin pidä luottaa. Niiden laskentaperusteita ei kerrota, eikä Google edes anna selata osumia järjestyksessä kuin johonkin rajaan saakka. Tämän havaitsee esimerkiksi käymällä läpi haun "pekingissä" tuloksia. Kun tullaan 30. sivulle, Google ilmoittaakin ”Sivu 30 noin 281 tuloksesta”. Tämä tuskin johtuu siitä, että tulosten todellinen määrä olisi noin pieni, vaan siitä, että Google ei suostu näyttämään kaikkia osumia. Tämä saattaa liittyä siihen, että Google yrittää estää sivujen tekijöitä huijaamasta hakukoneita. Toisaalta siitä seuraa, että Google-osumien määrä on hyvin tulkinnanvarainen käsite.
Tuloksia sekoittaa myös se, että nykyisin netissä on paljon kielenkääntöohjelmilla tuotettuja sivuja, joilla esiintyy ilmauksia, joita ei juuri esiinny todellisessa kielenkäytössä. Tämä koskee ennen muuta sanojen yhdistelmiä.
Vieraskielisten nimien asun selvittämisessä on paljon hyötyä, jos tiedetään varmasti, mitä kieltä nimi on. Tällöin nimittäin voidaan tehdä hakuja kyseisenkielisiltä sivuilta. Niillä nimen asu on varmemmin oikea kuin englanninkielisessä uutistoiminnassa.
Joskus kirjoittajan on syytä tahallisesti kirjoittaa sääntöjen vastaisesti. Yksi syy tähän on, että joskus sääntö on selvästi yleisen kielitajun ja käytännön vastainen.
Kielitoimiston vanhan kannanoton mukaan tulisi muinaisen Egyptin hallitsijoiden nimitys kirjoittaa ”farao” eikä ”faarao”. Perusteluksi on mainittu, että muinaisegyptissä sanan ensimmäinen vokaali on lyhyt. Todellinen peruste lienee kuitenkin se, että kirjoitusasua ”farao” on vanhastaan käytetty raamatunsuomennoksissa. Äänneasu on kuitenkin useimmiten ”faarao”, ja luultavasti useimmat pitävät myös sen mukaista kirjoitusasua luonnollisempana. Olisiko siis ainakin suurelle yleisölle kirjoittavan parempi rikkoa sääntöä? – Kielenhuollon kanta muuttui vuonna 2016 niin, että myös faarao sallitaan. Tämä oikeastaan vain vaikeutti valintatilannetta.
Kun jokin työryhmä kokoaa jonkin erikoisalan sanastoa yksiin kansiin, se joutuu usein ottamaan kantaa sanoihin, joille ei vielä ole muodostunut yleistä suomenkielistä vastinetta. Vielä selvempi kannan ottamisen tarve on silloin, kun joku on kirjoittamassa ensimmäistä suomenkielistä oppikirjaa joltakin alalta. Sanastojen tekijät saattavat myös pitää yleisesti käytössä olevia sanoja niin huonoina, että ne pitäisi korvata toisille. Joskus sanastojen tekijöiden ehdotukset tulevatkin yleiseen käyttöön. Useammin ne jäävät vaille vastakaikua. Esimerkiksi ATK-sanakirja tarjosi vuosien ajan sanaa ”umpilevyasema” ilmaisun ”hard disk unit” vastineeksi, mutta koska vain harvat rupesivat sitä käyttämään, otettiin vuoden 2003 painokseen päähakusanaksi ”kiintolevyasema”, joka vastaa alan yleistä kielenkäyttöä (joskin usein käytetään lyhempää sanaa ”kiintolevy”).