Zippaus ja unzippaus

"Zippaus" tarkoittaa tässä dokumentissa erästä tarkoin määriteltyä dataan kohdistuvaa toimenpidettä, ja tässä käsitellään lyhyesti siihen tarkoitettuja ohjelmia kuten WinZip. Zippausta käytetään kahteen tarkoitukseen, usein yhtaikaa: tiivistämään dataa pienempään tilaan, etenkin jotta se siirtyisi nopeammin, ja yhdistämään joukko tiedostoja yhdeksi "paketiksi", joka voidaan kätevästi lähettää kerralla tai arkistoida. Tässä kuvataan lyhyesti myös mitä muuta "zip" voi merkitä.

Mitä kaikkea "zip" voi tarkoittaa

Englannin sanalla zip on monia eri merkityksiä, ja se on hauska sana. Täten on ymmärrettävää, että ATK-alalla sitä on ruvettu käyttämään monia ihan erilaisiakin teknisiä asioita tarkoittamaan. Tästä on toisaalta aiheutunut paljon sekaannusta, joten tarkastelemme lyhyesti myös sitä, mitä kaikkea muuta "zip" voi ATK:ssa tarkoittaa.

Muutama keskeinen nimitys, joissa esiintyy merkkijono "zip" ja jotka helposti sekaantuvat toisiinsa:

zippaus (engl. zipping)
Eräs tekniikka useiden tiedostojen yhdistämiseksi yhdeksi tiedoksi, yleensä datan esitysmuotoa tiivistäen ("pakaten"). Teknisesti menetelmän määrittelee mediatyypin application/zip kuvaus. Tämä on tässä dokumentissa tarkasteltava merkitys. Zipatussa muodossa olevaa aineistoa ei voi käyttää suoraan, vaan se pitää ensin "unzipata" sopivalla ohjelmalla (joita jäljempänä kuvaillaan).
.zip
Zipatuille tiedostoille yleisesti käytetty (ja suositeltava) tiedostonnimen loppuosa.
gzip (GNU zip)
Ohjelmisto datan tiivistämistä varten. Huomaa, että tämä on osittain samantapainen asia kuin zippaus, mutta gzip ei yhdistä tiedostoja ja käyttää eri tiivistysmenetelmää. Kyse on siis kahdesta keskenään "kilpailevasta" asiasta, joskin monet ohjelmat osaavat tehdä molempia. Huomaa, että gzipiä ei vastaa mikään rekisteröity mediatyyppi vaan se käsitetään koodaukseksi (ks. esim. HTTP:n määrittelyn kohtaa Content Codings).
Zip-levy
Datan siirtoon ja varastointiin, etenkin varmuuskopiointiin, käytetty muistiväline. Käyttö edellyttää siihen soveltuvaa levyasemaa.
ZIP code
Yhdysvalloissa käytetty postinumero (Zoning Improvement Plan).

Englannin kielessä z-kirjain ääntyy soinnillisena ässänä. Suomessa se usein lausutaan "ts" silloinkin, kun kyseessä on esimerkiksi englannista lainattu sana, ja tämä on tavallisinta myös zippauksesta puhuttaessa.

Miksi zipataan?

Zippauksen hyödyllisyys tulee selvimmin ehkä esiin seuraavanlaisissa tilanteissa: Meillä on joukko tiedostoja, joita haluamme jakaa yhtenä kokonaisuutena Internetin kautta. Kyseessä voi olla esimerkiksi Web-sivusto, josta halutaan tehdä versio, joka on kätevää ladata omaan koneeseen paikallisesti käytettävksi, jolloin sitä voi lukea mukavasti ja myös ilman Internet-yhteyttä lukemisen aikana. Tai kyseessä voi ohjelman ja siihen liittyvien data- ja ohjetiedostojen kokonaisuus. Mukana voi olla paitsi tekstitiedostoja myös kuvatiedostoja, käännettyjä ohjelmia jne.

Zippaus tekee kokonaisuudesta yhden tiedoston, joka voidaan kätevästi kopioida levykkeelle, panna Web-palvelimeen "yhdellä klikkauksella" imuroitavaksi, liittää meiliin liitetiedostona tms. Lisäksi zippaus yleensä tuottaa tiedoston, jonka koko on merkittävästi pienempi, kuin alkuperäisten tiedostojen yhteenlaskettu koko, esim. kolmasosa siitä. Tällä taas on merkitystä mm. sille, kauanko kestää "imuroida" aineisto Internetin kautta tai mahtuuko se yhdelle levykkeelle. Huomaa myös, että ainakin WinZip-ohjelma osaa kirjoittaa aineiston usealle levykkeelle.

Zipattu muoto sinänsä on riippumaton siitä, millaisessa järjestelmässä se on tehty. Esimerkiksi Unix-koneessa zipattu aineisto voidaan unzipata Windows-koneessa. Eri asia on, että aineistoon sisältyvien tiedostojen muodot eivät välttämättä toimi uudessa ympäristössä. Mutta esimerkiksi tekstimuotoiset ja HTML-muotoiset dokumentit toimivat yleensä hyvin (tosin rivinvaihtojen kanssa voi olla ongelmia), samoin useimmat tavalliset grafiikkaformaatit (esim. JPEG, GIF).

Zippaamista joissakin suhteissa vastaavia menetelmiä on useita muitakin. Aihetta käsittelee yleisesti aineiston Etätyö Euroopassa, Internet-osio kohta Pakkaaminen - tiedostojen pakkaaminen ja purkaminen.

Zippauksen ongelmia

Zippauksen haittana taas on se, että se tuo yhden työvaiheen lisää kumpaankin päähän: aineiston lähettäjän tai tarjoajan tulee suorittaa "zippaus" ja vastaanottajan sille käänteinen toimenpide eli "unzippaus". Tähän tarvitaan erityisiä ohjelmia, joita varsin usein ei tule valmiiksi tietokonejärjestelmän mukana, vaan ne pitää hankkia erikseen. Täten yleensä kannattaa pyrkiä tarjoamaan zipattu "jakelupaketti" vain yhtenä vaihtoehtona.

Tosin Windowsin perusasennuksen mukana on ME- ja XP-versioista lähtien tullut Exploreriin integroitu zip-tiedostojen katselu-, pakkaus- ja purkutoiminto, "Compressed Folders", joka toimii käytännössä lähes samoin kuin jäljempänä kuvattava WinZip. Lisätietoja: Windows ME: Compressed Folders.

"Unzippaus" periaatteessa palauttaa aineiston alkuperäiseen muotoonsa, aina tiedostonnimiä ja hakemistoja myöten. Tosin tässä voi olla rajoituksia, jotka johtuvat tietokoneiden tiedostojärjestelmien eroista.

Millä ohjelmilla voi zipata ja unzipata?

Eräs zipattujen tiedostojen muoto on ns. itsestäänpurkautuva (self-extracting) paketti, jolloin tiedoston nimen loppuosana on tavallisesti .exe eikä normaali .zip. (Kaikki .exe-tiedostot eivät suinkaan ole zipattuja paketteja; valtaosa niistä on jotain aivan muuta: ylipäänsä ohjelmia.) Kyse on tällöin siitä, että aineiston mukaan, samaan tiedostoon, on liitetty pienehkö ohjelma sen avaamiseksi. Tällöin paketin voi avata yksinkertaisesti ajamalla kyseisen ohjelman - mutta tämä on mahdollista vain sellaisessa koneessa, jossa ajettavaksi ohjelma on tehty! Paketin voi avata myös seuraavassa kuvattavilla ohjelmilla, ja tämä on suositeltavaa turvallisuussyistä silloinkin, kun käytettävässä koneessa voisi vain suorittaa paketin ohjelmana. Ethän voi tietää, mitä ohjelma oikeasti tekee!

Tavallisin zippaukseen ja unzippaukseen käytetty ohjelma lienee WinZip, joka on Windows-ohjelma, kuten nimestä voinee päätellä. Ohjelma on maksullinen, mutta melko edullinen, ja sille on maksuton kokeilukausi; lisäksi monet yhteisöt kuten korkeakoulut ovat hankkineet sen yhteislisenssejä. Internetixissä on suomenkielinen WinZip-opas. Eräs WinZipin kilpailija on NetZIP, joka on suunniteltu Web-selaimeen liittyväksi valmisosaksi (plugin).

Täysin lisenssimaksuton vaihtoehto Windows-käyttäjille on Info-ZIPin WiZ, joka on graafinen käyttöliittymä ohjelmille Zip ja Unzip, jotka ovat saatavissa muihinkin järjestelmiin, mm. Maceille MacZipin muodossa ja Unixeihin. Jos käytät Unixia, kannattaa ensimmäiseksi tarkistaa, onko järjestelmässä jo sopivat ohjelmat, jolloin ne luultavasti ovat nimellä zip ja unzip ja ohjeet löytynevät man-komennolla.

Seuraavassa on pikaohjeet WiZin asentamisesta ja käytöstä Windows 95:tä, 98:aa ja NT:tä varten:

  1. perusta C-levyn hakemistoon Ohjelmatiedostot tai Program Files alihakemisto nimeltä WiZ
  2. kopioi sinne WiZin jakelupaketti tiedostona wiz502xN.exe (missä numero-osa voi muuttua uusien versioiden myötä) esim. Web-selaimella osoitteen http://www.info-zip.org/pub/infozip/WiZ.html kautta
  3. käynnistä kyseinen ohjelma kaksoisklikkaamalla sen kuvaketta; kyseessä on ns. itsestäänpurkautuva paketti; vahvista purkaminen klikkaamalla Extract-painiketta, ja purkamisen jälkeen klikkaa Done-painiketta
  4. nyt voit käynnistää WiZin klikkaamalla win.exe-ohjelman kuvaketta; ks. WiZin omia ohjeita siitä, mitä kaikkea muuta voit tehdä, esim. saadaksesi WiZin mukaan Käynnistä-valikkoon
  5. unzipataksesi zipatun tiedoston WiZillä toimi näin (käynnistettyäsi WiZin, siis sen omassa käyttöliittymässä):
    1. valitse File-valikosta kohta Open archive... ja etsi avautuvan ikkunan kautta zipattu tiedosto, jonka haluat purkaa; WinZipin pitäisi nyt näyttää lista sen sisältämistä tiedostoista
    2. valitse Archives-valikosta kohta Select All Files; tällöin em. tiedostolistan taustavärin pitäisi muuttua valkeasta tummansiniseksi
    3. valitse samasta Archives-valikosta kohta Extract ja valitse avautuvan ikkunan kautta hakemisto, johon haluat tiedostot tallentaa; huomaa, että voit tässä vaiheessakin luoda uusia hakemistoja, mikä voi olla tarpeellista, etteivät tiedostot mene sekaisin
    4. voit lopettaa WiZin käytön File-valikon kohdasta Exit
    5. halutessasi voit hävittää zipatun tiedoston viemästä tilaa, mutta on parasta ehkä ensin kokeeksi avata muutama niistä tiedostoista, jotka unzippaus tuotti.
f

IZArc on maksuton arkistointiohjelma, joka tukee zip-muodon lisäksi monia muitakin paketointimuotoja. Siinä on myös suomenkielinen käyttöliittymä. Winzip-ohjelmaan tottuneiden kannattaa IZArcia käyttäessään ehkä muuttaa ulkoasu "klassiseksi" valitsemalla Näytä-valikosta kohta Klassinen-tyyli.

Vielä yksi vaihtoehto Windows-käyttäjille on PowerArchiver, joka osaa mm. jakaa ison zip-paketin usealle levykkeelle sekä käsitellä monia muitakin pakkausformaatteja. Se oli aiemmin maksuton, nykyisin maksullinen, mutta ei kallis, ja sitä voi kokeilla maksutta. Siitä on myös suomenkielinen versio. Ohjelman viimeinen maksuton versio oli (englanninkielinen) PowerArchiver 2001 v6.11.

Alkuperäinen zippausohjelma oli DOSille tehty PKWAREn PKZIP (ja PKUNZIP), joka edelleenkin on uusina versioina olemassa ja saatavissa muillekin järjestelmille.

Tietoja eräistä maksuttomista vaihtoehdoista on Tero Niemisen sivulla ZIP-ohjelmia.