Történeti áttekintés
A tömörítésekre a számítástechnika őskorában voltak már kezdeti próbálkozások. Az első publikációt egy tömörítési algoritmusról Shannon és Fano az 1950-es években tette közzé. Ennek a tömörítőnek azonban korántsem voltak jók a tömörítési tulajdonságai, algoritmusai még nagyon egyszerűek, mindenféle gyorsítás nélküliek, azaz egy szó mint száz lassúak voltak.
Az 1977-ben és 1978-ban a Lempel-Ziv páros által publikált algoritmusok jelentős áttörést hoztak, ráadásul ez volt az az időpont amikor a személyi számítógépek elkezdtek elterjedni, és robbanásszerűen fejlődni.
A 80-as években inkább minőségi javulás volt megfigyelhető a tömörítők területén, újabb algoritmusok nem születtek, inkább csak javítások, melyek végül is jobbá, gyorsabbá tették a már meglévő algoritmusokat.
Elérkeztünk a jelenhez. A tömörítési algoritmusok várhatóan még jelentős változáson fognak keresztül menni, a hagyományos eljárások pedig valószínűleg az egyes területeken specializálódni fognak, de ez már a jövő titka.
A tömörítő pogramok osztályozása
Számítógépünkön különféle adatok lehetnek. Elég megkülönböztetni a tömörítés szempontjából a szöveges és bináris, képi és hang adatokat. Két nagy csoportra osztjuk a tömörítő programokat. Az elsőbe azok tartoznak, amelyek veszteség nélküli tömörítést biztosítanak. Ezek a programok az eredeti állományt betömörítve, majd újra kibontva olyan állományt szolgáltatnak, amelyek bitről bitre az eredeti állománnyal megegyeznek. Nyilván a szövegek és bináris állományok tömörítése, valamint a kommunikációs csatornákban felhasznált tömörítők csak veszteségmentesen képzelhető el. A képek és hangok tárolásánál már lehetséges, azaz megengedhető a veszteséges tömörítési algoritmusok használata. Ezeknél az algoritmusoknál az eredeti állományt nem lehet létrehozni a tömörített állományból. A szemünk és a fülünk becsapható!
Gyakorlati tömörítés
LHA
Ez az archiváló volt az első, mely jól tömörített, gyors volt és elterjedt az egész világon. Sebességének és funkcióinak köszönhetően a mai napig is megállná helyét, tömörítési aránya azonban manapság már nem mondható jónak. Ezzel szemben azért nem árt, ha megvan eszköztárunkban, hiszen még napjainkban is találkozni lehet a vele készített archívumokkal.
Az archiváló által generált archív fájl kiterjesztése LZH. A program funkcióit a következő módon lehet elérni:
Archív kitöm.: LHA x archív [célkönyvtár\] [fmaszk]
Archív kitöm. könyvtárak nélkül: LHA e archív [célkönyvtár\] [fmaszk]
Archív tesztelése: LHA t archív [fmaszk]
Archív-ba tömörítés alkönyvtárak nélkül: LHA a archív [fmaszk]
Archív-ba tömörítés: LHA a -r archív [fmaszk]
Fájlnév törlése archív-ból: LHA d archív fájlnév
Archív tartalmának listázása: LHA l archív [fmaszk]
Önkicsomagoló készítése archív-ból: LHA s archív
Fájl kiírása a képernyőre archív-ból: LHA p archív fájl
PKZIP
Ez az archiváló ma a legelterjedtebb a számítástechnikában. Az interneten szinte csak ZIP fájlokkal találkozhatunk. Ez köszönhető nagyon jó sebességének, jó tömörítési arányának és nem elsősorban annak, hogy több különböző operációs rendszer alatt is kezelhetőek archívjai. Ez utóbbi annak következménye, hogy az Info-ZIP nevű csapat megjelentette az eredeti PKZIP-pel kompatibilis programját annak forráskódjával együtt, amit aztán mások átvittek különböző rendszerekre. Hiányosságai nem jelentősek, de például a jól megoldott szeletelés hiányzik belőle és sokan hátrányának tartják azt is, hogy a kitömörítő és a betömörítő külön programban kapott helyet.
A programmal készített fájlok kiterjesztése ZIP.
A program funkciói a következőképpen érhetők el:
Archív kitöm.: pkunzip -d archív [célkönyvtár\] [fmaszk]
Archív kitöm. könyvtárak nélkül: pkunzip archív [célkönyvtár\] [fmaszk]
Archív tesztelése: pkunzip -t archív [fmaszk]
Archív-ba tömörítés alkönyvtárak nélkül: pkzip archív [fmaszk]
Archív-ba tömörítés: pkzip -p -r archív [fmaszk]
Archív-ba tömörítés Jelszó-val: pkzip -p -r -sJelszó archív [fmaszk]
Archív-ba tömörítés szeleteléssel: pkzip -p -r -& archív [fmaszk]
Fájlnév törlése archív-ból: pkzip -d archív fájlnév
Archív tartalmának listázása: pkzip -v archív [fmaszk]
Önkicsomagoló készítése archívból: zip2exe arhív
Tömörítés arj-vel
Az ARJ (Archiváló Robert Jung) az 1990-es évben jelent meg, és a PKZIP méltó ellenfelévé vált.
A program szintaktikája:
arj < command > [ { / | - } < switch > [ - | + < options > ] … ] < archív név > [.ARJ] [ < alkönyvtárnév > \ ] [ < ! lista név > | < útvonal > | < wild név > ]
Command – parancs : Az ARJ után egy szóközzel adható meg, egyetlen karakter, egyszerre csak egy szerepelhet
Swith – kapcsoló: A kapcsolók bárhól szerepelhetnek. Több kapcsolót is használhatunk. A kapcsoló után írt pluszjel bekapcsolja, a mínuszjel pedig kikapcsolja az adott kapcsolót.
Options – módosítók: A kapcsolók hatását módosítják.
Lista név: Megadhatók az állományok nevekkel, teljes elérési útvonallal vagy joker karakterekkel, melyeket külön sorba kell írni
A kapcsolókat lehet a végére is írni és a kapcsolókat nem csak a – jel, hanem a / jel is bevezetheti, ahogyan az a „képlet” is hozza. A [] jelek között szereplő objektumok használata nem kötelező. Az ARJ nagyszámú paranccsal és kapcsolóval dolgozik. Ezek megtanulása teljesen felesleges, de a lehetőségeket mindenképp jegyezzük meg és a leggyakrabban használtakat tanuljuk csak meg. Parancssorba csak az arj-t beírva egy rövid helpet kapunk, ha ennél többet, illetve részletesebb információra van szükségünk akkor az arj /? parancsot kell használnunk.
Az archívok kiterjesztése ARJ, illetve szeletelt archívoknál A01, A02... a szelet sorszámától függően. Az alapfunkciók a következő módon használhatóak:
Archív kitöm.: arj x archív [célkönyvtár\] [fmaszk]
Archív kitöm. könyvtárak nélkül: arj e archív [célkönyvtár\] [fmaszk]
Archív tesztelése: arj t archív [fmaszk]
Archív-ba tömörítés alkönyvtárak nélkül: arj a archív [fmaszk]
Archív-ba tömörítés: arj a -r archív [fmaszk]
Archív-ba tömörítés Jelszó-val: arj a -r -gJelszó archív [fmaszk]
Archív-ba tömörítés Megjegyzés-sel: arj /r /zMegjegyzés archív [fmaszk]
Archív-ba tömörítés szeleteléssel: arj /r /va archív [fmaszk]
Fájlnév törlése archív-ból: arj d archív fájlnév
Archív tartalmának listázása: arj l archív [fmaszk]
Önkicsomagoló készítése archívból: arj y -je1 achív
ARJ bepakoló parancsai
Az ARJ néhány bepakoló parancsa
a (Add)
A megadott állományt bepakolja az archívumba, de új archívumot is tud létrehozni.
u (Update)
Új archív fájlt is létre tud hozni, de a létezőbe csak olyan állományokat tömörít bele, amelyeknek a dátuma korábbi keltezésű. A dátumellenőrzés kikapcsolható.
m (Move)
Ha nem történt hiba a tömörítés közben, akkor a forrásállományokat (nem read only) kitörli.
Az arj parancssorának felépítése
Az ARJ parancssorát a következő módon kell felépíteni:
arj <parancs> [-<kapcsoló> [-<kapcsoló>...]] <archív neve> [<file nevek>...]
Az arj kipakoló parancsai
Az ARJ néhány kipakoló parancsa
e (Extract)
Ez a parancs a megadott állományokat az adott könyvtárban vagy az aktuális könyvtárban fejti ki. Ha az archivált fájl több részből áll, akkor a /v kapcsolót kell megadni.
x (eXtract)
Ha az állományokat /r kapcsolóval tömörítettük be, akkor a kifejtés a forráskönyvtár szerkezetének megfelelően bontja ki.
Az arj egyéb parancsai
d (Delete)
Törli a megadott fájlt az archívumból
n (reName)
Lehetőség van az archivált állományok átnevezésére. Ha a parancsot kiadtuk, akkor az ARJ egyenként felkínálja a tömörített állományok nevét az átnevezéshez. Az Enter leütésével nem változtathatjuk meg a régi nevet. A Ctrl-Break hatására a további kérdezgetés megszakad.
l (List)
A tömörített fájl tartalomjegyzékét listázza ki.
y
Másolatot készít az archívumról, /je kapcsolóval együtt használva önkifejtő fájlt hoz létre .ARJ nevével azonos névvel, csak .EXE lesz a kiterjesztése.
Az adat az információ megjelenési formája.
Az információ a jelek, jelsorozatok tartalmi jelentése, amely új ismereteket hordoz, amivel befolyásolja döntésünket (befolyásolja a rendszer további működését).
A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő. Ha a tömörített fájlból teljes mértékben („bitről bitre'') visszanyerhető az eredeti fájl, akkor veszteségmentes, ha nem, akkor veszteséges tömörítésről beszélünk. Az első általánosan alkalmazható, a második csak akkor, hogyha kis eltérések nem számítanak (pl. kép- és hangfájlok esetén).