Merkatuan dauden argazki kamerek gero eta mega gehiago dituzten argazkiak ateratzen dituzte. Telebista digitalek Full HD marka erakusten dute, irudi kalitate gorena aginduz. Betiere, kalitate gehiago eskaintze horrek informazio bolumen handiagoa kudeatzea suposatzen du. Eta informazio asko transmititu edo gorde nahi bada, derrigorrezkoa bihurtzen da informazio horren bolumena txikitzeko beharra. Gaur egungo argazki kamera xumeenak ateratzen dituen argazkiak inongo konpresiorik gabe gordeko balira kameren memorian, argazki gutxi batzuekin laster beteko lirateke memoria horiek.
Datu konpresioa erabiliz, jatorrizko fitxategi baten tamaina txikitu daiteke, eta berau transmititzeko denbora gutxiago behar izango da, edo leku gutxiago beharko da disko gogor batean gordetzeko orduan. Konprimitutako fitxategitik, jatorrizko fitxategia lortzeko, deskonprimitu egin beharko da. Nola lortzen da fitxategi baten tamaina txikitzea, gero, berriz ere, jatorrizko fitxategia lortzeko?
Konpresioaren funtsa, jatorrizko informazioan errepikakorrak diren datuak atzeman eta ordeztean datza. Errepikatzen diren datuokin, hiztegi moduko bat eraikitzen da, eta hiztegi horretako sarrera bakoitzari nolabaiteko identifikadore bat ematen zaio. Azkenik, jatorrizko informazioan, hiztegian agertzen den datu bakoitza, bere identifikadorearekin ordezkatuko da. Konpresio prozesuaren ondorioz, hiztegi bat eta ordezkapenaren ondorioa lortuko dugu. Konprimitutako informazioa jatorrizko formara bueltatu nahi denean, identifikatzaileak hiztegiko sarrerekin ordeztuko dira. 70eko hamarkadan, Abraham Lempel eta Jacob Ziv israeldarrek asmatutako LZ algoritmoa da gaur egun erabiltzen diren algoritmo gehienen aita.
Aurrekoaren adibide gisa, Mikel Laboaren Txoriak txori kantuaren testua hartu eta bertan agertzen den hitz ororekin hiztegi bat osatuko litzateke. Hainbat hitzen artean, «txori» hitza agertuko da, eta hitz horren identifikadorea, esate baterako 8 izango da. Txori hitza 8 zenbakiarekin ordezkatzen bada kantaren testuan, «…ez zen gehiago txoria izango, eta nik, txoria nuen maite» prozesatuz, «…ez zen gehiago 8 izango, eta nik, 8 nuen maite» lortuko da. Txori hitzak dituen 5 karaktereen ordez, «8» identifikadoreak duen karaktere bakarra erabiliko da txori hitza agertzen den aldi bakoitzean. Konprimitu nahi den informazioa errepikakorragoa den neurrian, konpresioaren ondorioz, emaitza hobeak lortuko dira, konpresio tasa altuagoak.
7-zip izan daiteke Windows sistema eragilean, iturburu irekiko konpresio software erabilgarria.
Kalitatearen galera duten edo ez duten konpresio motak
Orain arte azaldutako metodo edo algoritmoarekin, konpresioaren ondorioz lortzen den informazioari deskonpresio prozesua aplikatzean, berriz ere jatorrizko informazioa lortzen dugu, inongo galerarik gabe. Testu fitxategiak aintzat hartuta, garbi dago konpresio-deskonpresio prozesuak ezin duela jatorrizko informazioaren galerarik sortu, baina beste informazio mota batzuetan, irudi edo audio fitxategietan adibidez, jatorrizko informazioaren galera onargarria suertatu daiteke.
Galera dagoen algoritmoek, «beharrezkoa» ez den informazioa baztertu egiten dute jatorrizko datuak konprimitzean. Zeru urdin bati egindako argazki bat hartuz, pentsatu daiteke galerarik ez duen metodo bat erabiliz, ez dela emaitza oso onik lortuko. Zerua urdina izan arren, pixel gutxi egongo da urdin balio berdinarekin, beraz errepikaketa txikia izango da irudi fitxategian. Kontuan hartzen badugu gizakiaren begia ez dela gai oso gertu dauden urdin-tonu bi bereizteko, konpresio aplikazio batek, oso gertukoak diren urdin tonuak, tonu bakarrera bihurtu ditzake; eta horrela, informazioa errepikakorragoa bihurtzen denez, konpresio tasa altuagoa lortuko da. Horrela konprimitutako irudiak galera du jatorrizko irudiarekiko, baina lortuko den fitxategi konprimituaren tamaina galera gabeko metodoekin lortutakoa baino txikiagoa izango da.
MP3
Audio CD batean entzuten dugun musika digitalki grabatzen denean, 44.100 lagin jasotzen dira segundoko. Lagin bakoitzarentzat, 16 bit erabiltzen dira (2 byte), eta estereo sistemetan, bi kanal grabatzen dira, ezkerrekoa eta eskumakoa. Horrek esan nahi du, kanta baten segundo bakoitza gordetzeko, 176 K behar direla, eta 3 minutu luze irauten dituen kanta bat gordetzeko, 32 mega beharko direla. ADSL konexio azkarra izanda ere, minutuak beharko lirateke kanta bakar bat jaisteko, eta oraintsurarte erabili izan diren 56 K konexio telefoniko batekin, 3 ordu inguru beharko lirateke.
Musika konprimitzeko gehien erabiltzen den algoritmoetako bat da MP3 esaten dioten MPEG-1 edo MPEG-2 Audio Layer 3 algoritmoa. Aipatu kantaren 32 megak, 3 megatan geratuko dira konpresioaren ondorioz. Musika konprimitzeko metodo horrek gizakiaren entzumenak dituen ezaugarriak hartzen ditu kontutan. Badira gizakiok entzuten ez ditugun soinu frekuentzia batzuk. Soinu batzuk beste batzuk baino hobeto entzuten ditu belarriak, eta azkenik, bi soinu batera entzutean, gizakion entzumenak, arreta handiago eskaintzen dio ozenago jotzen duenari. Hori dena kontuan hartuta, algoritmoak «soberan» dauden datuak alboratuko ditu, antzekoak direnak bateratu eta horrela, hamar aldiz txikiagoa den audio fitxategi bat lortuko da.