Andmete pakkimine

Allikas: Vikipeedia

Andmete pakkimine (ka andmete tihendamine, andmetihendus) on informaatikas digitaalandmete bitimäära vähendamine. Andmemahtu on vaja vähendada selleks, et vähendada kulutusi andmete edastamiseks ja salvestamiseks. Andmete tihendamine toimub koos kodeerimisega digitaalsignaaliks, mispuhul andmete esitusvormi muudetakse kindla reeglistiku abil selliselt, et infomaht väheneb. [1] Andmemahu vähendamist digiteerimisel nimetatakse ka säästkodeerimiseks.

Et kodeeritud andmeid saaks kasutada, tuleb need lahti pakkida ehk dekodeerida, s.t esialgsele kujule tagasi teisendada. Andmete kodeerimine ja dekodeerimine nõuab spetsiaalset tark- ja riistvara, nt koodekite näol.

Pakkimist on kahte põhitüüpi: kadudega ja kadudeta.

Kadudeta tihendamine[muuda | redigeeri lähteteksti]

Kadudeta andmetihenduse korral vähendatakse bitimäära statistilise liiasuse leidmise ja kõrvaldamise teel [2] . Kadudeta tihendamisel saab mahtu kokku hoida näiteks sel teel, et korduvalt esinevad andmelõigud esitatakse ühe koodiga Nii võib üks pilt endas kanda värvide piirkondi kus värv ei muutu, nii et need saab esitada ühe kokkuvõtliku koodiga. Tekstidokumendis võib luua korduvatest osadest ühe koopia ja lisada selle koopia lõppu iga asukoht, kus see osa dokumendis kordus.

Kadudeta andmetihendust tuleb kasutada siis, kui on oluline, et andmed säiliksid nii, nagu nad alguses olid, nt programmid ja tekst.

Kadudeta tihendamisel on bittide sääst siiski tagasihoidlik, nt audiosignaali korral kahekordne.

Kadudega tihendamine[muuda | redigeeri lähteteksti]

Palju tõhusalt saab andmeid kokku pakkida teatud signaaliosade eemaldamise teel, mis aga paratamatult on seotud kvaliteedikaoga. Kadudega tihendamisel leitakse ebavajalik või vähemoluline informatsioon ja eemaldatakse see. Niiviisi kodeeritud andmetest ei ole enam võimalik taastada kadudeta versiooni.

Kadudega andmetihenduse algoritmide väljatöötamisel kasutatakse muuhulgas ära inimese kuulmis- ja nägemistaju iseärasusi. Näiteks on inimese silm rohkem tundlik väikestele heleduse muutustele kui värvi muutustele. Selle põhjal saab bitte kokku hoida väikeste värvimuutuste arvel.

Fotode kadudega pakkimist kasutatakse digikaamerates, et säästa mälu kasutust, kusjuures selle nimel püütakse ohverdatakse võimalikult vähe pildi kvaliteeti. Samamoodi kasutavad DVD-d kadudega videopakkimise formaati MPEG-2.

Audiotihendus[muuda | redigeeri lähteteksti]

Kodeerimiseks töödeldakse audiosignaali mitmel moel:

  • vähendatakse helisignaali dünaamikaulatust, mis tähendab valjude helide vaigistamist ja vaiksete helide valjemaks tegemist, tulemusena vajab kodeerimine vähem bitte;
  • lõigatakse ära kuuldamatud sagedused üle 20 kHz (seega ülemtoonid) ja jäetakse ära signaalikomponendid, mis jäävad kuuldelävest allapoole; [3]
  • kõrgetel ja madalatel helisagedustel kasutatakse lühemat koodisõna, sest nendel sagedustel on kõrva tundlikkus väiksem;
  • jäetakse kodeerimata signaaliosad, mis maskeerimisnähtuse tõttu mattuvad suure amplituudiga signaalikomponentide alla.

Salvestatavat andmemahtu saab kokku hoida ka sel teel, et pakkimistihedus seatakse sõltuvusse helimaterjali keerukusest, s.t kasutatakse muutuva tihedusega andmevoogu. Sel juhul on kodeerimisel helikvaliteet püsiv.

Videotihendus[muuda | redigeeri lähteteksti]

Videoandmeid on vaja tugevasti tihendada selleks, et nt digitaalset televisioonisignaali oleks võimalik olemasolevate kanalite kaudu üle kanda. Nimelt oleks tihendamata digitaalse telesignaali ülekandmiseks tarvis andmeedastuskiirust umbes 250 Mbit/s (tavatelevisiooni ühe kaadri (pildi) edastamiseks läheb vaja 576×720×3 = 1 244 160 baiti (piksli iga värvi R, G, B jaoks 1 bait), vastavalt 1,244 MB; seega sekundis 25×1,244 = 31 MB ehk 31×8 = 249 Mbit/s).

Edastatava info mahtu vähendatakse kõigepealt videosignaali digiteerimisel. Nimelt kasutatakse nägemistaju omadust hinnata kuva teravust peamiselt heleduse järgi ja vähemal määral värvide järgi. [4] See võimaldab kasutada kaadrisisest tihendamist: näiteks kasutatakse digiteerimisel värvisignaalikomponentide (U ja V) kvantimisel poole väiksemat sagedust kui heledussignaali (Y) puhul – kui heledusnäidud võetakse sagedusega 13,5 MHz, siis värvinäidud sagedusega 6,75 MHz; vastava süsteemi tähis on 4:2:2 (Y:U:V).

Digitaalsignaali tihendamisel hoitakse ülekantavat andmemahtu kokku peamiselt kaadritevahelise tihendamise teel, mille puhul kodeeritakse perioodiliselt võtmekaadrid, aga neile järgnevates kaadrites üksnes pildierinevused. Järjestikuseid kaadreid analüüsides jätab protsessor üle kandmata selle osa infost, mis jääb kaadris eelmisega võrreldes samaks.

Tulemusena on võimalik edastatava videovoo mahtu vähendada kuni 200-kordselt. [5] Nii osutub võimalikuks ühe UHF-raadiokanali kaudu edastada kuni 14 tavalahutusega või kolm kõrglahutusega teleprogrammi. Nagu kõikides kadudega tihendamise süsteemides, leitakse siingi kompromiss video kvaliteedi, edastustrakti maksumuse ja tehniliste võimaluste vahel. [6].

Kuna kaadritevahelisel pakkimisel kopeeritakse andmeid ühelt kaadrilt teisele, siis võib juhtuda olukordi, kus võtmekaader läheb kaduma. Sel juhul aga ei ole võimalik järgmisi kaadreid õigesti moodustada ja signaaliedastus on häiritud.

Tihenduslgoritmid[muuda | redigeeri lähteteksti]

Kadudeta andmete pakkimisel kasutatavad algoritme:

  • DEFLATE
  • RLE
  • GZIP
  • BZIP2
  • LZW
  • JPEG 2000

Kadudega andmepakkimisel kasutatavaid algoritme:

  • MPEG1
  • MPEG2
  • MPEG3
  • MPEG4
  • JPEG (sisaldab ka kadudeta andmetihendamise võimalust)
  • MP3
  • DOLBY AC-3

Viited[muuda | redigeeri lähteteksti]

  1. Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique". International Journal of Computer Science Issues 9 (6, No. 3): 53–59. Vaadatud 6. märts 2013. 
  2. Pujar, J.H.; Kadlaskar, L.M. (Mai 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques". Journal of Theoretical and Applied Information Technology 15 (1): 18–23. 
  3. Arcangel, Cory. "On Compression". Vaadatud 12. detsember 2013. 
  4. Faxin Yu, Hao Luo, Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlin: Springer. p. 47. ISBN 9783642126512. 
  5. Graphics & Media Lab Video Group (2007). Lossless Video Codecs Comparison. Moscow State University. 
  6. Bhojani, D.R. "4.1 Video Compression". Hypothesis. Vaadatud 12. detsember 2013.