MP3

Allikas: Vikipeedia
Mp3.svg
Faililaiend .mp3
Esmane standard 1993
Standardid ISO/IEC 11172-3, ISO/IEC 13818-3
Arendaja Moving Picture Experts Group
Vormingu liik digitaalaudio
Avatud vorming jah

MP3 ehk MPEG Audio Layer III on helifailivorming, mis põhineb helisignaali kadudega tihendamise tarkvaral. Selle tehnoloogia abil saab tihendamata helifailide mahtu oluliselt vähendada ilma helikvaliteedi olulise languseta ning selliseid faile vastava tarkvara abil esitada arvuti, MP3-mängija, nutitelefoni või muu selleks otstarbeks mõeldud seadme abil. Seetõttu on MP3-failivorming populaarne helifailide säilitamiseks ja Interneti kaudu jagamiseks.

MP3-vorming on loodud Fraunhoferi Instituudis ja edasi arendatud Moving Picture Experts Group (MPEG) töörühma poolt.

Ajalugu[muuda | muuda lähteteksti]

  • 1987 – Saksamaal asuv Fraunhoferi Instituut alustas EUREKA projekti EU147 raames uurimustööd digitaalse audio levitamise alal.[1]
  • 1988 – loodi Moving Picture Experts Group ehk MPEG.[1]
  • 1989 – Fraunhoferi Instituut võttis Saksamaal MP3-tehnoloogiale patendi.[1]
  • 1992 – Fraunhoferi Instituudi ja Dieter Seitzeri audiokodeerimise algoritm integreeriti MPEG-1 tehnoloogiasse.[1]
  • 1993 – avaldati MPEG-1 standard.[1]
  • 1994 – töötati välja ja avaldati MPEG-2 standard.[1]
  • 1996 – USAs patenteeriti MP3-tehnoloogia.[1]
  • 1998 – ilmusid esimesed kaasaskantavad MP3-mängijad.[2]
  • 1998 – Fraunhofer hakkab oma patendiõigusi jõustama. Kõik tarkvaraarendajad, kelle loodud tarkvara tegeleb MP3 kodeerimise või dekodeerimisega, peavad hakkama Fraunhoferile litsentsitasu maksma. Samuti peavad autoriõiguste kaitse all oleva tehnoloogia kasutamise eest maksma kaasaskantavate MP3-mängijate tootjad.[1]
  • 1999 – SubPop sai esimeseks MP3-vormingus heliteoseid levitavaks firmaks.[1]

Standardi väljatöötamine ja levik[muuda | muuda lähteteksti]

MP3-tehnoloogia töötati välja Fraunhoferi Instituudis Saksamaal Dieter Seitzeri ja tema meeskonna poolt. Instituudi teaduskeskus alustas 1987. aastal tarkvara väljatöötamist eesmärgiga saavutada tihendatud helifailid, mis on kõrge helikvaliteediga ja väikse andmemahuga. 1989. aastal vastav tehnoloogia patenteeriti, juriidilisel patendil on väljatöötajatena märgitud Bernhard Grill, Karl-Heinz Brandenburg, Thomas Sporer, Bernd Kurten ja Ernst Eberlein.[1]

Samal aastal lisati MP3-standard MPEG-1 spetsifikatsiooni. MPEG-standardid defineerivad madala andmeedastuskiirustega audio- ja videofailivormingute süntaksid ja vastavate dekooderite teostatavad protseduurid, kuid ei defineeri kooderites kasutatavaid algoritme. MPEG on ISO/IEC (International Organisation for Standardisation / International Electrotechnical Commission) allüksusena tegutsev töörühm, mille eesmärk on digitaalse video- ja audiotihendamise standardite loomine, samuti standarditele vastavuse testimise metodoloogiate loomine ja tehnilise dokumentatsiooni avaldamine.[3]

MP3 Internetis[muuda | muuda lähteteksti]

MP3-failide massiline levimine Internetis algas 1990. aastate keskel. Väikese andmemahu ja hea helikvaliteedi tõttu sai MP3 vorming väga populaarseks Interneti kaudu muusika- ja helifailide levitamiseks. Sellele aitas tugevalt kaasa 1997. aastal firma Nullsoft poolt avaldatud tarkvara Winamp, mis tegi MP3-failide esitamise ja haldamise tavakasutajale senisest lihtsamaks ja mugavamaks.

Novembris 1997 alustas veebileht mp3.com sõltumatute esitajate poolt loodud tuhandete tasuta MP3-vormingus helifailide levitamist.[4] Samuti on mõned tuntud esitajad lubanud enda teoseid Internetist MP3-vormingus tasuta alla laadida, nagu näiteks ansambel Radiohead 2007. aastal oma albumit “In Rainbows”.[5]

Muusikapiraatlus[muuda | muuda lähteteksti]

MP3-failide väike andmemaht tegi need 1990. aastate lõpus ja 2000. aastate alguses populaarseks P2P-võrkudes muusikafailide jagamiseks, mis varem olnuks tolleaegseid andmeedastuskiirusi ja Interneti kasutamise hinda arvestades peaaegu võimatu. Esimene populaarne P2P-failijagamise programm Napster avaldati 1999. aastal,[6] sellele järgnesid Kazaa, SoulSeek ja torrentprogrammid.

MP3-failide loomise ja jagamise lihtsus tõi laialdaselt kaasa autoriõiguste rikkumisi, sest P2P-võrkude kaudu jagati ka autorikaitse all olevaid teoseid. Suured muusikafirmad väitsid, et muusika vaba jagamine toob kaasa müüginumbrite langemise. Järgnesid kohtuvaidlused Napsteriga, mis lõppes Napsteri ajutise sulgemisega[7], samuti on kohtulikult karistatud failivahetusprogrammide eraisikutest kasutajaid. Eestis seni ühtegi inimest P2P-võrgu kaudu helifailide jagamise eest kohtulikult karistatud pole.

Tehnilised andmed[muuda | muuda lähteteksti]

Andmemaht[muuda | muuda lähteteksti]

Interneti levikuga muutus oluliseks selle kaudu edastatavate failide maht. Seetõttu tekkis vajadus tõhusa ja standardiseeritud vormingu järele, mis võimaldaks salvestatavate ja levitatavate helifailide mahtu oluliselt vähendada.

Traditsiooniline meetod heli digitaalseks salvestamiseks on diskreetida helisignaali teatud arv kordi sekundis ja vastavad amplituudid salvestada, nii salvestatakse heli näiteks CD-plaatide ja digitaalse televisiooni puhul.[8] Helisignaali talletamiseks või edastamiseks vajaminev andmemaht sõltub kolmest asjaolust: helilõikude arv sekundis ehk sagedus, amplituudi salvestamiseks kasutatav bittide arv ehk bitisügavus ning helisignaali kestus ehk aeg.[8] Vajaminevat andmemahtu on võimalik arvutada järgmise valemi kaudu:

andmemaht = sagedus × bitisügavus × aeg.

Lisaks tuleb arvestada, et stereosignaali puhul tuleb vajaminev andmemaht korrutada kahega, sest salvestatakse kahe üksteisest sõltumatu audiokanali signaal.[8]

CD-plaadile on heli salvestatud tihendamata 16-bitise ja 44 100 Hz juures diskreeditud stereosignaalina,[9] mistõttu on ühe minuti pikkuse CD-plaadil oleva helisignaali salvestamiseks vaja 44 100 × 16 × 60 × 2 = 84 672 000 bitti ehk natuke üle 10 megabaidi. 4-minutilise heliteose jaoks oleks vaja umbes 40 megabaiti.

Seetõttu eelistatakse kõrge kvaliteediga helisignaali salvestamiseks või Interneti kaudu levitamiseks tihti kasutada tihendatud failivormingut.

MP3 kodeerimine[muuda | muuda lähteteksti]

Algse helifaili MP3-vormingusse tihedamise tulemusena saadakse algfailist oluliselt väiksem fail, kuid protsessi käigus läheb osa infot kaduma ja seda pole võimalik hiljem taastada. Seetõttu kutsutakse algoritmi kadudega tihendamise algoritmiks.[10]

MPEG-audio tihendamine põhineb psühhoakustilisel kodeerimisskeemil. Kooder ei ürita salvestada algsele signaalile identset signaali, eesmärk on jätta inimkõrvale mulje algupärasega identnest helisignaalist. Info kodeerimisel kasutatakse ära asjaolu, et inimkõrv pole võimeline teatud helisid kuulma, eriti kui need on varjatud teiste samaaegselt kõlavate helide poolt. Seega vähendatakse tihendamisel nende heliosade täpsust, mis asuvad algoritmi järgi väljaspool inimeste kuulmispiirkonda.[10]

Nende helisignaalide summutamiseks sisaldab kooder inimkõrva imiteerimiseks mõeldud psühhoakustilist mudelit, mis analüüsib sisendsignaali mitmes järjestikuses etapis ning määrab igas etapis signaali spektri ja akustilised omadused. Seejärel modelleeritakse helisignaalide vastastikused maskeerimisomadused inimkõrvas ja selle põhjal hinnatakse helisignaali minimaalset kuuldavustaset.[10] Analüüsi põhjal saab inimkõrvale kuuldamatud helid tihendatud infost välja jätta, mis võimaldab tuletada algsest helifailist kordades väiksema faili ilma helikvaliteedi märgatava languseta.

MPEG-standardid defineerivad madalate andmeedastuskiirustega audio- ja videovormingute süntaksid ning vastavate dekoodrite teostatavad protseduurid. Koodrite kasutatavaid algoritme MPEG-standardid ei defineeri, mis võimaldab koodrite täiustamist ning erinevate versioonide loomist spetsiifiliste rakenduste tarbeks ilma vajaduseta andmete struktuuri või paigutuse muutmiseks.

MPEG-1 standardi järgi saab määrata diskreetimissagedusi 32, 44,1 või 48 kHz, MPEG-2 standardiga lisati neile 16, 22.05 ja 24 kHz. Enamasti kasutatakse diskreetimiseks sagedust 44,1 kHz, sest sama sagedust kasutatakse ka heli salvestamiseks CD-plaatidele ja suur osa MP3-faile on tehtud CD-plaatide põhjal.[11]

Bitikiirus[muuda | muuda lähteteksti]

MP3-helifailide puhul on faili suurus ja heli kvaliteet omavahel seotud. Tavaliselt lubab kodeerimistarkvara valida bitikiiruse (inglise keeles "bit rate"), millega määratakse ühe sekundi helisignaali salvestamiseks kasutavate kilobittide arv. Suurema bitikiiruse korral on tihendatud fail suurem, kuid samas kõlab see lähedasemalt originaalile. [10]

Liiga madala bitikiirusega tihendatud heli puhul võib heli kvaliteet märgatavalt langeda. Samuti võib sel juhul kodeerimise tulemusena tekkida helis komponente, mis algses helisignaalis puudusid. [12]

MPEG-1 Audio Layer III standardis on spetsifitseeritud järgmised võimalikud bitikiirused: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 ja 320 kbit/s, MPEG-2 standardiga lisati neile 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144 ja 160 kbit/s. Tavaliselt jääb muusikafailide puhul MP3-failides kasutatav bitikiirus 128 ja 320 kbit/s vahele.[11] Võrdluseks on CD-plaatidel heli salvestamise bitikiirus 1411,2 kbit/s.[13]

Varieeruv bitikiirus[muuda | muuda lähteteksti]

Kõige lihtsamat tüüpi MP3-failid kodeeritakse CBR (Constant Bit Rate) meetodiga, mille puhul on bitikiirus muutumatu. VBR- (Variable Bit Rate) meetodi kasutamisel võib bitikiirus faili jooksul muutuda. CBR-meetodi kasutamisel on kodeerimine võrreldes VBR-meetodiga lihtsama ja kiirem.

VBR-meetod põhineb eeldusel, et helifailis võib olla lihtsamini tihendatavaid lõike, mis sisaldavad näiteks vaikust või ainult paari muusikariista samaaegset kõlamist. Seega saab sama andmemahu juures helifaili kvaliteeti parandada, kui keerulisemate helilõikude puhul bitikiirust dünaamiliselt suurendada ja lihtsamate helilõikude puhul vähendada. Standarditele vastamiseks peavad kõik Layer III dekoodrid ka VBR-tehnoloogiat toetama.[11]

Dekodeerimine[muuda | muuda lähteteksti]

MP3-faili dekodeerimine on kodeerimisest oluliselt lihtsam, kuna selle käigus on vaja ainult rekonstrueerida audiosignaal failis oleva info põhjal ja puutub tarvidus psühhoakustilise mudeli kasutamiseks. Dekoodimise algoritmid ja protseduurid on MP3-standardis täpselt määratud ja seetõttu on sama faili erinevate dekoodritega töötlemisel saadud heli peaaegu identne. Dekoodreid võrreldakse tavaliselt nende tõhususe põhjal, näiteks kui palju mälu või protsessoriaega nad kasutavad.[14]

ID3-silt[muuda | muuda lähteteksti]

Helifailide “silt” on osa MP3-failist, mis sisaldab helisignaali metaandmeid, näiteks muusikapala pealkirja, autorit, albumit, teose järjekorranumbrit albumil jne. MP3-standardis siltide vormingut defineeritud ei ole. Sellegipoolest on laialt kasutusel mitu siltide vormingut, millest levinuimad on ID3v1 ja ID3v2.[15] Sildid lisatakse MP3-failide algusse või lõppu. Olenevalt dekoodrist silte kas eiratakse või loetakse neist salvestatud metaandmed. MP3-failide esitamise tarkvara sisaldab sageli siltide vaatamise või muutmise funktsionaalsust.

MP3-faili struktuur[muuda | muuda lähteteksti]

MP3 faili struktuur.

MP3-fail koosneb paljudest MP3-kaadritest, millest igaüks koosneb päise- ja andmeplokist. Andmeplokk sisaldab tihendatud heliandmeid. Päis algab preambuliga, mida dekoodril on vaja korrektses vormingus kaadri alguse tuvastamiseks. Sellele järgnev bitt määrab, et tegu on MPEG-standardiga ja järgmised kaks bitti, et tegu on Layer 3 tehnoloogiaga. Järgmiste bittide väärtused sõltuvad konkreetsest MP3-failist. [16]

Samuti võib MP3-fail sisaldada ID3-sildi vormingus metaandmeid, mis asuvad kas faili alguses või lõpus.

Helikvaliteet[muuda | muuda lähteteksti]

Helifaili kodeerimisel MP3-vormingusse tuleb teha valikuid faili mahu ja heli kvaliteedi osas. MP3-failis oleva heli kvaliteet sõltub järgmistest teguritest:

  1. Tihendamisel kasutatud bitikiirus. Reeglina kaasneb suurema bitikiirusega parem helikvaliteet. Liiga madala bitikiirusega kodeerimisel tekkivad kõrvalhelid võivad helikvaliteeti veelgi rikkuda. Näiteks kontsertlindistuste puhul võib publiku aplaus madala bitikiirusega kodeeritud MP3-failis kõlada ebaloomulikult või isegi ebameeldivalt. [17]
  2. Kasutatud koodri kvaliteet. Kuna standardid ei määra täpselt kodeerimisel kasutatavaid algoritme, siis on võimalik sama bitikiirusega kodeerides saada eri kooderite puhul tulemuseks erineva kvaliteediga helifaile. Ühes uuringus hindasid kuulajad kahe erineva koodriga 128 kbit/s bitikiirust kasutades kodeeritud helifaile skaalal ühest viieni, ühe kooderi puhul oli helikvaliteedile antud keskmine hinne 3,66, teise puhul aga ainult 2,22. [18]
  3. Kodeeritava signaali keerukus. Kuna algoritm kasutab tihendamisel algse heli perioodilist diskreetimist, siis näiteks väga nüansseeritud helide puhul on võimalik, et kodeerimisalgoritm ei suuda heli originaalilähedaselt tihendada. [17]
  4. Kodeerimisel kasutatavad parameetrid. Tihti saab helifaili tihendamise kooderile määrata parameetreid, mille järgi valitakse tihendamise algoritm. Valesti valitud parameetrid võivad teatud juhtudel kuulaja vaatenurgast lähtuvalt helikvaliteeti hoopis vähendada.
  5. Helikvaliteeti võib tugevalt mõjutada ka MP3-failist otseselt sõltumatud asjaolud, näiteks heli kuulamiseks kasutatav riistvara, eriti helikaardi ja kõlarite või kõrvaklappide kvaliteet.

MP3-vormingus muusika kvaliteedi kohta on erinevaid arvamusi. Standfordi Ülikooli muusikaprofessori Jonathan Bergeri 2009. aastal tehtud uurimus näitas, et tema tudengite seas kasvab iga aastaga eelistus MP3-kvaliteediga helifailidele. Berger väitis, et tema tudengid on hakanud eelistama MP3-vormingus muusikapalade “krõbisevat” heli.[19]

Levinud on ka arvamus, et tihendamisel tekkivad kaod vähendavad muusika kuulamisel saadavat naudingut, samuti on väidetud, et tihendatud vormingus muusikafailide lai levik mõjub negatiivselt tänapäeva muusikale. Näiteks Alan Wilder on väitnud:

„MP3 tihendamine võimaldab tekitada väiksemamahulisi helifaile, eemaldades selleks muusikalise info, mida inimkõrval on raskem märgata. Suur osa eemaldatavast infost on kas väga kõrge või väga madala helikõrgusega, seetõttu CD-plaadil juba niigi kokku surutud heli MP3 failiks kodeerides suurendatakse kokkusurumisefekti veelgi. Tulemus – mitterahuldav, rabe, omapäratu ja tühi muusikakogemus, millel puudub igasugune jõud.

Me juba näeme selle väikese kuid olulise nihke mõjusid muusikatööstusele. Asi ei ole ainult helikvaliteedis. Muusika puhul on olulised ka detailid ja produtseerimisel nähtud vaev. Oluline on kunst…“

[20]

MP3 tänapäeval[muuda | muuda lähteteksti]

MP3-failivormingul on endiselt väga oluline roll helindite salvestamisel ja Interneti kaudu levitamisel, kuna vorming on meediaesituse tarkvara ja seadmete poolt laialdaselt toetatud ja kasutajate seas tuntud.

Suur osa autorikaitse all olevatest heliteostest, mida Internetis ebaseaduslikult levitatakse, on endiselt MP3-vormingus. MP3-vormingus heliteoste legaalseks ostmiseks on ka mitmeid teenuseid, näiteks Beatport, Bleep, Juno Records, eMusic, Rhapsody, Napster ja Amazon.com.

Muudest helifailide tihendamise failivormingutest on tuntumad:

  • WMA
  • Ogg
  • FLAC – kadudeta helitihendamise koodek

MP3-helindite esitamise tarkvara[muuda | muuda lähteteksti]

MP3-vormingus helindite esitamise tarkvara dekodeerib helindi standardseks helivooks ja edastab selle helikaardile. [13] Esimene selline programm loodi sisemiseks kasutamiseks Fraunhoferi Instituudis 1990. aastatel. Esimene Internetis laiemalt levinud MP3-failide esitamise tarkvara kandis nime AMP MP3 Playback Engine ja selle lõi Tomislav Uzelac 1997. aastal. [1] Justin Frankel ja Dmitri Boldõrev lõid selle põhjal programmi Winamp, mis muutus kiiresti populaarseks.[1] Kuna MP3-failide esitamise tarkvara kasutamine ei nõua litsentsitasu, on paljud sellekohased programmid tasuta.[1]

Peaaegu kõikidel multimeedia esitamise programmidel on tänapäeval ka MP3-failide esitamise tugi. Tuntumatest võib nimetada:

MP3-mängijad[muuda | muuda lähteteksti]

Aastal 1998 anti välja esimene kaasaskantav digitaalne MP3-mängija MPMan.[2] Tänapäeval on MP3-mängijad levinud ning saadaval erinevates hinna- ja kvaliteediklassides. Samuti toetavad MP3-failide esitamist nutitelefonid.

Viited[muuda | muuda lähteteksti]

  1. 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 Bellis, Mary. "History of MP3". Vaadatud 2011-11-13. 
  2. 2,0 2,1 Van Buskirk, Eliot (2005-01-25). "Introducing the world's first MP3 player". Vaadatud 2011-11-13. 
  3. "The MPEG Home Page". Vaadatud 2011-11-13. 
  4. Burnett, Chris (2003-11-16). "MP3.com – We Made History!". Vaadatud 2011-11-13. 
  5. "Hard hats on..". 2007-10-10. Vaadatud 2011-11-13. 
  6. "A Brief History of Napster". Vaadatud 2011-11-13. 
  7. Riedel, Sarah (2006-02-24). "A Brief History of Filesharing: From Napster to Legal Music Downloads". Originaali arhiivikoopia seisuga 2013-06-28. Vaadatud 2011-11-13. 
  8. 8,0 8,1 8,2 "MPEG Audio Layer 3 (MP3) Technical Guide". 2000-11-17. Vaadatud 2011-11-13. 
  9. "Is the sound on vinyl records better than on CDs or DVDs?". Vaadatud 2011-11-13. 
  10. 10,0 10,1 10,2 10,3 "Digitaal-audiosignaal ja selle infomahu vähendamine". Vaadatud 2011-11-13. 
  11. 11,0 11,1 11,2 "Enter Bitrates, Stage Left". Vaadatud 2011-11-13. 
  12. "Reduce audio artifacts found in digital music with SX Fidelity Amplifier". Vaadatud 2011-11-13. 
  13. 13,0 13,1 Rinde, Andrus. "Audiokompressioon". Vaadatud 2011-11-13. 
  14. "Notes On Decoding". Vaadatud 2011-11-13. 
  15. "id3lib". Vaadatud 2011-11-13. 
  16. "The Anatomy of an MP3 File". Vaadatud 2011-11-13. 
  17. 17,0 17,1 Brain, Marshall. "MP3 Bit Rates". Vaadatud 2011-11-13. 
  18. Amorim, Roberto (2003-08-03). "Results of 128 kbit/s Extension Public Listening Test". Vaadatud 2011-12-11. 
  19. Dougherty, Dale (2009-03). "The Sizzling Sound of Music". Vaadatud 2011-12-11. 
  20. Wilder, Alan (2008-02-09). "Music For The Masses – I Think Not". Vaadatud 2011-12-11.