Kasutaja:Sellissander/Kõne kodeerimine

Allikas: Vikipeedia

Kõne kodeerimist peetakse üheks tähtsaimaks komponendiks inimeste omavahelises suhtluses. See on viis, kuidas üritatakse kõne edastada võimalikult väheste bittide arvuga. Kõne kodeerimist on vajalik teha, kui soovitakse pikkadel distantsidel suhelda, kui soovitakse et kõne oleks krüpteeritud või kui soovitakse kasvõi lihtsalt heli salvestada. Kõne kodeerimine on kadudega andmete pakkimine, mis tähendab, et sisendsignaal ei ole kunagi täielikult sarnane väljundsignaaliga. Peamised kõne kodeerimis viisid on SBC (Sub-band coding), Waveform coding ja LPC (Linear predictive coding). [1]

Kasutusalad[muuda | muuda lähteteksti]

  • Mobiilside
  • Mobiilside
  • Sateliittelefon
  • VOIP (Internetitelefon)
  • Helide salvestamine
  • Arvutimängud
  • Videokonverentsid

Peamised kõne kodeerimis viisid[muuda | muuda lähteteksti]

Sub-band coding[muuda | muuda lähteteksti]

SBC (Sub-band coding) on kõne kodeerimis viis, kus signaal jagatakse mitmeks erinevaks sagedusribaks, selle saavutamiseks peamiselt kasutatakse Fourier ' kiirteisendust. SBC põhineb sel põhimõttel, kuidas inimene tegelikult kuuleb palju erinevaid sagedusi aga me kuule neid sagedusi mille signaalis pole palju energiat. Seega SBC põhiidee on salvestada signaali sagedusriba ja välja visata sagedused mis on maskeeritud tugevama signaali poolt, olgu selleks kasvõi inimese kõne. See on üks lihtsamaid kõne kodeerimis viise, kuna me ei tee otseselt järeldusi kuidas inimene kuuleb ning ei toimu otsest müra summutamist. Ühte sellist kõne kodeerimis alamviisi kutsutakse PCM (Pulse Code Modulation), mis on nii kasutuses olnud CD, kui ka helilintide salvestamisel. Mida vähem bitte me kasutame digitaliseerimisel, seda rohkem müra lisatakse. Kuna me soovime müra võimalikult vähe siis tuleks valida just niipalju bitte, et müra oleks alati välja maskeeritud. On ka paremaid viise kuidas SBC'd kasutada, olemas on veel mittelineaarne PCM, MPEG-1 ja ka MPEG-2 [2]

Waveform coding[muuda | muuda lähteteksti]

Lainekuju kodeerimist (Waveform coding) kasutatakse peamiselt pikkade vahemaade vahel suhtlemiseks. Selle kodeerimise põhimõte, et heli oleks võimalikult sarnane tegelikkusele ning ei esineks moonutusi. Tavaliselt sel viisil kodeerides on kõrge kvaliteet (16Kbps-32Kbps) ning madal keerukus. Üheks selliseks kodeerimis viisiks on eelnevalt mainitud PCM (Pulse Code Modulation).[3] Kuna PCM'is on võimalik ka väga suurte bitikiirusteni jõuad ja kuna Waveform coding kodeerimist kasutatakse pikkade vahemaadel suhtlemiseks, siis antud juhul soovime piisavalt madalat ja piisavalt hea kvaliteediga heli, siis üheks selliseks edasiarenduseks PCM'ist nimetatakse DPCM (Differential Pulse Code Modulation). DPCM edasiarendus seisneb selles, et meil on ennustusväärtus, mis arvutatakse eelnevate sämplite põhjal ning seejärel leitakse erinevus tegeliku ja ennustatud sämpli põhjal. Saadud tulemus kvanditakse ja kodeeritakse digitaalsele kujule. Seega väga palju oleneb ennustatud väärtusest, kui see on hästi ennustatud, siis on ka andmed tihedamalt koos.[4]

Linear Predicitive Coding[muuda | muuda lähteteksti]

LPC (Linear Predicitive Coding) on hea kvaliteediga ja madala bitikiirusega kodeering mida kasutatakse ainult inimese kõne kodeerimiseks. Sellel kodeerimis viisil on kaks põhilist komponenti LPC analüüs ehk kodeering ja LPC süntees ehk dekodeering. LPC analüüsi sammul üritatakse anda hinnang kas kõne signaal on heliline või hääletu, leida kaadri sees helikõrgus ja parameetrid, et koostada allikafiltri mudeli. Need parameetrid edastatakse LPC süntees komponendile, mis üritab nende parameetrite põhjal heli sünteesida.[1]

LPC kodeerimist ja dekodeerimist seletavad järgmised sammud: [1]

  1. Loeme kõne digitaalsele kujule.
  2. Määrame koefitsiendi pikkuseks 10 ja kaardi pikkuseks 30ms ning saame kaardi pikkusega 331.
  3. Kõne jagatakse ülal nimetatud kaadri pikkuse põhjal ning hakkame kaadreid töötlema.
  4. Tuleb arvutada, kohad kus ületame nulli, periood ning leida filtri vastus, et arvutada magnitude sum.
  5. Läviväärtused on nulli ületamise ja perioodi puhul on määratud nulliks.
  6. Võrdleme läviväärtuste põhjal kas signaal on heliline.
  7. LPC parameetrid arvutatakse selle põhjal kas signaal oli heliline või mitte.
  8. Arvutatud parameetrid edastatakse.
  9. Vastuvõtja võtab antud signaali vastu ja dekodeerib selle.

Kuna LPC kodeerimist saab ainult kasutada inimese kõne kodeerimiseks siis peamiselt kasutataksegi LPC'd kõne analüüsimiseks ja sünteesimiseks. Näiteks kasutatakse seda telefonitootjate poolt GSM standardis.

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 1,2 S.K Jagtap. "Speech Coding Techniques" (PDF) (inglise). India: Kashibai Navale College of Enegg. Vaadatud 18.04.2022.
  2. Wil Howitt. "Sub-Band-Coding" (rawtext) (inglise). Vaadatud 18.04.2022.
  3. Samir Mohamed. "Waveform Coding" (rawtext) (inglise). Vaadatud 18.04.2022.
  4. "DPCM - Differential Pulse Code Modulation" (rawtext) (inglise). Vaadatud 18.04.2022.