Arvutipõhine tõlkimine

Allikas: Vikipeedia

Arvutipõhine tõlkimine on tõlkimise vorm, mille puhul tõlkija kasutab tõlkeprotsessi teostamiseks arvutitarkvara.[1]

Kuigi arvutipõhises tõlkes kasutatakse masinate abi, ei tohiks seda segi ajada masintõlkega.

Ülevaade[muuda | muuda lähteteksti]

Tänapäevased automaatse masintõlke süsteemid ei ole võimelised iseseisvalt kõrge kvaliteediga tõlkeid tootma: enamasti vajab nende väljund inimeste poolset toimetamist, et kõrvaldada vead ning parandada tõlke kvaliteeti. Arvutipõhine tõlkimine ühendab tarkvara kasutamise käsitsi toimetamisega, muutes tõlkimise nii interaktiivseks protsessiks, kuhu on kaasatud nii inimene kui ka arvuti.[2]

Mõned kaasaegsemad arvutipõhise tõlke lahendused sisaldavad ka masintõlke (MT) võimalust. Reeglina võimaldavad kõrgema hinnaga MT moodulid tõlkijal kasutada mitmekülgsemat tõlketööriistade komplekti, mis võib muuhulgas sisaldada terminihalduse funktsioone ning erinevaid lingvistilisi vahendeid. Hoolikalt kohandatud sõnastikud, mis põhinevad korrektsel terminoloogial, parandavad masintõlke täpsust ning muudavad seega tõhusamaks kogu tõlkeprotsessi.

Tööriistad[muuda | muuda lähteteksti]

Arvutipõhine tõlkimine on laiapõhjaline ja täpselt piiritlemata mõiste, mis hõlmab väga erinevaid vahendeid, alustades suhteliselt lihtsa ehitusega tööriistadest ning lõpetades keerukate vahenditega. Nende hulgast võib välja tuua järgmised:

  • Tõlkemälu tööriistad (TM tööriistad), mis hõlmavad andmebaasi teksti segmentidest algkeeles ning nende tõlketest ühes või mitmes sihtkeeles.[3]
  • Õigekirja kontroll, kas sisseehitatud tekstitöötlusprogrammiga või selleks ette nähtud lisaprogrammiga.
  • Grammatika kontroll, jällegi sisseehitatud tekstitöötluse tarkvara või lisaprogrammi kujul.
  • Terminihaldusesüsteemid, mis võimaldavad tõlkijatel oma terminipanka elektroonsel kujul hallata. Siia kuuluvad lihtsakoelised tabelid, mis on koostatud tõlkija tekstitöötluse tarkvara abil; andmebaasid, mis on loodud selliste programmidega nagu FileMaker Pro, või – töökindlamate (ja kallimate) lahenduste tagamiseks – spetsiifilisema suunitlusega tarkvarapakette (ESÕ MultiTerm, LogiTerm, Termex, jne) kasutades.
  • Elektroonilised sõnastikud, üks- või kakskeelsed
  • Terminoloogia andmebaasid, mis on ligipääsetavad peaarvuti või interneti kaudu, näiteks ESTERM 
  • Täistekstiotsingu tööriistad, mis võimaldavad kasutajal teha päringu juba tõlgitud tekstide või eri tüüpi viitedokumentide hulgas
  • Konkordantsi tööriistad: programmid, kus kasutaja saab otsida sõnu või termineid neile vastavas kontekstis, ühe- või mitmekeelses korpuses.
  • Joondusvahendid: tööriistad, mis võimaldavad omavahel joondada algteksti segmendid ning nende tõlked, mida saab seejärel analüüsida täisteksti otsingu tööriista või konkordantsi funktsiooni abil
  • Projektijuhtimise tarkvara, mis võimaldab struktureerida keerukaid tõlkeprojekte, suunata erinevaid ülesandeid erinevatele inimestele ning jälgida iga ülesande täitmisprotsessi

Mõisted[muuda | muuda lähteteksti]

Tõlkemälu tarkvara[muuda | muuda lähteteksti]

Tõlkemälu programmid säilitavad andmebaasina varem tõlgitud algtekstid ja nende sihttekstid ning võimaldavad uute tekstide tõlkimisel ligipääsu sarnastele (potentsiaalselt kasulikele) varasemate tekstide segmentidele.[4]

Sellised programmid jaotavad algteksti käepärasteks ühikuteks – segmentideks. Segment võib olla algteksti lause või lausesarnane kogum (pealkiri, nimekirja element). Samuti võivad segmentideks olla mahukamad tekstiosad (lõigud) või väiksemad osad (osalaused). Võimalusel (olenevalt andmebaasi sisust) pakub programm iga segmendi juures varasemast tõlkest pärit sarnase segmendi taaskasutamiseks. Kui sobivat vastet mälus ei ole, saab tõlkija segmendile uue tõlke sisestada. Pärast segmendi tõlke kinnitamist lisab programm uue tõlkevaste andmebaasi ja liigub järgmise segmendi juurde. Olemas on ka selline tõlkemälu lähenemine, mis ei vaja andmebaasi, vaid põhineb hoopis joondatud viitedokumentidel.

Mõned tõlkemälu programmid toimivad kui eraldiseisvad keskkonnad, samas kui teised funktsioneerivad lisandprogrammidena, mis lubavad lisada erinevates vormingutes dokumente, nt tabeleid, või HTML-koodi, mida kasutatakse tõlkemäluprogrammi abil.

Keelepõhine otsingumootori tarkvara[muuda | muuda lähteteksti]

Keelepõhine otsingumootori tarkvara on enamasti internetipõhine süsteem, mis toimib sarnaselt interneti otsingumootoritega, kuid interneti asemel teeb see otsinguid suures tõlkemälukogumis, kuhu on salvestatud varem tõlgitud laused, lausefragmendid, fraasid ning isegi terved lõigud, mis langevad kokku algdokumendi segmentidega.

Keelepõhised otsingumootorid on loodud selleks, et teostada kaasaegse otsingutehnoloogia abil otsinguid, mis põhinevad algteksti sõnadel neile sobivas kontekstis. Nii tagatakse, et otsingu tulemused kannavad algteksti segmentidega sama tähendust. Sarnaselt traditsiooniliste tõlkemälu tööriistadega sõltub keelepõhise otsingumootori väärtus tugevalt otsinguks kasutatavast tõlkemälude kogumikust.

Terminihalduse tarkvara[muuda | muuda lähteteksti]

Terminihalduse tarkvara abil saab tõlkija algdokumendis esinevaid termineid terminibaasist automaatselt otsida. Paljudel tõlkeabiprogrammidel ilmuvad asjakohased vasted automaatselt tõlkemälu liidese aknasse, või on vastavad terminid kättesaadavad teminibaasi sissekandena, mis avaneb kindla klahvikombinatsiooni kasutamisel.[4]

Joondamistarkvara[muuda | muuda lähteteksti]

Joondamisprogrammides jaotatakse nii algtekst kui ka sihttekst segmentideks, algteksti segmendid ühendatakse seejärel tõlgitud segmentidega loomaks tõlkemälu või mõni muu viiteallikas. Paljud joondusprogrammid võimaldavad tõlkijatel valesti paardunud segmente käsitsi korrigeerida.

Interaktiivne masintõlge[muuda | muuda lähteteksti]

Interaktiivse masintõlke puhul üritab automaatne süsteem ennustada, millise tõlke teeks inimesest tõlkija, pakkudes välja erinevaid tõlke hüpoteese. Need hüpoteesid võivad olla terviklikud laused või lauseosad.


Viited[muuda | muuda lähteteksti]

  1. Bowker, Lynne (2002). Computer-aided Translation Technology. Ottawa: University of Ottawa Press. p. 144.
  2. Barrachina, Sergio; et al. (2009). "Statistical Approaches to Computer-Assisted Translation" (PDF). Computational Linguistics35 (1): 3–28. doi:10.1162/coli.2008.07-055-r2-06-29ISSN 0891-2017.
  3. Christensen, Tina Paulsen; Schjoldager, Anne. "Translation-Memory (TM) Research: What Do We Know and How Do We Know It?" (PDF). Hermes44.
  4. 4,0 4,1 "Terminology Management and MT" (PDF). Circuit117.