Keeletehnoloogia

Allikas: Vikipeedia
Jump to navigation Jump to search

Keeletehnoloogia (inglise language technology) on erialadevaheline valdkond, mis tegeleb keelelise informatsiooni – teksti ja kõne – arvutitöötluseks vajalike meetodite uurimise ja rakenduste arendamisega. Keeletehnoloogia põhineb teadmistel keele ehitusest ja funktsioneerimisest ning hõlmab mitmeid valdkondi, nagu psühholoogia, kognitiivsed teadused, arvutiteadus, tehisintellekt, signaalitöötlus, matemaatika, statistika jm.[1] Üldiselt peetakse keeletehnoloogiat informaatika haruks.

Keeletehnoloogia on välja kasvanud arvutilingvistikast, milles tegeldakse eelkõige kirjaliku keele arvutitöötluse teoreetiliste aspektidega ja seda peetakse pigem lingvistika haruks.[1]

Keeletehnoloogid kasutavad arvutilingvistikas välja töötatud teooriaid, et luua rakendusi (nt arvutiprogramme), mis võimaldavad inimkeelt arvuti abil töödelda ja mõista. Tänapäeval on keeletehnoloogia tuntumateks valdkondadeks masintõlge, arvutileksikoloogia, dialoogisüsteemid, kõneanalüüs ja kõnesüntees.

Keeletehnoloogia peamisteks komponentideks on keeleressursid ja keeletarkvara.[1]

Terminikasutus[muuda | muuda lähteteksti]

Termin keeletehnoloogia võeti kasutusele 1990. aastal, kui infotehnoloogia edenedes hakkas arvutilingvistika alal tekkima vajadus spetsiifilisema eristuse järele.[1]

Keeletehnoloogiat on kitsamalt tähistatud ka terminiga inimkeeletehnoloogia (inglise human language technology) – inimkeele käsitlemiseks loodud tarkvarasüsteemid.[2]

Sageli käsitatakse keeletehnoloogiat ja loomuliku keele töötlust sama mõistena.

Keeletehnoloogia areng Eestis[muuda | muuda lähteteksti]

Keeletehnoloogia sai Eestis alguse 1950ndail, kui Tartu Ülikoolis loodi masintõlke uurimisrühm, et automaatselt tõlkida matemaatilisi tekste vene keelest eesti keelde (uurimisrühm tegutses Ülo Kaasiku juhtimisel). Järgnevalt alustati keele arvutitöötlusega Eesti Keele Instituudis ning kõneanalüüsi ja -sünteesi uuringutega Tallinna Tehnikaülikoolis. Need kolm asutust on ka tänapäeval peamised keeletehnoloogia uurimis- ja arenduskeskused Eestis.[1] Tartu Ülikoolis töötavad arvutilingvistika uurimisrühm ja keeletehnoloogia töörühm, Eesti Keele Instituudis tegeldakse kõnesünteesi ja arvutileksikograafiaga, Tallinna Tehnikaülikoolis on foneetika ja kõnetehnoloogia labor.

1994. aastal kaasati Eesti arvutilingvistid ja keeletehnoloogid Euroopa Liidu COPERNICUS-programmi, mille tulemusel avanes Eesti keeletehnoloogia uurimisrühmadele võimalus osaleda rahvusvahelistes projektides.[1] Lisaks teadus- ja tehnoloogiauuringutele on Eesti keeletehnoloogia arengut toetatud ka kõrghariduse tasemel. Tartu Ülikoolis saab õppida nii keeletehnoloogiat[3] kui arvutilingvistikat[4].

Alates 2006. aastast rahastatakse keeletehnoloogia projekte riiklikest programmidest. Aastatel 2006–2010 oli käigus programm "Eesti keele keeletehnoloogiline tugi", aastatel 2011–2017 "Eesti keeletehnoloogia" ja hetkel on töös "Eesti keeletehnoloogia 2018–2027".[5][6]

Vaata ka[muuda | muuda lähteteksti]

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 1,2 1,3 1,4 1,5 Meister, Einar 2018. Keeletehnoloogia ja eesti keel. – Sõida tasa üle silla: Raamat eesti keelest ja meelest (toim. Raimo Raag, Jüri Valge), Tallinn-Tartu: EKSA 2018. ISBN 9789949604623. Libris ID: 199gnpx2z084rpjb
  2. Krista Liin, Kadri Muischnek, Kaili Müürisep, Kadri Vider: Eesti keel digiajastul = The Estonian language in the digital age Springer, 2012
  3. "Informaatika ja infotehnoloogia". Tartu Ülikooli matemaatika-informaatikateaduskonna koduleht. Vaadatud 04.01.2019.
  4. "Tartu Ülikooli õppekavad: eesti ja soome-ugri keeleteadus". 2018. Vaadatud 04.01.2019.
  5. Eesti keeletehnoloogia programmi koduleht (kasutatud 04.01.2019)
  6. Riiklik programm "Eesti keeletehnoloogia (2011-2017)" vana.keeletehnoloogia.ee

Välislingid[muuda | muuda lähteteksti]