Arvutisemantika

Allikas: Vikipeedia

Arvutisemantika tegeleb loomuliku keele väljenditele omistatud tähenduse esituse loomise ja selle esituse kasutamisega arvutuslikes protsessides.[1] Seega on arvutisemantikal oluline roll nii arvutilingvistikas kui keeletehnoloogias.

Arvutisemantika võib üldiselt jagada kaheks suureks alaprobleemiks: väljendi tähenduse formaalse esituse leidmise probleem ja formaalsete esituste vaheliste seoste leidmise probleem. Formaalsete esituste vahelisi seoseid kasutatakse selle jaoks, et teada saada, kui kasulik mingi otsingu või väljendite võrdluse vastus tegelikult on.[2]

Ajalugu[muuda | muuda lähteteksti]

Algne lähenemine tehisintellekti uuringute käigus kasutas tähenduse esitamiseks vaid graafiteooriat. Üks tuntumaid lähenemisi oli Roger Schanki 1969. aastal loodud kontseptuaalse sõltuvuse teooria, kus sõnade tähendused kodeeriti graafidena, mis esitasid kindlaid põhimõtteid ja relatsioone. Sõnade tähendusi esitavad graafid liideti teatud reeglistikke kasutades kokku lausete tähendusi esitavateks graafideks. Selline esitusviis ei võimaldanud aga esitada keerulisemat informatsiooni ning seda modelleeriti graafi servadele siltide lisamisega.[2]

Tänapäevane lähenemine sai alguse 1970. aastate alguses ning põhineb Richard Montague'i loodud kompositsioonilise semantika teooriat. Tänapäevase lähenemise puhul kasutatakse tähenduse esitamiseks formaalset loogikat. Teksti süntaktilise analüüsi tulemusel saadud esitust esimese või kõrgema järgu loogikas kasutatakse soovitud tulemuse saamiseks järeldusmootori sisendina.[2]

Alamteemad[muuda | muuda lähteteksti]

Antud alapeatükis on välja toodud mõningad alamteemad, millega arvutisemantikas tegeldakse. Nende probleemide lahendamiseks võidakse kasutada nii formaalse kui statistilise semantika meetodeid.

Tähenduse esituse konstrueerimine[muuda | muuda lähteteksti]

Semantilise analüüsi eesmärgiks on jõuda fraaside, osalausete, lausete ja lõikude tasandilt teksti tasandile ja läbi selle leida keelest sõltumatu tähendus. Selle tulemuse saavutamiseks eemaldatakse tekstist keeleline ja kultuuriline kontekst, idioomid ja muud kõnekujundid.

Semantiline alatäpsustus[muuda | muuda lähteteksti]

Keeleliselt tähendab semantiline alatäpsustus informatsiooni ärajätmist tekstist. Arvutisemantika seisukohalt on vaja leida moodus leida ühene esitus mitmele erinevale esitusele. Vastasel juhul ei ole neid võimalik arvutuslikult efektiivselt töödelda, kuna seotud nimisõnafraaside puhul on võimalike interpretatsioonide arv seotud Catalani arvuga.

Anafooride lahendamine[muuda | muuda lähteteksti]

Anafoor on teksti element, mis viitab tekstis varem esinenud elemendile. Näiteks lauses "Harri väitis, et nägi metsas kummitust, aga keegi ei uskunud teda" viitab 'teda' just Harrile, mitte kummitusele.

Presupositsioon[muuda | muuda lähteteksti]

Presupositsioon on selline järeldus, mida saab teha maailma kohta eeldusel, et suhtluses räägitakse tõtt. Näiteks saame lause "Toomas ostis turult kaseviha" põhjal järeldada, et üsna tõenäoselt on Toomal plaanis sauna minna.[3]

Kvantifikaatorite skoobi lahendamine[muuda | muuda lähteteksti]

Teatud lausetes võib tekkida probleem, kus kaks kvantifikaatorit võivad olla mõistetavad erinevas skoobis ning seega muuta lause mõistet. Näiteks lause Iga mees armastab üht naist võib tähendada nii seda, et igal mehel on üks naine, keda see mees armastab; või ka seda, et maailmas on vaid üks naine, keda kõik mehed armastavad.

Rakendusviisid[muuda | muuda lähteteksti]

Paljud arvutuslingvistika rakendused kasutavad suuremal või vähemal määral arvutisemantikauuringute tulemusi. Näiteid rakendustest, mis vajavad semantilist töötlust:

  • relatsiooniliste andmebaaside jaoks informatsiooni kogumine tekstist;
  • multimodaalsed või kõnetuvastuse abil töötavad kasutajaliidesed;
  • masintõlkesüsteemid nii teksti kui ka kõne jaoks.

[2]

Viited[muuda | muuda lähteteksti]

  1. Keith Allan. The Oxford Handbook of the History of Linguistics. 2013
  2. 2,0 2,1 2,2 2,3 Semantics, Volume 3
  3. Christof Monz. Contextual Inference in Computational Semantics. 2nd International and Interdisciplinary Conference on Modeling and Using Context (CONTEXT’99). LNAI 1688, Springer, pages 242–255, 1999.