Parsimine

Allikas: Vikipeedia
Jump to navigation Jump to search

Parsimine ehk süntaksianalüüs (ka süntaktiline analüüs; inglise parsing) on protsess, milles arvutikeeles või andmestruktuurides esinevaid sõnesid analüüsitakse vastavalt loomuliku keele formaalse grammatika reeglitele. Ingliskeelne termin parsing tuleneb ladinakeelsest sõnast pars (orationis), mis tähendab osa (kõnest).[1]

Parsimist tõlgendatakse keeleteaduse ja informaatika harudes üldjuhul erinevalt.

Traditsioonilist lauseparsimist kasutatakse tihti mingi kindla lause või sõna täpse tähenduse mõistmiseks. Sageli rõhutatakse, kui oluline on lause jaotamine lauseliikmeteks.[2]

Arvutilingvistikas kasutatakse terminit viitamaks arvuti poolt teostatud lauseanalüüsile, mille tulemuseks on lauseosade omavahelisi süntaktilisi suhteid kujutav struktuur.[3]

Psühholingvistikas kasutatakse terminit, kirjeldades keele mõistmist. Selles kontekstis viitab parsimine viisile, kuidas inimesed analüüsivad mingit lauset või fraasi (kõne- või kirjakeeles) vastavalt grammatikale, määratledes lauseliikmeid, süntaktilisi suhteid jne.[1]

Informaatikas mõistetakse parsimist kui protsessi, mille tulemuseks on programmikoodi kujutav pars- või süntaksipuu.[4] See protsess on kolmeastmeline:

  1. leksikaline analüüs – leksikalist analüsaatorit (ka lekser) kasutatakse sõnade ära tundmiseks ja nende märgendamiseks;
  2. süntaktiline analüüs – kontrollib, kas lekserilt saadud märgendid moodustavad mingi mõistliku lause;
  3. semantiline analüüs – protsessi viimane samm, mis võtab arvesse leitud lausete tähendused ja tagamõtted ning tegutseb vastavalt nendele.[4]

Saadud tulemust kasutatakse nii kompilaatorites kui ka interpretaatorites.[4]

Loomulikud keeled[muuda | muuda lähteteksti]

Traditsioonilised meetodid[muuda | muuda lähteteksti]

Parsimine kui traditsiooniline grammatikaharjutus hõlmab teksti jaotamist lauseliikmeteks, selgitades iga liikme vormi, funktsiooni ja sünktaktilist suhet teiste liikmetega. Saadud selgitused tulenevad suuresti keele käänetest ja pööretest, mis võivad olla võrdlemisi keerukad, eriti tugevalt hääldatud keelte puhul.[2] Selle jaoks, et parsida fraas mees hammustab koera, peab märkima kolme asja:

  1. mees – nimetavas käändes olev nimisõna, mis on lause alus;
  2. hammustab – ainsuse 3. pöördes olev lause öeldis, sõnast 'hammustama';
  3. koera – osastavas käändes olev nimisõna, mis on lause sihitis.[2]

Lauseosadevaheliste suhete kujutamiseks kasutatakse mõnikord lausediagramme.[5]

Psühholingvistika[muuda | muuda lähteteksti]

Psühholingvistika kontekstis ei hõlma parsimine ainult lauses olevate sõnade liigitamist ja nendevaheliste seoste äratundmist, vaid ka lause tähenduse hindamist vastavalt süntaksi reeglitele, mis tulenevad igast järgnevast sõnast lauses. Tavaliselt parsivad lugejad lauseid osade kaupa ning üritavad pärast iga osa tõlgendada lause tähendust. Saades piisavalt informatsiooni, teevad lugejad oletuse lause järgneva sisu ja kogu tähenduse kohta. Kohates uut lauseosa, üritavad lugejad siduda seda nii varasema tõlgenduse kui ka tehtud järeldustega. Aia-tee lause efekt esineb olukorras, kus lugeja on ebamäärase sõnastuse tõttu tõlgendanud lugemise ajal lause tähendust valesti. Õige tähendus tuleb välja lause lõppu jõudes. Seega peab lugeja lauset uuesti lugema ja hindama, et selle tähendusest aru saada.[6]

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 "Parse". Vaadatud 4. november 2018. Inglise keeles.
  2. 2,0 2,1 2,2 "Grammar and Composition". Vaadatud 4. november 2018. Inglise keeles.
  3. Ariva, Lilian. Eskor, Liina. "Mis on arvutilingvistika?". Vaadatud 27. november 2018.
  4. 4,0 4,1 4,2 "What is a parser?". Vaadatud 27. november 2018. Inglise keeles.
  5. "Diagramming Sentences". Vaadatud 27. november 2018. Inglise keeles.
  6. Reisberg, D. (2010). Cognition: Exploring the science of the mind. (4 ed.). New York, NY: W.W. Norton & Company, Inc.