Formaalne grammatika

Allikas: Vikipeedia

Formaalseks grammatikaks nimetatakse informaatikas ja keeleteaduses formaalse keele täpset kirjeldust, mis tähendab keele kuuluvate stringide (sõne (informaatika)) määratlemist. Formaalses grammatikas on kaks põhilist kategooriat. Esimene neist, generatiivsed grammatikad tegeleb reeglitega kuidas keelde kuuluvaid stringe genereerida. Teine, analüütilised grammatikad tegeleb reeglitega kuidas on võimalik stringe analüüsida, et aru saada, kas see kuulub keelde. Lühidalt, analüütiline grammatika kirjeldab kuidas ära tunda stringe mis kuuluvad mingisse hulka, samal ajal kui generatiivne grammatika kirjeldab kuidas kirjutada ainult neid stringe, mis kuuluvad mingisse hulka.

Generatiivsed grammatikad[muuda | muuda lähteteksti]

Next.svg Pikemalt artiklis Generatiivne grammatika

Generatiivne grammatika koosneb reeglitest, mille abil konstrueerida stringe. Selleks, et genereerida keelde kuuluvat stringi tuleb alustada grammatika algussümbolist ning seejärel rakendada teisi sobivaid reegleid. Reegleid võib kasutada suvalises järjekorras ja suvaline arv kordi. Reeglite rakendamise tulemusena saadakse string, mis kuulub grammatikaga määratud keelde. Osad grammatikad võimaldavad saada sama stringi mitmel eri viisil reegleid kohaldades, neid grammatikaid nimetatakse mitmeseks. Grammatikat, mille abil saab kõiki stringe ainult ühtviisi reegleid rakendades genereerida nimetatakse üheseks.

Näiteks võtame keele, milles on kaks tähte - ja ning 2 reeglit:

1.
2.

Alustame -st mis on algussümbol. Valides esimese reegli, asendame me -i -ga ja saame stringi . Valides reegli 1 veel üks kord saame stringi ja seejärel rakendades reeglit 2 saame stringi . Lühidalt kokkuvõttes oli tuletuskäik järgmine: . Grammatikaga määratud keeleks on kõikide nende stringide hulk mida antud reeglite abil on võimalik genereerida: .

Formaalne definitsioon[muuda | muuda lähteteksti]

Noam Chomsky pakkus 1950 aastatel välja formaalse grammatika definitsiooni. Grammatika G koosneb 4 komponendist:

  • Mitteterminalide lõplikust hulgast
  • Terminalide lõplikust hulgast , millel puudub ühisosa mitteterminalide hulgaga.
  • Produktsioonireeglite lõplikust hulgast , igaüks kujul
Lahtiseletatuna, iga produktsioonireegel seob ühe stringi teisega, vasakul pool peab olema vähemalt üks sümbol mitteterminalide hulgast. Juhul kui paremal pool on tühi string (string, milles ei ole ühtegi sümbolit), siis kasutatakse selle väljanäitamiseks sümbolit epsilon ().
  • Algussümbolist , mis sisaldub hulgas

Tavaliselt viidatakse grammatikale kui nelikule: . Formaalse grammatika poolt määratud keel () on defineeritud kui kõikide nende stringide hulk, mis koosnevad ainult sümbolitest hulgast ja mida on võimalik genereerida alustades algussümbolist ja seejärel rakendades produktsioone hulgast kuni sõnad koosnevad ainult terminalidest (ei leidu sümboleid mitteterminalide hulgast ).

Näide[muuda | muuda lähteteksti]

Nende näidete jaoks on formaalsete keelte spetsifitseerimiseks kasutatud set-builder notationi.

Olgu meil grammatika , kus , , on algussümbol ja sisaldab järgmisi produktsioonireegleid:

1.
2.
3.
4.

Mõned näited keelde kuuluvate stringide tuletamisest oleks:

(Selgitus: loe kui "L genereerib R-i kasutades selleks produktsiooni number i" ja genereeritud osa näidatakse iga kord rasvaselt)

See grammatika defineerib keele , kus tähendab n arvust sümbolitest koosnevat stringi. Seega, see keel sisaldab stringe, milles on võrdne nullist suurem arv , ja stinge ning need sümbolid asuvad samas järjekorras.

Chomsky hierarhia[muuda | muuda lähteteksti]

Analüütilised grammatikad[muuda | muuda lähteteksti]

Kirjandus[muuda | muuda lähteteksti]

  • Jaak Henno. Formaalsed keeled, grammatikad ja translaatorid 2006. TTÜ Kirjastus. ISBN 9985-59-627-7.