Kasutaja:Pavel Kornyshev/Semantiline veeb

Allikas: Vikipeedia
Semantilise veebi "stack"

Semantiline veeb (ingl semantic web) on üldkättesaadav globaalne semantiline võrk, mis on moodustatud veebi baasil informatsiooni esitamise standardiseerimise kaudu nii, et informatsioon oleks masintöötlemiseks sobival kujul.

HTML-lehekülgedel põhinevas tavapärases veebis teave sisaldub lehekülgede tekstis ja on mõeldud inimlugemiseks ja mõistmiseks. Semantiline veeb koosneb masinloetavatest elementidest - semantilise võrgu tippudest, mis põhinevad ontoloogial. Tänu sellele on kliendiprogrammidel võimalik otseselt vastu võtta Internetist teateid kujul "objekt – vastastiku seose tüüp - teine objekt" ja arvutada nende põhjal loogilised järeldused. Semantiline veeb töötab paralleelselt tavalise veebiga ja põhineb sellel, kasutades HTTP protokolli ja URI ressursside identifikaatoreid.

Nimetust "semantiline veeb" tutvustati esmakordselt 1998. aasta septembris Tim Berners-Lee poolt (veebi leiutaja)[1], ja kannab nime "järgmine samm ülemaailmse veebi arendamisel". Hiljem tegi ta oma blogis ettepaneku[2] sünonüümiks „globaalne hiigelgraaf” (ingl ‘giant global graph’, GGG, analoogselt WWW-ga). Semantilise veebi kontseptsiooni võttis vastu ja edendab World Wide Web Consortium[3].

Põhiidee[muuda | muuda lähteteksti]

Veebis olev informatsioon on inimestele mugav lugeda. Semantiline veeb on olemasoleva veebi lisand, mis on loodud selleks, et muuta Internetis kasutatav teave masintöötlemiseks sobivaks: muuta informatsiooni sobivaks automaatse analüüsi ja järelduste sünteesi jaoks, lisaks nii andmete kui ka nende põhjal tehtud järelduste muutmiseks erinevateks esitlusteks, mis on praktikas kasulikud.[4]

Masintöötlemine on võimalik tänu semantilise veebi kahele omadusele:

  • URI olemasolu;
  • semantiliste võrkude ja ontoloogiate kasutamine.

URI - ühtne ressursiidentifikaator või aadress, mida kasutatakse infoallika üheseks määramiseks (näiteks veebileht, fail või e-posti kast). URI-sid kasutatakse objektide ühetähenduslikuks nimetamiseks. Igal globaalse semantilise võrgu objektil on unikaalne URI. Eraldi URI-sid luuakse mitte ainult lehekülgedele, vaid ka reaalsetele objektidele (inimesed, linnad, kunstiteosed jne) ja isegi abstraktsetele mõistetele (näiteks „nimi“, „värv“). URI unikaalsuse tõttu võib sama objekti nimetada ühtemoodi semantilise veebi erinevates kohtades. Kasutades URI, saab koguda informatsiooni ühe objekti kohta erinevatest kohtadest. Soovitatav on lisada URI aadressile ühe veebi protokolli (HTTP või HTTPS), s.t URI-d soovitatakse alustada «http: //»-ga või «https: //»-ga. Sellist aadressi võib samaaegselt kasutada URI aadressina ja veebilehe aadressina (URL). Veebilehtedel, mille URL kattub URI-ga, W3C soovitab panna objekti kirjeldust. Kirjeldus on soovitav esitada kahes formaadis[5]:

  • formaadis, mis on inimeste lugemiseks kohane;
  • formaadis, mis masinlugemiseks kohane.

Semantiliste võrkude ja ontoloogiate kasutamine. Veebi andmed esitatakse tavaliselt teksti kujul, mis on kirjutatud loomulikes keeltes. Sellised tekstid on mõeldud inimestele tajumiseks, kuid masin võib nende tähendusest aru saada, kasutades ühte loomulike keelte töötlemise meetoditest. Meetodid teostavad teksti sagedusanalüüsi ja / või leksikaalset analüüsi.

Masina jaoks sobivana formaadina soovitab W3C kasutada RDF keelt. RDF võimaldab kirjeldada semantilise võrgu struktuuri graafi kujul. Iga graafi tipule ja iga kaarele saab määrata eraldi URI. RDF-i abil kirjutatud väiteid saab tõlgendada ontoloogiate abil. Ontoloogiate loomiseks on soovitatav kasutada RDF Schema ja OWL (Web Ontology Language) keeli. Ontoloogiad on loodud loogiliste järelduste saamiseks andmetest. Ontoloogiad põhinevad matemaatilistel formalismidel, mida nimetatakse [[Deskriptiivne loogika|deskriptiivseks loogikaks].

Arhitektuur[muuda | muuda lähteteksti]

Semantilise veebi tehnilise osa moodustab kirjelduskeelte standardite perekond, sealhulgas XML, XML Schema, RDF, RDF Schema, OWL ja mõned teised. Paigaldades neid realiseeruva abstraktsiooni suurendamise järgi, saame:

  • XML esindab süntaksit masintöötlemiseks kuuluva dokumendi struktuuri määratlemiseks. XML-süntaks ei kanna semantilist koormust.
  • XML Schema määratleb XML-dokumendi struktuuri piirangud. Standardne XML keele süntaktiline analüsaator on võimeline kontrollima suvalist XML-dokumenti, et selle struktuur vastaks nn dokumendi skeemile, mis on kirjeldatud XML-Schema’s.
  • RDF kujutab endast lihtsat viisi eksemplarandmete kirjeldamiseks formaadis subjekt-suhe-objekt, kus selle kolmiku mis tahes elemendina kasutatakse ainult ressursside identifikaatoreid.
  • RDF Schema kirjeldab atribuutide komplekti (siin on täpsem nimetada neid suheteks), näiteks rdfs:Class, et määratleda uusi RDF-andmete tüüpe.
  • OWL laiendab uute tüüpide kirjeldamise võimet (sealhulgas loendite lisamise abil) ning samuti võimaldab kirjeldada uusi RDF Schema andmetüüp olemasolevate terminite põhjal.
  • Mikroandmed (HTML microdata) on HTML-lehekülgede semantilise märgistuse rahvusvaheline standard atribuutide abil, mis kirjeldavad ühtes või teistes HTML-elementides sisaldava informatsiooni mõtet. Sellised atribuutid muudavad lehtede sisu masinloetavaks, st võimaldavad automaatselt leida ja välja võtta vajalikke andmeid[6].

Loogiline järeldus[muuda | muuda lähteteksti]

Semantilise veebi metaandmete kirjelduse vormingud viitavad sellele metaandmetele loogilisele järeldusele ja töötati välja selles valdkonnas olemasolevate matemaatiliste vormide põhjal. Vormingu aluseks olev formaalsus võimaldab teha järeldusi selle vormi andmeid töötlevate programmide omaduste kohta.

See kehtib eriti OWL-i keele kohta. Selle põhivormismiks on deskriptiivse loogika ja keel ise on jagatud kolme pesastatud alamhulka (pesitsuse järjekorras): OWL Lite, OWL DL ja OWL Full[7]. On tõestatud[8], et OWL Lite ekspressiivsusega metaandmetele loogiline järeldus tehakse polünoomi ajal (teisisõnu, järeldusprobleem kuulub klassi P). OWL DL kirjeldab deskriptiivse loogika maksimaalset lahendatavat alamhulka, kuid mõnede selliste andmete päringud võivad vajada eksponentsiaalset käitust. OWL Full rakendab kõiki olemasolevaid kirjeldavaid loogikakujundajaid, vältides päringute kohustuslikku lahendamist.

RDF-i keele predikaatide lihtne struktuur võimaldab omakorda kasutada loogiliste andmebaaside teooriatest saadud kogemusi, predikaadi loogikat jne.

Viited[muuda | muuda lähteteksti]

  1. [[1]]Tim Berners-Lee (01-09-1998). "Semantic Web Road map". {{cite web}}: kontrolli kuupäeva väärtust: |date= (juhend)
  2. Giant Global Graph.Mall:Wayback, русский перевод: Тим Бёрнерс-Ли. Гигантский Глобальный Граф
  3. Раздел о семантической паутине на сайте W3C
  4. "Resource description framework (RDF): concepts and abstract syntax" (inglise). Консорциум Всемирной паутины. 10-02-2004. Originaali arhiivikoopia seisuga 2011-08-24. Vaadatud 2010-09-12. {{cite web}}: eiran tundmatut parameetrit |deadlink=, kasuta parameetrit (|url-status=) (juhend); eiran tundmatut parameetrit |description= (juhend); kontrolli kuupäeva väärtust: |date= (juhend)
  5. "Cool URIs for the Semantic Web" (inglise). Консорциум Всемирной паутины. 3-12-2008. Originaali arhiivikoopia seisuga 2011-08-24. Vaadatud 2010-09-12. {{cite web}}: eiran tundmatut parameetrit |deadlink=, kasuta parameetrit (|url-status=) (juhend); eiran tundmatut parameetrit |description= (juhend); kontrolli kuupäeva väärtust: |date= (juhend)
  6. "W3C Semantic Web Activity". World Wide Web Consortium (W3C). 7-11-2011. Vaadatud 26-11-2011. {{cite web}}: kontrolli kuupäeva väärtust: |accessdate= ja |date= (juhend)
  7. The Species of OWL in OWL Language Guide
  8. OWL Full, OWL DL and OWL Lite in OWL Language Reference