Mine sisu juurde

Bibliokaeve

Allikas: Vikipeedia

Bibliokaeve ehk bibliograafiline andmekaeve (inglise keeles bibliomining, tuletatud terminitest bibliometrics ja data mining) on andmekaeve metoodika, kus kasutatakse sotsiaalseid võrgustikke, mis võimaldavad nii bibliomeetriat kui ka kasutajapõhist andmekaevet üheainsa andmeaida (data warehouse) kaudu.

Bibliokaeve on defineeritud kui andmekaeve, bibliomeetria, statistika ja aruandlusvahendite kogum. Bibliokaevet kasutatakse nii infoteaduses, äris (kindlustus, pangandus), teadusuuringutes (astronoomia, meditsiin) kui ka riiklikus julgeolekus (kurjategijate ja terroristide avastamine). Bibiliokaevet kasutatakse raamatukoguüsteemides käitumismustrite väljaselgitamiseks. Bibliokaeve võimaldab raamatukogu juhtidel ja teadlastel paremini mõista raamatukogus sisalduvaid ressursse ja kuidas raamatukogu kasutajad ressurssidele ligi pääsevad.

Täielik bibliokaeve protsess hõlmab mitut etappi alates projekti eesmärgi mõistmisest kuni selleni, millised andmed on kättesaadavad protsessi muudatuste rakendamiseks lõpliku analüüsi põhjal.

Termini "bibliokaeve" võttis 2003. aastal kasutusele Syracuse'i ülikooli infoteaduste kooli õppejõu Scott Nicholson, et eristada seda raamatukogudes muud tüüpi andmekaevetest.

Bibliokaeve rakendamine[muuda | muuda lähteteksti]

Bibliokaeve rakendamiseks tuleb luua andmeait. Selleks on vajalik koguda informatsiooni ressursside kohta (nt andmed töö autori kohta). Kui andmed on kogutud, korrastatakse demograafiline informatsioon ja lõpuks otsitakse raamatukogu informatsioon. Seejärel on võimalik andmeid analüüsida ning töödelda. Lisaks on võimalik uurida ka, millal inimesed kõige sagedimini raamatukogu külastavad. Tänu bibliokaevele suudab raamatukogu paremini mõista oma kasutajaid. Bibliokaeve abil saavad raamatukogu juhid planeerida eelarvet, keskendudes ressurssidele, mida kõige rohkem kasutatakse.

Bibliokaeve tehnikad[muuda | muuda lähteteksti]

Bibliokaevandamise liike on palju, mis on tavalisel jagatud teadaoleva teabe liigi ja andmekaevandamise mudelist otsitavate teadmiste tüüpidega.

  • Ennustatav modelleerimine – seda kasutatakse juhul, kui eesmärk on hinnata konkreetse sihtatribuudi väärtust ja on olemas näidistreeningandmed, mille jaoks on selle atribuudi väärtused teada. Näiteks klassifikatsioon, mis võtab juba eelmääratletud rühmadeks jagatud andmekogumi ja otsib mustreid andmetest, mis neid rühmi eristavad.
  • Kirjeldav modelleerimine ehk klasterdamine – jagab andmed rühmadesse. Klasterdamisega ei ole aga korralikud rühmad eelnevalt teada; andmeid analüüsides avastatud mustreid kasutatakse rühmade määramiseks.
  • Mustri kaevandamine – keskendub andmete spetsiifilisi mustreid kirjeldavate reeglite tuvastamisele. Teine oluline asi mustrite kaevandamise juures on järjestikuse mustrite avastamine; näiteks võib seadme rikkele eelnenud vigade või hoiatuste järjestusi kasutada ennetava hoolduse ajastamiseks või projekteerimisvea kohta teabe saamiseks.
  • Anomaalia tuvastamine – seda võib vaadelda nii nagu klasterdamist; see tähendab ebatavaliste andmeekseplaride leidmist, mis ei sobi ühegi väljakujunenud mustriga.

Kirjandus[muuda | muuda lähteteksti]

  • Sirje Virkus. "Andmeanalüütika. Bibliokaeve ehk bibliograafiline andmekaeve"
  • Britannica. "Data mining." [1]
  • Raido R. blogi. "Bibliomeetriast." [2]
  • Novaator. "Teadlaste tulevik: tsiteeringute lugemine muutub veelgi olulisemaks." [3]