Infootsing

Allikas: Vikipeedia
Jump to navigation Jump to search

Infootsing on toimingud, meetodid ja protseduurid talletatud andmetest informatsiooni saamiseks etteantud teemal.

Infootsing üldises tähenduses on informatsiooni hankimine mistahes viisil mingi probleemi lahendamiseks, otsuse vastuvõtmiseks või muul eesmärgil kõigist kättesaadavatest infoallikatest ja -kanalitest.

Olemus ja infootsingu tüübid[muuda | muuda lähteteksti]

Kitsamas tähenduses kasutatakse infootsingu mõistet eeskätt arvutipõhiste infosüsteemide kontekstis ja infootsinguna käsitletakse niisuguste meetodite ja tehniliste võtete kogumit, mis võimaldavad infomassiivist kiiresti leida vajalikku informatsiooni. Toimingud, meetodid ja protseduurid talletatud andmetest informatsiooni saamiseks etteantud teemal.

Infosüsteemile esitatakse infopäringloomulikus keeles formuleeritud küsimus või kirjeldus, milles infotarbija mõne sõnaga iseloomustab teda huvitavat ainevaldkonda või konkreetset probleemi. Infosüsteemis toimub päringu ja otsimassiivis olevate andmete otsitunnustike võrdlemine, selle tulemusena väljastatakse tulemused – informatsioon, kus otsitunnustikud ühtivad. Sisuliselt vastab päringule vaid osa esitatud otsitulemustest (relevantne informatsioon), kõike relevantset informatsiooni ei ole võimalik üles leida.

Iga infootsingut käivitavaks faktoriks on infovajadus. Otsitava info iseloomust või laadist tulenevalt võib eristada teaviku- ehk dokumendi, fakti- ja teemainfovajadust. Nendest tuletatakse peamised infootsingu tüübid:

  1. Teaviku- ehk dokumendiotsing – otsitakse andmeid konkreetse teaviku või dokumendi kohta, dokumenti ennast või tema koopiat. Igas kirjes on tavaliselt otsitava pealkiri, kirjeldus või märksõna.
  2. Faktiotsing – otsingu objektiks on konkreetsed andmed, faktid mis on pärit dokumendist (seadmete tehnilised näitajad, materjalid, jne), mingi nähtuse, sündmuse kohta jms faktiline informatsioon.
  3. Teemaotsing – otsitakse mingil teemal avaldatud materjale. Sünonüümide kasutamine aitab teemat käsitlevaid materjale paremini leida.

Terviklikku lähenemisviisi infootsingu sooritamiseks nimetatakse otsingustrateegiaks. Ühel infootsingul võib olla üks strateegia, kuid võib kasutada ka mitmeid strateegiaid. Kõige enam levinud otsingustrateegiateks on:

  • lehitsemine, sirvimine (browse)
  • liht- ehk kiirotsing (basic search, quick search)
  • liit- ehk kompleksotsing (advanced search, vahel ka expert search)

Infootsing moodustab ühe osa informatsiooni hankimisest. Selline otsing on seotud andmebaasidega ja sinna sisestatud teabega (nt viited, faktid, tekstid, pildid, helikujundid) ja seda teavet otsitakse kasutamise eesmärgil.

Infootsingu täpsustamisvõimalused[muuda | muuda lähteteksti]

Kui infootsinguks on andmebaas valitud, tuleb alustada otsingut. Alustatakse märksõnade sisestamisega, kas üksikult või koos päringuoperaatoritega AND, OR, NOT.

Boole’i operaatoritega otsitakse sõnu mistahes kirje osast määramata nende omavahelist järjestust

  • AND piirab otsingut – birds AND bees – kirjes on nii sõna birds kui ka bees
  • OR laiendab otsingut – birds OR bees – kirjes on sõna birds või bees
  • NOT kitsendab otsingut – birds NOT bees – kirjes on sõna birds ja ei ole sõna bees

Lisaks märgitud enimkasutatavatele märksõnadele on võimalik otsingu täpsustamiseks kasutada

  • sulgusid (cutting OR welding) AND laser
  • erinevaid kärpimis- või peitemärke ? või $ või / või – või : või #
  • autorite nimede järgi au=Kuusik, Rein
  • avaldamise aasta py=1999
  • piirata vastuste hulka.

Nende märkidega antakse märksõnade kirjutamisel erinevaid võimalusi. Infootsingu õnnestumise eelduseks on, et otsija saab aru, mida otsib.

Infootsing Internetis[muuda | muuda lähteteksti]

Internetis info otsimise protsess sisaldab hulga alamprotsesse, mis on omavahel seotud: probleemi äratundmine, probleemi defineerimine, otsingusüsteemi valik, päringu kontseptualiseerimine, päringu formuleerimine, infotsingu sooritamine, tulemuste hindamine ja kui osutub vajalikuks, on vaja mõnd alamprotsessi korrata.

Infootsingu ajalugu[muuda | muuda lähteteksti]

Elektronarvutustehnika tekkega sai võimalikuks infotöö automatiseerimine. Arvutite abiga hakati valmistama bibliograafianimestikke, alustati uuringuid tekstide automaatseks refereerimiseks ja identifitseerimiseks, infokeelte automaatseks koostamiseks ning infootsisüsteemide realiseerimiseks arvutitel. Tekstide sisuliseks töötluseks hakati kasutama elektronarvuteid ja masinmeetodeid. Algul rakendati arvuteid ainult dokumentide ja päringute otsitunnustike võrdlemiseks ning relevantsete dokumentide aadresside või kirjete väljastuseks. Arvutustehnika arenguga tekkisid infosüsteemid, mis on kui infotöö automatiseeritud kompleksid. Esialgu nimetati neid integraalseteks infosüsteemideks, tänapäeval tunneme rohkem integreeritud infosüsteemidena, mis toimivad põhimõttel, et dokument salvestatakse süsteemis üks kord ja kasutatakse siis salvestatud dokumentide massiivi kõikvõimalike infotöö ülesannete lahendamiseks. Eri liiki andmete kombineerimisel saadakse erinevaid väljundeid: infoväljaandeid, päringute vastuseid, statistilisi aruandeid jpm.

1954. aastal esitleti arvuti kasutamist bibliograafilisel otsingul pakett-töötlusrežiimis. Esialgse pakett-töötluse puhul infovajaja esitas oma päringu spetsialistidele, kes selle kodeerisid arvutile arusaadavasse keelde ja andsid siis arvutile töödelda. Umbes kuue nädala pärast saadi päringule vastus. Kui otsingu formuleering osutus ebatäpseks või tulemused ei rahuldanud infovajajat, tuli kogu protseduur uuesti läbi teha. Pakettotsingu aeglus ja kohmakus takistasid selle laialdast rakendamist.

1960–1967 töötati välja tekstide masintöötluse teoreetilisi aluseid ning tehti arvukalt masineksperimente informatsiooni analüüs-sünteestöötluseks.

Pakettotsingu kõrvale tekkis dialoogotsing, mis tugines arvutisüsteemide reaalajatöötlusele, kus arvuti kasutaja on sisend-väljundseadme kaudu vahetult arvutiga seotud ehk töötab sidusrežiimis. 1960. aastal demonstreeris esmakordselt maailmas avalikult oma dialoogsüsteemi Protosynthex firma System Development Corporation Santa Monicas Californias. 1964. aastal alustas USAs National Library of Medicine [1] oma seni mehaaniliselt koostatud bibliograafia Index medicus koostamist arvuti abil. 1965. aastal toimus Ameerika Ühendriikides esmakordne dialoogotsingu andmevõrgu demonstratsioon riiklikul tasandil.

Infootsingualased uurimused[muuda | muuda lähteteksti]

Vastavad uurimused võivad

  • keskenduda eelkõige süsteemile;
  • keskenduda infoallikate ja süsteemide tõhusa kasutamise kavandamisele;
  • keskenduda tulemustele ja nende täpsuse hindamisele;
  • eeldada, et informatsioon on süsteemis tarbijale kasutamiseks juba olemas;
  • pöörata tähelepanu päringu täpsele formuleerimisele ning ümberformuleerimisele.

Ajalooliselt on info hankimise uuringud

  • keskendunud info kasutajale;
  • keskendunud inforessursside lehitsemise heuristilisele ja dünaamilisele olemusele;
  • eeldanud, et informatsiooni hangitakse eelkõige teadmiste laiendamiseks
  • pööranud tähelepanu mitteplaneeritud otsingustrateegiale ning relevantse informatsiooni äratundmisele;
  • keskendunud lehitsemise interaktiivsele olemusele.

Vaata ka[muuda | muuda lähteteksti]

Kirjandus[muuda | muuda lähteteksti]

  • Virkus, S. 2003. Infokirjaoskus ja infokäitumine infouuringute kontekstis. [2]