Andmete revolutsioon

Allikas: Vikipeedia

Andmete revolutsioon on kvalitatiivne muutus infotehnoloogilises ja ühiskondlikus elus, järsk üleminek ühelt kvaliteedilt teisele.

Andmete revolutsiooni üheks eelduseks on andmestumine. Andmete revolutsioon tekitab uusi uurimisküsimusi, meetodeid ja eetilisi küsimusi, mis nõuavad uusi kirjaoskusi ja tegevusjuhendite väljatöötamist.

Eellugu[muuda | muuda lähteteksti]

Pärast teist maailmasõda muutusid pildi-, heli- ja videolindid teabe säilitamise ja edastamise vahenditeks. Infokommunikatsioonitehnoloogia esilekerkimine tõi kaasa teabe eksponentsiaalse kättesaadavuse, mis vaatamata oma eelistele tõi kasutajatele ja infohalduritele ka raskusi, sünnitades infoteaduse.[1]

Pidades silmas kompaktse teabe saatmise vajadust, kasutasid Ameerika sõjaväelased teise maailmasõja ajal pilte, mille kaudu sai korraga saata palju teavet pika teksti lühikeste märkmetena. Just see lähenemine lõi visuaalse info pakendamise süsteemi ja peagi võeti kasutusele ka heli.[1]

Info- ja andmeplahvatus[muuda | muuda lähteteksti]

Teise maailmasõjaga tekkinud olukorda on nimetatud ka infoplahvatuseks. Infoplahvatus on avaldatava teabe hulga kiire kasv, ehk olukord, kus teave on rikkalikult kättesaadav või valitseb andmete üleküllus. Infoplahvatust on täiendavalt selgitatud kui olukorda, kus teabe kasutajad ja haldajad on olemasoleva teabega ülekoormatud. Seda nimetatakse ka teabe ülekoormuseks.[1]

Andmete tootmise protsess on asjade salvestamine arvutisüsteemidesse andmete kujul. Mõned andmed on kultuuri ja ühiskonnaga seotud kirjed, teised aga universumi ja elu nähtuste kirjeldused. Andmeplahvatuseks nimetatakse suure hulga andmete kiiret loomist ja salvestamist arvutisüsteemidesse. Andmeplahvatus moodustab arvutisüsteemides andmeloomuse. Andmete olemuse uurimiseks on vaja uusi teooriaid ja meetodeid.[2]

Vastavalt IDC uurimisaruandele pealkirjaga "Majanduse lepingute tõttu laieneb digitaalne universum" jõudis uue digitaalse teabe hulk 2008. aastal umbes 486 miljardi gigabaidini ja kasvas 3 protsenti kiiremini kui IDC varem prognoosis. Eeldatakse, et digitaalne universum on iga 18 kuu järel kaks korda suurem. 2012. aastal luuakse viis korda rohkem digitaalset teavet võrreldes 2008. aastaga. Kui andmed plahvatuslikult suurenevad, muutuvad need ka keerulisemaks ja mitmekesisemaks. IBM Information on Demand 2009 konverentsil tõid eksperdid välja, et maailmas toodetakse iga päev ligi 15 GB[küsitav] andmemahtu. Need andmed pärinevad erinevatest seadmetest, sealhulgas anduritest, RFID-dest, arvestitest, GPS-idest ja vähemalt 80 protsenti uutest andmetest on struktureerimata, näiteks veebisisu, veebilogid, meilid, pildid, videod, helid jne.[2] Seetõttu peab andmetega tegelema kriitilisemalt ja filosoofilisemalt.[3]

Uued andmeallikad[muuda | muuda lähteteksti]

Uued andmeallikad pakuvad uut tüüpi tõendeid, tekitavad uut tüüpi küsimusi, võimaldavad uut tüüpi vastuseid ja kujundavad viise, kuidas tõendeid kasutatakse poliitika, avaliku arvamuse ja äritavade mõjutamiseks. Olulised arengud hõlmavad avatud andmeid, suurandmeid, andmete visualiseerimist ja andmepõhise ajakirjanduse esilekerkimist. Need arengud muudavad olemasolevate tõendite olemust, nende esitamise ja kasutamise viise ning nende tõlgendamiseks vajalikke oskusi. Õpetajad peaksid panema rohkem rõhku suurtele valimitele, mitme muutujaga kirjeldusele ja andmete visualiseerimisele. Suurandmete analüüsimiseks on vaja õppida teatud tehnikaid. Andmekasutuse kasvav mitmekesisus nõuab sügavamat kontseptuaalset analüüsi ja peaks hõlmama modelleerimise funktsioonide ning andme- ja eetikapoliitika uurimist. Andmete revolutsioon suunab statistiliselt mõtlema ja kujundama praktiliste probleemide lahendamisel põhinevat andmetöötluse ja modelleerimise esteetikat.[4]

Kogutavad andmed[muuda | muuda lähteteksti]

Oleme keset andmete revolutsiooni. Organisatsioonid ja üksikisikud soovivad üha enam kasutada tohutuid andmekoguseid, mida praegu kogutakse ja jagatakse.[5]

Ettevõtted ja teadusasutused kaevandavad väärtuslike teadmiste saamiseks üha enam mitmesuguseid andmeid:

  • andmeid sisust ja jälgedest, mida me veebis maha jätame;
  • andmed elektroonilistest tehingutest, mis on meie igapäevaelu lahutamatu osa;
  • teavet koguvate andurite ja teadusseadmete andmed.[5]

Andmete nappusest on saanud nende uputus ja muutusega on kaasnenud ettekuulutused suurandmete potentsiaalist uute lähenemisviiside jaoks uurimis- ja otsustusprotsessides. Ka suurandmete aluseks olevad tehnoloogiad on kiiresti arenenud.[5]

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 1,2 Kadiri, J. A., & Adetoro, N. A. (2012). Information explosion and the challenges of information and communication technology utilization in Nigerian libraries and information centres. Ozean Journal of Social Sciences, 5(1), 21–30.
  2. 2,0 2,1 Zhu, Y., Zhong, N., & Xiong, Y. (oktoober 2009). Data explosion, data nature and dataology. In International Conference on Brain Informatics (pp. 147–158). Springer, Berlin, Heidelberg.
  3. Kitchin, R. (2014). The data revolution: Big data, open data, data infrastructures and their consequences. Sage.
  4. Ridgway, J. (2016). Implications of the data revolution for statistics education. International Statistical Review, 84(3), 528–549.
  5. 5,0 5,1 5,2 Stuart, D. (2015). The data revolution: Big data, open data, data infrastructures and their consequences. Online Information Review.