Kasutaja:AndreVak/Bioinformaatika

Bioinformaatika on interdistsiplinaarne valdkond, mis loob moodsaid meetodeid ja tarkvaratööriistu, et uurida ja mõista bioloogilisi andmeid. Teadusharuna seob bioinformaatika omavahel bioloogia, arvutiteaduse ja matemaatika, et analüüsida ja tõlgendada bioloogilisi andmeid.

Sissejuhatus[muuda | muuda lähteteksti]

Bioinformaatika on väga olulisel kohal paljudes bioloogilistes uurimustes. Eksperimentaalses molekulaarbioloogias kasutatakse bioinformaatilisi võtteid nagu Digitaalne pilditöötlus- ja signaalitöötlus, mis võimaldavad kiiresti uurida suuri andmestikke. Geneetikas ja genoomikas aitab see geenide järjestuse ja nendes toimunud mutatsioonide leidmisel. See mängib rolli andmekaevel bioloogia teaduskirjanduslikest teostest. Bioinformaatika aitab võrrelda geneetilisi ja genoomikalisi andmeid ja üldisemalt aitab mõista molekulaarbioloogia evolutsioonilisi aspekte. Struktuuribioloogias aitab bioinformaatika simuleerida ja mudeldada DNA-d, RNA-d, valke ja biomolekulaarseid reaktsioone.

Ajalugu[muuda | muuda lähteteksti]

Ajalooliselt ei ole bioinformaatika tähendanud alati seda, mida ta tähendab tänapäeval. Paulien Hogeweg ja Ben Hesper defineerisid 1970. aastal bioinformaatika kui bioloogiliste süsteemide andmeprotsesside uurimise. Selle definitsiooni kohaselt on bioinformaatika paralleelne biofüüsikaga (füüsikaliste protsesside uurimine bioloogilistes süsteemides) või biokeemiaga (keemiliste protsesside uurimine bioloogilistes süsteemides).

Ahelad[muuda | muuda lähteteksti]

Bioinformaatikas uuritakse tihti bioloogilisi ahelaid, kuna need võivad olla väga pikkad hoiustatakse neid arvutites.

Arvutid said olulise koha molekulaarbioloogias, kui proteiinide järjestused muutusid kättesaadavaks tänu Frederick Sangerile, kes tegi kindlaks insuliini aminohapete järjekorra. Erinevate bioloogiliste ahelate võrdlemine manuaalselt osutus ebapraktiliseks. Margaret Oakley Dayhoff oli üks esimesi inimesi, kes koostas proteiinide aminohapete järjestuse andmebaasi, mida esialgselt hoiti raamatuformaadis. Veel üks suur panustaja bioinformaatika arengusse oli Elvin A. Kabat, kes oli teerajaja bioloogiliste ahelate uurimises. Ta avastas ka väga paljude antikehade aminohapete järjekorra.

Eesmärgid[muuda | muuda lähteteksti]

Et uurida, kuidas harilikud rakulised protsessid muutuvad erinevate haigusnähtude puhul, tuleb bioloogilistest andmetest luua arusaadav pilt nendest protsessidest. Seega arenes bioinformaatika erinevat tüüpi andmete uurimise ja tõlgendamise suunas. Nende andmete hulka kuuluvad nukleotiidide ja aminohapete järjestused, valkude Domeen (struktuuribioloogia)id, ja valkude ehitus. Tegelikku protsessi, mille käigus selliseid andmeid analüüsitakse ja tõlgendatakse, nimetatakse arvutuslikuks bioloogiaks. Tähtsamad tütarharud bioinformaatikas ja arvutuslikus bioloogias on:

Selliste arvutiprogrammide arendamine ja rakendamine, mis hõlbustavad erinevat tüüpi andmetele ligipääsemist ja nende haldamist.
Uute algoritmide ja statistiliste meetmete välja arendamine, mis leiavad seoseid erinevate näidiste vahelt. Näiteks on meetodid geenide leidmiseks DNAst, et ennustada proteiinide struktuuri ja funktsioone ning rühmitada neid sarnaste mustrite järgi.

Bioinformaatika peamine eesmärk on mõista bioloogilisi protsesse. Teistest lähenemistest erineb see selle poolest, et kesksel kohal on selliste arvutuslike meetmete arendamine ja rakendamine, mis aitavad tõlgendada bioloogilisi andmeid. Näiteks: mustrite äratundmine, andmekaeve, masinõppimine ja andmete visualiseerimine. Põhipingutuseks on bioloogiliste ahelate järjestuste leidmine, geenide leidmine, ravimite väljatöötamine, ravimite avastamine, proteiini struktuuri uurimine, proteiini struktuuri ennustamine, geenide avaldumise ennustamine, proteiinide vastastikuse mõju uurimine, genoomi uurimine, evolutsioonimudeli koostamine ja rakkude pooldumise/mitoosi uurimine.

Bioinformaatikaga kaasneb uute andmebaaside, algoritmide, arvutuslike ja statistiliste meetodite loomine ja arendamine, et lahendada probleeme, mis tekivad bioloogiliste andmete uurimisel ja haldamisel.

Viimaste aastakümnete jooksul on toimunud eksponentsiaalne areng genoomi ja teiste molekulaartaseme uuringute tehnoloogias. Ühes infotehnoloogia arenguga on see kaasa toonud tohutu hulga molekulaarbioloogilisi andmeid. Bioinformaatika on nimi, mis on antud just neile matemaatilistele ja arvutuslikele lähenemistele, mida kasutatakse bioloogiliste protsesside mõistmiseks.

Sagedasti uuritakse bioinformaatikas DNA ahelate järjestust, suhet DNA ja proteiinide järjestuste vahel ja luuakse proteiinide struktuurseid 3D mudeleid.

Suhe teiste valdkondadega[muuda | muuda lähteteksti]

Bioinformaatika on sarnane kuid eraldiseisev bioloogilisest arvutusteadusest, kuid peetakse sünonüümiks arvutuslikule bioloogiale. Bioloogiline arvutusteadus kasutab bioloogilisi süsteeme, et ehitada bioloogilisi arvuteid, kuid bioinformaatika kasutab arvuteid, et paremini mõista bioloogiat. Bioinformaatika ja arvutuslik bioloogia hõlmavad DNA, RNA ja proteiinide ahelate järjestuste analüüsi. Bioinformaatikas toimus plahvatuslik areng 90-date keskpaigas, eestvedava jõuna oli sellel ajal Inimese Genoomi Projekt ja areng DNA ahela dekodeerimises.

Informatsiooni tootmiseks kasutatakse ja arendatakse programme, mis kasutavad graafiteooriat, tehisintellekti, andmekaevet, pildi analüüsi ja arvutisimulatsioone. Kasutatavad algoritmid tulevad diskreetsest matemaatikast, süsteemiteooriast, informatsiooniteooriast ja statistikast.

Bioloogiliste ahelate analüüs[muuda | muuda lähteteksti]

Sellest alates kui phi-X174(üheahelaline DNA viirus) aastal 1977 dekodeeriti, on tuhandete organismide DNA järjestatud ja andmebaasidesse salvestatud. DNA järjestust uuritakse, et kindlaks määrata geene, RNA geene ja teisi ahelaid. Liigisiseseid või liikidevahelisi geene võrreldes, võidakse leida sarnasusi valkude ülesannetes või liikide vahel. Kasvava andmestiku tõttu on DNA järjestuse manuaalne uurimine juba ammu ebapraktiline. Tänapäeval kasutatakse arvutiprogramme nagu Blast, et uurida seoseid rohkem kui 260 000 organismi vahel, kelle DNA on lahti kodeeritud ja salvestatud. Need programmid suudavad leida erinevates DNA-ahelates seotud lõike, millel on sama või sarnane ülesanne, isegi, kui need lõigud ei ole identsed.

DNA ahela järjekorra leidmine[muuda | muuda lähteteksti]

Enne kui ahelaid saab analüüsida, tuleb need kõigepealt järjestada. DNA ahela järjekorra leidmine on mittetriviaalne probleem, sest esialgsed andmed ei ole iga kord üheselt mõistetavad. On leiutatud algoritme, mis aitavad kaasa DNA ahela järjestuse leidmisele.

DNA ahela kokkupanek[muuda | muuda lähteteksti]

Enamus DNA ahela leidmise meetoditest leiavad lõike täielikust DNA-ahelast, mis tuleb kokku panna, et saada kätte terve genoom. Nii-öelda pumppüssi meetod genereerib tuhandeid lühikesi DNA lõike (enamasti 35 kuni 900 nukleotiidi pikkused). Nende lõikude otsad kattuvad, ja kui õigesti järjekorda sättida, võib saada terve genoomi järjestuse. Pumppüssi meetodi abil saab kiirelt kätte erinevad genoomi lõigud, kuid suuremate genoomide korral võib nende kokkupanemine osutada väga keeruliseks. Inimese genoomi ahela leidmiseks võib arvutiprogrammil kuluda lõikude kokkupanemiseks päevi ja lõpptulemuses on üldiselt tühimikud, mis tuleb manuaalselt täita. Pumppüssi meetod on tänapäeval kasutatuim meetod genoomi järjestuse leidmisel.

Genoomi sildistamine[muuda | muuda lähteteksti]

Genoomi sildistamise all peetakse silmas geenide ja teiste bioloogiliste üksuste, mis asuvad DNA-s, nimetamist. See protsess peab olema automatiseeritud, sest enamus genoome on liialt suured, et neid käsitsi sildistama hakata. Sildistamise teeb võimalikuks see, et geenide otsad on eristuvad, kuigi erinevate geenide korral on otsad erinevad.

Esimene geenide sildistamise tarkvara arendas välja Owen White aastal 1995, kes tegi teadustööd Genoomika Instituudis, kus järjestati ja analüüsiti esimesena vaba-organismi genoom, milleks oli Haemophilus influenzae. White lõi tarkvara, mis leidis geene, transformatsiooni RNA-d, ja märkis geenidele peale nende funktsiooni. Kõige moodsamad sildistamise programmid töötavad sarnaselt, kuigi programmid DNA uurimiseks nagu GeneMark, on pidevas muutumises ja arenemises.

Arvutuslik evolutsioonibioloogia[muuda | muuda lähteteksti]

Evolutsioonibioloogia on teadusvaldkond, mis uurib liikide pärilust ja nende muutumist läbi aja. Informaatika on evolutsioonibiolooge aidanud, lubades teadlastel:

uurida paljude organismide evolutsiooni käiku, mõõtes muutusi nende DNA-s. Ilma informaatika abita tuleks uurida füüsilisi ja füsioloogilisi erinevusi erinevates isendites.
võrrelda terveid genoome, et seeläbi uurida keerulisi evolutsioonilisi sündmusi nagu duplikatsioon, horisontaalne geeniülekanne, ja faktoreid, mis mõjutavad bakterite liigiteket.
luua arvutuslike populatsiooni geneetika mudeleid, et ennustada populatsiooni muutumist läbi aja.
hallata ja jagada andmeid suure hulga liikide ja organismide kohta.

Võrdlev genoomika[muuda | muuda lähteteksti]

Võrdleva genoomika tuumaks on seoste leidmine erinevate organismide geenides. Sellised geenidevahelised kaardid teevad võimalikuks leida põhjuseid genoomi hargnemiseks. Genoomi evolutsiooni mõjutavad erinevad evolutsioonilised sündmused. Kõige madalamal tasemel mõjutab evolutsiooni muteerumine, mis on üksikute nukleotiidide muutumine. Kõrgemal tasemel protsessid, nagu kromosoomide lõikude duplikeerimine, horisontaalne geeniülekanne, kromosoomide lõikude ümberpöördumine, kromosoomi lõikude kaod ja juurdeliitmine. Lõppude lõpuks jõuavad muutused tervesse genoomi, mis kiirendab liigisisest arengut ja seeläbi uute liikide teket.

Haiguste geneetiliste tagamaade uurimine[muuda | muuda lähteteksti]

Geenide järjestamine annab meile palju informatsiooni geenide kohta, mis põhjustavad haigusi nagu diabeet, viljatus, rinnavähk ja Alzheimeri tõbi. Genoomiseoste uurimine on tõhus lähenemine leidmaks mutatsioone, mis põhjustavad selliseid keerulisi haigusi. Selliste uuringute põhjal on tuvastatud tuhandeid DNA ahelaid, mida seostatakse haiguste tekkimisega. Sellest tulenevalt on võimalik uurida inimese geene, et diagnoosida haigusi või leida neile ravi.

Vähkipõhjustavate mutatsioonide uurimine[muuda | muuda lähteteksti]

Vähi korral on haigete rakkude genoomid järjestatud täiesti ettearvamatult. Palju rõhku pannakse sellele, et leida varem tundmatuid geenide mutatsioone haigetes rakkudes. Bioinformaatikud loovad automatiseeritud süsteeme, millega käidelda tohutut hulka andmeid haiguste geneetiliste tagamaade kohta, ja nad loovad uusi algoritme ja programme, millega saab võrrelda erinevaid ahelaid kasvavast inimgenoomi andmestikust. Kasutama on hakatud ka uusi vähituvastusmeetodeid nagu oligonukleotiidide mikroahelad, et tuvastada kromosoomide saame ja kadusid ja üksiknukleotiidi polümorfismi ahelaid, et tuvastada teadaolevaid vähkipõhjustavaid mutatsioone. Sellised meetodid jälgivad üheaegselt sadu tuhandeid lõike üle terve genoomi. Järgmise generatsiooni DNA dekodeerimise tehnoloogiate tekkimisega tulenevad läbimurded võivad drastiliselt muuta vähi genoomi uurimist. Uued meetodid ja programmid võimaldavad bioinformaatikutel kiiresti ja odavalt järjestada palju vähi genoome. Tulevikus saab jälgida patsientide haiguskulgu vähiproovide genoomi järgi.

Geenide ja proteiinide avaldumine[muuda | muuda lähteteksti]

Geenide avaldumine[muuda | muuda lähteteksti]

Paljude geenide avaldumist saab määratleda mõõtes mRNA tasemeid. Mõõtmiseks saab kasutada mikroahelaid, EST järjestamine, SAGE järjestamine, MPSS, RNA järjestamine, tuntud ka kui transkriptoom pumppüss järjestamine. Nende meetmetega kogutud andmed pole alati üheselt mõistetavad, sest need on väga mürarikkad. Seetõttu tehakse laiaulatuslikku uurimustööd, et välja töötada programme, mis suudaks signaalist (informatsioonist) müra eraldada ja tagastada puhta selgestimõistetava informatsiooni.

Valkude avaldumine[muuda | muuda lähteteksti]

Bioloogilisi näidiseid uurides on võimalik leida nendes sisalduvad proteiinid. Bioinformaatika võetakse kasutusele, et võrrelda näidiseid andmebaasides olevate salvestustega. Nii saab leida seoseid erinevate isendite ja ka liikide vahel, võrreldes erinevusi proteiinide avaldumises.

Geeniregulatsioon[muuda | muuda lähteteksti]

Regulatsioon on keeruline protsess, mille käigus mingi signaalaine, näiteks hormoon, põhjustab proteiini aktiivsuse muutumist. Et seda protsessi mõista, kasutatakse bioinformaatilisi võtteid.

Näiteks, geenide avaldumist võivad mõjutada selle sama geeni ümbruses olevad DNA-lõigud. Eksisteerivad kindlad nukleotiidide järjestused, mis määravad ära, kuidas nende ümbruses olevat DNA-d loetakse. Geenide avaldumist võivad mõjutada ka DNA-lõigud, mis ei ole genoomis vastava geeni vahetus läheduses. Siin tuleb mängu kromosoomide kuju, kus üks geen võib teisest olla eraldatud tuhandete nukleotiididega, aga ruumiliselt on need geenid üksteise lähedal.

Võidakse uurida, kuidas erinevad keskkonnatingimused mõjutavad proteiinide avaldumist, et teada saada, missugused geenid on aktiivsed vastavate keskkonnategurite mõjul. Kasutatakse arvuti algoritme, mis leiavad, millised geenid avalduvad samaaegselt. Seejärel on võimalik uurida sarnasusi nende geenide ümbruses olevast DNA-st, et leida seoseid regulatoorsetes DNA lõikudes.

Rakuorganisatsioon[muuda | muuda lähteteksti]

Selleks, et leida organellide, geenide, valkude ja teiste raku koostisosade asukohti, on palju lähenemisi. See on tähtis, sest nende asukoht mõjutab bioloogiliste protsesside kulgu rakus, mis omakorda aitab meil ennustada bioloogiliste süsteemide käitumist. Raku osade asukohti salvestatakse paljudesse bioloogia andmebaasidesse.

Mikroskoobi piltide analüüs[muuda | muuda lähteteksti]

Mikroskoobi pildid aitavad leida nii organelle kui ka molekule. Nende abil saab eristada ebanormaalseid rakke normaalsetest, nagu näiteks vähirakke tervetest rakkudest.

Valgu asukoht rakus[muuda | muuda lähteteksti]

Valgu asukoht annab vihjeid selle kohta, mis võib olla selle valgu ülesanne. Näiteks kui valk paikneb raku tuumas, võime oletada, et tegu on valguga, mille ülesandeks on geeniregulatsioon. Kui aga proteiin asub mitokondris, võib see olla seotud mingi ainevahetusprotsessiga.

Kromatiini distibutsioon[muuda | muuda lähteteksti]

Kromatiinide 3D mudelite koostamiseks kasutatakse erinevaid mikrobioloogilisi võtteid. Bioinformaatikud teevad pingutusi, et nende mudelite alusel jagada genoom topoloogiliselt eristuvateks domeenideks.

Struktuuriline bioinformaatika[muuda | muuda lähteteksti]

Oluline koht bioinformaatikas on valkude struktuuri ennustamisel. Valgu aminohapete järjestuse leidmine on kerge, sest seda saab välja lugeda geenis olevate nukleotiidide järjestusest. Nii saadakse kätte proteiini primaarne struktuur (erandiks on hullu lehma tõbi). Proteiini struktuuri teadmine on äärmiselt vajalik, et mõista proteiini funktsiooni. Proteiine liigitatakse struktuuri järgi primaarseks, sekundaarseks, tertsiaarseks ja kvaternaarseks. Nende struktuuride ennustamiseks ei ole leitud ühest lahendust ja selle leidmine on siiani probleem.

Üks bioinformaatika tähtsaim ennustusmeetod on homoloogia kasutamine. Bioinformaatika genoomika harus kasutatakse homoloogiat, et ennustada geeni funktsiooni: kui meil on geen A, mille funktsioon on teada, ja geen B, millel on A-ga homoloogiline järjestus, siis võime järeldada, et geenil B võib olla geeniga A sarnane ülesanne. Sama loogikat kasutatakse proteiinide struktuuri uurimisel, et määrata, millised osad proteiinist on tähtsad vastava struktuuri tekkimisel. Seda saab kasutada valgu struktuuri ennustamiseks, kui me juba teame vastava homoloogilise valgu struktuuri. See on siiani ainus viis, kuidas proteiinide struktuuri usaldusväärselt ennustada.

Üks homoloogia näide on hemoglobiin inimestes ja hemoglobiin kaunviljades. Mõlemal neist on sama funktsioon- hapniku transport organismis. Kuigi mõlemal proteiinil on täiesti erinev aminohapete järjekord, on nende struktuurid identsed.

Võrgu ja süsteemibioloogia[muuda | muuda lähteteksti]

Võrguks nimetatakse igat süsteemi, millel on üheks tervikuks ühendatud alamüksused, nagu näiteks toitumisahel. Võrkude analüüsi käigus proovitakse leida ja mõista võrgusiseseid seoseid. Kuigi võrk võib koosneda samasuguse olemusega üksustest (näiteks geenivõrgustik), proovib võrgubioloogia ühendada erinevaid võrke, et moodustada ühtne suurem võrk, kust näeme, kuidas protsessid erinevates võrkudes üksteist mõjutavad.

Süsteemibioloogia kasutab arvutisimulatsioone, et uurida rakusiseste protsesside toimumist ja visualiseerida keerulisi seoseid nende protsesside vahel. Simuleeritakse ka algelisi eluvorme, et mõista evolutsioonilisi protsesse.

Molekulaarse vastastikmõju võrgud[muuda | muuda lähteteksti]

Rontgenkristallograafia ja nukleaar magneetilise resonantsspektroskoopia abil on kindlaks määratud kümnete tuhandete proteiinide struktuurid ja üheks keskseks küsimuseks struktuuribioloogias on see, kas proteiinidevahelisi reaktsioone on efektiivne ennustada nende 3D mudelite põhjal või peaksime tegema vastavaid katseid, et nende reaktsioonide tulemus teada saada.

Muud[muuda | muuda lähteteksti]

Kirjanduse analüüs[muuda | muuda lähteteksti]

Avaldatud teaduskirjandusteoste arv kasvab aastast aastasse ja nende kõigi lugemine on võimatu, mille tulemusena tekivad lahknevused erinevate uurimisvaldkondade vahel. Kirjanduse analüüs proovib kaevata andmeid teaduskirjandusteostest, kasutades arvutuslikke ja statistilisi lahendusi. Näiteks:

Lühendite äratundmine - seob täispikkuses väljendid neile vastavate lühenditega.
Bioloogiliste üksuste nimede äratundmine - bioloogiliste terminite, näiteks geenide nimede tuvastamine.
Proteiinide vastastikmõju - leiab teadustekstidest, millised proteiinid omavahel reageerivad.

See teadusharu tuleneb statistikast ja arvutuslikust lingvistikast.

Piltide analüüs[muuda | muuda lähteteksti]

Kasutatakse arvutuslikke tehnoloogiaid, et kiirendada või täielikult automatiseerida suure hulga biomeditsiiniliste piltide töötlemist, kvantifitseerimist ja uurimist. Kaasaegsed pildianalüüsimisprogrammid suudavad piltidelt tuvastada kasulikku informatsiooni. Kuigi need programmid ei ole välja töötatud bioloogia jaoks, on neid hakatud bioloogias aina rohkem kasutama. näiteks:

rakukoostisosade asukoha leidmisel rakus
morfomeetrias
kliiniliste piltide analüüsil ja visualiseerimisel
õhuvoolude liikumise kindlaks määramisel elus loomade kopsudes
laboriloomade käitumisharjumuste jälgimisel
ainevahetusprotsesside kindlaksmääramisel

Üksiku raku analüüs[muuda | muuda lähteteksti]

Üksiku raku andmete analüüsimiseks kasutatakse arvutuslikke võtteid, nagu näiteks voo tsütomeetria. Selliseid võtteid kasutades proovitakse leida rakke, mis on seotud mingi haigusega või eksperimentaalsete konditsioonidega.

Bioloogilise mitmekesisuse informaatika[muuda | muuda lähteteksti]

Sellel alal kogutakse ja uuritakse mitmekesisusandmeid, nagu näiteks taksonoomilised andmebaasid või mikrobioomide andmestikud.

Andmebaasid[muuda | muuda lähteteksti]

Andmebaasid on bioinformaatiliste uuringute tegemiseks elementaarse tähtsusega. Olemas on palju andmebaase, kus hoitakse erinevat tüüpi bioloogilisi andmeid: näiteks, DNA ja proteiini ahelate järjekorrad, molekulaarsed struktuurid, fenotüübid ja bioloogilise mitmekesisuse näitajad. Andmebaasidesse lisatakse nii eksperimentaalseid andmeid kui ka neid, mis on saadud andmete analüüsi käigus. Andmebaasides võidakse hoida infot üht tüüpi organismi või molekuli kohta, aga võidakse ka ühendada paljude erinevate üksuste andmed ühte suuremasse andmebaasi. On palju erinevaid andmebaasitüüpe, mida bioinformaatikud kasutavad erinevat tüüpi andmete hoidmiseks.

Genbank, UniProt - kasutatakse bioloogiliste ahelate analüüsiks
InterPro, Pfam - kasutatakse proteiini alamharude uurimiseks
Sequence Read Archive - kasutatakse bioloogiliste ahelate järjekordade salvestamiseks

Programmid ja tööriistad[muuda | muuda lähteteksti]

Bioinformaatikute kasutada on palju erinevaid programme, alustades lihtsate käsurea programmidega ja lõpetades keerulisemate graafiliste programmide ja veebirakendustega

Nähtava lähtekoodiga programmid[muuda | muuda lähteteksti]

1980-datest aastast alates on loodud palju nähtava lähtekoodiga bioinformaatika programme. Kuna bioloogiliste andmete maht on järest kasvamas, siis on vaja välja mõelda uusi algoritme nende andmete uurimiseks.

Vabakasutuses olevad tuntumad programmid on Bioconductor, BioPerl, Biopython, BioJava, BioJS, BioRuby, Bioclipse, EMBOSS, .NET Bio, Orange koos bioinformaatika lisaga, Apache Taverna, UGENE ja GenoCAD.

Veebiteenused bioinformaatikas[muuda | muuda lähteteksti]

SOAPil ja RESTil põhinevate veebirakenduste loomine annab võimaluse kasutada serverite algoritme, andmestikke ja arvutusvõimsust. See tähendab, et kasutajad ei pea muretsema andmebaaside haldamise ja tarkvara pärast.

Euroopa Bioinformaatika Instituut on bioinformaatilised veebiteenused jaganud 3 kategooriasse: ahelate järjestuste otsimise rakendused, järjestuste joondamisrakendused ja bioloogiliste ahelate analüüsi rakendused. Sellised rakendused pakuvad bioinformaatikutele võimalusi uurida andmeid, omamata ise selleks vastavaid andmebaase, algoritme või arvutusvõimsust.

Haridusplatvormid[muuda | muuda lähteteksti]

Internetis võib leida palju kohti, kus saab bioinformaatikat õppida. Šveitsi bioinformaatika instituut pakub Rosalindi õppeplatvormi, et tutvustada õpilistele bioinformaatika põhitõdesi ja õpetada lahedama probleeme läbi programmeerimise. Tuntud platvorm on ka 4273pi projekt, kus kasutatakse Rasberry Pi arvuteid ja nendega tehakse teadusuuringute tasemel tööd.

MOOCide kaudu on võimalik saada bioinformaatika sertifikaate: tuntuimad neist on Coursera Bioinformatics Specialization ja Genomic Data Science Specialization ning EdXi Andmeanalüüs eluteadustes XSeries.

Konverentsid[muuda | muuda lähteteksti]

Toimub palju suuri konverentse, kus tegeletakse bioinformaatika arendamisega. Kõige tuntumad neist on Euroopa Arvutusliku bioloogia konverents, Inteligentsed Süsteemid Molekuaarbioloogiasse ja Uurimused Arvutuslikus Bioloogias.

Bioinformaatika Eestis[muuda | muuda lähteteksti]

Eestis saab bioinformaatikat õppida Tartu Ülikoolis kahel eraldi suunal. Esimeseks suunaks on DNA-põhiste molekulaarse diagnostika meetodite arendus ja teiseks suunaks on võrdlev genoomika. Tartu Ülikooli bioinformaatika õppetooli juhataja on professor Maido Remm. Tema ja ta töögrupi pingutustega töötati välja uus algoritm ja sellel põhinev programm GenomeMasker. GenomeMasker on programm, mis suudab leida kordused inimgenoomis üles kahe tunniga, enne seda oli parim tulemus umbes tuhat tundi.