Masinõppimine

Allikas: Vikipeedia

Masinõppimine on teadusvaldkond, mille eesmärk on disainida empiiriliste andmete põhjal otsuseid ja ennustusi tegevaid algoritme.

Ajalugu[muuda | redigeeri lähteteksti]

Masinõpe sai alguse 1950. aastatel, kui Arthur Samuel valmistas kabet mängiva programmi. Samuel oli üks esimesi, kes kasutas efektiivselt ära heuristilisi otsingumeetodeid ehk ajalise vahega õppimist. 1959. aastal avaldas Oliver Selfridge oma "Pandemooniumi" artikli, millest sai tehisintellekti valdkonnas klassika. Selfridge'i arhitektuur suutis modelleerida inimesele sarnast seaduspärasuste tuvastust. 1960. aastatel loodi esimene kunstlik närvivõrk – pertseptron. See teisendab sisendi x (reaalväärtustega vektor) väljundiks f(x), mis on tavaline binaarväärtus. Pertseptroni korral on tegu lineaarse klassifitseerijaga. 1970. aastatel arendas Ross Quinlan välja ID3 algoritmi, mis genereeris otsuste puu. ID3 oli C4.5 algoritmi eelkäija. Järgnevatel aastakümnetel tuli välja selgituspõhine õpe ning uuesti hakkasid populaarsust koguma tehislikud närvivõrgud. Järgneval kahel aastakümnel arendati andmekaevet, tekstiõppimist, abistatud õpet, induktiivset loogikaprogrammeerimist ja Bayesi võrkude põhjal õppimist. Viimase kümne aasta jooksul on tekkinud tugivektor-masinad, graafilised mudelid ning palju on arendatud masinõppimist robootikas ja masinnägemises.[1]

Formaalne definitsioon[muuda | redigeeri lähteteksti]

Tom Michael Mitchell on öelnud masinõppimise formaalseks definitsiooniks laialt tsiteeritud lause: "Arvutiprogramm õpib kogemusest E ülesannete klassi T ja tulemuste mõõdu P suhtes, kui selle tulemuslikkus klassi T ülesannetes, nii nagu mõõdetud P kaudu, paraneb kogemusega E." [2]

Üldistus[muuda | redigeeri lähteteksti]

Õppija põhiline eesmärk on teha üldistusi eelneva kogemustehulga põhjal.[3] Programmi jaoks tulnud treeningandmed on suvalise tõenäosusjaotusega, kuid programm peab nende andmete põhjal eraldama informatsiooni, mis võimaldaks programmil luua kasulikke vastuseid ja teha üldiseid järeldusi.

Masinõppimine, andmebaasidest teadmiste avastamine ja andmekaeve[muuda | redigeeri lähteteksti]

Neid kolme valdkonda aetakse mõnikord segi, kuna nad kasutavad tihti samu meetodeid ja kattuvad paljuski. Siiski on neil erinevusi:

  • Masinõppimine keskendub rohkem treeningandmetes olemasolevate omaduste põhjal ennustuste tegemisele.
  • Andmekaeve, mis on andmebaasidest teadmiste avastamise analüüsi osa, keskendub rohkem andmetest uute omaduste leidmisele.

Andmekaeve kasutab küll mitmeid erinevaid masinõppe meetodeid, kuid tihti on nende kasutamisel hoopis teine eesmärk. Samuti kasutatakse õppija täpsuse parandamiseks meetodeid andmekaevest.

Inimese mõju[muuda | redigeeri lähteteksti]

Mõned masinõppesüsteemid proovivad andmeanalüüsi teha inimese intuitsioonita, kuid teised süsteemid kasutavad rohkem inimese ja masina koostööd. Inimese intuitsiooni aga ei saa täielikult elimineerida, kuna süsteemi disainija peab täpsustama, kuidas andmed on süsteemile esitatud ja missuguseid mehhanisme kasutatakse andmete karaktiseerimiseks.

Algoritmide tüübid[muuda | redigeeri lähteteksti]

Masinõppe algoritmid jaotatakse oodatava tulemuse põhjal erinevatesse kategooriatesse:

  • Juhendamisega õpe genereerib funktsiooni, mis teisendab sisendandmed soovitud väljundandmeteks. Näiteks liigituse probleemis genereerib õppija funktsiooni, mis teisendab sisendvektori erinevateks klassideks, vaadates funktsiooni sisend- ja väljundnäiteid. Juhendamisega õppel peab masinale olema etteantud märgistatud treeningandmete kogu, mille põhjal tehakse uusi järeldusi.
  • Juhendamata õppe korral proovitakse leida märgistamata andmete kogust uusi struktuure.
  • Vähese juhendamisega õppes kasutatakse nii märgistatud kui ka märgistamata andmeid, et luua sobiv funktsioon või klassifitseerija.
  • Abistatud õpe on masinõppe ala, mis tegeleb põhiliselt sellega, kuidas õppija peaks keskkonnas käituma, et maksimeerida kumulatiivset tasu. Igal teol on mõju keskkonnale ning keskkond annab tagasiside tasu vormis, mis juhib õppimisalgoritmi.
  • Õppima õppimine – programm õpib endale kogemuse põhjal uue hulga eeldusi, mida kasutatakse selliste sisendite väljundite ennustamisel, milliseid programm pole ise veel kohanud.

Teooria[muuda | redigeeri lähteteksti]

Masinõppe algoritmide ja nende jõudluse arvutuslik analüüs on teoreetilise informaatika üks harusid, mida kutsutakse arvutuslikuks õppeteooriaks. Kuna treeninghulgad on lõplikud ja tulevik on määramatu, ei pruugita õppeteooria algoritmide jõudlust alati õigesti kirjeldada. Algoritmide jõudluse kirjeldamiseks kasutatakse tõenäosuslikke piirdeid.

Peale jõudluse piirete kasutavad arvutusliku õppimise teoreetikud algoritmi ajalist keerukust ja õppimise võimalikkust. Arvutuslikus õppeteoorias on arvutus ainult siis võimalik, kui see saavutatakse polünomiaalse ajaga. On olemas kahte erinevat sorti ajalise keerukuse tulemusi. Positiivsed tulemused näitavad, et teatud funktsioonide klasse on võimalik ära õppida polünomiaalse ajaga. Negatiivsed tulemused näitavad, et teatud klasse ei saa ära õppida polünomiaalse ajaga.

Meetodid[muuda | redigeeri lähteteksti]

Otsuste puu põhjal õppimine[muuda | redigeeri lähteteksti]

Otsuste puu põhjal õppimine kasutab ennustava mudelina puu andmestruktuuri, mis ennustab soovitud muutuja väärtuse mitmete sisendparameetrite põhjal.

Assotsiatsooni reeglite õppimine[muuda | redigeeri lähteteksti]

Assotsiatsiooni reeglite õppimine on populaarne ja hästi uuritud meetod leidmaks suurtest andmebaasidest relatsioone erinevate muutujate vahel. Las I=\{i_1, i_2,\ldots,i_n\} olla esemete hulk ja D = \{t_1, t_2,\ldots, t_m\} olla tehingute hulk. Igal tehingul on oma ID ja sisaldab endas alamhulka I elementidest. Reegel defineeritakse kui implikatsioonina X \Rightarrow Y, kus X, Y \subseteq I ja X \cap Y = \emptyset. Näiteks kui mõne poe I= \{\mathrm{piim, leib, margariin, liha}\} ja reegel on \{\mathrm{margariin, leib}\} \Rightarrow \{\mathrm{piim}\}, tähendab see seda, et kui kliendid ostavad võid ja leiba, ostavad nad ka piima.

Tehislikud närvivõrgud[muuda | redigeeri lähteteksti]

Tehisliku närvivõrgu õppimisalgoritm on algoritm, mis on inspireeritud bioloogiliste närvivõrkude struktuurist ja funktsioonist. Tänapäevased tehislikud närvivõrgustikud on mittelineaarsed statistilised andmemodelleerimise vahendid. Neid kasutatakse keerukate sisendite ja väljundite suhete modelleerimisel, andmetest seaduspärasuste otsimisel või mitmete muutujate ühise tõenäosusjaotuse statistilise struktuuri leidmisel.

Geneetiline programmeerimine[muuda | redigeeri lähteteksti]

Geneetiline programmeerimine on bioloogilisest evolutsioonist inspireeritud metodoloogia, mille ülesanne on leida kasutaja poolt defineeritud ülesannetele neid lahendavaid programme. See on geneetiliste algoritmide spetsialiseerumine, kus iga osa on eraldi arvutiprogramm. Geneetiline programmeerimine on masinõppe nipp, mida kasutatakse, et optimeerida arvutiprogrammide hulka nende kõlblikkuse järgi, mis tuleneb selle arvutiprogrammi suutelisusest etteantud ülesannet täita. Algselt genereeritakse suvaliselt programmide kogum ning aja möödudes jäävad valikulise protsessi toimel järele ainult parimad.[4]

Induktiivse loogika programmeerimine[muuda | redigeeri lähteteksti]

Induktiivse loogika programmeerimine on üks lähenemine reeglite õppimisele, kasutades loogilise programmeerimise meetodit ühtse esindajana andmetele, taustainfole ja hüpoteesidele. Kui ette on antud loogilise andmebaasina taustainfo ja hulk andmeid, tuletab induktiivse loogika programmeerimise süsteem hüpotiseeritud loogikaprogrammi, milles on kõik positiivsed ja mitte ühtegi negatiivset näidet.

Tugivektor-masinad[muuda | redigeeri lähteteksti]

Tugivektor-masinad on hulk seotud juhendamisega õppe meetodeid, mida kasutatakse klassifikatsiooniks ja regressiooniks. Kui ette on antud hulk treeningandmeid, kus kõik andmed on eraldi kategooriatesse kuuluvatena märgistatud, siis tugivektor-masina treenimisalgoritm ehitab mudeli, mis ennustab, kuhu kategooriasse uus andmetükk kuulub. Tugivektor-masin loob hüpertasandi või hüpertasandite hulga mitmedimensionaalses ruumis.

Klasterdamine[muuda | redigeeri lähteteksti]

Klasteranalüüsi tulemusel kolmeks klastriks eraldatud sisendandmed.

Klastrianalüüs või klasterdamine on mõõtmiste hulga eraldamine alamhulkadeks, mida kutsutakse klastriteks, nii et ühes klastris mõõtmised oleks kõik kuidagi omavahel seotud. Klasterdamine on üks juhendamata õppe meetoditest ja tavaline statistilise andmeanalüüsi meetod.

Bayesi võrgud[muuda | redigeeri lähteteksti]

Bayesi võrk ehk suunatud atsükliline graafiline mudel on tõenäosuslik graafiline mudel, mis esindab juhuslike muutujate hulka ja nende tingitud sõltumatust suunatud atsüklilise graafi kaudu. Näiteks suudab Bayesi võrk esindada erinevate haiguste ja sümptomite vahelist tõenäosuslikke suhteid. Kui ette on antud sümptomid, siis Bayesi võrk suudab välja arvutada erinevate haiguste olemasolu tõenäosst.

Abistatud õpe[muuda | redigeeri lähteteksti]

Abistatud õpe tegeleb sellega, kuidas õppija või agent peaks keskkonnas tegutsema, et maksimeerida pikas perspektiivis tasu. See algoritm üritab leida strateegia, mis teisendab keskkonna olekud nendeks tegudeks, mida agent peaks sooritama. Abistatud õppes, erinevalt juhendamisega õppest, ei anta ette korrektseid sisend- ja väljundpaare ega parandata vähem kui optimaalset käitumist.

Regressiooni analüüs[muuda | redigeeri lähteteksti]

Regressiooni analüüs sisaldab erinevaid tehnikaid ja meetodeid, et modelleerida muutujate vahelisi seoseid. Kasutatakse lineaarregressiooni ja polünomiaalset regressiooni.

Rakendusvalkdonnad[muuda | redigeeri lähteteksti]

Masinõpe on kasutusel alljärgnevates valdkondades[5]:

Tarkvara[muuda | redigeeri lähteteksti]

RapidMiner, KNIME, Weka, ODM, Shogun Toolbox, Orange, Apache Mahout, scikit-learn ja SVM-Light on näiteid masinõppe tarkvaraplatvormidest.

Internetis on võimalus masinõpet õppida Andrew Ng võrgupõhises kursusel ml-class.org, mis põhineb Stanfordi ülikool kursusel, mille loengumaterjalid on saadaval tasuta. Kursusel kasutatakse GNU Octave platvormi.

Ajakirjad ja konverentsid[muuda | redigeeri lähteteksti]

  • Machine Learning (ajakiri)
  • Journal of Machine Learning Research (ajakiri)
  • Neural Computation (ajakiri)
  • Journal of Intelligent Systems (ajakiri)
  • International Conference on Machine Learning ehk ICML (konverents)
  • Neural Information Processing Systems ehk NIPS (konverents)

Vaata ka[muuda | redigeeri lähteteksti]

Viited[muuda | redigeeri lähteteksti]

  1. Raimond J. Mooney, CS 391L: Machine learning introduction
  2. Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
  3. Christopher M. Bishop (2006) Pattern Recognition and Machine Learning, Springer ISBN 0-387-31073-8.
  4. Walker, M. (2001). Introduction to Genetic Programming
  5. Mitchell, T. (2006). The Discipline of Machine Learning

Edasist lugemist[muuda | redigeeri lähteteksti]

Välislingid[muuda | redigeeri lähteteksti]