Pertseptron

Masinõppes on pertseptron binaarsete klassifitseerijate juhendatud õppimise algoritm. Binaarne klassifitseerija on funktsioon, mis otsustab, kas sisend, mis koosneb numbmbrite vektorist, kuulub kindlasse klassi. Pertseptron on lineaarne klassifitseerija ehk klassifitseerimis algoritm mis teeb ennustuse, kasutades lineaarset ennustusfunktsiooni, mis kombineerib tunnuste vektori ja kaalude hulga.^[1]

Ajalugu[muuda | muuda lähteteksti]

Pertseptron algoritmi leiutas Frank Rosenblatt, aastal 1958 Cornell Aeronautical Laboratorys^[2]. Projekti rahastas USA Office of Naval Research.^[3]

Algselt implementeeriti pertseptron tarkvarana IBM 704 arvuti jaoks, seejärel toodeti eraldi riistvara nimega “Mark 1 Perceptron”, mille ülesandeks oli pildi tuvastus. Masin koosnes 400 fotoelemendi reastusest, mille külge ühendati neuronid. Kaalud kodeeriti potentsiomeetritesse ja elektrimootorid muutsid kaalude väärtuseid õppeprotsessi käigus.^[4]

1958. aastal peetud pressikonverentsil tegi Rosenblatt avaldusi pertseptroni kohta, mis põhjustas vaidluseid noores tehisintellekti valdkonnas. Väidetavalt pidi pertseptron olema esimene samm elektroonilise arvutini, mis USA mereväe ootuste kohaselt oleks ühel päeval võimeline kõndima, rääkima, nägema, kirjutama, ennast paljundama ja enda olemasolust teadlik olema.^[3]

Kuigi algselt peeti pertseptronit paljulubavaks, avastati kiirelt, et pertseptronit ei saa õpetada mitmeid klasse ära tundma. Mis omakorda põhjustas tehisnärvivõrkude valdkonnas stagneerumist, kuni avastati, et mitmetasandilised otsesuunatud tehisnärvivõrgud ehk mitmetasandilised pertseptronid on võimsamad kui ühetasandilised pertseptronid.

1969. aastal Marvin Minsky ja Seymour Paperti raamatus “Perceptrons” tõestati, et ühetasandilistel pertseptronil on võimatu õppida välistav või funktsiooni. Sellest tulenes valearusaam, et mitmetasandilistel pertseptronidel on sama viga, mis põhjustas tehisnärvivõrkude uurimise rahastamise probleeme järgnevaks kümneks aastaks.

Pertseptron on bioloogilise neuroni lihtsustatud mudel. Uuringud näitavad, et pertseptroni laadne lineaarne mudel on võimeline osaliselt jäljendama päris neuronite käitumist.^[5]

Definitsioon[muuda | muuda lähteteksti]

Pertseptron on tänapäevases mõistes binaarse klassifitseerija ehk lävendfunktsiooni õppimise algoritm. Lävendfunktsioon on funktsioon, mis seab vastavusse sisendi x, mis on reaalarvude vektor ja väljundi f(x), mis on üks binaarne väärtus.^[6]

$f(x)={\begin{cases}1&{\text{if }}w\cdot x+b>0,\\0\end{cases}}$

kus w on reaalarvuliste kaalude vektor, w * x on skalaarkorrutis, $\sum _{i=1}^{m}w_{i}x_{i}$ , kus m on sisendite arv ja b on nihe. Nihe liigutab otsustus piiri algpunktist eemale ja ei sõltu sisenditest.

f(x) väärtust kasutatakse, et klassifitseerida x positiivseks või negatiivseks juhuks. Binaarse klassifitsserimise probleemis, kui b on negatiivne, siis kaalutud sisendite kombinatsioon peab andma suurema väärtuse kui |b|, et lükata klassifitseeriv neuron üle 0 lävendi. Ruumiliselt mõjutab nihe otsustus piiri asukohta, aga mitte suunda. Pertseptron algoritm ei lõpeta oma tööd kui sisend hulk ei ole lineaarselt eraldatav. Kui vektorid ei ole lineaarselt eraldatavad, siis ei jõuta kunagi punkti, kus kõik vektorid on lõplikult klassifitseeritud. Kõige kuulsam näide sellest on välistav või probleem.^[6]

Viited[muuda | muuda lähteteksti]

↑ Yoav Freund, Robert E. Schapire (detsember 1999). "Large Margin Classification Using the Perceptron Algorithm" (PDF). Vaadatud 28.01.2020.
↑ Frank Rosenblatt (jaanuar 1957). "The Perceptron a perceiving and recognizing automaton" (PDF). Cornell Aeronautical Laboratory. Originaali (PDF) arhiivikoopia seisuga 7.04.2023. Vaadatud 28.01.2020.
↑ ^3,0 ^3,1 Mikel Olazaran A Sociological Study of the Official History of the Perceptrons Controversy (1996) Social Studies of Science
↑ Christopher M. Bishop (2006). "Pattern Recognition and Machine Learning" (PDF). Springer. Vaadatud 28.01.2020.
↑ M. A. Aizerman, E. M Braverman, L. I. Rozonoer. Theoretical foundations of the potential function method in pattern recognition learning (1964) Automation and Remote Control
↑ ^6,0 ^6,1 D.-R. Liou, J.-W. Liou, C.-Y. Liou. Learning Behaviors of Perceptron (2013) iConcept Press.

[1] Yoav Freund, Robert E. Schapire (detsember 1999). "Large Margin Classification Using the Perceptron Algorithm" (PDF). Vaadatud 28.01.2020.

[2] Frank Rosenblatt (jaanuar 1957). "The Perceptron a perceiving and recognizing automaton" (PDF). Cornell Aeronautical Laboratory. Originaali (PDF) arhiivikoopia seisuga 7.04.2023. Vaadatud 28.01.2020.

[:0-3] 3,0 ^3,1 Mikel Olazaran A Sociological Study of the Official History of the Perceptrons Controversy (1996) Social Studies of Science

[4] Christopher M. Bishop (2006). "Pattern Recognition and Machine Learning" (PDF). Springer. Vaadatud 28.01.2020.

[5] M. A. Aizerman, E. M Braverman, L. I. Rozonoer. Theoretical foundations of the potential function method in pattern recognition learning (1964) Automation and Remote Control

[:1-6] 6,0 ^6,1 D.-R. Liou, J.-W. Liou, C.-Y. Liou. Learning Behaviors of Perceptron (2013) iConcept Press.

[1]

[2]

[3]

[4]

[5]

[6]