DeepDream

Allikas: Vikipeedia
Jump to navigation Jump to search

Deepdream on Google’i inseneri Alexander Mordvintsevi loodud arvutinägemise programm, mis kasutab konvolutsioonilist võrku algoritmilise pareidoolia abil pildimaterjalist mustrite leidmiseks ja võimendamiseks, luues seeläbi tahtlikult ületöödeldud piltides unenäolaadse hallutsinogeense väljanägemise.[1][2][3]

Google-i programm levitas väljendit (süva)unenägude nägemine, et viidata piltide genereerimisele, mis annavad treenitud süvavõrgus soovitud väljundi. Terminit kasutatakse ka laiemalt seotud lähenemiste kogumile viitamiseks.

Protsess[muuda | muuda lähteteksti]

Hilises staadiumis olev DeepDreamiga töödeldud pilt kolmest mehest basseinis

DeepDream-i tarkvara pärineb süvakonvolutsioonilisest võrgust koodnimega “Inception” (samanimelise filmi järgi)[1][2][3] . Tarkvara arendati ImageNet Large-Scale Visual Recognition Challenge'i (ILSVRC) jaoks aastal 2014[3] ja avaldati 2015 aasta juulis.

Tarkvara on kavandatud nägude ja muude mustrite tuvastamiseks piltidel, eesmärgiga pilte automaatselt klassifitseerida.[4] Treenitud võrku saab jooksutada ka tagurpidi, paludes võrgul muuta originaalpilti, et mingil väljundneuronil (näiteks nägudel või kindlatel loomadel) oleks kõrgem kvaliteedimäär. Seda saab kasutada areneva närvivõrgu struktuuri visualiseerimiseks, mis on ka DeepDream-i mõiste aluseks. Peale piisavalt kordusi leitakse detaile ka piltidelt, millel neid algselt ei esinenud. Seeläbi tekib pareidoolia vorm, mille läbi psühhedeelseid ja sürreaalistlikke pilte luuakse algoritmiliselt. Optimeerimine sarnaneb tagasilevile, kuid selle asemel, et kohandada võrgukaalusid, hoitakse kaalusid muutumatuna ning muudetakse sisendit.

Näiteks saab olemasolevat pilti muuta nii, et sellel kujutatu oleks kassilaadsem ning tagastatud muudetud pilti saab uuesti protseduurile sisendiks anda.[2] See kasutus sarnaneb pilvedest loomade või teiste mustrite otsimisele.

Gradientlaskumise iseseisval rakendamisel igale sisendi pikslile tekib pilt, milles kõrvutiolevatel pikslitel ei ole üksteisega palju ühist ning seega on pildil liiga palju kõrge sagedusega informatsiooni. Genereeritud pilte saab parandada, lisades regulariseerija, mis eelistab sisendeid, millel on loomuliku pildi statistika (omamata eelistust mingi kindla pildi suhtes) või on lihtsalt sujuvad.[5][6][7] Näiteks, Mahendran jt[6] kasutasid totaalse variatsiooni regulariseerijat, mis eelistab pilte, mis on tükkhaaval konstantsed. Sügavam visuaalne uurimine funktsiooni visualisatsiooni ja regularisatsiooni tehnikate kohta avaldati hiljem.[8]

Ajalugu[muuda | muuda lähteteksti]

Unenägude nägemise idee ja nimi said internetis populaarseks aastal 2015 tänu Google-i DeepDream programmile. Idee pärineb närvivõrkude ajaloo varastest aegadest[9] ning sarnaseid meetodeid on kasutatud visuaalsete tekstuuride sünteesiks.[10] Sarnaseid visualiseerimise ideid arendati (enne Google-i tööd) mitmetes uurimusgruppides[11][5]

Peale seda, kui Google oma avalikustas oma tehnikad ja lähtekoodi,[12] on ilmunud turule mitmeid tööriistu veebiteenuste, mobiili rakenduste ja lauaarvuti tarkvara näol, mis lubab kasutajatel oma pilte muundada.[13]

Kasutus[muuda | muuda lähteteksti]

LSD mõju all joonistatud inimnägu

Unenägude nägemise ideed saab rakendada peidetud (sisemistele) neuronitele, mis ei ole väljundi osaks. See lubab omakorda uurida eri võrgu osade rolle ja esindusi.[7] Ühtlasi on võimalik sisendit optimeerida, et rahuldada kas üksikut neuronit (sellist kasutust kutsutakse ka tegevuse maksimeerimiseks)[14] või tervet neuronite kihti.

Kuigi unenägude nägemist kasutatakse enamasti võrkude visualiseerimiseks või arvutikunsti tootmiseks, on hiljuti välja pakutud, et unenäoliste sisendite lisamine treeningkomplekti võib parandada treeningu aegu abstraktsiooni jaoks arvutiteaduses.[15]

DeepDreami mudelil on leidnud kasutust kunstiajaloo valdkonnas.[16]

Pildimaterjali tsiteeritud sarnasus LSD ja psilotsübiini esile kutsutud hallutsinatsioonidega viitab funktsionaalsele sarnasusele tehislike närvivõrkude ja kindlate visuaalsete ajukoorekihtide vahel.[17]

DeepDream-i kasutati Foster the People-i muusikavideos laulule “Doing It for the Money”.[18]

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (2015). "DeepDream - a code example for visualizing Neural Networks". Google Research. Vaadatud 27-11-2018. 
  2. 2,0 2,1 2,2 Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (2015). "Inceptionism: Going Deeper into Neural Networks". Google Research. Vaadatud 27-11-2018. 
  3. 3,0 3,1 3,2 Szegedy, Christian; Liu, Wei; Jia, Yangqing; Sermanet, Pierre; Reed, Scott; Anguelov, Dragomir; Erhan, Dumitru; Vanhoucke, Vincent et al. (2014). "Going Deeper with Convolutions". Computing Research Repository. Bibcode:2014arXiv1409.4842S. arXiv:1409.4842. 
  4. Rich McCormick (7. juuli 2015). "Fear and Loathing in Las Vegas is terrifying through the eyes of a computer". The Verge. Vaadatud 27.11.2018. 
  5. 5,0 5,1 Simonyan, Karen; Vedaldi, Andrea; Zisserman, Andrew (2014). "Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps". International Conference on Learning Representations Workshop. 
  6. 6,0 6,1 Mahendran, Aravindh; Vedaldi, Andrea (2015). "Understanding Deep Image Representations by Inverting Them". IEEE Conference on Computer Vision and Pattern Recognition. arXiv:1412.0035. doi:10.1109/CVPR.2015.7299155. 
  7. 7,0 7,1 Yosinski, Jason; Clune, Jeff; Nguyen, Anh; Fuchs, Thomas (2015). 27-11-2018 "Understanding Neural Networks Through Deep Visualization". Deep Learning Workshop, International Conference on Machine Learning (ICML) Deep Learning Workshop. 
  8. Olah, Chris; Mordvintsev, Alexander; Schubert, Ludwig (7. november 2017). "Feature Visualization". Distill (en-US keeles) 2 (11). ISSN 2476-0757. doi:10.23915/distill.00007. Vaadatud 27-11-2018. 
  9. Lewis, J.P. (1988). "Creation by refinement: a creativity paradigm for gradient descent learning networks". IEEE International Conference on Neural Networks. doi:10.1109/ICNN.1988.23933. 
  10. Portilla, J; Simoncelli, Eero (2000). "A parametric texture model based on joint statistics of complex wavelet coefficients". International Journal of Computer Vision. doi:10.1023/A:1026553619983. 
  11. Erhan, Dumitru. (2009). "Visualizing Higher-Layer Features of a Deep Network". International Conference on Machine Learning Workshop on Learning Feature Hierarchies. Vaadatud 27-11-2018. 
  12. https://github.com/google/deepdream. 
  13. Daniel Culpan (3. juuli 2015). "These Google "Deep Dream" Images Are Weirdly Mesmerising". Wired. Vaadatud 27.11.2018. 
  14. Nguyen, Anh; Dosovitskiy, Alexey; Yosinski, Jason; Brox, Thomas (2016). "Synthesizing the preferred inputs for neurons in neural networks via deep generator networks". arxiv. Bibcode:2016arXiv160509304N. arXiv:1605.09304 . 
  15. Arora, Sanjeev; Liang, Yingyu; Tengyu, Ma (2016). "Why are deep nets reversible: A simple theory, with implications for training". arxiv. Bibcode:2015arXiv151105653A. arXiv:1511.05653 . 
  16. Spratt, Emily L. (2017). "Dream Formulations and Deep Neural Networks: Humanistic Themes in the Iconology of the Machine-Learned Image". Kunsttexte (Humboldt-Universität zu Berlin) 4. Vaadatud 27-11-2018. 
  17. LaFrance, Adrienne. "When Robots Hallucinate". The Atlantic. Vaadatud 27-11-2018. 
  18. Foster The People - Doing It for the Money, https://www.youtube.com/watch?v=dJ1VorN9Cl0 

Välislingid[muuda | muuda lähteteksti]