Hallutsineerimine
| See artikkel räägib tehisaru väärväidetest; teiste tähenduste kohta vaata lehekülge Hallutsinatsioon |
Artiklis ei ole piisavalt viiteid. |
See artikkel vajab täiendamist, et anda teemast piisavat ülevaadet. |
Hallutsinatsioon on tehisaru veenvalt sõnastatud väljund, mis ei paista olevat treeningandmetega põhjendatud ja mis võib olla väär.[1]
Selliseid nähtusi nimetatakse analoogia põhjal inimesel esinevate hallutsinatsioonidega juturobotite tekitatud tehisaru hallutsinatsioonidega. Oluline erinevus seisneb selles, et inimeste hallutsinatsioonid põhinevad enamasti vääradel aju andmetel, tehisaru hallutsinatsioon aga tekitab põhjendamatuid tulemusi teksti või pildi kujul. Google'i otsingumootori juht Prabhakar Raghavan nimetas juturobotite hallutsinatsioone veenvalt sõnastatud, kuid suures osas väljamõeldud tulemusteks.[2] Väljend "tehisaru hallutsinatsioon" võib arvuteid ebasobivalt isikustada.
Ent on ka tehisaru hallutsinatsioone, mida teadlased sihilikult kasutavad reaalsuse tundmatute variantide avastamiseks.[3] Näiteks rakendatakse generatiivset tehisaru ravimite väljatöötamisel, rakendades eritreeninguga tehisarumudeleid võimalike uute ravimina paljutõotavate molekulide ennustamiseks olemasolevate tõhusate molekulide põhjal. Ennustatud molekulide tõhusust testitakse laboris ning nii positiivsed kui ka negatiivsed tulemused söödetakse uuesti tehisarumudelisse.[4] Need tehisaru teaduslikud kasutamisviisid ei põhine mitte juturobotite või internetiandmete meelevaldsetel keelekonstruktsioonidel, vaid teaduslikult kinnitatud teadmistel.[3] [5]
Esinemine
[muuda | muuda lähteteksti]Tehisaru hallutsinatsioonid said aktuaalseks 2022. aasta paiku rööbiti teatud suurte keelemudelite, näiteks ChatGPT kasutuselevõtuga.[6] Kasutajad kaebasid, et sellised juturobotid põimivad genereeritavasse sisusse sageli mõttetult usutavana kõlavaid juhuslikke valesid. Näiteks kui ChatGPT-l paluti koostada artikkel ühe konkreetse ettevõtte viimase finantskvartali kohta, lõi vestlusrobot sidusa artikli, kuid mõtles seal esitatud finantsnumbrid välja. Kui küsiti astrofüüsikaliste magnetväljade kohta, väitis ChatGPT ekslikult, et mustade aukude magnetväljad tekivad nende lähedal olevate äärmiselt tugevate gravitatsioonijõudude tõttu.[7] Tegelikult puudub mustal augul juustetuse teoreemi tõttu magnetväli.[8] Analüütikud peavad sagedasi hallutsinatsioone suurte keelemudelite tehnoloogia suureks probleemiks.[9]
Põhjused
[muuda | muuda lähteteksti]Teadlased on nimetanud hallutsinatsioone statistiliseks nähtuseks või seostanud neid ebapiisavate treeningandmetega. Et suurtel keelemudelitel ei ole täielikku teadmist maailma kohta, siis puuduv teadmine interpoleeritakse või konfabuleeritakse[10] See keelemudelite omadus võimaldab vastata päringutele loovalt, mitte ainult olemasolevale teadmisele tuginedes. Kuid see viib ka selleni, et kasutaja päringule, millel on olemas objektiivselt õige vastus, mida mudel ei tea, antakse vastus, mis võib tunduda õige, kuid ei vasta tegelikkusele.
Mõned asjatundjad usuvad, et tehisaru teatud väärad vastused, mida inimesed objektituvastuse puhul peavad hallutsinatsioonideks, võivad tegelikult olla treeningandmetega põhjendatud või tehisaru annab isegi õige vastuse, mida inimestest hindajad ei näe. Näiteks võib vaidlusalune pilt, mis inimesele paistab olevat tavaline koerapilt, tegelikult sisaldada tehisaru jaoks mustreid, mis autentsetes piltides esineks ainult kassi vaatlemise korral. See tähendaks, et tehisaru tunneb ära reaalsed visuaalsed mustrid, mida inimene ei suuda märgata. Kuid teised teadlased on need järeldused kahtluse alla seadnud. Näiteks on vastu väidetud, et mudelid võivad toetuda pealiskaudsele statistikale, mistõttu ei pruugi treening vaieldavate teemade korral olla reaalsetes olukordades piisavalt robustne.
On osutunud, et hallutsinatsioon on statistiliselt vältimatu kõrvalsaadus igasuguses generatiivses tehisarumudelis, mis on treenitud maksimeerima treeningtõenäosust, nagu näiteks GPT-4. Samuti võivad hallutsinatsioone põhjustada vead teksti ja representatsioonide vahelisel kodeerimisel ja dekodeerimisel. Tehisaru treenimine mitmekesiste vastuste genereerimiseks võib samuti viia hallutsinatsioonideni. Hallutsinatsioonid võivad tekkida ka siis, kui tehisaru treenitakse andmestikul, millele lisatakse kokkuvõtted, mis on küll faktiliselt õiged, kuid ei lähtu otseselt andmetest, mida need väidetavalt kokku võtavad. Suuremad andmestikud võivad tekitada nn parameetrilise teadmise (st õpitud süsteemiparameetrites fikseeritud teadmise) probleemi, mis viib hallutsinatsioonideni, kui süsteem kasutab oma fikseeritud teadmist liiga enesekindlalt.[11] Niisugustes süsteemides nagu GPT-4 genereerib tehisaru iga järgmise sõna eelmiste sõnade jada (sealhulgas sõnad, mis ta on sama dialoogi jooksul varem ise genereerinud) põhjal, mis võib viia hallutsinatsioonide kaskaadini.[12]
Viited
[muuda | muuda lähteteksti]- ↑ Craig S. Smith. AI Hallucinations Could Blunt ChatGPT’s Success, IEEE Spectrum, 24.3.2023.
- ↑ Google cautions against hallucinating chatbots, report says. Reuters, 11.2.2023. Vaadatud 24. september 2023 (inglise keeles)
- 1 2 William Broad: How Hallucinatory A.I. Helps Science Dream Up Big Breakthroughs, nytimes.com, 23.12.2024.
- ↑ [https://assets.roche.com/f/176343/x/e8591e7840/ar24d.pdf KI und maschinelles Lernen: Revolution in der Medikamentenentwicklung.] – Roche 2024. aasta tegevusaruanne, 2025, lk 155.
- ↑ KI und maschinelles Lernen: Revolution in der Medikamentenentwicklung. – Roche Geschäftsbericht 2024, 2025, lk 155.
- ↑ Christian J. Meier: Warum die KI so gerne lügt, sueddeutsche.de, 28.3.2023.
- ↑ Marc Zastrow. We Asked ChatGPT Your Questions About Astronomy. It Didn't Go so Well, discovermagazine.com, 29.12.2022.
- ↑ Marc Zastrow: We Asked ChatGPT Your Questions About Astronomy. It Didn't Go so Well. In: Discover Magazine. Kalmbach Publishing Co., 29. detsember 2022.
- ↑ Ziwie Ji jt. Survey of hallucination in natural language generation. – ACM Computing Surveys, 2023, 55 (12), lk 1–38.
- ↑ Beren Millidge. LLMs confabulate not hallucinate, 19.3.2023.
- ↑ Stephen Casper, Xander Davies jt. Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback, MIT / Harvard University, 27.7.2023.
- ↑ Muru Zhang jt. How language model hallucinations can snowball arXiv preprint arXiv:2305.13534, 2023.