Anomaaliate tuvastamine

Allikas: Vikipeedia

Anomaaliad on väärtused, mis erinevad olulisel määral andmete üldisest dünaamikast. Anomaaliade tuvastamine on protsess, mille käigus analüüsitakse andmeid, et tuvastada andmepunkte, mis ei vasta oodatava käitumismustrile.[1]

Kuidas see töötab?[muuda | muuda lähteteksti]

Küberturvalisuses kasutatakse anomaalia tuvastamist ootamatute muudatuste tuvastamiseks andmetes. See süsteem töötab, õppides ära, milline on normaalne andmemuster, ja seejärel võrreldes uusi andmeid sellega. Kui süsteem leiab andmepunkti, mis erineb normaalsest mustrist, teavitab see sellest administraatorit. Administraator saab seejärel otsustada, kas tegu on tõsise probleemiga või mitte.

Anomaalia tuvastamine on oluline küberturvalisuse vahend, sest see aitab tuvastada võimalikke rünnakuid ja muid probleeme. See võib aidata ära hoida turvaintsidente ja kiirendada turvaohtude tuvastamist.[2]

Kus kasutatakse?[muuda | muuda lähteteksti]

Anomaaliate tuvastamine aktiivselt kasutatakse ärinduses. Seda tehakse selleks, et tuvastada ja lahendada tõrkeid. Tarkvarasüsteemid võivad sisaldada palju erinevaid komponente ja olla keerulised. Tõrked võivad tekkida erinevatel põhjustel, näiteks füüsiliste seadmete riketest, võrguühenduste katkestustest või kasutajate kasutusmustrite muutustest. Anomaaliate tuvastamine aitab tuvastada need tõrked kiiresti ja tõhusalt, et vähendada äritegevuse häirimist. See protsess aitab ka tuvastada ja ennetada küberrünnakuid. Küberrünnakud on üha enam levinud ja võivad tekitada suurt kahju. Anomaaliate tuvastamine aitab tuvastada rünnakuid juba nende varases staadiumis, et vähendada nende mõju. Anomaaliate tuvastamine võib aidata tuvastada tõrkeid äriprotsessides, näiteks tarneahela juhtimises või klienditeeninduses. Nende tõrgete kiire tuvastamine ja lahendamine võib aidata parandada äriprotsesside tõhusust ja vähendada kulusid.[3]

Meditsiinitööstus toimub olulist muutust, mida põhjustavad kiiret arengut masinõppe ja tehisintellekti tehnoloogiates. Neid tööriistu kasutatakse mitmesuguste tervishoiuaspektide muutmiseks, alates meditsiinilisest diagnoosist ja raviplaanimisest kuni patsiendi jälgimise ja haldusülesannete täitmiseni. Üks masinõppe kõige lootustandvamaid rakendusi tervishoius on meditsiiniliste vigade tuvastamine ja ennetamine.

Arvutid muutuvad targemaks ja neid kasutatakse arstide abistamisel vigade tuvastamisel. Need masinad saavad vaadata suuri koguseid patsiendiandmeid, näiteks meditsiinilisi andmeid, testitulemusi ja röntgenülesvõtteid, et leida mustreid, mis võivad viidata veale. Näiteks võib masin märgata, et patsiendile antakse ravimit, mille suhtes ta on allergiline.

Neid masinaid saab kasutada ka vigade tuvastamiseks enne nende toimumist. Näiteks võib masin hoiatada arsti, kui ta on kohe ette kirjutamas ravimit, mis võib suhelda teise ravimiga, mida patsient juba kasutab. See võib aidata vältida tõsiseid raskusi tervisega.

Masinõppe kasutamine tervishoius on kõik veel ei ole arenenud ideaalselt, kuid potentsiaalsed eelised on hästi nähtavad. Need tehnoloogiad võivad aidata tervishoidu ohutumaks ja tõhusamaks muuta, aidates ära hoida meditsiinilisi vigu.[4]

Anomalia tuvastamine on pankade jaoks oluline tööriist küberturvalisuse tugevdamiseks ja nende andmete ning varade kaitsmiseks. See kasutab masinõpet finantsandmete analüüsimiseks ja ebatavaliste mustrite tuvastamiseks, mis võivad viidata ohtudele, näiteks pettusele või loata juurdepääsule.

Pangad kasutavad anomalia tuvastamist mitmel eesmärgil, sealhulgas:

  • Petiseduvastamine (anomalia tuvastamise süsteemid jälgivad tehingu mustreid, et tuvastada kahtlasi tegevusi, näiteks suuri või ebatavalisi tehinguid, ebajärjekindlaid kulutusharjumusi või tehinguid, mis pärinevad tundmatutelt asukohtadelt).
  • Riskijuhtimine (anomalia tuvastamise mudelid analüüsivad krediidiandmeid, et tuvastada potentsiaalseid krediidiriske ja teavitada laenuandmise otsustamisest).
  • Operatiivtõhusus ( IT-järelevalve aitab tuvastada potentsiaalseid turvaauke, süsteemi rikkeid või jõudluse kitsaskohti.
  • Klienditeenindus: Anomalia tuvastamise süsteemid võivad tuvastada ebatavalist kliendikäitumist, näiteks järsku muutust kulutusharjumustes või tehinguid ebatüüpilistes asukohtades, ja käivitada proaktiivse teavitamise, et pakkuda abi või ära hoida potentsiaalset pettuse). [5]

Probleemid[muuda | muuda lähteteksti]

Üks väljakutse on see, et anomaaliate väljanägemine võib sarnane olla uue või haruldase andmeklassi omaga. See võib viia valepositiivsete tulemusteni, kus anomaalid on valesti identifitseeritud normaalse andmena.[6]

Andmete kvaliteet, täpsemalt baasandmekogumi kvaliteet, on täpse ja kasutatava mudeli loomisel kõige olulisem tegur.Anomaaliade tuvastamise mudelitel on vaja puhast ja täpset andmeid, et korralikult töötada. Kui andmed on määrdunud, puudulikud või ebajärjekindlad, võib see põhjustada valepositiivseid või negatiivseid tulemusi. Nende probleemide vältimiseks peaksite andmeid puhastama, skaalastama, valideerima ja dokumenteerima. Andmete kvaliteeti saab parandada järgmiste näpunäidete abil:

Eemalda või täida nullväärtused.Kui andmetes on nullväärtusi, saad need eemaldada või asendada. Nullväärtuste asendamine võib toimuda eeldatava väärtuse või mediaanväärtusega. Standardiseeri kõik andmete formaadid enne oma mudeli sobitamist. Enne andmete kasutamist mudeli koolitamiseks veendu, et kõik andmed oleksid samas formaadis. See aitab mudelil andmeid paremini mõista. Tuleb eemaldada duplikaadid enne mudeli koolitamist. Andmete duplikaadid võivad põhjustada analüüsi tulemuste moonutamist. Andmete eeltöötlemine võib aidata parandada nende kvaliteeti ja muuta need sobivaks mudeli koolitamiseks. On vaja vähendada sõltuvust inimeste poolt sisestatud andmetest. Inimeste poolt sisestatud andmed võivad olla vigadega. Vajadusel kasuta automaatseid andmeallikaid, et vähendada sõltuvust inimeste poolt sisestatud andmetest.

Kui algoritmil ei ole piisavalt andmeid, millest õppida, ei saa ta luua head pilti sellest, mis on tavaline. See võib viia olukorrani, kus algoritm märgib ebaharilikud andmepunktid tavalisteks, mis muudab selle üldiselt vähem täpseks. On samuti oluline omada andmeid eri aastaaegadel, et arvesse võtta hooajalisi muutusi. Näiteks võib klientide liiklus olla pühade ajal suurem, seega peab mudel nägema andmeid mitme aasta jooksul, et mõista tavapärast mustrit.

Kui koolitada mudelit valeandmete tuvastamiseks, on oluline kasutada piisavalt halbu andmeid. Kui halbu andmeid ei ole piisavalt, on oht, et mudel ei suuda õppida, kuidas valeandmeid tõhusalt tuvastada. Selle probleemi lahendamiseks võid koguda rohkem halbu andmeid. See on oluline, sest anomaaliate tuvastamise eesmärk on tuvastada ebatavalisi andmeid, mis võivad olla probleemi märgiks.[7]

Viited[muuda | muuda lähteteksti]

  1. Lawton, George (august 2023). "Anomaly detection". TechTarget. Vaadatud 5. detsembril 2023.
  2. Brown, Schuyler (5. oktoober 2023). "What Is Anomaly Detection? Methods, Examples, and More". Strongdm. Vaadatud 5. detsembril 2023.
  3. Samreen Mahak, Hassan (2019). "Anomaaliate tuvastamiseks sügav õpe kasutavate äriliste intsidentide klassifitseerimine ja prognoosimine". Tartu Ülikool. Vaadatud 5. detsembril 2023.
  4. Fernando, Tharindu; Gammulle, Harshala; Denman, Simon; Sridharan, Sridha; Fookes, Clinton (13. aprill 2021). "Deep Learning for Medical Anomaly Detection - A Survey" (PDF). Vaadatud 5. detsembril 2023.
  5. Vanini, Paolo; Rossi, Sebastiano; Zvizdic, Ermin; Domenig, Thomas (13. märts 2023). "Online payment fraud: from anomaly detection to risk management". SpringerOpen. Vaadatud 5. detsembril 2023.
  6. Celvikalp, Hakan; Uzun, Bedirhan; Salk, Yusuf; Saribas, Hasan; Köpüklü, Okan (juuni 2023). "From anomaly detection to open set recognition: Bridging the gap". Sciencedirect. Vaadatud 6. detsembril 2023.
  7. Watts, Stephen (12. juuli 2022). "Common Anomaly Detection Challenges & How To Solve Them". Splunk.ee. Vaadatud 6. detsembril 2023.