Ääretuvastus

Allikas: Vikipeedia

Ääretuvastus (ehk servatuvastus) on matemaatiliste meetodite kogum, mille eesmärk on tuvastada digitaalsel kujutisel punkte, kus kujutise heledus muutub järsult. Need punktid on tavaliselt koondatud kõverjoontena segmentidesse, mida nimetatakse äärteks. Sarnast probleemi pidevusetuse leidmisel ühemõõtmelistes signaalides tuntakse astmetuvastusena ning signaali pidevusetuse ajas uurimist muutuse tuvastamisena. Ääretuvastus on peamine tööriist pilditöötluses ning masin- ja raalnägemises, eriti nendel aladel, mis on seotud omaduste tuvastamise ja eraldamisega.

Eesmärgid[muuda | muuda lähteteksti]

Näidis Canny ääretuvastuse algoritmi tulemusest

Kujutise heleduses esinevate järskude muutuste tuvastamise eesmärk on tabada olulisi momente ja muutusi kujutatava maailma omadustes. Muutused kujutise heleduses viitavad enamasti järgnevale:[1][2]

  • muutused sügavuses,
  • muutused pinna orienteerituses,
  • muutused materjali omadustes
  • erinevused kaadri valgustatuses.

Ideaaljuhul on kujutisele ääretuvastuse rakendamise tulemuseks kogum ühendatud kõveraid, mis kajastavad objektide piirjooni ning muutusi pindade suunas. Seega võib ääretuvastuse algoritmi rakendamine märkimisväärselt vähendada töödeldava info hulka ning sõeluda välja vähemolulist infot, säilitades samas kujutise olulised struktuursed omadused. Kui ääretuvastuse etapp on edukas, muudab see järgneva kujutise info interpreteerimise tunduvalt lihtsamaks. Siiski ei ole alati võimalik keskmise keerukusega päriselu kujutavate piltide puhul sellist ideaalolukorda saavutada.

Keerukamate kujutiste puhul on eraldatavad ääred sageli killustatud, mis tähendab, et äärekõverad ei ole omavahel ühendatud, mistõttu on äärte info puudulik ning esile võivad olla tõstetud valed ääred. See raskendab tuntavalt kujutise edasist tõlgendamist.[3]

Ääretuvastus on üks olulisemaid etappe pilditöötluses, kujutiste analüüsimisel ja mustrite tuvastamisel ning raalnägemise tehnoloogiates.

Ääre omadused[muuda | muuda lähteteksti]

Kolmedimensioonilise pildi kahedimensioonilisest kujutisest eraldatud ääri võib jagada vaatepunktist sõltuvateks ja sõltumatuteks. Vaatepunktist sõltumatu äär kajastab enamasti kolmedimensioonilise objekti loomupäraseid omadusi, näiteks pinna kuju. Vaatepunktist sõltuv äär võib muutuda vastavalt vaatepunkti muutumisele ning kajastab enamasti pildi geomeetriat, näiteks objektide suhestumist teineteisega.

Tüüpiline äär võib olla näiteks piir punast värvi kogumi ja kollast värvi kogumi vahel. Joon seevastu võib olla aga väikesearvuline eri värvi pikslite kogum üldiselt muutumatul taustal. Seega võib kummalgi pool joont esineda üks äär.[4]

Lihtsustatud ääre mudel[muuda | muuda lähteteksti]

Ajalooliselt on mitmed koolkonnad tegelenud n-ö ideaalsete, üheastmelise reljeefiga äärte tuvastamise uurimisega. Praktilises kasutuses ei ole säärase reljeefiga ääred levinud, kuna nii sisendandmed kui ka uuritavad esemed ise ei ole ideaalsed. Sisendandmed võivad olla ebatäpsed mitmel põhjusel:

  • ebatäiusliku läätse fookuskaugusest tulenev hägusus
  • ebaideaalsete valgusallikate loodud hägused varjud ja valgustus
  • kumera kujuga esemetele iseloomulik sujuva varjutatud ala teke
  • sensorite ja muude sisendandmeid koguvate vahendite ebatäpsusest tulenev müra

Mitmed uurijad on antud ebatäpsuste mõju vähendamiseks kasutanud Gaussi kõverana modelleeritud ääre reljeefi, kuna katsed on tõestanud, et antud mudel vastab päris maailmale paremini kui varem uuritud ideaalse Heaviside’i astmefunktsiooni sarnane mudel.[3][5] Gaussi kõvera baasil konstrueeritud mudelis võib vaadelda ühemõõtmelises pildis  abstsissil asuvat üksikut äärt kui:

Sealjuures Gaussi kõvera parameeter  peaks ideaalsetel oludel vastama keskmisele ääre hägususele, vältimaks täiendava ebatäpsuse teket, ent reaalselt pole tihti antud muutuja täpsus väga oluline, kuna tekkiv viga on marginaalne.

Ääretuvastuse keerulisus[muuda | muuda lähteteksti]

Selleks, et illustreerida ääretuvastuse keerukust, võib vaadelda äärte tuvastamist järgnevas ühedimensioonilises signaalis. Siinkohal võib vaistlikult öelda, et äär peaks paiknema 4. ja 5. piksli vahel.

5 7 6 4 152 148 149

Kui intensiivsuse erinevused 4. ja 5. piksli vahel oleks väiksemad ning erinevused nendega külgnevate pikslite vahel oleks suuremad, ei oleks samavõrd lihtne järeldada, et äär peaks asuma vastavas regioonis. Pealegi võib antud olukorras väita, et esineb mitmeid ääri.

5 7 6 41 113 148 149

Seega ei ole alati lihtne määrata kindlat lävendit kahe kõrvutioleva piksli erinevuseks, mis võimaldaks tuvastada ääre olemasolu.[3] See on kahtlemata üks põhjustest, mis muudab ääretuvastuse protsessi keerukaks, välja arvatud juhul, kui objektid pildil on väga lihtsad ning valgustatuse tingimused kergesti kontrollitavad (näiteks nagu ülaltoodud tüdrukut kujutaval pildil eraldatud ääred).

Lähenemisviisid[muuda | muuda lähteteksti]

Ääretuvastuseks kasutatakse mitmeid erinevaid meetodeid, millest enamik jagunevad kahte kategooriasse: otsingupõhised ning nullkohapõhised meetodid. Otsingupõhised meetodid tuvastavad ääri, arvutades sisendi tuletise ning otsides seejärel lokaalseid maksimume, määrates nii üheselt ära nii ääre asukoha kui ka ääre reljeefi suuna. Nullkohapõhised meetodid kasutavad sisendi teist järku tuletisega seotud valemeid, otsides seejärel tulemist nulliga ristumise kohti. Tavaliselt on nullkohapõhiste meetodite keskseks valemiks Laplace’i operaator või mõni muu sarnane diferentsiaalvõrrand. Enne ääretuvastuse algoritmi kasutamist rakendatakse sisendile peaaegu eranditult mõnd hägustamisfiltrit, vähendamaks mürast tingitud ebatäpsuste mõju väljundile. Üldlevinud lahendustes on kasutusel arvutuslikult odav Gaussi filter.[2]

Viimastel kümnenditel levinumad ääre tuvastamise meetodid erinevadki suuremalt jaolt erinevate ühtlustavate filtrite parameetrite ning tuletiste ja reljeefide määratlemise mooduste poolest. Ääre suuna tuvastus on tihti ääre asukoha määramisega samaväärselt tähtis ning suuna määramise meetodite erinevused tulenevad suuresti eelnevalt kirjeldatud erinevustest.[4][6]

Canny ääretuvastus[muuda | muuda lähteteksti]

John Canny lähenes ääretuvastusele kui rangelt parametriseeritavale matemaatilisele probleemile, seades lahenduse edukuse mõõtmiseks kolm kriteeriumi:[7] 

  • ääre leidmine, st iga sisendis esinev äär tuleb edukalt tuvastada,
  • ääre asetus, st iga leitud äär peab asetsema oma õigel kohal,
  • ääre unikaalsus, st igale sisendis esinevale äärele peab väljundis vastama üks äär, mitte rohkem.

Canny tõestas, et matemaatiliselt vastab antud kriteeriumitele kõige paremini neljanda astme eksponentsiaalvõrrand, kuid väga hea lähenduse saab ka kasutades Gaussi filtrite esimesi tuletisi, mida on oluliselt lihtsam arvutada. Canny tõi kasutusele ka tänapäeval üldlevinud madalate väärtuste summutamise meetodi: ääre tuvastamisel leitakse lokaalsed maksimumid, mis ühtivad viimati leitud maksimumi suunaga, sealjuures kõrvalised väärtused loetakse nulliks. Canny ääretuvastuse algoritmi lõplikus variandis kasutatakse kahte künnist: kõrgem künnis, mis määrab üksiku ääre tuvastamiseks vajaliku taseme, ja madalam künnis, mis määrab eelneva äärega ühendatud ääre tuvastamiseks vajaliku taseme. Antud lähenemine võimaldab oluliselt vähendada müra mõju väljundile, samas tagades, et iga edukalt leitud äär märgitakse väljundis maksimumväärtusega.

Tänu arvutuslikule odavusele ja väga suurele täpsusele on Canny ääretuvastuse algoritm tänapäeval levinuim üldkasutatav ääretuvastuse algoritm.[8]

Ääre õhendamine[muuda | muuda lähteteksti]

Ääre õhendamiseks nimetatakse tehnikat, mille käigus eemaldatakse kujutise äärest soovimatud ja/või valeinfot sisaldavad punktid. Seda tehnikat kasutatakse pärast seda, kui kujutist on esmalt filtreeritud müra suhtes, seejärel teostatud ääre tuvastamine ning kui ääred on sobiva künnisega tasandatud. Õhendamine aitab kõrvaldada kõik ebavajalikud punktid ning eduka õhendamise tulemuseks on ühe piksli laiused ääreelemendid.

Õhendatud äärtel on mitmeid eeliseid:[9]

  • Õhukesed, selged ääred annavad paremaid tulemusi objektide tuvastamisel.
  • Kui joonte või teiste geomeetriliste kujundite tuvastamiseks kasutatakse Hough’ operaatorit, annavad õhendatud ääred palju paremaid tulemusi.
  • Kui äär on ühtlasi ka mingi ala piirjooneks, võimaldab ääre õhendamine anda kujutisele kergesti ja ilma suurema matemaatikata selliseid parameetreid nagu näiteks ümbermõõt.

Viited[muuda | muuda lähteteksti]

  1. H.G. Barrow and J.M. Tenenbaum (1981) "Interpreting line drawings as three-dimensional surfaces", Artificial Intelligence, vol 17, issues 1–3, pages 75–116.
  2. 2,0 2,1 Lindeberg, Tony (2001), "Edge detection", in Hazewinkel, Michiel, Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4
  3. 3,0 3,1 3,2 T. Lindeberg (1998) "Edge detection and ridge detection with automatic scale selection", International Journal of Computer Vision, 30, 2, pages 117–154.
  4. 4,0 4,1 D. Ziou and S. Tabbone (1998) "Edge detection techniques: An overview", International Journal of Pattern Recognition and Image Analysis, 8(4):537–559, 1998
  5. W. Zhang and F. Bergholm (1997) "Multi-scale blur estimation and edge type classification for scene analysis", International Journal of Computer Vision, vol 24, issue 3, Pages: 219–250.
  6. J. M. Park and Y. Lu (2008) "Edge detection in grayscale, color, and range images", in B. W. Wah (editor) Encyclopedia of Computer Science and Engineering, doi 10.1002/9780470050118.ecse603
  7. J. Canny (1986) "A computational approach to edge detection", IEEE Trans.
  8. Shapiro L.G. & Stockman G.C. (2001) Computer Vision.
  9. M. A. Oskoei and H. Hu (2010) "A Survey on Edge Detection Methods", Technical Report CES-506, ISSN 1774–8050

Välislingid[muuda | muuda lähteteksti]