Kalmani filter

Allikas: Vikipeedia

Kalmani filter on Rudolf Emil Kalmani loodud algoritm, mida kasutatakse kosmonautikas, merenavigatsioonis, aatomielektrijaamades, demograafilises modelleerimises ja mujal.

Inseneriteadustes on palju valdkondi, kus filtreerimine on eluliselt tähtis. Raadiosignaalid on tihti suure müratasemega (mingid segavad lained). Väga hea filtreerimise algoritm saab elimineerida selle müra, et saada kätte olulist ja vajalikku informatsiooni. Ka elektrienergia juures on tegemist filtreerimise protseduuriga. Paljudes maades nõutakse koduses majapidamises kasutatava elektrienergia voltide filtreerimist, et tagada kodus kasutatavate seadmete pikaealisus (näiteks arvutid, telerid, video- ja DVD-mängijad, jne).

Rudolf Emil Kalman arendas filtri välja aastatel 1960–1961, selle juured ulatuvad Gaussi teooriateni 1795. aastast.

Sissejuhatus[muuda | muuda lähteteksti]

Kalmani filter on lineaarne, ennustav ja korduv algoritm. Ta on võimeline optimaalselt ennustama reaal-ajas süsteemi seisundit. Kui eksisteerivad mittelineaarsused, siis tuleb mudel eelnevalt lineariseerida.

Korduvus Kalmani filtris tähendab seda, et see ei nõua eelnevate andmete salvestamist ja ümber arvutamist niipea, kui uus mõõtmine on tehtud. Kalmani filtri töös kasutatakse (Maybeck, 1979): (1) teadmisi süsteemi ja mõõtmiste dünaamikast; (2) statistilist iseloomustust süsteemi müra, mõõtmiste vigade ning dünaamilistes mudelites oleva ebakindluse kohta; (3) informatsiooni algsete tingimuste kohta.

Kalmani filter töötab tingimustes, kus süsteemi oleks võimalik kirjeldada lineaarse mudeli abil ning süsteemi ja mõõtmiste müra on iseloomustatav valge gaussi mürana. Valge müra tähendab, et müra väärtus ei ole ajaga korrelatsioonis ning tal on võrdne tugevus kõikidel sagedustel. Gaussi müra on seotud müra amplituudiga. Eeldatakse, et igal ajahetkel Gaussi müra amplituudi tõenäosusjaotus moodustab kella-kujulise kõvera iga üksiku punkti jaoks.

Matemaatiline alus[muuda | muuda lähteteksti]

Kalmani filter lihtsalt seletatuna on rakenduslik matemaatika. See on lineaarne süsteem, millele vastav funktsioon on: . Kalmani filtrisse sisestatakse mürased andmed, filtrist väljuvad loodetavalt vähem mürased andmed. Kuid viivitus on hind selle filtreerimise juures. Puhas Kalmani filter ei kohanda andmeid.

Kalmani filter on formuleeritud järgnevalt: Oletame, et protsessi müra on valge gaussi müra koodispersiooni maatriksiga . Edasi oletame et mõõtmiste müra on valge gaussi müra koodispersiooni maatriksiga ja see ei ole korreleerunud protsessi müraga. Me tahaksime formuleerida määramise algoritmi, mille puhul järgmised statistilised tingimused oleks täidetud (Simon, 2004):

  1. Määrang on võrdne õige seisundi väärtusega.
  2. Algoritm annab väikseima võimaliku määramise vea.

Kalmani filter[muuda | muuda lähteteksti]

Kalmani filtri iseloomustamiseks on erinevad autorid kasutanud mitmeid erinevaid tähistusi, siin on kasutatud Welch ja Bishop poolt pakutud valemeid ja Kalmani filtri tuletuskäiku. Kalmani filter opereerib põhimõttel: (1) ennustab uue seisundi ja tema ebakindluse ja (2) korrigeerib seda uue mõõtmisega.

Kalmani filter kasutab protsessi määramiseks tagasiside kontrolli mehhanismi: filter määrab protsessi seisundi mingil ajahetkel ning siis saab tagasiside (mürastest) mõõtmistest. Kalmani filtri valem koosneb kahest grupist: aja uuenduse valemid ja mõõtmiste uuenduse valemid. Aja uuenduse valemid vastutavad praeguse seisundi projekteerimisest tulevikku (ajas) ja vea koodispersioon määrab aprioorse määrangu järgnevaks aja sammuks. Nende kohta võiks ka öelda, et nad on ennustavad valemid. Mõõtmise uuenduse valemid vastutavad tagasiside eest – kasutavad uut mõõtmist apriori määrangus, et saada täpsustatud aposterioorne määrang. Mõõtmiste uuendamise valemeid võib nimetada ka korrigeerivateks valemiteks.

Kalmani filtri aja uuenduse ja mõõtmise uuenduse valemid on antud järgnevalt:

aja uuendus:
 (1)
 (2)
mõõtmiste uuendus:
 (3)
 (4)
 (5)
Valemites on kasutatud järgmisi tähistusi:
 - Protsessi dünaamika maatriks
 - Protsessi mõõtmistulemuste vektor
 - Vea koodispersioon
 - Protsessi müra koodispersioon
 - Mõõtmise müra koodispersioon
 - Kalmani juurdekasv

Esimene samm mõõtmiste uuenduses on Kalmani juurdekasvu arvutamine. Järgmine samm on tegelikult mõõta protsessi, et leida , seejärel tekitada aposterioorne määrang, mis sisaldab mõõtmist (4). Viimane samm on määrata aposterioorselt vea koodispersioon valemiga (5).

Peale igat aja ja mõõtmise uuenduse paari protsessid korratakse viimase aposterioorse määrangutega, mida kasutatakse uue aprioorse määrangu ennustamiseks. See korduv loomus võimaldab muuta praktilised lahendused teostatavaks paremini, kui teised sarnased meetodid.

Tegelik filtri teostus, mõõtmise müra koodispersioon on tavaliselt eelnevalt mõõdetud. Protsessi müra koodispersiooni määramine on raskem, kuna ei ole võimalik otse mõõta protsessi, mida me määrame. Kuid võib kasutada teist Kalmani filtrit nende parameetrite ( ja ) määramiseks. Seda tehakse tavaliselt sõltumatult (nn off-line) ja sellele viidatakse kui süsteemi identifitseerimisele.

Kuid oletagem, et me liigume. Siis kõik müra ei ole mõõtmiste viga, osa sellest on ka liikumine. Kalmani filter võimaldab kaasata liikumiste mudeli, määramaks kiirust ja asukohta. Protsessi mudel kirjeldab seisundi muutust ajas järgmiselt:

  • seisund on kaherealine vektor [asukoht, kiirus]

Kalmani filtri parameetrite optimeerimine toimub järgmise algoritmi kohaselt (http://www.cs.unc.edu/~welch/kalman/):

Kalman optimeerim.JPG

Joonis 1. Kalmani filtri parameetrite optimeerimise protsess.

Laiendatud Kalmani filter[muuda | muuda lähteteksti]

Kalmani filter eeldab lineaarsust, kus on lubatud ainult tehted maatriksitega. Mõõtmine on seisukorra lineaarne funktsioon, kusjuures järgmine seisund on eelmise lineaarne funktsioon. Lineaarne Kalmani filter ei ole võimeline määrama juurdekasvu, ta ei suuda käsitleda pöördeid ega projektsiooni. Et sellest üle saada, kasutatakse Laiendatud Kalmani filtrit.

Laiendatud Kalmani filtri kasutamine aitab vähendada lähendamise vigu, mitte-lineaarne süsteem lineariseeritakse rakendades selleks parimat seisundi vektori määrangut, mida kasutatakse igas lineariseerimise sammus.

Olgu protsess on juhitud mitte-lineaarsete võrrandite poolt:

 (6)

mõõtmisega

, (7)

kus juhuslikud muutujad ja iseloomustavad protsessi ja mõõtmiste müra. Funktsioon seob seisundi eelmisest ajaetapist praegusse ajaetappi , mis sisaldab parameetreid ükskõik millise liikuva funktsiooni ja keskmise müra jaoks. Mittelineaarne funktsioon mõõtmiste võrrandis seob seisundi mõõtmistega .

Praktikas võiks määrata ligikaudselt seisundi ja mõõtmise vektori, teadmata konkreetseid väärtusi müra ja jaoks:

 (8)
ja
,   (9)

kus on aposterioorse seisundi määrang (eelmisest ajaetapist ).

Protsessi mittelineaarse erinevuse ja mõõtmise suhte määramiseks võiks alustada võrranditest, mis lineariseerivad valemid (8) ja (9):

 (10)
ja
, (11)

kus

 ja  on tegelikud seisundi ja mõõtmiste vektorid; 
 ja  on ligikaudsed seisundi ja mõõtmise vektorid valemitest (8) ja (9);
 on aposterioorne määrang viimasel aja etapil ;
Juhuslikud muutujad  ja  tähistavad protsessi ja mõõtmiste müra;
 on Jakobi maatriks osatuletistest funktsioonist  suhtes:
; (12)
 on Jakobi maatriks osatuletistest funktsioonist  suhtes:
; (13)
 on Jakobi maatriks osatuletistest funktsioonist  suhtes:
; (14)
 on Jakobi maatriks osatuletistest funktsioonist  suhtes:
. (15)

Ennustatava vea jaoks võib kirjutada:

, (16)

mõõtmiste hälve:

. (17)

Kasutades (31) ja (32) võib kirjutada valemid vea protsessi jaoks järgnevalt:

 (18)
ja
, (19)

kus ja tähistavad juhuslikke muutujad, mille keskmine on null ja koodispersiooni maatriksid on vastavalt ja , kus ja on eelnevalt defineeritud.

Nüüd saab kasutada tegelikku mõõtmise hälvet valemis (17) ja teist (oletuslikku) Kalmani filtrit et määrata ennustamise viga . Seda määrangut võiks kasutada selleks, et saada aposterioorset seisundi määrangut originaalsest mitte-lineaarsest protsessist:

. (20)

Juhuslikud muutujad valemites (18) ja (19) omavad ligikaudselt järgnevat tõenäosusjaotust:

, (21)
, (22)
. (23)

Arvestades niisuguste lähendustega ja lubades ennustatava väärtuse nulliks, kasutatakse Kalmani filtri valemit määramiseks:

. (24)

Asendades (24) tagasi valemisse (20) ja kasutades valemit (17) võib näha, et tegelikult me ei vajagi teist (oletuslikku) Kalmani filtrit:

. (25)

Valemit (40) võib seejärel kasutada mõõtmiste uuendamiseks Laiendatud Kalmani filtris, kus ja tulevad valemitest (8) ja (9), ja Kalmani juurdekasv saadakse valemist (3) koos sobiva asendusega mõõtmiste vea koovariansile.

Täielik Laiendatud Kalmani filtri valemite komplekt on järgmine:

aja uuenduse valemid
 (26)
 (27)
mõõtmiste uuenduse valemid
 (28)
, (29)
. (30)

Alaindeks on seotud Jakobi maatriksitega , ja et tugevdada märget, et nad on erinevad igal aja etapil (ning seepärast alati uuesti arvutatud).

Aja uuenduse valemid projekteerivad seisundi ja koodispersiooni määrangud eelmisest aja etapist järgmisse etappi . Funktsioon valemis (26) tuleb valemist (8), ja on protsessi Jakobi maatriksid ajahetkel , ja on protsessi müra koodispersioon ajahetkel .

Mõõtmiste uuenduse valemid korrigeerivad seisundi ja koodispersiooni määranguid mõõtmisega . Funktsioon valemis (29) tuleb valemist (9), ja on mõõtmiste Jakobi maatriksid aja etapil , ja on mõõtmiste müra koodispersioon aja etapil . alaindeks lubab selle muutumist koos iga uue mõõtmisega.

Laiendatud Kalmani filtri oluline omadus on see, et Jakobi maatriks Kalmani juurdekasvu valemis võimaldab korrektselt levida ainult asjakohasel mõõtmiste informatsiooni komponendil.

Rakendused[muuda | muuda lähteteksti]

GPS (Global Position System) / INS (Inertial Navigation System) integreerimine[muuda | muuda lähteteksti]

Niisugusel juhul annab Kalmani filter täiendatud üldise navigatsiooni tulemuse. Tuleb meeles piadada, et INS toetab virtuaalselt müratut väljundit, mis aeglaselt sumbub ajas. GPS omab minimaalset triivi, aga müra on INS mürast suurem. Kalmani filter kasutab statistilisi mudeleid mõlemast süsteemist, minimeerides optimaalselt nende vigade allikaid. See ongi Kalmani filtri kasutamise eeliseks GPS ja INS kombineerimisel.

GPS vead võivad olla vastuvõtja kell, ionosfääri ja troposfääri viivitus, mitmeteelisus ja satelliitide efemeriidid ning kella vead. Inertsiaalsed ebatäpsused võivad sisaldada asukoha, kiiruse, orientatsiooni, güroskoobi, kiirendusmõõturi ja raskuskiirenduse vigu.

GPS-navigatsioon[muuda | muuda lähteteksti]

Kalmani filter asub vastuvõtjas, oletuslikud vastuvõtja liikumise valemid asendavad inertsiaalset süsteemi. Liikumise võrrandid (tavaliselt pime-navigatsioon liikuva vastuvõtja jaoks) laiendavad valemit nii, et vastuvõtja trajektoor määrab vigade mudeli, mida on vaja Kalmani filtri jaoks. Siin on Kalmani filtri eeliseks (versus üksiku, fikseeritud vähimruutude lahendus) see, et need liikumise valemid siluvad GPS müra, saavutades nii vajaliku tulemuse.

Näited[muuda | muuda lähteteksti]

NÄIDE 1.[muuda | muuda lähteteksti]

Olgu meil teostatud mõõtmine, mida iseloomustavad mõõtmine ja selle dispersioon , ning mida võib iseloomustada normaaljaotusfunktsiooniga , ning mille kohta võib märkida, et ja . Kui me teostame sama mõõtmise teist korda, siis seda mõõtmist iseloomistavad mõõtmine ja selle dispersioon . Küsimus on, kuidas määrata ja vastavalt meile teadaolevatele andmetele.

Kombineerides hinnanguid, saame



Kombineerides dispersioone, saame


Kombineeritud määrang on ja , mis on reaalajas saadud kaalutud keskmine!

NÄIDE 2.[muuda | muuda lähteteksti]

Küsimus, mida Kalmani filter lahendab on järgmine: Me teame, kuidas süsteem käitub vastavalt süsteemi võrrandile, ja meil on teada asukoha mõõtmised, siis kuidas on võimalik kõige paremini määrata süsteemi muutujaid?

Dünaamilistes süsteemides (süsteemid, mis muutuvad ajas) on muutujad väljendatud terminiga „state variables” ehk seisundi muutujad. Oletame et süsteemi muutujad, mis on väljendatud vektoriga , on seotud valemiga


kus on juhuslik protsessi müra, allindeksid vektorite juures tähistavad ajasamme. Näiteks vektor võiks koosneda asukohast ja kiirusest . Niisugusel juhul oleks süsteemi võrrand järgmine (Simon, 2004):

,

kus on juhuslik, ajast sõltuv pöörlemine ja on ajasamm ja vahel. Nüüd oletame, et meil on võimalik mõõta asukoht . Siis meie mõõtmine ajahetkel võib olla väljendatud , kus on juhuslik mõõtmise müra.

NÄIDE 3. 2D asukoha määramine[muuda | muuda lähteteksti]

Protsessi mudel:

,

mille võib ümber kirjutada järgmiselt:

,
kus  
 on seisukord ajaepohhil ;   
 on seisundi üleminek;   
 on seisund ajaepohhil  ja   
 on müra. 

Mõõtmiste mudel:

,

mille võib ümber kirjutada

,
kus   
 on mõõtmine;   
 on mõõtmise maatriks;   
 on seisund ja   
 on müra.

Ettevalmistus filtreerimiseks:

  • Kirjutame välja järgmised maatriksid:
    • seisundi üleminek
    • protsessi müra koodispersioon
    • mõõtmise müra koodispersioon

Initialiseerimine:



Ennustus:



Korrigeerimine



Kus on tegelik mõõtmine ja on ennustatav mõõtmine.

Kalmani juurdekasv arvutatakse

,

kus on „denominaator” (ehk mõõtmiste ruum)


Kokkuvõte: joonisel 2 on näidatud Kalmani filtri tööprotsess (http://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf):

Kalman ex3.PNG

Joonis 2. Kalmani filtri tööprotsess.

Kasutatud kirjandus[muuda | muuda lähteteksti]

  1. Martin Vermeer (2004): „Methods of Navigation“. Lecture materials. URL: http://www.hut.fi/~mvermeer/nav_en.pdf
  2. Greg Welch, Gary Bishop (2004): „An Introduction to the Kalman Filter“. URL: http://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf
  3. H. W. Sorenson (1970): „Least Squares estimation: from Gauss to Kalman“. Reprinted from IEEE Spectrum, vol. 7, pp. 63-68, July 1970. URL: http://www.cs.unc.edu/~welch/media/pdf/Sorenson1970.pdf
  4. Maybeck, Peter S (1979): „Stochastic Models, Estimation and Control, Vol. 1“. Academic Press Inc, 1979. URL: http://www.cs.unc.edu/~welch/kalman/maybeck.html
  5. R. E. Kalman (1960): „A New Approach to Linear Filtering and Prediction Problems“. Transactions of the ASME–Journal of Basic Engineering, 82 (Series D): 35-45. URL: http://www.cs.unc.edu/~welch/media/pdf/Kalman1960.pdf
  6. Dan Simon (2001): „Kalman Filtering”. Innovatia Software, 1998 – 2001. URL: http://www.innovatia.com/software/papers/kalman.htm.
  7. Greg Welch , Gary Bishop (2001): ”An Introduction to the Kalman Filter”. Course 8. SIGGRAPH, 2001. URL: http://www.cs.unc.edu/~welch/kalman/