Kalmani filter

Allikas: Vikipeedia

Kalmani filter on Rudolf Emil Kalmani loodud algoritm, mida kasutatakse kosmonautikas, merenavigatsioonis, aatomielektrijaamades, demograafilises modelleerimises ja mujal.

Inseneriteadustes on palju valdkondi, kus filtreerimine on eluliselt tähtis. Raadiosignaalid on tihti suure müratasemega (mingid segavad lained). Väga hea filtreerimise algoritm saab elimineerida selle müra, et saada kätte olulist ja vajalikku informatsiooni. Ka elektrienergia juures on tegemist filtreerimise protseduuriga. Paljudes maades nõutakse koduses majapidamises kasutatava elektrienergia voltide filtreerimist, et tagada kodus kastutatavate seadmete pikaealisus (näiteks arvutid, televiisorid, video- ja DVD mängijad, jne).

Rudolf Emil Kalman arendas filtri välja aastatel 1960–1961, selle juured ulatuvad Gaussi teooriateni 1795. aastast.

Sissejuhatus[muuda | redigeeri lähteteksti]

Kalmani filter on lineaarne, ennustav ja korduv algoritm. Ta on võimeline optimaalselt ennustama reaal-ajas süsteemi seisundit. Kui eksisteerivad mittelineaarsused, siis tuleb mudel eelnevalt lineariseerida.

Korduvus Kalmani filtris tähendab seda, et see ei nõua eelnevate andmete salvestamist ja ümber arvutamist niipea, kui uus mõõtmine on tehtud. Kalmani filtri töös kasutatakse (Maybeck, 1979): (1) teadmisi süsteemi ja mõõtmiste dünaamikast; (2) statistilist iseloomustust süsteemi müra, mõõtmiste vigade ning dünaamilistes mudelites oleva ebakindluse kohta; (3) informatsiooni algsete tingimuste kohta.

Kalmani filter töötab tingimustes, kus süsteemi oleks võimalik kirjeldada lineaarse mudeli abil ning süsteemi ja mõõtmiste müra on iseloomustatav valge gaussi mürana. Valge müra tähendab, et müra väärtus ei ole ajaga korrelatsioonis ning tal on võrdne tugevus kõikidel sagedustel. Gaussi müra on seotud müra amplituudiga. Eeldatakse, et igal ajahetkel Gaussi müra amplituudi tõenäosusjaotus moodustab kella-kujulise kõvera iga üksiku punkti jaoks.

Matemaatiline alus[muuda | redigeeri lähteteksti]

Kalmani filter lihtsalt seletatuna on rakenduslik matemaatika. See on lineaarne süsteem, millele vastav funktsioon on: f(a+b)=f(a)+f(b). Kalmani filtrisse sisestatakse mürased andmed, filtrist väljuvad loodetavalt vähem mürased andmed. Kuid viivitus on hind selle filtreerimise juures. Puhas Kalmani filter ei kohanda andmeid.

Kalmani filter on formuleeritud järgnevalt: Oletame, et protsessi müra w_k on valge gaussi müra koodispersiooni maatriksiga Q. Edasi oletame et mõõtmiste müra on valge gaussi müra koodispersiooni maatriksiga R ja see ei ole korreleerunud protsessi müraga. Me tahaksime formuleerida määramise algoritmi, mille puhul järgmised statistilised tingimused oleks täidetud (Simon, 2004):

  1. Määrang on võrdne õige seisundi väärtusega.
  2. Algoritm annab väikseima võimaliku määramise vea.

Kalmani filter[muuda | redigeeri lähteteksti]

Kalmani filtri iseloomustamiseks on erinevad autorid kasutanud mitmeid erinevaid tähistusi, siin on kasutatud Welch ja Bishop poolt pakutud valemeid ja Kalmani filtri tuletuskäiku. Kalmani filter opereerib põhimõttel: (1) ennustab uue seisundi ja tema ebakindluse ja (2) korrigeerib seda uue mõõtmisega.

Kalmani filter kasutab protsessi määramiseks tagasiside kontrolli mehhanismi: filter määrab protsessi seisundi mingil ajahetkel ning siis saab tagasiside (mürastest) mõõtmistest. Kalmani filtri valem koosneb kahest grupist: aja uuenduse valemid ja mõõtmiste uuenduse valemid. Aja uuenduse valemid vastutavad praeguse seisundi projekteerimisest tulevikku (ajas) ja vea koodispersioon määrab aprioorse määrangu järgnevaks aja sammuks. Nende kohta võiks ka öelda, et nad on ennustavad valemid. Mõõtmise uuenduse valemid vastutavad tagasiside eest – kasutavad uut mõõtmist apriori määrangus, et saada täpsustatud aposterioorne määrang. Mõõtmiste uuendamise valemeid võib nimetada ka korrigeerivateks valemiteks.

Kalmani filtri aja uuenduse ja mõõtmise uuenduse valemid on antud järgnevalt:

aja uuendus:
\hat{x}_k^-=A\hat{x}_{k-1}+Bu_{k-1} (1)
P_k^-=AP_{k-1}A^T+Q (2)
mõõtmiste uuendus:
K_k=P_k^-H^T(HP_k^-H^T+R)^{-1} (3)
\hat{x}_k=\hat{x}_k^-+K_k(z_k-H\hat{x}_k^-) (4)
P_k=(I-K_kH)P_k^- (5)
Valemites on kasutatud järgmisi tähistusi:
A - Protsessi dünaamika maatriks
B - Protsessi mõõtmistulemuste vektor
P - Vea koodispersioon
Q - Protsessi müra koodispersioon
R - Mõõtmise müra koodispersioon
K_k - Kalmani juurdekasv

Esimene samm mõõtmiste uuenduses on Kalmani juurdekasvu K_k arvutamine. Järgmine samm on tegelikult mõõta protsessi, et leida z_k, seejärel tekitada aposterioorne määrang, mis sisaldab mõõtmist (4). Viimane samm on määrata aposterioorselt vea koodispersioon valemiga (5).

Peale igat aja ja mõõtmise uuenduse paari protsessid korratakse viimase aposterioorse määrangutega, mida kasutatakse uue aprioorse määrangu ennustamiseks. See korduv loomus võimaldab muuta praktilised lahendused teostatavaks paremini, kui teised sarnased meetodid.

Tegelik filtri teostus, mõõtmise müra koodispersioon R on tavaliselt eelnevalt mõõdetud. Protsessi müra koodispersiooni Q määramine on raskem, kuna ei ole võimalik otse mõõta protsessi, mida me määrame. Kuid võib kasutada teist Kalmani filtrit nende parameetrite (R ja Q) määramiseks. Seda tehakse tavaliselt sõltumatult (nn off-line) ja sellele viidatakse kui süsteemi identifitseerimisele.

Kuid oletagem, et me liigume. Siis kõik müra ei ole mõõtmiste viga, osa sellest on ka liikumine. Kalmani filter võimaldab kaasata liikumiste mudeli, määramaks kiirust ja asukohta. Protsessi mudel kirjeldab seisundi muutust ajas järgnevalt:

  • seisund on kaherealine vektor [asukoht, kiirus]
  • asukoht_{n+1}=asukoht_n+kiirus_n*aeg
  • kiirus_{n+1}=kiirus_n

Kalmani filtri parameetrite optimeerimine toimub järgneva algoritmi kohaselt (http://www.cs.unc.edu/~welch/kalman/):

Kalman optimeerim.JPG

Joonis 1. Kalmani filtri parameetrite optimeerimise protsess.

Laiendatud Kalmani filter[muuda | redigeeri lähteteksti]

Kalmani filter eeldab lineaarsust, kus on lubatud ainult tehted maatriksitega. Mõõtmine on seisukorra lineaarne funktsioon, kusjuures järgmine seisund on eelmise lineaarne funktsioon. Lineaarne Kalmani filter ei ole võimeline määrama juurdekasvu, ta ei suuda käsitleda pöördeid ega projektsiooni. Et sellest üle saada, kasutatakse Laiendatud Kalmani filtrit.

Laiendatud Kalmani filtri kasutamine aitab vähendada lähendamise vigu, mitte-lineaarne süsteem lineariseeritakse rakendades selleks parimat seisundi vektori määrangut, mida kasutatakse igas lineariseerimise sammus.

Olgu protsess on juhitud mitte-lineaarsete võrrandite poolt:

x_k=f(x_{k-1},u_{k-1},w_{k-1}) (6)

mõõtmisega

z_k=h(x_k,v_k), (7)

kus juhuslikud muutujad w_k ja v_k iseloomustavad protsessi ja mõõtmiste müra. Funktsioon f seob seisundi eelmisest ajaetapist k-1 praegusse ajaetappi k, mis sisaldab parameetreid ükskõik millise liikuva funktsiooni u_{k-1} ja keskmise müra w_k jaoks. Mittelineaarne funktsioon h mõõtmiste võrrandis seob seisundi x_k mõõtmistega z_k.

Praktikas võiks määrata ligikaudselt seisundi ja mõõtmise vektori, teadmata konkreetseid väärtusi müra w_k ja v_k jaoks:

\bar{x}_k=f(\hat{x}_{k-1},u_{k-1},0) (8)
ja
\bar{z}_k=h(\bar{x}_k,0),   (9)

kus \hat{x}_k on aposterioorse seisundi määrang (eelmisest ajaetapist k).

Protsessi mittelineaarse erinevuse ja mõõtmise suhte määramiseks võiks alustada võrranditest, mis lineariseerivad valemid (8) ja (9):

x_k \approx \bar{x}_k+A(x_{k-1}-\hat{x}_{k-1})+Ww_{k-1} (10)
ja
z_k \approx \bar{z}_k+H(x_k-\bar{x}_k)+Vv_k, (11)

kus

x_k ja z_k on tegelikud seisundi ja mõõtmiste vektorid; 
\bar{x}_k ja \bar{z}_k on ligikaudsed seisundi ja mõõtmise vektorid valemitest (8) ja (9);
\hat{x}_k on aposterioorne määrang viimasel aja etapil k;
Juhuslikud muutujad w_k ja v_k tähistavad protsessi ja mõõtmiste müra;
A on Jakobi maatriks osatuletistest funktsioonist f\ x suhtes:
A_{i,j}=\frac{\partial f_i}{\partial  x_f}(\hat{x}_{k-1},u_{k-1},0); (12)
W on Jakobi maatriks osatuletistest funktsioonist f\ w suhtes:
W_{i,j}=\frac{\partial f_i}{\partial  w_f}(\hat{x}_{k-1},u_{k-1},0); (13)
H on Jakobi maatriks osatuletistest funktsioonist h\ x suhtes:
H_{i,j}=\frac{\partial h_i}{\partial  x_f}(\bar{x}_k,0); (14)
V on Jakobi maatriks osatuletistest funktsioonist h\ v suhtes:
V_{i,j}=\frac{\partial h_i}{\partial  v_f}(\bar{x}_k,0). (15)

Ennustatava vea jaoks võib kirjutada:

e_{xk}^-=x_k-\bar{x}_k, (16)

mõõtmiste hälve:

e_{zk}^-=z_k-\bar{z}_k. (17)

Kasutades (31) ja (32) võib kirjutada valemid vea protsessi jaoks järgnevalt:

e_{xk}^- \approx A(x_{k-1}-\hat{x}_{k-1})+\varepsilon_k (18)
ja
e_{zk}^- \approx H^-e_{xk}+\eta_k, (19)

kus \varepsilon_k ja \eta_k tähistavad juhuslikke muutujad, mille keskmine on null ja koodispersiooni maatriksid on vastavalt WQW^T ja VRV^T, kus Q ja R on eelnevalt defineeritud.

Nüüd saab kasutada tegelikku mõõtmise hälvet \bar{e}_{zk} valemis (17) ja teist (oletuslikku) Kalmani filtrit et määrata ennustamise viga e_{xk}^-. Seda määrangut \hat{e}_k võiks kasutada selleks, et saada aposterioorset seisundi määrangut originaalsest mitte-lineaarsest protsessist:

\hat{x}_k=\bar{x}_k+\hat{e}_k. (20)

Juhuslikud muutujad valemites (18) ja (19) omavad ligikaudselt järgnevat tõenäosusjaotust:

p(\bar{e}_{xk}) \approx N(0,E[\bar{e}_{xk}\bar{e}_{xk}^T]), (21)
p(\varepsilon_k) \approx N(0,WQ_kW^T), (22)
p(\eta_k) \approx N(0,VR_kV^T). (23)

Arvestades niisuguste lähendustega ja lubades ennustatava väärtuse nulliks, kasutatakse Kalmani filtri valemit \hat{e}_k määramiseks:

\hat{e}_k=K_k\bar{e}_{zk}. (24)

Asendades (24) tagasi valemisse (20) ja kasutades valemit (17) võib näha, et tegelikult me ei vajagi teist (oletuslikku) Kalmani filtrit:

\hat{x}_k=\bar{x}_k+K_k\bar{e}_{zk}=\bar{x}_k+K_k(z_k-\bar{z}_k). (25)

Valemit (40) võib seejärel kasutada mõõtmiste uuendamiseks Laiendatud Kalmani filtris, kus ja tulevad valemitest (8) ja (9), ja Kalmani juurdekasv saadakse valemist (3) koos sobiva asendusega mõõtmiste vea koovariansile.

Täielik Laiendatud Kalmani filtri valemite komplekt on järgmine:

aja uuenduse valemid
\hat{x}_k^-=f(\hat{x}_{k-1},u_{k-1},0) (26)
P_k^-=A_kP_{k-1}A_k^T+W_kQ_{k-1}W_k^T (27)
mõõtmiste uuenduse valemid
K_k=P_k^-H_k^T(H_kP_k^-H_k^T+V_kR_kV_k^T)^{-1} (28)
\hat{x}_k=\hat{x}_k^-+K_k(z_k-h(\hat{x}_k^-,0)), (29)
P_k=(I-K_kH_k)P_k^-. (30)

Alaindeks k on seotud Jakobi maatriksitega A, W ja V et tugevdada märget, et nad on erinevad igal aja etapil (ning seepärast alati uuesti arvutatud).

Aja uuenduse valemid projekteerivad seisundi ja koodispersiooni määrangud eelmisest aja etapist k-1 järgmisse etappi k. Funktsioon f valemis (26) tuleb valemist (8), A_k ja W_k on protsessi Jakobi maatriksid ajahetkel k, ja Q_k on protsessi müra koodispersioon ajahetkel k.

Mõõtmiste uuenduse valemid korrigeerivad seisundi ja koodispersiooni määranguid mõõtmisega z_k. Funktsioon h valemis (29) tuleb valemist (9), H_k ja V_k on mõõtmiste Jakobi maatriksid aja etapil k, ja R_k on mõõtmiste müra koodispersioon aja etapil k. R alaindeks lubab selle muutumist koos iga uue mõõtmisega.

Laiendatud Kalmani filtri oluline omadus on see, et Jakobi maatriks H_k Kalmani juurdekasvu valemis K_k võimaldab korrektselt levida ainult asjakohasel mõõtmiste informatsiooni komponendil.

Rakendused[muuda | redigeeri lähteteksti]

GPS (Global Position System) / INS (Inertial Navigation System) integreerimine[muuda | redigeeri lähteteksti]

Niisugusel juhul annab Kalmani filter täiendatud üldise navigatsiooni tulemuse. Tuleb meeles piadada, et INS toetab virtuaalselt müratut väljundit, mis aeglaselt sumbub ajas. GPS omab minimaalset triivi, aga müra on INS mürast suuremsuurem. Kalmani filter kasutab statistilisi mudeleid mõlemast süsteemist, minimeerides optimaalselt nende vigade allikaid. See ongi Kalmani filtri kasutamise eeliseks GPS ja INS kombineerimisel.

GPS vead võivad olla vastuvõtja kell, ionosfääri ja troposfääri viivitus, mitmeteelisus ja satelliitide efemeriidid ning kella vead. Inertsiaalsed ebatäpsused võivad sisaldada asukoha, kiiruse, orientatsiooni, güroskoobi, kiirendusmõõturi ja raskuskiirenduse vigu.

GPS-navigatsioon[muuda | redigeeri lähteteksti]

Kalmani filter asub vastuvõtjas, oletuslikud vastuvõtja liikumise valemid asendavad inertsiaalset süsteemi. Liikumise võrrandid (tavaliselt pime-navigatsioon liikuva vastuvõtja jaoks) laiendavad valemit nii, et vastuvõtja trajektoor määrab vigade mudeli, mida on vaja Kalmani filtri jaoks. Siin on Kalmani filtri eeliseks (versus üksiku, fikseeritud vähimruutude lahendus) see, et need liikumise valemid siluvad GPS müra, saavutades nii vajaliku tulemuse.

Näited[muuda | redigeeri lähteteksti]

NÄIDE 1.[muuda | redigeeri lähteteksti]

Olgu meil teostatud mõõtmine, mida iseloomustavad mõõtmine z_1 ja selle dispersioon \sigma_{z1}^2, ning mida võib iseloomustada normaaljaotusfunktsiooniga N(z_1,\sigma_{z1}^2), ning mille kohta võib märkida, et \hat{x}_1=z_1 ja \hat{\sigma}_1^2=\sigma_{z1}^2. Kui me teostame sama mõõtmise teist korda, siis seda mõõtmist iseloomistavad mõõtmine z_2 ja selle dispersioon \sigma_{z2}^2. Küsimus on, kuidas määrata \hat{x}_2 ja \hat{\sigma}_2^2 vastavalt meile teadaolevatele andmetele.

Kombineerides hinnanguid, saame

\hat{x}_2=\hat{x}_1+K_2(z_2-\hat{x}_1)
K_2=\frac{\sigma_1^2}{\sigma_1^2+\sigma_{z2}^2}

Kombineerides dispersioone, saame

\frac{1}{\sigma_2^2}=\frac{1}{\sigma_1^2}+\frac{1}{\sigma_{z2}^2}

Kombineeritud määrang on \hat{x}=\hat{x}_2 ja \hat{\sigma}^2=\sigma_2^2, mis on reaalajas saadud kaalutud keskmine!

NÄIDE 2.[muuda | redigeeri lähteteksti]

Küsimus, mida Kalmani filter lahendab on järgmine: Me teame, kuidas süsteem käitub vastavalt süsteemi võrrandile, ja meil on teada asukoha mõõtmised, siis kuidas on võimalik kõige paremini määrata süsteemi muutujaid?

Dünaamilistes süsteemides (süsteemid, mis muutuvad ajas) on muutujad väljendatud terminiga „state variables” ehk seisundi muutujad. Oletame et süsteemi muutujad, mis on väljendatud vektoriga \textbf{x}, on seotud valemiga

x_{k+1}=Ax_k+w_k

kus w_k on juhuslik protsessi müra, allindeksid vektorite juures tähistavad ajasamme. Näiteks vektor \textbf{x} võiks koosneda asukohast p ja kiirusest v. Niisugusel juhul oleks süsteemi võrrand järgmine (Simon, 2004):

\binom{p_{k+1}}{v_{k+1}}=\begin{pmatrix} 1 & T\\0 & 1\end{pmatrix} \binom{p_k}{v_k}+\binom{T^2 \setminus 2}{T} a_k,

kus a_k on juhuslik, ajast sõltuv pöörlemine ja T on ajasamm k ja k+1 vahel. Nüüd oletame, et meil on võimalik mõõta asukoht p. Siis meie mõõtmine ajahetkel k võib olla väljendatud z_k=p_k+v_k, kus v_k on juhuslik mõõtmise müra.

NÄIDE 3. 2D asukoha määramine[muuda | redigeeri lähteteksti]

Protsessi mudel:

\binom{x_k}{y_k}=\begin{pmatrix} 1 & 0\\0 & 1\end{pmatrix} \binom{x_{k-1}}{y_{k-1}}+\binom{\sim x_{k-1}}{\sim y_{k-1}},

mille võib ümber kirjutada järgmiselt:

\bar{x}_k=A\bar{x}_{k-1}+\bar{w}_{k-1},
kus  
\bar{x}_k on seisukord ajaepohhil Sisesta k;   
A on seisundi üleminek;   
\bar{x}_{k-1} on seisund ajaepohhil k-1 ja   
\bar{w}_{k-1} on müra. 

Mõõtmiste mudel:

\binom{u_k}{v_k}=\begin{pmatrix} H_x & 0 \\ 0 & H_y \end{pmatrix} \binom{x_k}{y_k}+\binom{\approx u_k}{\approx v_k},

mille võib ümber kirjutada

\bar{z}_k=H\bar{x}_k+\bar{v}_k,
kus   
\bar{z}_k on mõõtmine;   
H on mõõtmise maatriks;   
\bar{x}_k on seisund ja   
\bar{v}_k on müra.

Ettevalmistus filtreerimiseks:

  • Kirjutame välja järgmised maatriksid:
    • A=\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} seisundi üleminek
    • Q=E[\bar{w}*\bar{w}^T]=\begin{pmatrix} Q_{xx} & 0 \\ 0 Q_{yy} \end{pmatrix} protsessi müra koodispersioon
    • R=E[\bar{v}*\bar{v}^T]=\begin{pmatrix} R_{xx} & 0 \\ 0 & R_{yy} \end{pmatrix} mõõtmise müra koodispersioon

Initialiseerimine:

\bar{x}_0=H\bar{z}_0
P_0=\begin{pmatrix} \varepsilon & 0 \\ 0 & \varepsilon \end{pmatrix}

Ennustus:

\bar{x}_k^-=A\bar{x}_{k-1}
P_k^-=AP_{k-1}A^T+Q

Korrigeerimine

\bar{x}_k=\bar{x}_k^-+K(\bar{z}_k-H\bar{x}_k^-)
P_k=(I-KH)P_k^-

Kus \bar{z}_k on tegelik mõõtmine ja H\bar{x}_k^- on ennustatav mõõtmine.

Kalmani juurdekasv arvutatakse

K=P_k^-(HP_k^-H^T+R)^{-1},

kus (HP_k^-H^T+R) on „denominaator” (ehk mõõtmiste ruum)


Kokkuvõte: joonisel 2 on näidatud Kalmani filtri tööprotsess (http://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf):

Kalman ex3.PNG

Joonis 2. Kalmani filtri tööprotsess.

Kasutatud kirjandus[muuda | redigeeri lähteteksti]

  1. Martin Vermeer (2004): „Methods of Navigation“. Lecture materials. URL: http://www.hut.fi/~mvermeer/nav_en.pdf
  2. Greg Welch, Gary Bishop (2004): „An Introduction to the Kalman Filter“. URL: http://www.cs.unc.edu/~welch/media/pdf/kalman_intro.pdf
  3. H. W. Sorenson (1970): „Least Squares estimation: from Gauss to Kalman“. Reprinted from IEEE Spectrum, vol. 7, pp. 63-68, July 1970. URL: http://www.cs.unc.edu/~welch/media/pdf/Sorenson1970.pdf
  4. Maybeck, Peter S (1979): „Stochastic Models, Estimation and Control, Vol. 1“. Academic Press Inc, 1979. URL: http://www.cs.unc.edu/~welch/kalman/maybeck.html
  5. R. E. Kalman (1960): „A New Approach to Linear Filtering and Prediction Problems“. Transactions of the ASME–Journal of Basic Engineering, 82 (Series D): 35-45. URL: http://www.cs.unc.edu/~welch/media/pdf/Kalman1960.pdf
  6. Dan Simon (2001): „Kalman Filtering”. Innovatia Software, 1998 – 2001. URL: http://www.innovatia.com/software/papers/kalman.htm.
  7. Greg Welch , Gary Bishop (2001): ”An Introduction to the Kalman Filter”. Course 8. SIGGRAPH, 2001. URL: http://www.cs.unc.edu/~welch/kalman/