Markovi ahel

Allikas: Vikipeedia
Artiklit tuleb tõlkida ja kohandada!

Markovi ahelaks (vene matemaatiku Andrei Markov seeniori nime järgi) nimetatakse matemaatikas lõpliku või loenduva olekute hulgaga diskreetse ajaga juhuslikku protsessi, millel on Markovi omadus.

Markovi omadus tähendab, et fikseeritud oleviku korral tulevik ei sõltu minevikust. Teiste sõnadega, olevikuseisundi kirjeldus sisaldab kogu informatsiooni, mis võib protsessi tulevast arengut mõjutada.

Definitsioon[muuda | redigeeri lähteteksti]

Markovi ahel on juhuslike muutujate jada X1, X2, X3, ..., millel on Markovi omadus:

\Pr(X_{n+1}=x|X_n=x_n, \ldots, X_1=x_1) = \Pr(X_{n+1}=x|X_n=x_n).\,

Muutujate Xi võimalikud väärtused moodustavad lõpliku või loenduva hulga S, mida nimetatakse ahela olekute ruumiks.

Markovi ahelat kujutatakse tihti suunatud graafina, mille servade juurde on kirjutatud ühest olekust teistesse ülemineku tõenäosused.

Modifikatsioonid[muuda | redigeeri lähteteksti]

Pideva ajaga Markovi ahelatel on pidevalt muutuv indeks.

Ajaliselt homogeenne Markovi ahel (ajaliselt homogeensete üleminekutõenäosustega Markovi ahel) on Markovi ahel, kus n kõigi väärtuste korral

\Pr(X_{n+1}=x|X_n=y) = \Pr(X_{n}=x|X_{n-1}=y)\, .

m-ndat järku Markovi ahel ehk Markovi ahel mäluga m (m on lõplik) on Markovi ahel, milles iga n korral

\Pr(X_n=x_n|X_{n-1}=x_{n-1}, X_{n-2}=x_{n-2}, \dots , X_{1}=x_{1})
  = \Pr(X_n=x_n|X_{n-1}=x_{n-1}, X_{n-2}=x_{n-2}, \dots, X_{n-m}=x_{n-m}) ,

st tulevik sõltub ainult olekutest viimasel m hetkel. Ahelast (Xn) saab konstrueerida ahela (Yn), millel on "klassikaline" Markovi omadus. Nimelt, olgu Yn = (Xn; Xn−1; ...; Xnm+1) X väärtuste m-korteež. Sel juhul on Yn klassikalise Markovi omadusega Markovi ahel.

Markovi ahelad võib esitada lõplike automaatidena. Kui automaat on hetkel n olekus y, siis tõenäosus, et ta hetkel n + 1 läheb üle olekusse x, sõltub ainult olekust hetkel n.

Markovi ahelate omadused[muuda | redigeeri lähteteksti]

Olgu n ajasammuga olekust i olekusse j jõudmise tõenäosus defineeritud kui

p_{ij}^{(n)} = \Pr(X_n=j\mid X_0=i) \,

ja ühe ajasammuga olekust i olekusse j ülemineku tõenäosus kui

p_{ij} = \Pr(X_1=j\mid X_0=i). \,

n sammuga üleminek rahuldab Chapmani-Kolmogorovi võrrandit, mille järgi iga k (0 < k < n) korral

p_{ij}^{(n)} = \sum_{r \in S} p_{ir}^{(k)} p_{rj}^{(n-k)}.

Marginaaljaotus Pr (Xn = x) on olekutevaheline jaotus hetkel n. Algjaotus on Pr (X0 = x). Protsessi kulgu sammude kaupa kirjeldab valem

 \Pr(X_{n}=j) = \sum_{r \in S} p_{rj} \Pr(X_{n-1}=r) = \sum_{r \in S} p_{rj}^{(n)} \Pr(X_0=r).

Ülaindeks (n) on mõeldud lihtsalt täisarvulise indeksina. Ent kui Markovi ahel on homogeenne, siis võib seda ülaindeksit tõlgendada ka astmenäitajana.

Taanduvus[muuda | redigeeri lähteteksti]

Olekut j nimetatakse teisest olekust i kättesaadavaks (accessible; tähistus ij), kui eeldusel, et ollakse olekus i, on nullist erinev tõenäosus, et millalgi tulevikus ollakse olekus j . Teiste sõnadega, olek j on olekust i kättesaadav, kui leidub niisugune täisarv n ≥ 0, et

 \Pr(X_{n}=j | X_0=i) > 0.\,

Selles definitsioonis lubatakse ka n väärtust 0, mistõttu iga olek on selle definitsiooni järgi kättesaadav ka iseendast.

Öeldakse, et olek i lävib seisundiga j (ij), kui olek i on kättesaadav olekust j ning olek j on kättesaadav olekust i. Olekute hulk C on läviv klass, kui mis tahes kaks olekut hulgast C lävivad teineteisega ja ükski olek hulgast C ei lävi ühegi olekuga, mis ei kuulu hulka C. (Saab näidata, et lävimine on ekvivalentsusseos.) Läviv klass on kinnine, kui klassist lahkumise tõenäosus (probability of leaving the class) on null: kui olek i asub lävivas klassis C, kuid olek j mitte, siis olek j ei ole kättesaadav olekust i.

Markovi ahel on taandumatu, kui tema olekute ruum on läviv klass. Teiste sõnadega, taandumatus Markovi ahelas on mis tahes olek kättesaadav mis tahes olekust.

Perioodilisus[muuda | redigeeri lähteteksti]

Olekul i on periood k, kui mis tahes naasmine (return) olekusse i peab toimuma k kordse arvu ajasammude möödudes. Näiteks kui olekusse i on võimalik naasta ainult paarisarvu sammude möödudes, siis i on perioodiline perioodiga 2. Oleku periood on

 k = \operatorname{SYT}\{ n: \Pr(X_n = i | X_0 = i) > 0\}

(kus "SYT" on suurim ühistegur). Pandagu tähele, et kui mingil olekul on periood k, ei pruugi sellesse olekusse olla võimalik k sammuga naasta. Näiteks kui olekusse on võimalik naasta {6, 8, 10, 12, ...} ajasammuga, siis k on 2, kuigi 2 selles loetelus ei esine.

Kui k = 1, siis nimetatakse olekut aperioodiliseks. Kui k>1, siis nimetatakse olekut perioodiliseks perioodiga k.

Saab näidata, et lävivas klassis on kõigil olekutel üks ja seesama periood.

Lõpliku olekute arvuga taandumatut Markovi ahelat nimetatakse ergoodiliseks, kui tema olekud on aperioodilised.

Naasmine[muuda | redigeeri lähteteksti]

Olekut i nimetatakse siirdeolekuks (transient), kui on nullist erinev tõenäosus, et alustades olekust i ei naasta kunagi olekusse i. Olgu juhuslik muutuja Ti esimene naasmisaeg olekusse i ("tabamisaeg" ("hitting time")):

 T_i = \inf \{ n: X_n = i | X_0 = i\}

Siis olek i on siirdeolek siis ja ainult siis, kui

 \Pr(T_i = {\infty}) > 0.

Kui olek i on ei ole siirdeolek (tal on tõenäosusega 1 lõplik tabamisaeg), siis teda nimetatakse naasvaks. Kuigi tabamisaeg on lõplik, ei pruugi tal olla lõplikku matemaatilist ootust.

Olgu Mi naasmisaja matemaatiline ootus

 M_i = E[T_i].\,

Siis olek i on püsiv, kui Mi on lõplik. Vastasel juhul on olek i nullsiirdeolek (null recurrent).

Saab näidata, et olek on naasev (recurrent) siis ja ainult siis, kui

\sum_{n=0}^{\infty} p_{ii}^{(n)} = \infty

Olekut i nimetatakse neelavaks, kui sellest olekut on võimatu lahkuda. Seega on olek i on neelav siis ja ainult siis, kui

 p_{ii} = 1 ning  p_{ij} = 0, kui i \not= j.

Ergoodilisus[muuda | redigeeri lähteteksti]

Olekut i nimetatakse ergoodiliseks, kui ta on aperioodiline ja püsiv. Kui Markovi ahela kõik olekud on ergoodilised, siis ahelat nimetatakse ergoodiliseks.

Püsivate seisundite analüüs ja piiravad jaotused[muuda | redigeeri lähteteksti]

(Steady-state analysis and limiting distributions)

Kui Markovi ahel on homogeenne, nii et protsess on kirjeldatav üheainsa ajast sõltumatu maatriksiga pij, siis vektor π on statsionaarne jaotus (stationary distribution) (ka tasakaalus jaotus, invariantne mõõt), kui selle koordinaatide (entries) πj summa on 1 ning nad rahuldavad võrrandit

\pi_j = \sum_{i \in S} \pi_i p_{ij}.

Taandumatul ahelal on statsionaarne jaotus siis ja ainult siis, kui kõik selle olekud on püsivad. Sel juhul leidub ainult üks statsionaarne jaotus π ning ta on seotud naasmisaja matemaatilise ootusega:

\pi_j = \frac{1}{M_j}.\,

Kui ahel on taandumatu ja ühtlasi aperioodiline, siis mis tahes i ja j korral

\lim_{n \rarr \infty} p_{ij}^{(n)} = \frac{1}{M_j}.

Algsele jaotusele ei ole siin mingit piirangut. Ahel koondub statsionaarse jaotusega ahelaks sõltumata algsest olekust.

Kui ahel ei ole taandumatu, siis ei ole tal ühtset statsionaarset jaotust. (Igal kinnisel lävival klassil on oma ainus statsionaarne jaotus. Igaüks neist laieneb kogu ahela statsionaarseks jaotuseks, kus tõenäosus väljaspool klassi on nullile lähenev hulk (set to zero).) Samas, kui olek j on aperioodiline, siis

\lim_{n \rarr \infty} p_{jj}^{(n)} = \frac{1}{M_j}

ja iga teise oleku i puhul olgu fij tõenäosus, et startides olekust i, läbib (visits) ahel kunagi olekut j

\lim_{n \rarr \infty} p_{ij}^{(n)} = \frac{f_{ij}}{M_j}.

Lõpliku seisundite ruumiga Markovi ahelad[muuda | redigeeri lähteteksti]

Kui olekute ruum on lõplik, transitsiooni tõenäolist jaotust (transition probability distribution) võib kujutada transitsioonimaatriksina, milles element p järjekorranumbriga (i, j) võrdub

p_{ij} = \Pr(X_{n+1}=j\mid X_n=i). \,

P on stohhastiline maatriks. Kui Markovi ahel on ajaliselt homogeenne (time-homogeneous) Markovi ahel, siis transitsioonimaatriks P on sõltumatu tähisest n ning k-astmelise transitsioonitõenäosuse võib arvutada transitsioonimaatriksi astmel k', Pk.

Olekujaotus (stationary distribution) π on (jada) vektor, mis rahuldab võrrandit

 \pi = \pi\mathbf{P}.\,

Teisisõnu, olekujaotus π on normaliseerimisel saadud transitsioonimaatriksi omadusvektor (normalized left eigenvector), mis on seotud omadusväärtusega (eigenvalue) 1.

Väärtust π võib vaadelda lineaarse (järelikult pideva) maatriksiga P seotud ühiksimpleksi (unit simplex) transformatsiooni fikseeritud punktina.

Iga pideva transformatsiooni (continuous transformation) puhul on ühiksimpleksil kindel punkt, milles alati eksisteerib olekujaotus, kuid üldiselt ei ole garanteeritud, et see on ainukordne. Ometi, kui Markovi ahel on redutseerimatu ja aperioodiline, eksisteerib ainukordne olekujaotus π. Lisaks läheneb (converges) Pk üheveeruline maatriks (rank-one matrix), milles iga rida on olekujaotus π

\lim_{k\rightarrow\infty}\mathbf{P}^k=\mathbf{1}\pi

kus 1 on veeru vektor (column vector) kõigi väärtuste jaoks, mis võrduvad 1. Seda väidab Perron-Frobeniuse teoreem. See tähendab, et aja möödudes "unustab" Markovi ahel oma algjaotuse ning läheneb oma olekujaotusele.

Pöörduv Markovi ahel[muuda | redigeeri lähteteksti]

Pöörduva (reversible) Markovi ahela idee tuleneb võimest "inverteerida" ("invert") tõenäosuse tingimuslikkust kasutavat Bayes' seadust:

\Pr(X_{n}=i\mid X_{n+1}=j) = \frac{\Pr(X_n = i, X_{n+1} = j)}{\Pr(X_{n+1} = j)}

 = \frac{\Pr(X_{n} = i)\Pr(X_{n+1} = j\mid X_n=i)}{\Pr(X_{n+1} = j)}. \,

Ilmneb, et aeg on pöörduv. Järelikult võib Markovi ahel olla pöörduv (reversible), kui see on π, nagu näiteks

\pi_i p_{i,j} = \pi_j p_{j,i}.\,

Seda tingimust tuntakse ka detailse tasakaalu tingimusena (detailed balance).

Summeerides (summing over) i annab

\sum_i \pi_i p_{i,j} = \pi_j\,

pöörduvate Markovi ahelate puhul, et π on alati olekujaotus.

Bernoulli skeem[muuda | redigeeri lähteteksti]

(A Bernoulli scheme)

Bernoulli skeem on Markovi ahela erijuhtumiks, kus transitsioonide tõenäosusmaatriksil (transition probability matrix) on identsed read, mis tähendab, et ka järgmine olek on sõltumatu käesolevast (lisaks sellele, et ta on sõltumatu mineviku olekutest). Ainult kahe võimaliku olekuga Bernoulli skeem on tuntud kui Bernoulli protsess.

Üldise olekuruumiga Markovi ahelad[muuda | redigeeri lähteteksti]

(Markov chains with general state space)


Rakendused[muuda | redigeeri lähteteksti]

Füüsika[muuda | redigeeri lähteteksti]

Katsetamine[muuda | redigeeri lähteteksti]

(Testing)

Järjestusteooria[muuda | redigeeri lähteteksti]

(Queueing theory)


Internetirakendused[muuda | redigeeri lähteteksti]

Statistika[muuda | redigeeri lähteteksti]

Majandusteadus[muuda | redigeeri lähteteksti]

Matemaatiline bioloogia[muuda | redigeeri lähteteksti]

Mänguteooria[muuda | redigeeri lähteteksti]

(Gambling)


Muusika[muuda | redigeeri lähteteksti]

Markovi ahelaid on kasutatud algoritmilisel komponeerimisel, kasutades selleks näiteks muusikatarkvara Open Music, CSound või Max.

Esimese tasandi järjestusega ahelate (first-order chain) puhul saavad olekutest heli väärtused ning igale helile konstrueeritakse tõenäosusvektor, saades nii üleminekute tõenäolise maatriksi (transition probability matrix). Algoritmi konstrueerimise eesmärgiks on toota üleminekute maatriksi väärtustel põhinevaid muusikaliste parameetrite väärtusi: näiteks MIDI väärtusi, helisagedusi hertsides, helivältuste suurusi või muude muusikaliste parameetrite väärtusi.

Esimese tasandi maatriks (1st-order matrix)
Heliklass A Cis Es
A 0.1 0.6 0.3
Cis 0.25 0.05 0.7
Es 0.7 0.3 0

Teise tasandi Markovi ahelaid (second-order Markov chain) võib kasutada, arvestades käesolevat ja ka eelmist olekut.

Teise tasandi maatriks (2nd-order matrix)
Note A D G
AA 0.18 0.6 0.22
AD 0.5 0.5 0
AG 0.15 0.75 0.1
DD 0 0 1
DA 0.25 0 0.75
DG 0.9 0.1 0
GG 0.4 0.4 0.2
GA 0.5 0.25 0.25
GD 1 0 0


Kõrgematel tasanditel, n-tasandi järjestusega ahelate ( nth-order chains) puhul rühmituvad algsed helid helide rühmadeks, 'purunedes' samal ajal juhuslikeks kujunditeks ja järgnevusteks. Sellised kõrgema tasandi ahelad genereerivad muusikalise fraasi tasemel struktuure, sel ajal kui esimese tasandi järjestusega süsteem toodab 'sihitut ekslemist'[1].

Pesapall[muuda | redigeeri lähteteksti]

Kirjandus: Markovi paroodiageneraatorid[muuda | redigeeri lähteteksti]

(Markov parody generators)

Markovi protsesse võib kasutada ka antud tekstikatkest pealiskaudsel vaatlusel reaalsena näivate uute tekstide genereerimiseks. Meetodit on kasutatud erinevate taasloovate "paroodiageneraatorite" tarkvara puhul (vt dissociated press, Jeff Harrison, Mark V Shaney, [2] [3] ).

Teooria ajalugu[muuda | redigeeri lähteteksti]

Andrei Markov vanem sai aastal 1906 nende protsesside esimesi tulemusi alguses puhtalt teoreetiliselt . Arvutuslikult lõpetatud seisundiruumide (countably infinite state spaces) üldistuse esitas Andrei Nikolajevitš Kolmogorov aastal 1936. Markovi ahelaid on seostatud Browni liikumisega ja ergoodilise hüpoteesiga, mis on ühtedeks tähtsamateks teemadeks 20.sajandi alguse füüsikas.


Vaata ka[muuda | redigeeri lähteteksti]

Kirjandus[muuda | redigeeri lähteteksti]

  1. Curtis Roads (ed.) (1996). The Computer Music Tutorial. MIT Press. ISBN 0262181584. 
  2. A Travesty Generator for Micros 
  3. The Virtual Muse: Experiments in Computer Poetry, ISBN 0819522392 
  • A.A. Markov. "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp 135-156, 1906.
  • A.A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reprinted in Appendix B of: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
  • Leo Breiman. Probability. Original edition published by Addison-Wesley, 1968; reprinted by Society for Industrial and Applied Mathematics, 1992. ISBN 0-89871-296-3. (See Chapter 7.)
  • J.L. Doob. Stochastic Processes. New York: John Wiley and Sons, 1953. ISBN 0-471-52369-0.
  • Booth, Taylor L. (1967). Sequential Machines and Automata Theory, 1st, New York: John Wiley and Sons, Inc.. Library of Congress Card Catalog Number 67-25924.  Extensive, wide-ranging book meant for specialists, written for both theoretical computer scientists as well as electrical engineers. With detailed explanations of state minimization techniques, FSMs, Turing machines, Markov processes, and undecidability. Excellent treatment of Markov processes pp.449ff. Discusses Z-transforms, D transforms in their context.
  • Kemeny, John G.; Hazleton Mirkil, J. Laurie Snell, Gerald L. Thompson (1959). Finite Mathematical Structures, 1st, Englewood Cliffs, N.J.: Prentice-Hall, Inc.. Library of Congress Card Catalog Number 59-12841.  Classical text. cf Chapter 6 Finite Markov Chains pp.384ff.

Välisviited[muuda | redigeeri lähteteksti]