Suurima tõepära meetod on statistikas laialt kasutatav meetod hinnangute leidmiseks. Suurima tõepära meetod on üldjuhul efektiivsem kui muud levinud meetodid.[1]
Olgu antud valim
jaotusest
, mis võib olla kas pidev või diskreetne. Tõepärafunktsiooniks nimetame avaldist
![{\displaystyle L(\theta )=\left\{{\begin{array}{c}f(x_{1};\theta )\cdot f(x_{2};\theta )\cdot ...\cdot f(x_{n};\theta ),{\text{pideval juhul,}}\\p(x_{1};\theta )\cdot p(x_{2};\theta )\cdot ...\cdot p(x_{n};\theta ),{\text{diskreetsel juhul,}}\end{array}}\right.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61afb7aece86547ba9f4bdedc3036aac8f1eccb9)
kus
tähistab jaotuse
tihedusfunktsiooni (pideval juhul) ja
tähistab
tõenäosusfunktsiooni
(diskreetsel juhul),
.[1]
Olgu
sõltumatud suurused ja
, siis
on valimi
saamise tõenäosus (diskreetsel juhul) või juhusliku vektori
tihedusfunktsiooni
väärtus punktis
(pideval juhul) antud
korral.
Realiseerunud valimi
korral on suurused
teadaolevad arvud ja
on üksnes
parameetri
funktsioon. Eesmärgiks on leida niisugune
väärtus parameeterruumist
, et
oleks maksimaalne. Ütleme, et vastav
väärtus on kõige tõepärasem vaadeldava valimi
jaoks (st ka vastav üldkogumi jaotus on kõige tõepärasem vaadeldava valimi jaoks).
Suurima tõepära printsiip – kõige tõepärasema üldkogumijaotuse määramine antud valimi jaoks.
Väärtust
, mida maksimeeritakse parameeterruumis
(
saavutab maksimaalse
väärtuse), nimetatakse parameetri
suurima tõepära hinnanguks:
![{\displaystyle L({\hat {\theta }})={\underset {\theta \in A}{\operatorname {max} }}\ L(\theta ).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/88fb75685f71d06f0ece15007ff9894d50490515)
Kui tahta leida suurima tõepära hinnangut praktiliselt, on tihti lihtsam kasutada tõepärafunktsiooni logaritmi. Logaritmi monotoonsuse tõttu saavutavad
ja
maksimumi samas
punktis, st määravad sama suurima tõepära hinnangu.
Logaritmiline tõepärafunktsioon on
[1]
Näide 1: Mündivise. Üldkogumijaotuseks on mündi visketulemuse (vapp, kiri) jaotus,
kus vapi tulemise tõenäosuseks on
ja kirja tulemise tõenäosuseks
. Olgu eelnevalt teada, et
Olgu meil kaks
vaatlust:
= vapp ja
= vapp. Kumb on tõepärasem hinnang parameetrile p, kas
või
Kirjutame välja tõepärafunktsiooni:
![{\displaystyle L(p)=P(X=x_{1})\cdot P(X=x_{2})=p^{2},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/08a518aea0e18221d772a08f77233e44ddd8d929)
millest saame, et
.
Kuna
, siis
on suurima tõepära hinnang
-le.[1]
Näide 2: Olgu üldkogumijaotus eksponentjaotusest
parameetriga
. Jaotusele vastav tihedusfunktsioon on
![{\displaystyle f(x;\theta )={\frac {1}{\theta }}e^{-{\frac {x}{\theta }}},x\geq 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/60730660e18012bec86e9db4ff2d49df2310ab35)
Olgu parameeter
tundmatu. Pole raske näidata, et
on antud jaotuse keskväärtus.
Olgu meil
vaatlust jaotusest:
![{\displaystyle 0.322,0.879,0.222,0.012.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ddb55b8b9c06dc9d3a26ee0e2e3b07de29a99713)
Leiame tõepärafunktsiooni
![{\displaystyle L(\theta )=\prod _{i=1}^{n}f(x_{i};\theta )={\frac {1}{\theta ^{n}}}e^{-{\frac {\sum _{i=1}^{n}}{\theta }}}={\frac {1}{\theta ^{4}}}e^{\frac {-1.435}{\theta }}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/797a9f8ca5a9dac3213e006299cb3f6bad3c2c84)
ja logaritmilise tõepärafunktsiooni:
![{\displaystyle l(\theta )=\ln L(\theta )=-4\ln \theta -{\frac {1.435}{\theta }}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3859c182948706664b00080371f2b4e3292166fd)
Paneme tähele, et tõepärafunktsioonid on
funktsioonid. Mõlemad funktsioonid saavutavad maksimumi
samal kohal, kuna logaritmfunktsioon on monotoonselt kasvav.
Maksimumi leidmiseks leiame tuletise,
![{\displaystyle {\frac {d}{d\theta }}l(\theta )=-{\frac {4}{\theta }}+{\frac {1.435}{\theta ^{2}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/05688c2513f60fe5ae2bf6b9b6ef0c05a83b5584)
Tuletise võrdsustamisel nulliga saame logaritmilise tõepärafunktsiooni maksimumpunkti, mis on ühtlasi parameetri
suurima tõepära hinnanguks,
.[1]
Logistilise regressiooni korral avaldub suurima tõepära hinnang järgmiselt:
![{\displaystyle LF=\prod _{i=1}^{n}\{P_{i}^{Y_{i}}*(1-P_{i})^{1-Y_{i}}\},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9bdf67a820da12777b2ebe515eefdc8be2b49ef4)
kus
on tõepära hinnang,
on vaadeldav väärtus
-l juhul ja
on ennustatud tõenäosus
-l juhul.
väärtused tulevad logistilise regressiooni mudelist ja valemist
, kus
on log-šansid, mis on määratud vabaliikme ja parameetri väärtuste
poolt. Eesmärk on leida
väärtused, mille tulemusel saadakse
ja
väärtused, mis maksimeerivad
-i.[2]