Kahe valimi t-test

Kahe valimi t-test on üks statistiline test, üks t-testidest. See kontrollib kahe valimi keskmiste järgi, kas kahe üldkogumi keskmised on omavahel võrdsed (alternatiiviks on see, et üks keskmistest on teisest väiksem).

Kahe valimi t-testil on kaks varianti:

kahe sõltumatu valimi jaoks, kusjuures mõlemal üldkogumil on sama standardhälve $\sigma$
kahe mittesõltumatu valimi jaoks.

Kui kaks sõltumatut valimit pärinevad erineva standardhälbega üldkogumitest, siis tuleb kasutada Welchi testi.

Testi idee[muuda | muuda lähteteksti]

Kahe valimi t-test kontrollib (lihtsaimal juhul) kahe valimi keskmiste ${\bar {x}}_{1}$ ja ${\bar {x}}_{2}$ järgi, kas vastavate üldkogumite keskmised on erinevad.

Joonis näitab kahte üldkogumit (mustad punktid) ja kahte valimit (sinised ja punased punktid), mis on üldkogumitest juhuslikult valitud. Valimite keskmised ${\bar {x}}_{1}$ ja ${\bar {x}}_{2}$ saab valimitest, arvutada, üldkogumite keskmised $\mu _{1}$ ja $\mu _{2}$ on aga tundmatut. Joonisel on üldkogumid nii konstrueritud, et nende keskmised on võrdsed: $\mu _{1}=\mu _{2}$ . Nüüd oletatakse ajaloosündmuste tõttu või teoreetilistel kaalutlustel, et üldkogumite keskväärtused $\mu _{1}$ ja $\mu _{2}$ on erinevad.

Lihtsaimal juhul kontrollib test

nullhüpotees]i, et üldkogumite keskmised on võrdsed ( $H_{0}:\,\mu _{1}=\mu _{2}$ ), *alternatiivhüpoteesi vastu, et üldkogumite keskmised on erinevad ( $H_{1}:\,\mu _{1}\neq \mu _{2}$ ).

Kui valimid on sobivalt valitud, näiteks lihtsate juhuvalimitena, siis on valimi 1 keskmine ${\bar {x}}_{1}$ suure tõenäosusega üldkogumi 1 keskmise $\mu _{1}$ lähedal ja valimi 2 keskmine ${\bar {x}}_{2}$ suure tõenäosusega üldkogumi 2 keskmise $\mu _{2}$ lähedal. See tähendab, kaugus punase ja musta punktiirjoone vahel ning kaugus sinise ja musta punktiirjoone vahel on suure tõenäosusega väikesed.

Kui ${\bar {x}}_{1}$ ja ${\bar {x}}_{2}$ vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on väike, siis on ka üldkogumite keskmised $\mu _{1}$ ja $\mu _{2}$ lähestikku. Siis ei saa nullhüpoteesi tagasi lükata.
Kui ${\bar {x}}_{1}$ ja ${\bar {x}}_{2}$ vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on suur, siis on ka üldkogumite keskmised $\mu _{1}$ ja $\mu _{2}$ teineteisest kaugel. Siis võib nullhüpoteesi tagasi lükata.

Täpsed arvutused on järgnevates jaotistes.

Kahe valimi t-test sõltumatute valimite korral[muuda | muuda lähteteksti]

Et uurida kahe võrdse tundmatu standardhälbega $\sigma$ üldkogumi keskmiste vahesid, kasutatakse kahe valimi t-testi. Selleks peavad mõlemad üldkogumid olema normaaljaotusega või valimid nii suured, et rakendub tsentraalne piirteoreem, (valimite suurus ületab 30). Testi jaoks valitakse n-elemendiline valim $x_{1},\ldots ,x_{n}$ 1. üldkogumist ja sellest sõltumatult m-elemendiline valim $y_{1},\ldots ,y_{m}$ 2. üldkogumist. Vastavate sõltumatute valimimuutujate $X_{1},\ldots ,X_{n}$ ja $Y_{1},\ldots ,Y_{m}$ keskväärtuste kohta kehtib siis $E(X_{i})=\mu _{X}$ ja $E(Y_{j})=\mu _{Y}$ , kus $\mu _{X}$ ja $\mu _{Y}$ on üldkogumite keskmised. Kui keskmiste vahe jaoks on ette antud arv $\omega _{0}$ , siis ütleb nullhüpotees, et

H_{0}:\,\mu _{X}-\mu _{Y}=\omega _{0},

ja alternatiivhüpotees, et

H_{1}:\,\mu _{X}-\mu _{Y}\neq \omega _{0}

.

Statistiliseks kriteeriumiks osutub

T={\frac {{\bar {X}}-{\bar {Y}}-\omega _{0}}{S{\sqrt {{\frac {1}{n}}+{\frac {1}{m}}}}}}={\sqrt {\frac {nm}{n+m}}}{\frac {{\bar {X}}-{\bar {Y}}-\omega _{0}}{S}},

kus $\scriptstyle {\bar {X}}$ ja $\scriptstyle {\bar {Y}}$ on vastavad valimikeskmised ja

S^{2}={\frac {(n-1)S_{X}^{2}+(m-1)S_{Y}^{2}}{n+m-2}}

kaalutud dispersioon, mis arvutatakse valimite dispersioonide $\scriptstyle S_{X}^{2}$ ja $\scriptstyle S_{Y}^{2}$ kaalutud keskmisena.

Statistilisel kriteeriumil $T$ on nullhüpoteesi korral $m+n-2$ vabadusastmega t-jaotus. Kontrollväärtus (statistilise kriteeriumi realisatsioon valimi korral) saadakse siis kujul

t={\sqrt {\frac {nm}{n+m}}}{\frac {{\bar {x}}-{\bar {y}}-\omega _{0}}{s}},

kus ${\bar {x}}$ ja ${\bar {y}}$ on valimist arvutatavad keskväärtused ja

s^{2}={\frac {(n-1)s_{x}^{2}+(m-1)s_{y}^{2}}{n+m-2}}

kaalutud dispersiooni realisatsioon, mis arvutatakse valimite dispersioonidest $\scriptstyle s_{x}^{2}$ ja $\scriptstyle s_{y}^{2}$ .

Olulisnivool $\alpha$ lükatakse nullhüpotees alternatiivi kasuks tagasi, kui

|t|>t(1-{\tfrac {1}{2}}\alpha ,\ n+m-2).

Teise võimalusena võib sama statistilise kriteeriumiga $T$ testida järgmisi hüpoteese:

$\!H_{0}:\mu _{X}-\mu _{Y}\leq \omega _{0}$ versus $\!H_{1}:\mu _{X}-\mu _{Y}>\omega _{0}$ ja nullhüpotees lükatakse tagasi, ui $t>t(1-\alpha ,\ m+n-2)$ .
$\!H_{0}:\mu _{X}-\mu _{Y}\geq \omega _{0}$ versus $\!H_{1}:\mu _{X}-\mu _{Y}<\omega _{0}$ ja nullhüpotees lükatakse tagasi, kui $t<-t(1-\alpha ,\ m+n-2)$ .

Märkus[muuda | muuda lähteteksti]

Kui üldkogumite dispersioonid ei ole võrdsed, siis tuleb teha Welchi test.

Näide 1[muuda | muuda lähteteksti]

Tuleb võrrelda väetisesorte. Selleks kasutatakse 25 väetisena ühesuurust portsjonit, nimelt $n=10$ portsjonit väetist sordist A ja $m=15$ portsjonit väetist sordist B. Eeldatake, et saakidel on normaaljaotus ja dispersioonid on võrdsed. Esimese sordi puhul on keskmine saak ${\bar {x}}=23{,}6$ valimi dispersiooniga $s_{x}^{2}=9{,}5$ ja teise sordi puhul on keskmine saak ${\bar {y}}=20{,}1$ dispersiooniga $s_{y}^{2}=8{,}9$ . Kaalutud keskmiseks saame

s^{2}={\frac {9\cdot 9{,}5+14\cdot 8{,}9}{10+15-2}}=9{,}135

.

Siit saame kontrollväärtuse

t={\sqrt {\frac {10\cdot 15}{10+15}}}\cdot {\frac {23{,}6-20{,}1}{\sqrt {9{,}135}}}=2{,}837

.

See väärtus on suurem kui $10+15-2=23$ vabadusastmega t-jaotuse 0,975-kvantiil $t(0{,}975;\ 23)=2{,}069$ . Järelikult saab $95\%$ -ise usaldusega väita, et väetisesortide toimes on erinevus.

Kahe valimi t-test mittesõltumatute valimite korral (paarisvõrdluse t-test)[muuda | muuda lähteteksti]

Siin on $x_{1},x_{2},\dots ,x_{n}$ und $y_{1},y_{2},\dots ,y_{n}$ kaks paarikaupa erinevat valimit, mis on saadud näiteks samade uuritavate üksuste kahest mõõtmisest (korduvmõõtmine). Valimid võivad olla paarikaupa mittesõltumatud ka muudel põhjustel, näiteks kui $x$ -i ja $y$ -i väärtused on partnerluses olevate naiste ja meeste näidud ning huvi pakuvad soolised erinevused.

Selleks et testida nullhüpoteesi, et normaaljaotusega üldkogumil on võrdsed keskmised, võib testida ühe valimi t-testi abil hüpoteesi, et vahede $d_{i}=x_{i}-y_{i}$ keskmine on null. Praktikas peab väiksemate valimite ( $n\leq 30$ ) korral olema täidetud tingimus, et vahedel on üldkogumis normaaljaotus. Piisavalt suurte valimite korral jaotuvad paaride vahed ligikaudselt normaaljaotusega ümber üldkogumi vahe aritmeetilise keskmise. Tingimuste täidetuse suhtes ei ole t-test kuigi tundlik.^[1]

Näide 2[muuda | muuda lähteteksti]

Et testida uut ravimeetodit kolesterooli taseme alandamiseks, määratakse 10 katsealusel kolesterooli tase enne ja pärast ravi. Saadakse järgmised näidud:

Enne ravi:	223	259	248	220	287	191	229	270	245	201
Pärast ravi:	220	244	243	211	299	170	210	276	252	189
Vahe:	3	15	5	9	−12	21	19	−6	−7	12

Näitude vahede aritmeetiline keskmine on ${\bar {d}}=5{,}9$ ja valimi standardhälve on $s_{d}=11{,}3866$ . Kontrollväärtuseks saame

t={\sqrt {10}}{\frac {5{,}9}{11{,}3866}}=1{,}6385

.

Et $t(0{,}975;\ 9)=2{,}2622$ , siis $|t|\leq t(0{,}975;\ 9)$ . Seega ei saa nullhüpoteesi, et kolesteriini taseme keskväärtused on enne ja pärast ravi võrdsed, nii et ravil pole toimet, olulisusnivool $\alpha =5\%$ tagasi lükata. Et $t<t(0{,}95;\ 9)=1{,}8331$ , siis ka ühepoolne alternatiiv, et ravi alandab kolesterooli taset, statistiliselt oluline. Kui ravil üldse toime on, pole see nii suur, et seda võiks nii väikse valimi pealt avastada.

Welchi test[muuda | muuda lähteteksti]

Pikemalt artiklis Welchi test

Welchi testi puhul arvutatakse statistiline kriteerium sarnaselt nagu kahe valimi t-testi puhul:

T={\frac {{\bar {X}}-{\bar {Y}}-\omega _{0}}{\sqrt {{\frac {S_{X}^{2}}{n}}+{\frac {S_{Y}^{2}}{m}}}}}\approx t_{\nu }.

Ent sellel kriteeriumil ei ole nullhüpoteesi korral t-jaotust, vaid seda lähendatakse t-jaotuse abil vabadusastmete arvu muutmise teel (vaata ka Behrensi-Fisheri probleem):

\nu ={\left({\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}\right)^{2} \over {\frac {1}{n-1}}\left({\frac {s_{x}^{2}}{n}}\right)^{2}+{\frac {1}{m-1}}\left({\frac {s_{y}^{2}}{m}}\right)^{2}},

kus $s_{x}$ ja $s_{y}$ on üldkogumite standardhälvete hinnangud valimite järgi ning $n$ ja $m$ on valimite suurused.

Kuigi Welchi test on välja töötatud spetsiaalselt juhtumiks, kus $\sigma _{X}\neq \sigma _{Y}$ , ei tööta ta hästi, kui vähemalt üks jaotus on mittenormaalne ning juhtumite arvud on väikesed ja väga erinevad $n\neq m$ ). ^[2]^[3]

Alternatiivsed testid[muuda | muuda lähteteksti]

t-testi kasutatakse selleks, et testida hüpoteese ühe või kahe tundmatu standardhälbega normaaljaotusega üldkogumitest võetud valimi keskväärtuste kohta.

Eeldust, et kumbki rühm omaette on normaaljaotusega, saab kontrollida Shapiro-Wilki testiga või Kolmogorovi-Smirnovi testiga. Kui normaaljaotus puudub, võib t-testi asemel kasutada mitteparameetrilisi teste, näiteks Wilcoxoni-Manni-Whitney testi ehk Manni-Whitney U-kriteeriumi ehk Wilcoxoni astaksummatesti sõltumatute valimite korral või Wilcoxoni astakmärgitesti paarikaupa seotud valimite korral. Lihtne alternatiivne meetod kiireks hindamiseks on Tukey kiire test.
Kui on tarvis testida keskväärtuste võrdsust rohkem kui kahe normaaljaotusega valimi puhul, võib kasutada dispersioonanalüüsi.
Kui tuleb võrrelda keskväärtusi teadaoleva standardhälbega normaaljaotusega valimite puhul, siis võib kasutada Gaußi teste.

Viited[muuda | muuda lähteteksti]

↑ Jürgen Bortz. Statistik für Human- und Sozialwissenschaftler, 6. trükk, Springer: Berlin 2005, ISBN 3-540-21271-X, lk 142.
↑ R. R. Wilcox. Statistics for the Social Sciences, Academic Press Inc 1996, ISBN 978-0127515403.}}
↑ D. G. Bonnet, R. M. Price. Statistical inference for a linear function of medians: Confidence intervals, hypothesis testing, and sample size requirements. – Psychological Methods, kd 7, nr 3, 2002.

Välislingid[muuda | muuda lähteteksti]

Võimalus teha t-teste

[ZoEZb-1] Jürgen Bortz. Statistik für Human- und Sozialwissenschaftler, 6. trükk, Springer: Berlin 2005, ISBN 3-540-21271-X, lk 142.

[mz9NE-2] R. R. Wilcox. Statistics for the Social Sciences, Academic Press Inc 1996, ISBN 978-0127515403.}}

[hqjwJ-3] D. G. Bonnet, R. M. Price. Statistical inference for a linear function of medians: Confidence intervals, hypothesis testing, and sample size requirements. – Psychological Methods, kd 7, nr 3, 2002.

[1]

[2]

[3]