Kahe valimi t-test

Allikas: Vikipeedia
Jump to navigation Jump to search

Kahe valimi t-test on üks statistiline test, üks t-testidest. See kontrollib kahe valimi keskmiste järgi, kas kahe üldkogumi keskmised on omavahel võrdsed (alternatiiviks on see, et üks keskmistest on teisest väiksem).

Kahe valimi t-testil on kaks varianti:

  • kahe sõltumatu valimi jaoks, kusjuures mõlemal üldkogumil on sama standardhälve
  • kahe mittesõltumatu valimi jaoks.

Kui kaks sõltumatut valimit pärinevad erineva standardhälbega üldkogumitest, siis tuleb kasutada Welchi testi.

Testi idee[muuda | muuda lähteteksti]

Kahe valimi t-test kontrollib (lihtsaimal juhul) kahe valimi keskmiste ja järgi, kas vastavate üldkogumite keskmised on erinevad.

Joonis näitab kahte üldkogumit (mustad punktid) ja kahte valimit (sinised ja punased punktid), mis on üldkogumitest juhuslikult valitud. Valimite keskmised ja saab valimitest, arvutada, üldkogumite keskmised ja on aga tundmatut. Joonisel on üldkogumid nii konstrueritud, et nende keskmised on võrdsed: . Nüüd oletatakse ajaloosündmuste tõttu või teoreetilistel kaalutlustel, et üldkogumite keskväärtused ja on erinevad.

Lihtsaimal juhul kontrollib test

  • nullhüpotees]i, et üldkogumite keskmised on võrdsed (), *alternatiivhüpoteesi vastu, et üldkogumite keskmised on erinevad ().
Two sample ttest.svg

Kui valimid on sobivalt valitud, näiteks lihtsate juhuvalimitena, siis on valimi 1 keskmine suure tõenäosusega üldkogumi 1 keskmise lähedal ja valimi 2 keskmine suure tõenäosusega üldkogumi 2 keskmise lähedal. See tähendab, kaugus punase ja musta punktiirjoone vahel ning kaugus sinise ja musta punktiirjoone vahel on suure tõenäosusega väikesed.

  • Kui ja vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on väike, siis on ka üldkogumite keskmised ja lähestikku. Siis ei saa nullhüpoteesi tagasi lükata.
  • Kui ja vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on suur, siis on ka üldkogumite keskmised ja teineteisest kaugel. Siis võib nullhüpoteesi tagasi lükata.

Täpsed arvutused on järgnevates jaotistes.

Kahe valimi t-test sõltumatute valimite korral[muuda | muuda lähteteksti]

Et uurida kahe võrdse tundmatu standardhälbega üldkogumi keskmiste vahesid, kasutatakse kahe valimi t-testi. Selleks peavad mõlemad üldkogumid olema normaaljaotusega või valimid nii suured, et rakendub tsentraalne piirteoreem, (valimite suurus ületab 30). Testi jaoks valitakse n-elemendiline valim 1. üldkogumist ja sellest sõltumatult m-elemendiline valim 2. üldkogumist. Vastavate sõltumatute valimimuutujate ja keskväärtuste kohta kehtib siis ja , kus ja on üldkogumite keskmised. Kui keskmiste vahe jaoks on ette antud arv , siis ütleb nullhüpotees, et

ja alternatiivhüpotees, et

.

Statistiliseks kriteeriumiks osutub

kus ja on vastavad valimikeskmised ja

kaalutud dispersioon, mis arvutatakse valimite dispersioonide ja kaalutud keskmisena.

Statistilisel kriteeriumil on nullhüpoteesi korral vabadusastmega t-jaotus. Kontrollväärtus (statistilise kriteeriumi realisatsioon valimi korral) saadakse siis kujul

kus ja on valimist arvutatavad keskväärtused ja

kaalutud dispersiooni realisatsioon, mis arvutatakse valimite dispersioonidest ja .

Olulisnivool lükatakse nullhüpotees alternatiivi kasuks tagasi, kui

Teise võimalusena võib sama statistilise kriteeriumiga testida järgmisi hüpoteese:

  • versus ja nullhüpotees lükatakse tagasi, ui .
  • versus ja nullhüpotees lükatakse tagasi, kui .

Märkus[muuda | muuda lähteteksti]

Kui üldkogumite dispersioonid ei ole võrdsed, siis tuleb teha Welchi test.

Näide 1[muuda | muuda lähteteksti]

Tuleb võrrelda väetisesorte. Selleks kasutatakse 25 väetisena ühesuurust portsjonit, nimelt  portsjonit väetist sordist A ja  portsjonit väetist sordist B. Eeldatake, et saakidel on normaaljaotus ja dispersioonid on võrdsed. Esimese sordi puhul on keskmine saak valimi dispersiooniga ja teise sordi puhul on keskmine saak dispersiooniga . Kaalutud keskmiseks saame

.

Siit saame kontrollväärtuse

.

See väärtus on suurem kui vabadusastmega t-jaotuse 0,975-kvantiil . Järelikult saab -ise usaldusega väita, et väetisesortide toimes on erinevus.

Kahe valimi t-test mittesõltumatute valimite korral (paarisvõrdluse t-test)[muuda | muuda lähteteksti]

Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.
Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.

Siin on und kaks paarikaupa erinevat valimit, mis on saadud näiteks näiteks samade uuritavate üksuste kahest mõõtmisest (korduvmõõtmine). Valimid võivad olla paarikaupa mittesõltumatud ka muudel põhjustel, näiteks kui -i ja -i väärtused on partnerluses olevate naiste ja meeste näidud ning huvi pakuvad soolised erinevused.

Selleks et testida nullhüpoteesi, et normaaljaotusega üldkogumil on võrdsed keskmised, võib testida ühe valimi t-testi abil hüpoteesi, et vahede keskmine on null. Praktikas peab väiksemate valimite () korral olema täidetud tingimus, et vahedel on üldkogumis normaaljaotus. Piisavalt suurte valimite korral jaotuvad paaride vahed ligikaudselt normaaljaotusega ümber üldkogumi vahe aritmeetilise keskmise. Tingimuste täidetuse suhtes ei ole t-test kuigi tundlik.[1]

Näide 2[muuda | muuda lähteteksti]

Et testida uut ravimeetodit kolesterooli taseme alandamiseks, määratakse 10 katsealusel kolesterooli tase enne ja pärast ravi. Saadakse järgmised näidud:

Enne ravi: 223 259 248 220 287 191 229 270 245 201
Pärast ravi: 220 244 243 211 299 170 210 276 252 189
Vahe: 3 15 5 9 −12 21 19 −6 −7 12

Näitude vahede aritmeetiline keskmine on ja valimi standardhälve on . Kontrollväärtuseks saame

.

Et , siis . Seega ei saa nullhüpoteesi, et kolesteriini taseme keskväärtused on enne ja pärast ravi võrdsed, nii et ravil pole toimet, olulisusnivool tagasi lükata. Et , siis ka ühepoolne alternatiiv, et ravi alandab kolesterooli taset, statistiliselt oluline. Kui ravil üldse toime on, pole see nii suur, et seda võiks nii väikse valimi pealt avastada.

Welchi test[muuda | muuda lähteteksti]

Next.svg Pikemalt artiklis Welchi test.

Welchi testi puhul arvutatakse statistiline kriteerium sarnaselt nagu kahe valimi t-testi puhul:

Ent sellel kriteeriumil ei ole nullhüpoteesi korral t-jaotust, vaid seda lähendatakse t-jaotuse abil vabadusastmete arvu muutmise teel (vaata ka Behrensi-Fisheri probleem):

kus ja on üldkogumite standardhälvete hinnangud valimite järgi ning ja on valimite suurused.

Kuigi Welchi test on välja töötatud spetsiaalselt juhtumiks, kus , ei tööta ta hästi, kui vähemalt üks jaotus on mittenormaalne ning juhtumite arvud on väikesed ja väga erinevad ). [2][3]

Alternatiivsed testid[muuda | muuda lähteteksti]

t-testi kasutatakse selleks, et testida hüpoteese ühe või kahe tundmatu standardhälbega normaaljaotusega üldkogumitest võetud valimi keskväärtuste kohta.

Välislingid[muuda | muuda lähteteksti]

Viited[muuda | muuda lähteteksti]

  1. Jürgen Bortz. Statistik für Human- und Sozialwissenschaftler, 6. trükk, Springer: Berlin 2005, ISBN 3-540-21271-X, lk 142.
  2. R. R. Wilcox. Statistics for the Social Sciences, Academic Press Inc 1996, ISBN 978-0127515403.}}
  3. D. G. Bonnet, R. M. Price. Statistical inference for a linear function of medians: Confidence intervals, hypothesis testing, and sample size requirements. – Psychological Methods, kd 7, nr 3, 2002.