Kvartiil

Allikas: Vikipeedia

Kvartiilid on kirjeldavas statistikas tunnuse väärtused variatsioonireal, mis jagavad variatsioonirea neljaks ligikaudu võrdseks osaks.

  • Keskmine kvartiil ehk 2. kvartiil e. 50-protsentiil e 0,5 kvantiil ehk mediaan on tunnuse väärtus, millest suuremaid ja väiksemaid tunnuseid on variatsioonireas ligikaudu võrdselt.
  • Alumine kvartiil e. 1. kvartiil e. 25-protsentiil ehk 0,25 kvantiil (lühendid LQ ja Q1) on tunnuse väärtus, millest väiksemaid või võrdseid tunnuseid on ligikaudu 25%
  • Ülemine kvartiil e. 3. kvartiil e 75-protsentiil ehk 0,75 kvantiil (lühendid UQ ja Q3) on tunnuse väärtus, millest suuremaid või võrdseid tunnuseid on ligikaudu 25%

Ülemise ja alumise kvartiili vahele jääb 50% tunnuste väärtustest. Seda vahemikku nimetatakse kvartiilhaardeks.

Ülemist ja alumist kvartiili saab defineerida ka tõenäosuslikult – variatsioonirea 1. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus variatsioonireas on kõige rohkem 1/4. 3. kvartiil on selline tunnuse väärtus x, millest väiksemate väärtuste esinemise tõenäosus on kõige rohkem 3/4.

Ülemise ja alumise kvartiili arvutamise meetodeid[muuda | redigeeri lähteteksti]

Kvartiilide arvutamiseks on kasutusel erinevaid meetodeid, mis annavad pisut erinevaid tulemusi. Eristatakse nn. klassikalisi meetodeid, mis on mõeldud ennekõige kvartiilide arvutamiseks, ja meetodeid, mis on mõeldud protsentiilide arvutamiseks, kusjuures 25-protsentiil, 50-protsentiil ja 75-protsentiil vastavad vastavalt 1., 2. ja 3. kvartiilile.

Klassikalised meetodid[muuda | redigeeri lähteteksti]

Tukey' meetod[muuda | redigeeri lähteteksti]

Tukey' meetod on John Tukey' välja töötatud meetod, mille eesmärk oli teha kvartiilide leidmine võimalikult lihtsaks.

Selle meetodi järgi:

  • järjestatakse variatsioonirea elemendid väärtuste kasvamise järjekorras;
  • jagatakse variatsioonirida pooleks nii, et mõlemale poole jääb võrdne arv elemente (leitakse mediaan);
  • kui variatsioonireas on paaritu arv elemente, lisatakse mediaanväärtus mõlemale poolele
  • leitakse mõlema poole mediaan

Näiteks:

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. mediaan jaotab rea pooleks: 1, 2, 3, 4, - 5, 6, 7, 8    – mediaan on 4,5
2. alumine kvartiil: 1, 2, - 3, 4     - alumine kvartiil on 2,5
3. ülemine kvartiil: 5, 6, - 7, 8     - ülemine kvartiil on 6,5

Valemina:

Kui n on paaritu arv, siis LQ= (n+3)/4; UQ= (3n+1)/4;
Kui n on paarisarv, siis LQ= (n+2)/4; UQ= (3n+2)/4

kus n on elementide arv variatsioonireas

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
n=8, mis on paarisarv. Järelikult 
LQ=(8+2)/4= 2,5
UQ=(3×8+2)/4= 6,5


Moore'i & McCabe'i meetod[muuda | redigeeri lähteteksti]

Moore'i ja McCabe'i meetod on edasiarendus Tukey' meetodist. Kui variatsioonireas on paaritu arv elemente, siis erinevalt Tukey' meetodist ei lisata mediaanväärtust kummalegi poolele. Muul juhul on tulemus sama.

Kui n on paaritu arv, siis LQ= (n+1)/4; UQ=(3n+3)/4
Kui n on paarisarv, siis LQ= (n+2)/4; UQ=(3n+2)/4

kus n on elementide arv variatsioonireas

Mendenhalli & Sincichi meetod[muuda | redigeeri lähteteksti]

Selle meetodiga leitakse alumine kvartiil valemiga L = (n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+3)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.

Näiteks:

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. L= (8+1)/4= 2,25 -> L=2, alumine kvartiil on 2. element ehk 2
2. U= (3×8+3)/4= 6,75 -> L=7, ülemine kvartiil on 7. element ehk 7 

Mendenhalli & Sincichi 1. variatsioon[muuda | redigeeri lähteteksti]

Kasutusel on ka sama meetodi variatsioon, kus L ja Q väärtust ei ümardata, vaid leitakse lineaarse interpolatsiooni abil lähimate väärtuste vahele jääv sobiv väärtus. Näiteks kui L=2,25, siis leitakse teise (L täisosa) ja sellele järgneva (kolmanda) elemendi vahel väärtus, mis on 1/4 kaugusel (L väärtuse murdosa 0,25) 2. elemendi väärtusest. (Antud näites on 2. ja 3. elemendi vahel sobivas kohas 2,25)

Mendenhalli & Sincichi 2. variatsioon[muuda | redigeeri lähteteksti]

Kasutusel on ka sama meetodi variatsioon, kus L=(n+1)/4, kus n on elementide arv ja L näitab alumisele kvartiilile vastava elemendi järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse ülespoole. Ülemine kvartiil leitakse valemiga U = (3n+2)/4, kus n on elementide arv ja U näitab ülemise kvartiili järjekorranumbrit variatsioonireas. Tulemus ümardatakse lähima täisarvuni; kui väärtus jääb täpselt kahe täisarvu vahele, ümardatakse allapoole.

Freundi ja Perlesi meetod[muuda | redigeeri lähteteksti]

See on vähekasutatud meetod mille järgi L = (n+3)/4, kus n on elementide arv ja L-nda elemendi väärtus on alumine kvartiil. Kui L pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni. Ülemise kvartiili leidmisel U = (3n+1)/4, kus n on elementide arv ja U-nda elemendi väärtus on ülemine kvartiil. Kui U pole täisarv, kasutatakse väärtuse leidmiseks lineaarset interpolatsiooni.

Variatsioonirida elementidega {1, 2, 3, 4, 5, 6, 7, 8}
1. L=(8+3)/4= 2,75 alumine kvartiil on 2,75
2. U=(3×8+1)/4= 6,25 ülemine kvartiil on 6,25

Muud meetodid[muuda | redigeeri lähteteksti]

Muud meetodid on sarnased muude protsentiilide arvutamise meetoditega, kus leitakse vastavalt 25-protsentiili alumise kvantiili ja 75-protsentiili ülemise kvantiili jaoks.

Kirjandust[muuda | redigeeri lähteteksti]