Lineaarne korrelatsioonikordaja

Allikas: Vikipeedia

Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)

Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.

Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.

Matemaatiline definitsioon[muuda | muuda lähteteksti]

Lineaarne korrelatsioonikordaja r avaldub kujul[1]ː

,

kus n on juhuslike suuruste X ja Y väärtuste ja paaride arv (valimi maht), ja aritmeetilised keskmised ning ja vastavad standardhälbed.

Omadused[muuda | muuda lähteteksti]

  • Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
  • Kui tunnused on kasvavalt seotud on r>0.
  • Kui tunnused on kahanevalt seotud, on r<0.
  • Kui tunnused on sõltumatud, siis r =0.
  • Nõrk seos: kordaja |r|< kui 0.3
  • Keskmine seos: kordaja 0.3< |r| < 0.7.
  • Tugev seos: kordaja |r|> 0.7.

Puudused[muuda | muuda lähteteksti]

  • Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
  • Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
  • Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.

Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.

Vaata ka[muuda | muuda lähteteksti]

Viited[muuda | muuda lähteteksti]

  1. Ako Sauga (2020). Statistika õpik majanduseriala üliõpilastele. Tallinn: Tallinna Tehnikaülikooli kirjastus. Lk 398. ISBN 978-9949-83-519-5.