Lineaarne korrelatsioonikordaja

Allikas: Vikipeedia

Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)

Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.

Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.

Omadused:

  • Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
  • Kui tunnused on kasvavalt seotud on r>0.
  • Kui tunnused on kahanevalt seotud, on r<0.
  • Kui tunnused on sõltumatud, siis r =0.
  • Nõrk seos: kordaja |r|< kui 0.3
  • Keskmine seos: kordaja 0.3< |r| < 0.7.
  • Tugev seos: kordaja |r|> 0.7.

Puudused:

  • Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
  • Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
  • Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.

Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.