Korrelatsioon vs kovariatsioon
Korrelatsioon ja kovariatsioon on teoreetilises statistikas tihed alt seotud mõisted. Need on olulised kahe juhusliku muutuja vahelise seose määramisel.
Mis on korrelatsioon?
Korrelatsioon on kahe muutuja vahelise seose tugevuse mõõt. Korrelatsioonikordaja kvantifitseerib ühe muutuja muutumise astet teise muutuja muutumise põhjal. Statistikas on korrelatsioon seotud sõltuvuse mõistega, mis on statistiline seos kahe muutuja vahel
Pearsoni korrelatsioonikordaja või lihts alt korrelatsioonikordaja r on väärtus vahemikus -1 kuni 1 (-1≤r≤+1). See on kõige sagedamini kasutatav korrelatsioonikordaja ja kehtib ainult muutujate vahelise lineaarse seose korral. Kui r=0 seost ei eksisteeri ja kui r≥0 on seos otseselt võrdeline; ühe muutuja väärtus suureneb teise suurenemisega. Kui r≤0 on seos pöördvõrdeline; üks muutuja väheneb, kui teine suureneb.
Lineaarsustingimuse tõttu saab muutujate vahelise lineaarse seose tuvastamiseks kasutada ka korrelatsioonikordajat r.
Mis on kovariatsioon?
Statistika teoorias on kovariatsioon mõõt, mis näitab, kui palju kaks juhuslikku muutujat koos muutuvad. Teisisõnu, kovariatsioon on kahe juhusliku muutuja vahelise korrelatsiooni tugevuse mõõt.
Teisest vaatenurgast võib näha, et korrelatsioon on lihts alt kovariatsiooni normaliseeritud versioon, kus kovariatsioon jagatakse kahe juhusliku suuruse standardhälbete korrutisega. Kovariatsiooni vahemik võib olla suur; seetõttu pole seda lihtne võrrelda. Sellest raskusest saab üle, viies kovariatsiooni väärtused vahemikku, kus seda saab võrrelda, normaliseerides (sarnaselt z-skooriga). Kuigi kovariatsioon ja dispersioon on omavahel seotud ül altoodud viisil, ei ole nende tõenäosusjaotused üksteisega lihtsal viisil seotud ja neid tuleb käsitleda eraldi.
Mis vahe on korrelatsioonil ja kovariatsioonil?
• Nii korrelatsioon kui ka kovariatsioon on kahe juhusliku muutuja vahelise seose mõõdikud. Korrelatsioon on kahe muutuja lineaarsuse tugevuse mõõt ja kovariatsioon on korrelatsiooni tugevuse mõõt.
• Korrelatsioonikordaja väärtused on vahemikus -1 kuni +1, samas kui kovariatsiooni vahemik ei ole konstantne, vaid võib olla positiivne või negatiivne. Kuid kui juhuslikud suurused on enne kovariatsiooni arvutamist standarditud, on kovariatsioon võrdne korrelatsiooniga ja selle väärtus on vahemikus -1 kuni +1.