Kowariancja

Kowariancja jest miarą zależności liniowej (miara związku) między zmiennymi (danymi) X i Y. Miara kowariancji opiera się na badaniu wspólnej zmienności X i Y, tzn. czy odchylanie zmiennych od ich średnich jest podobne dla obu zmiennych. Jeżeli zależność liniowa nie występuje między X i Y to kowariancja będzie bliska 0 ( cov(X,Y) = 0 ). Jeżeli zależność jest mocna to wartość kowariancji będzie znacząco odległa od zera(w takim przypadku wartość może być ujemna albo dodatnia). Nie można jednak odpowiedzieć na pytanie jak duża powinna być w tym przypadku wartość kowariancji, ponieważ kowariancja jest miarą nieunormowaną, tzn. tylko na jej podstawie nie jesteśmy w stanie stwierdzić czy zależność liniowa jest mocna czy słaba.

Kowariancja jest miarą pośrednią, wykorzystywaną do wyliczania współczynnika korelacji, który jest już miarą unormowaną i na jego podstawie jesteśmy w stanie stwierdzić czy występuje i jak mocna jest zależność liniowa.

 

Definicja:

 \Large cov(X,Y) = \sum (X_{i}-\overline{X})(Y_{i}-\overline{Y}) = \sum X_{i} Y_{i} - \overline{X} \overline{Y}

gdzie

 X_{i} , Y_{i} - wartości zmiennych X i Y

 \overline{X} ,  \overline{Y} - średnie zmiennych X i Y

 

Kowariancja a korelacja:

Relacja między kowariancją(  cov(X,Y) ) a korelacją(  \large r_{xy} ) jest bardzo prosta i prezentuje ją poniższy wzór:

 \Large cov(X,Y) = r_{xy} \sigma_{x} \sigma_{y}

 

 \Large \sigma_{x} ,  \Large \sigma_{y} - odchylenia standardowe zmiennych X i Y

 

 

Przykład:

W tabeli poniżej zostały przedstawione oceny ze sprawdzianów z matematyki uzyskanych przez Marcina i Dominika. Czy istnieje zależność liniowa między wynikami otrzymanymi przez chłopców?

Marcin  X_{i} 35423
Dominik  Y_{i} 44323

 

Do policzenia kowariancji użyję wzoru po prawej stronie gdyż jest on nieco prostszy.
Najpierw policzmy średnie dla X i Y:

n = 5

 \overline{X} = \dfrac{1}{5}( 3 + 5 + 4 + 2 + 3 ) = \dfrac{1}{5} \cdot 17 = 3.4

 \overline{Y} = \dfrac{1}{5}( 4 + 4 + 3 + 2 + 3 ) = \dfrac{1}{5} \cdot 16 = 3.2

Pozostaje nam jeszcze do policzenia  \sum X_{i} Y_{i} :

Marcin  X_{i} 35423
Dominik  Y_{i} 44323
 X_{i} Y_{i}  3 \cdot 4 = 12 201249

 \sum X_{i} Y_{i} = 12 + 20 + 12 + 4 + 9 = 57

 

Teraz możemy przejść do obliczenia kowariancji:

 cov(X,Y) = \sum X_{i}Y_{i} - \overline{X} \overline{Y} = 57 - 3.2 \cdot 3.4 = 46.12

Kowariancja wyszła duża, czyli możemy założyć, że istnieje związek między ocenami z matematyki uzyskanymi przez Marcina i Damiana.

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany.