Kowariancja jest miarą zależności liniowej (miara związku) między zmiennymi (danymi) X i Y. Miara kowariancji opiera się na badaniu wspólnej zmienności X i Y, tzn. czy odchylanie zmiennych od ich średnich jest podobne dla obu zmiennych. Jeżeli zależność liniowa nie występuje między X i Y to kowariancja będzie bliska 0 ( cov(X,Y) = 0 ). Jeżeli zależność jest mocna to wartość kowariancji będzie znacząco odległa od zera(w takim przypadku wartość może być ujemna albo dodatnia). Nie można jednak odpowiedzieć na pytanie jak duża powinna być w tym przypadku wartość kowariancji, ponieważ kowariancja jest miarą nieunormowaną, tzn. tylko na jej podstawie nie jesteśmy w stanie stwierdzić czy zależność liniowa jest mocna czy słaba.
Kowariancja jest miarą pośrednią, wykorzystywaną do wyliczania współczynnika korelacji, który jest już miarą unormowaną i na jego podstawie jesteśmy w stanie stwierdzić czy występuje i jak mocna jest zależność liniowa.
Definicja:
\( cov(X,Y) = \frac{1}{n}\sum (X_{i}-\overline{X})(Y_{i}-\overline{Y}) = \frac{1}{n}\sum X_{i} Y_{i} – \overline{X} \overline{Y} \)
\( X_{i} \) ,\( Y_{i} \) – wartości zmiennych X i Y
\( \overline{X} \) , \( \overline{Y} \) – średnie zmiennych X i Y
Kowariancja a korelacja:
Relacja między kowariancją( \( cov(X,Y) \) ) a korelacją( \( r_{xy} \) ) jest bardzo prosta i prezentuje ją poniższy wzór:
\( cov(X,Y) = r_{xy} \sigma_{x} \sigma_{y} \)
\( \sigma_{x} \), \( \sigma_{y} \) – odchylenia standardowe zmiennych X i Y
Zadanie:
W tabeli poniżej zostały przedstawione oceny ze sprawdzianów z matematyki uzyskanych przez Marcina i Dominika. Oblicz kowariancję.
Marcin \( X_{i} \) | 3 | 5 | 4 | 2 | 3 |
Dominik \( Y_{i} \) | 4 | 4 | 3 | 2 | 3 |