Korelacja

Co to jest korelacja?

\(\)Korelacja jest miarą określającą związek między zmiennymi. Jeżeli między zmiennymi jest korelacja to znaczy, że istnieje między nimi relacja (są jakoś powiązane ze sobą). Mówimy wtedy, że zmienne są skorelowane.

Charakterystyka korelacji

Wartość korelacji r jest liczbą z przedziału \( [-1, 1]\)

Analizując korelację bierzemy pod uwagę 2 czynniki:

Siła korelacji

Dla |r|:

  1. < 0.2 – brak korelacji między zmiennymi
  2. 0.2 – 0.4 – słaba korelacja
  3. 0.4 -0.7 – umiarkowana korelacja
  4. 0.7 – 0.9 – dość silna korelacja
  5. > 0.9 – bardzo silna korelacja

Kierunek korelacji (rodzaj zależności)

Gdy \( r > 0 \) to mamy dodatnią korelację między zmiennymi X i Y co oznacza, że gdy rośnie X to rośnie Y oraz gdy maleje X to maleje Y. Mówimy wtedy że zmienne są dodatnio skorelowane.

Gdy \( r < 0 \) to mamy ujemną korelację między zmiennymi X i Y co oznacza, że gdy rośnie X to maleje Y oraz gdy maleje X to rośnie Y. Mówimy wtedy, że zmienne są ujemnie skorelowane.

Jak wyliczyć korelację?

Korelację możemy wyliczyć na 2 sposoby:

  • Korelacja Pearsona – korelacja o charakterze liniowym. Więcej tutaj
  • Korelacja Spearmana- korelacja monotoniczna. Więcej tutaj

Ponieważ funkcja liniowa jest funkcją monotoniczną to w przypadku korelacji liniowej zarówno Korelacja Pearsona jak i Korelacja Spearmana wykażą korelację.

Wykres rozrzutu

Korelację można zaprezentować za pomocą wykresu rozrzutu. Wykres rozrzutu tworzymy poprzez nanoszenie odpowiadających sobie punktów (X,Y).

Wykres rozrzutu. Każda kropka reprezentuje jedną parę odpowiadających sobie punktów X i Y.

Wykres rozrzutu można użyć do wizualnej oceny korelacji, tzn. czy występuję korelacja oraz jaka korelacja (dodatnia, ujemna, liniowa, monotoniczna, etc.).

Rodzaje korelacji

Rożne rodzaje korelacji zaprezentowane za pomocą wykresu rozrzutu: 1 brak korelacji, 2 korelacja liniowa, 3 korelacja monotoniczna (ale nie liniowa), 4 korelacja (ale nie monotoniczna)

Korelacja a wynikanie

Korelacja nie bada związku przyczynowo skutkowego między zmiennymi. Używając korelacji nie możemy określić, czy:

  • Zmienna X wpływa na zmienną Y
  • Zmienna Y wpływa na zmienną X
  • Którakolwiek zmienna wpływa na drugą

Na przykład pozytywna korelacja między liczbą kupionych jagodzianek, a liczbą kupionych piw na plaży nie musi świadczyć o tym, że ze zwiększonej sprzedaży piw wynika zwiększona sprzedaż jagodzianek (albo na odwrót). Może to wynikać z tego, że w ciepłe dni wszystkie produkty sprzedają się lepiej na plaży.

Dodaj komentarz

Twój adres email nie zostanie opublikowany.