Współczynnik korelacji Spearmana

Współczynnik korelacji Spearmana służy do badania zależności między danymi. Współczynnik korelacji Spearmana mierzy dowolną monotoniczną zależność. Współczynnik korelacji Spearmana jest ogólniejszy od współczynnika korelacji Pearsona, który mierzy tylko zależność liniową.

Np. Jeżeli w naszych danych X i Y zachodziłaby relacja \( Y = X^{2} \) to współczynnik Pearsona byłby bliski 0, a współczynnik Spearmana bliski 1.\(\)

Więcej o samej korelacji można przeczytać tutaj.

Definicja współczynnika korelacji Spearmana

\( \Large r_{s} = 1- \frac{6 \cdot \sum d^{2}_{i}}{n(n^{2}-1)} \)

n – liczba obserwacji (X i Y mają tyle samo obserwacji)

\( d_{i} \) – różnica między rangami X i Y : \( RX_{i} \) − \( RY_{i} \)

Czym są rangi Spearmana?

Rangi określają pozycję na której znajduje się dana obserwacja po uszeregowaniu rosnąco obserwacji. Dla wartości najmniejszej – ranga wynosi 1, dla wartości największej ranga wynosi n (gdzie n to liczba obserwacji). Rangi Spearmana wyznaczamy osobno dla X oraz dla Y.

W przypadku wystąpienia jednakowych wartości  zmiennych, należy przyporządkować im średnią arytmetyczną obliczoną z ich kolejnych numerów- pozycji, tzn. jeżeli mamy 2 takie same wartości na pozycji 2 i 3 to ich wspólną rangą będzie \( \frac{2+3}{2} =2.5 \)

Przykład rang Spearmana

Przypisz rangi Spearmana obserwacjom: 1, 3, 5, 3, 6, 5, 5, 2.

Najpierw uszeregujmy rosnąco obserwacje: 1, 2, 3, 3, 5, 5, 5, 6

Wartość 3 znajduje się na pozycjach numer 3 i 4 więc ranga Spearmana ma wartość:  \( R_{Xi} = \frac{3+4}{2} =3.5 \)

Wartość 5 znajduje się na pozycjach numer 5, 6 i 7 więc ranga Spearmana ma wartość:  \( R_{Xi} = \frac{5+6+7}{3} =6 \)

Wszystkie rangi Spearmana zostały zaprezentowane w tabelce:

Obserwacja12335556
Ranga Spearmana123.53.56668

Uwaga: Niektórzy podają odwrotną numerację rang Spearmana (tzn. od największej do najmniejszej). W obu przypadkach współczynnik korelacji Spearmana wyjdzie taki sam, ponieważ we wzorze liczymy różnicę rang między \( X_{i} \), a \( Y_{i} \), a różnica wyjdzie taka sama bez względu czy ponumerujemy obserwacje rosnąco, czy malejąco.

Interpretacja współczynnika korelacji:

Rodzaj korelacji:

  1. r > 0 korelacja dodatnia– gdy wartość X rośnie to Y też
  2. r = 0 brak korelacji– gdy X rośnie to Y czasem rośnie a czasem maleje
  3. r < 0 korelacja ujemna– gdy X rośnie to Y maleje

Siła korelacji dla |r|

  1. < 0.2 – brak związku liniowego
  2. 0.2 – 0.4 – słaba zależność
  3. 0.4 -0.7 – umiarkowana zależność
  4. 0.7 – 0.9 – dość silna zależność
  5. > 0.9 – bardzo silna zależność

Kiedy stosować współczynnik Spearmana, a kiedy Pearsona?

Współczynnik korelacji Pearsona jest szczególnym przypadkiem współczynnika korepacji Spearmana (tj. kiedy monotoniczna funkcja jest funkcją liniową).
Jeżeli chcemy sprawdzić, czy dane są skorelowane lepszym wyborem będzie policzenie współczynnika korelacji Spearmana, ponieważ nie ogranicza się on tylko do zależności liniowej (tak jak w powyższym przykładzie dla relacji \( Y = X^{2} \)).

Przewagą współczynnika korelacji Pearsona jest to, że w prosty sposób możemy użyć go do wyliczenia zależności, tj. możemy wyznaczyć równanie regresji, które powie nam dokładnie jak zachowuje się dana relacja (patrz Regresja liniowa/prosta).

Skoro wiemy już kiedy stosować współczynnik korelacji Spearmana, a kiedy korelacji Pearsona, rozwiążmy zadania na współczynnik korelacji Spearmana.

Zadanie 1:

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Spearmana:

DŁUGOŚĆ SERII X (SZT.)8090100100110120
KOSZT JEDNOSTKOWY Y (ZŁ.)12910986

Dalsza część treści jest płatna. Dokonaj zakupu lub zaloguj się

Regulamin dostępny tutaj
Zaloguj się lub Wykup
Sprawdź Wykup
Anuluj
30dniowy abonament, 69zł
Dostęp na 6 miesięcy, 79zł
30 dni, wszystkie treści + automatyczne rozwiązywanie zadań, 119zł
Dostęp na 6 miesięcy, wszystkie treści + automatyczne rozwiązywanie zadań, 129zł
Odblokuj dostęp do wszystkich treści na 30 dni.
Sprawdź
Odblokuj dostepDokonując zamówienia potwierdzasz zapoznanie się z regulaminem
Odblokuj dostęp do wszystkich treści na 6 miesięcy
Sprawdź
Odblokuj dostepDokonując zamówienia potwierdzasz zapoznanie się z regulaminem
Odblokuj dostęp do treści + automatycznego rozwiązywania zadań na 30 dni
Sprawdź
Odblokuj dostepDokonując zamówienia potwierdzasz zapoznanie się z regulaminem
Odblokuj dostęp do treści + automatycznego rozwiązywania zadań na 6 miesięcy
Sprawdź
Odblokuj dostepDokonując zamówienia potwierdzasz zapoznanie się z regulaminem
Anuluj

Zadanie 2:
Zbadano zależność między wysokością zarobków, a wynikiem z testu IQ, wyniki przedstawiono w tabeli. Oblicz siłę korelacji Spearmana pomiędzy zmiennymi.

Zarobki30003500300040001000050002000
IQ11511090115120130105

Treść dostępna po zalogowaniu

Zadanie 3:
Pewna firma turystyczna przeprowadziła, wśród swoich klientów,  ankietę dotyczącą preferowanego miejsca następnego wyjazdu.
Uszeregowane preferencje przedstawiają się następująco (gdzie 1 to najczęściej zaznaczana opcja, a 7-najrzadziej zaznaczana)

 IndieBrazyliaUSAFrancjaWlochyChinyTajlandia  
Mężczyźni4236751
Kobiety7531264

Oblicz współczynnik korelacji Spearmana i zinterpretuj wynik.

Treść dostępna po zalogowaniu

Komentarze:

  1. Fantastyczne tłumaczenie, przejrzałam wiele stron, ale tylko tu znalazłam jasny klarowny przykład a nie bełkot statystyczny.
    Tak można się uczyć i poszerzać wiedzę.
    Super, gratuluję i dziękuję

  2. Dlaczego zawsze tak jest, że osoby które zajmują się udzielaniem korepetycji i to nie tylko w przypadku statystyki, ale każdego przedmiotu, potrafią przekazać wiedzę w taki sposób, aby było to zrozumiałe i nie zostawiało w głowie tych myśli “a co to znaczy?/a jakby to wyglądało?” .
    Świetna robota! Dziękuję!

  3. Mogę prosić o wskazówkę kiedy należy wykorzystywać współczynnik Persona, a kiedy Spearmana? Rozumiem że dla tych samych danych można obliczyć oba te współczynniki ale czy są przypadki kiedy jeden z nich całkowicie się nie sprawdza?

  4. Cześć, jeśli związek ma charakter krzywoliniowy to liczyć Spearmen’em czy Pearson’em?

  5. Jeżeli związek ma charakter krzywoliniowy to warto liczyć współczynnik korelacji Spearmana. Jedyne o czym należy pamiętać to to, że krzywoliniowa zależność musi być monotoniczna.

  6. Mam pytanie – co jeśli szeregi nie są równe? Np. tak:

    Zmienna A: 45 79 89 90 70 47 76 89
    Zmienna B: 11 33 55 66 77 22

    Z góry dziękuję :)

  7. Aby policzyć korelację musisz wziąć wszystkie pary (Ai, Bi) gdzie Ai oraz Bi są dane.
    Z podanej sytuacji wnioskuję, że dla wartości Ai równych 76 i 89 nie ma wartości Bi.
    W tej sytuacji policzyłbym korelację bez tych wartości (czyli z pierwszych 6 par (Ai, Bi))

  8. Świetnie wytłumaczone, wiele stron przejrzałam, a tylko tutaj w jasny i klarowny sposób temat jest wyjaśniony. Dzięki wielkie!

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.