Współczynnik korelacji Spearmana służy do badania zależności między danymi. Współczynnik korelacji Spearmana mierzy dowolną monotoniczną zależność. Współczynnik korelacji Spearmana jest ogólniejszy od współczynnika korelacji Pearsona, który mierzy tylko zależność liniową.
Np. Jeżeli w naszych danych X i Y zachodziłaby relacja \( Y = X^{2} \) to współczynnik Pearsona byłby bliski 0, a współczynnik Spearmana bliski 1.\(\)
Więcej o samej korelacji można przeczytać tutaj.
Definicja współczynnika korelacji Spearmana
\( \Large r_{s} = 1- \frac{6 \cdot \sum d^{2}_{i}}{n(n^{2}-1)} \)
n – liczba obserwacji (X i Y mają tyle samo obserwacji)
\( d_{i} \) – różnica między rangami X i Y : \( RX_{i} \) − \( RY_{i} \)
Czym są rangi Spearmana?
Rangi określają pozycję na której znajduje się dana obserwacja po uszeregowaniu rosnąco obserwacji. Dla wartości najmniejszej – ranga wynosi 1, dla wartości największej ranga wynosi n (gdzie n to liczba obserwacji). Rangi Spearmana wyznaczamy osobno dla X oraz dla Y.
W przypadku wystąpienia jednakowych wartości zmiennych, należy przyporządkować im średnią arytmetyczną obliczoną z ich kolejnych numerów- pozycji, tzn. jeżeli mamy 2 takie same wartości na pozycji 2 i 3 to ich wspólną rangą będzie \( \frac{2+3}{2} =2.5 \)
Przykład rang Spearmana
Przypisz rangi Spearmana obserwacjom: 1, 3, 5, 3, 6, 5, 5, 2.
Najpierw uszeregujmy rosnąco obserwacje: 1, 2, 3, 3, 5, 5, 5, 6
Wartość 3 znajduje się na pozycjach numer 3 i 4 więc ranga Spearmana ma wartość: \( R_{Xi} = \frac{3+4}{2} =3.5 \)
Wartość 5 znajduje się na pozycjach numer 5, 6 i 7 więc ranga Spearmana ma wartość: \( R_{Xi} = \frac{5+6+7}{3} =6 \)
Wszystkie rangi Spearmana zostały zaprezentowane w tabelce:
Obserwacja | 1 | 2 | 3 | 3 | 5 | 5 | 5 | 6 |
---|---|---|---|---|---|---|---|---|
Ranga Spearmana | 1 | 2 | 3.5 | 3.5 | 6 | 6 | 6 | 8 |
Uwaga: Niektórzy podają odwrotną numerację rang Spearmana (tzn. od największej do najmniejszej). W obu przypadkach współczynnik korelacji Spearmana wyjdzie taki sam, ponieważ we wzorze liczymy różnicę rang między \( X_{i} \), a \( Y_{i} \), a różnica wyjdzie taka sama bez względu czy ponumerujemy obserwacje rosnąco, czy malejąco.
Interpretacja współczynnika korelacji:
Rodzaj korelacji:
- r > 0 korelacja dodatnia– gdy wartość X rośnie to Y też
- r = 0 brak korelacji– gdy X rośnie to Y czasem rośnie a czasem maleje
- r < 0 korelacja ujemna– gdy X rośnie to Y maleje
Siła korelacji dla |r|
- < 0.2 – brak związku liniowego
- 0.2 – 0.4 – słaba zależność
- 0.4 -0.7 – umiarkowana zależność
- 0.7 – 0.9 – dość silna zależność
- > 0.9 – bardzo silna zależność
Kiedy stosować współczynnik Spearmana, a kiedy Pearsona?
Współczynnik korelacji Pearsona jest szczególnym przypadkiem współczynnika korepacji Spearmana (tj. kiedy monotoniczna funkcja jest funkcją liniową).
Jeżeli chcemy sprawdzić, czy dane są skorelowane lepszym wyborem będzie policzenie współczynnika korelacji Spearmana, ponieważ nie ogranicza się on tylko do zależności liniowej (tak jak w powyższym przykładzie dla relacji \( Y = X^{2} \)).
Przewagą współczynnika korelacji Pearsona jest to, że w prosty sposób możemy użyć go do wyliczenia zależności, tj. możemy wyznaczyć równanie regresji, które powie nam dokładnie jak zachowuje się dana relacja (patrz Regresja liniowa/prosta).
Skoro wiemy już kiedy stosować współczynnik korelacji Spearmana, a kiedy korelacji Pearsona, rozwiążmy zadania na współczynnik korelacji Spearmana.
Zadanie 1:
Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Spearmana:
DŁUGOŚĆ SERII X (SZT.) | 80 | 90 | 100 | 100 | 110 | 120 |
KOSZT JEDNOSTKOWY Y (ZŁ.) | 12 | 9 | 10 | 9 | 8 | 6 |
Zadanie 2:
Zbadano zależność między wysokością zarobków, a wynikiem z testu IQ, wyniki przedstawiono w tabeli. Oblicz siłę korelacji Spearmana pomiędzy zmiennymi.
Zarobki | 3000 | 3500 | 3000 | 4000 | 10000 | 5000 | 2000 |
---|---|---|---|---|---|---|---|
IQ | 115 | 110 | 90 | 115 | 120 | 130 | 105 |
Zadanie 3:
Pewna firma turystyczna przeprowadziła, wśród swoich klientów, ankietę dotyczącą preferowanego miejsca następnego wyjazdu.
Uszeregowane preferencje przedstawiają się następująco (gdzie 1 to najczęściej zaznaczana opcja, a 7-najrzadziej zaznaczana)
Indie | Brazylia | USA | Francja | Wlochy | Chiny | Tajlandia | |||
---|---|---|---|---|---|---|---|---|---|
Mężczyźni | 4 | 2 | 3 | 6 | 7 | 5 | 1 | ||
Kobiety | 7 | 5 | 3 | 1 | 2 | 6 | 4 |
Oblicz współczynnik korelacji Spearmana i zinterpretuj wynik.
Fantastyczne tłumaczenie, przejrzałam wiele stron, ale tylko tu znalazłam jasny klarowny przykład a nie bełkot statystyczny.
Tak można się uczyć i poszerzać wiedzę.
Super, gratuluję i dziękuję
Super wytłumaczone !
Dlaczego zawsze tak jest, że osoby które zajmują się udzielaniem korepetycji i to nie tylko w przypadku statystyki, ale każdego przedmiotu, potrafią przekazać wiedzę w taki sposób, aby było to zrozumiałe i nie zostawiało w głowie tych myśli “a co to znaczy?/a jakby to wyglądało?” .
Świetna robota! Dziękuję!
Dzieki Tobie zdalem statystyke, krotko, zwiezle i na temat
Proszę i dziękuję za dobre słowo.
bardzo dobrze i jasno napisane!
Mogę prosić o wskazówkę kiedy należy wykorzystywać współczynnik Persona, a kiedy Spearmana? Rozumiem że dla tych samych danych można obliczyć oba te współczynniki ale czy są przypadki kiedy jeden z nich całkowicie się nie sprawdza?
Jasne, już wrzucam wyjaśnienie do tekstu.
Cześć, jeśli związek ma charakter krzywoliniowy to liczyć Spearmen’em czy Pearson’em?
Jeżeli związek ma charakter krzywoliniowy to warto liczyć współczynnik korelacji Spearmana. Jedyne o czym należy pamiętać to to, że krzywoliniowa zależność musi być monotoniczna.
(5+6+7)/2 to 5? Chyba nie do konca
Prawda, poprawione :)
Mam pytanie – co jeśli szeregi nie są równe? Np. tak:
Zmienna A: 45 79 89 90 70 47 76 89
Zmienna B: 11 33 55 66 77 22
Z góry dziękuję :)
Aby policzyć korelację musisz wziąć wszystkie pary (Ai, Bi) gdzie Ai oraz Bi są dane.
Z podanej sytuacji wnioskuję, że dla wartości Ai równych 76 i 89 nie ma wartości Bi.
W tej sytuacji policzyłbym korelację bez tych wartości (czyli z pierwszych 6 par (Ai, Bi))
Świetnie wytłumaczone, wiele stron przejrzałam, a tylko tutaj w jasny i klarowny sposób temat jest wyjaśniony. Dzięki wielkie!
Dzięki :)