Współczynniki zbieżności i determinacji

\(\)Współczynnik zbieżności oraz współczynnik determinacji są ściśle związane z analizą regresji liniowej. Załóżmy, że wartości \( X_{i} \in [0, 10] \) oraz że funkcja regresji liniową jest dana wzorem:

\( Y = 2 \cdot X + 20 \)

Jakiej wartości Y spodziewamy się dla X = 11?
Licząc ze wzoru wychodzi nam, że \( y = 2 \cdot 11 + 20 = 42 \)

A jakiej wartości Y spodziewamy się dla X = 20?
Licząc ze wzoru wychodzi nam, że \( y = 2 \cdot 20 + 20 = 60 \), ale czy możemy tak zrobić?

Zwróćmy, że X = 20 jest o wiele większy od X-ów dla których wyznaczyliśmy funkcję regresji. Dla X = 11 wszystko jest ok i wartość Y nie powinna odbiegać od wyznaczonej przez nas.
Aby być pewnym, że nasze oszacowanie Y jest dobre wyznacza się współczynniki zbieżności i determinacji:

Definicja:
Współczynnik determinacji: \( R^{2} = r^{2}_{xy} \)
Współczynnik zbieżności : \( \varphi^{2} = 1 – R^{2} \)
\( r_{xy}\) – współczynnik regresji liniowej między X i Y

Interpretacja:
Współczynnik determinacji \( R^{2} \) określa jaka część danych jest wytłumaczona przez model – im większy tym prosta regresji jest lepiej dopasowana do danych:

  1. 0.0 – 0.5 – dopasowanie niezadowalające
  2. 0.5 – 0.6 – dopasowanie słabe
  3. 0.6 – 0.8 – dopasowanie zadowalające
  4. 0.8 – 0.9 – dopasowanie dobre
  5. 0.9 – 1.0 – dopasowanie bardzo dobre

Im prosta regresji jest lepiej dopasowana do danych (czyli im \( R^{2} \) większe) tym możemy przewidzieć wartości Y dla bardziej oddalonych wartości X od danych na podstawie których stworzyliśmy prostą regresji liniowej.

Współczynnik zbieżności \( \varphi^{2} \) opisuje jaka część danych nie jest wytłumaczona przez model. Im większe \( R^{2} \) tym mniejsze \( \varphi^{2} \) – suma obu współczynników sumuje się do 1 co jest oczywiste: np. skoro model wyjaśnia 80% tzn. że nie wyjaśnia 20%.

Dalsza część treści jest płatna. Dokonaj zakupu lub zaloguj się

Zaloguj się lub Wykup
Sprawdź Wykup
Anuluj
7dniowy dostęp do Korelacji, 10zł
30dniowy abonament, 29zł
90dniowy abonament, 49zł
Odblokuj dostęp do treści związanych z korelacjami Pearsona, Spearmana oraz regresją liniową. Odblokuj dostep
Odblokuj dostęp do wszystkich treści na 30 dni. Odblokuj dostep
Odblokuj dostęp do wszystkich treści na 90 dni. Odblokuj dostep
Anuluj

2 comments:

  1. „Licząc ze wzoru wychodzi nam, że y=2⋅20+20=40, ale czy możemy tak zrobić?”

    Sądzę, że jednak lepiej przyjąć: y=2⋅20+20=60.

Dodaj komentarz

Twój adres email nie zostanie opublikowany.