\(\)Współczynnik zbieżności oraz współczynnik determinacji są ściśle związane z analizą regresji liniowej. Załóżmy, że wartości \( X_{i} \in [0, 10] \) oraz że funkcja regresji liniową jest dana wzorem:
\( Y = 2 \cdot X + 20 \)
Jakiej wartości Y spodziewamy się dla X = 11?
Licząc ze wzoru wychodzi nam, że \( y = 2 \cdot 11 + 20 = 42 \)
A jakiej wartości Y spodziewamy się dla X = 20?
Licząc ze wzoru wychodzi nam, że \( y = 2 \cdot 20 + 20 = 60 \), ale czy możemy tak zrobić?
Zwróćmy, że X = 20 jest o wiele większy od X-ów dla których wyznaczyliśmy funkcję regresji. Dla X = 11 wszystko jest ok i wartość Y nie powinna odbiegać od wyznaczonej przez nas.
Aby być pewnym, że nasze oszacowanie Y jest dobre wyznacza się współczynniki zbieżności i determinacji:
Definicja:
Współczynnik determinacji: \( R^{2} = r^{2}_{xy} \)
Współczynnik zbieżności : \( \varphi^{2} = 1 – R^{2} \)
\( r_{xy}\) – współczynnik regresji liniowej między X i Y
Interpretacja:
Współczynnik determinacji \( R^{2} \) określa jaka część danych jest wytłumaczona przez model – im większy tym prosta regresji jest lepiej dopasowana do danych:
- 0.0 – 0.5 – dopasowanie niezadowalające
- 0.5 – 0.6 – dopasowanie słabe
- 0.6 – 0.8 – dopasowanie zadowalające
- 0.8 – 0.9 – dopasowanie dobre
- 0.9 – 1.0 – dopasowanie bardzo dobre
Im prosta regresji jest lepiej dopasowana do danych (czyli im \( R^{2} \) większe) tym możemy przewidzieć wartości Y dla bardziej oddalonych wartości X od danych na podstawie których stworzyliśmy prostą regresji liniowej.
Współczynnik zbieżności \( \varphi^{2} \) opisuje jaka część danych nie jest wytłumaczona przez model. Im większe \( R^{2} \) tym mniejsze \( \varphi^{2} \) – suma obu współczynników sumuje się do 1 co jest oczywiste: np. skoro model wyjaśnia 80% tzn. że nie wyjaśnia 20%.
Zadanie 1:
Przeanalizujmy wyniki z Zadania 1 z tematu Regresja liniowa.
Funkcja regresji: Y = -0.13X + 22
\( r_{xy} \) = -0.92
1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy możemy przewidzieć Y dla X = 150? Jak tak ile wynosi Y w tym przypadku?
3) Czy możemy przewidzieć Y dla X = 200? Jak tak ile wynosi Y w tym przypadku?
Zadanie 2:
Mamy funkcję regresji Y = 2X + 3, która została wyliczona dla X z przedziału [1, 10] oraz \( r_{xy} \) = 0.2
1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy powinniśmy przewidywać Y dla X = 12?
Zadanie 3:
Dysponując poniższymi statystykami oblicz współczynniki zbieżności i determinacji:
\( s_{x} = 20\) , \( s_{y} = 30\), \( a = 0.9 \)
“Licząc ze wzoru wychodzi nam, że y=2⋅20+20=40, ale czy możemy tak zrobić?”
Sądzę, że jednak lepiej przyjąć: y=2⋅20+20=60.
Dzięki, poprawione:)