Regresja liniowa(zwana również regresją prostą) służy do oszacowania wartości Y gdy dysponujemy wartościami X, wtedy Y nazywa się zmienną objaśnianą, a X zmienną objaśniającą. O ile współczynnik korelacji liniowej mówi nam jak bardzo dane są od siebie zależne o tyle regresja liniowa mówi nam jak bardzo zmieni się Y gdy zmienimy X: \(\)
Definicja regresji liniowej
Regresja liniowa przedstawia się wzorem
\( y = a \cdot x + b \)
a – współczynnik kierunkowy prostej regresji
b – wyraz wolny prostej regresji
gdzie
\( a = \frac{\sum ( X_{i}- \overline{X} ) \cdot( Y_{i}- \overline{Y} ) }{\sum ( X_{i}- \overline{X} )^{2}} = \frac{cov(X,Y)}{\sigma^{2}_{x}} = r_{xy} \cdot \frac{\sigma_{y}}{\sigma_{x}} \)
\( b = \overline{Y} – a \cdot \overline{X} \)
\( X_{i} \), \( Y_{i} \) wartości zmiennych X i Y
\( \overline{X} \), \( \overline{Y} \) – średnie zmiennych X i Y
\( cov(X,Y) \) – kowariancja zmiennych X i Y
\( \sigma_{x} \), \( \Large \sigma_{y} \) – odchylenia standardowe zmiennych X i Y
\( r_{xy} \) – współczynnik korelacji między X i Y
Zadanie 1:
Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz funkcję regresji liniowej:
DŁUGOŚĆ SERII X (SZT.) | 80 | 90 | 100 | 100 | 110 | 120 |
KOSZT JEDNOSTKOWY Y (ZŁ.) | 12 | 9 | 10 | 9 | 8 | 6 |
Zadanie2:
Zadanie: \(\)
W grupie 10 przedsiębiorstw obserwowano poziom produkcji pewnych wyrobów (w szt.) i koszty całkowite (tys. zł)
Produkcja | 11 | 12 | 13 | 13 | 14 | 14 | 17 | 18 | 18 | 20 |
Koszty całkowite | 18 | 20 | 20 | 20 | 22 | 24 | 26 | 27 | 26 | 27 |
a) Oszacować parametry funkcji regresji opisującej zależność kosztów całkowitych od wielkości produkcji i nanieść ją na korelacyjny wykres rozrzutu
b) Korzystając z wyznaczonej prostej regresji przewidzieć całkowite koszty produkcji 25 szt. wyrobów
c) Jaka jest siła i rodzaj zależności liniowej między produkcją, a kosztami?
d) podać interpretację parametrów wyznaczonej prostej regresji
Zadanie 3:
Analiza wydatków na rozrywkę w zależności od dochodów w losowej grupie gospodarstw domowych dostarczyła niżej dostępne statystyki:
– średnie wydatki na rozrywkę na osobę wynosiły 150zł
– średnie zarobki na osobę wynosiły 1500zł
– współczynnik zmienności wydatków wynosił 20%
– współczynnik zmienności dochodu wynosił 30%
– kowariancja między zmiennymi wynosiła \( cov(X,Y)=11000 \).
Wyznacz oraz opisz parametry regresji liniowej wydatków na rozrywkę względem zarobków.
Zadanie 4:
Mamy dwie cechy:
X [liczba kupionych karpi]
Y [liczba otrzymanych prezentów].
Równanie prostej regresji: \( y = -2x+10 \)
Pozostałe parametry: \( Cov(x,y)=2, \overline{X}=2, \overline{Y}=6 \).
Święty Mikołaj nie zgadza się z tymi wyliczeniami.
Kto ma rację i dlaczego?
Mam pytanie odnośnie zadania 3. W jaki sposób otrzymano cov(x,y) = 11000?
Ucięło w treści zadania. Jest to jedna z podanych informacji.