Wariancja- szereg przedziałowy

Wariancję w szeregu przedziałowym będziemy liczyć podobnie jak wariancję w szeregu rozdzielczym z tym, że najpierw -jak w przypadku średniej w szeregu rozdzielczym, musimy uśrednić wartości:

 \overline{X}_{i} = \dfrac{X_{p} + X_{k}}{2} - środek przedziału, gdzie X_{p}- początek przedziału, a  X_{k} - koniec przedziału.

Wariancję w szeregu przedziałowym można wyliczyć na 2 sposoby: korzystając z ilości
 n_{i} lub z częstości  \omega_{i}

Definicja:

 \large VarX = \dfrac{1}{n} \sum (\overline{X}_{i}- \overline{X})^{2}\cdot n_{i}

lub

 \Large VarX= \sum(\overline{X}_{i}- \overline{X})^{2} \cdot \omega_{i}

 \Large n - ilość obserwacji
 \Large n_{i} - liczebność i-tego przedziału
 \Large \omega_{i} - częstość obserwacji i-tego przedziału
 \Large \overline{X}_{i} - wartość środkowa i-tego przedziału
 \Large \overline{X} - średnia z wszystkich przedziałów

 

 Przykład:

Wykorzystamy ten sam przykład co w średnia - szereg przedziałowy:

W tabeli zostały przedstawione zarobki w firmie informatycznej. Oblicz na 2 sposoby wariancję:

Wartość  X_{i} Ilość  n_{i}
1000-30002
3000-50003
5000-700010
7000-90007
9000-110001

Ilość obserwacji n = 23.

Najpierw dla każdego przedziału policzymy wartość środkową  \overline{X}_{i} :

Wartość  X_{i} Ilość  n_{i} Wartość środkowa  \overline{X}_{i}
1000-30002 \dfrac{1000+3000}{2} = 2000
3000-500034000
5000-7000106000
7000-900078000
9000-11000110000

Średnia dla wszystkich danych została policzona w statystyka- szereg przedziałowy, więc tylko dla przypomnienia  \overline{X} = 6173.91zł

Teraz dla każdego przedziału policzymy  \overline{X}_{i}- \overline{X} oraz
 (\overline{X}_{i}- \overline{X})^{2} :

Wartość  X_{i} Ilość  n_{i} Wartość środkowa  \overline{X}_{i}  \overline{X}_{i} -\overline{X}  (\overline{X}_{i} -\overline{X})^{2}
1000-3000220002000-6173.91 = -4173.91 17421524.69
3000-500034000-2173.914725884.69
5000-7000106000-173.9130244.69
7000-9000780001826.093334604.69
9000-110001100003826.0914638964,69

 

Policzenie średniej korzystając z ilości  n_{i}

Potrzebna nam jest jeszcze kolumna:  (\overline{X}_{i}- \overline{X})^{2} \cdot n_{i}

Dla czytelności pominę kolumnę  \overline{X}_{i} :

Wartość  X_{i} Ilość  n_{i}  \overline{X}_{i} -\overline{X}  (\overline{X}_{i} -\overline{X})^{2}  (\overline{X}_{i}- \overline{X})^{2} \cdot n_{i}
1000-30002-4173.9117421524.6934843049,38
3000-50003-2173.914725884.6914177654,06
5000-700010-173.9130244.69302446,88
7000-900071826.093334604.6923342232,82
9000-1100013826.0914638964,6914638964,69
 \sum  \overline{X}_{i}- \overline{X})^{2} \cdot n_{i} = 87304347,83

Teraz możemy skorzystać ze wzoru tzn.

 \large VarX = \frac{1}{n} \sum (\overline{X}_{i}- \overline{X})^{2} \cdot n_{i} = \frac{1}{23} \cdot 87304347.83 = 3795841.21 ^{2}

a odchylenie standardowe  \sigma = \sqrt{VarX} = \sqrt{3795841.21}=1948.29 zł.

 

Policzenie średniej korzystając z częstości  \omega_{i}

Częstości zostały wyliczone w średnia-szereg przedziałowy więc skorzystamy z tego.

Dodatkowo policzmy kolumnę:  (\overline{X}_{i}- \overline{X})^{2} \cdot \omega_{i}

Wartość  X_{i} Częstości  \omega_{i}  \overline{X}_{i} -\overline{X}  (\overline{X}_{i} -\overline{X})^{2}  (\overline{X}_{i}- \overline{X})^{2} \cdot \omega_{i}
1000-3000 \dfrac{2}{23} -4173.9117421524.69 \dfrac{2}{23} \cdot 17421524.69 =1514915.19

3000-5000 \dfrac{3}{23} -2173.914725884.69616419.74

5000-7000 \dfrac{10}{23} -173.9130244.6913149.86

7000-9000 \dfrac{7}{23} 1826.093334604.691014879,69
9000-11000 \dfrac{1}{23} 3826.0914638964,69636476,73

 \sum  (\overline{X}_{i}-\overline{X})^{2} \cdot \omega_{i}=3795841.21

czyli zgodnie ze wzorem:

 \large VarX= \sum(\overline{X}_{i}- \overline{X})^{2} \cdot \omega_{i} =3795841.21 ^{2}

a odchylenie standardowe  \sigma = \sqrt{VarX} = \sqrt{3795841.21}=1948.29 zł.

 

 

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany.