Histogram

Histogram jest najpopularniejszym sposobem przedstawienia rozkładu empirycznego cechy. Rozkład empiryczny oznacza rozkład otrzymany na podstawie danych - empiryczny, znaczy doświadczalny. Histogram służy do analizy zbiorowość, co oznacza, że jesteśmy w stanie odpowiedzieć na pytanie: z którego przedziału wartości wypadają częściej, a z którego rzadziej.

Histogram to graficznie przedstawiony szereg przedziałowy

Szereg przedziałów składa się z przedziałów i ilość obserwacji, które się w nim znajdują jednak bez histogramu ciężko byłoby zauważyć pewne rzeczy - jak chociażby skośność.

 

Kiedy przydaje się histogram?

Histogram przydaje się gdy mamy dużo obserwacji, które różnią się nieznacznie. Powiedzmy, że chcemy zbadać zarobki 200 osób, ale każda z nich zarabia inaczej. Jednak widzimy duże skupiska koło 2000zł, 2500zł i 3000zł. Dzięki histogramowi - który operuje na przedziałach - jesteśmy w stanie łatwo pogrupować i przeanalizować nasze obserwacje.

 

Przepis na histogram ilościowy i częstościowy:

Histogram ilościowy przedstawia ilość obserwacji w każdym przedziale natomiast histogram częstościowy przedstawia częstość obserwacji w każdym przedziale(jaki procent obserwacji znajduje się w każdym przedziale)

  1. Policz ile mamy obserwacji
    Warto to zrobić na początku by potem nie zgubić jakiejś obserwacji przy liczeniu ile razy występuje każda obserwacja.
  2. Uszereguj obserwacje
    Ułatwi nam to liczenie ile obserwacji należy do danego przedziału
  3. Określ k - liczbę przedziałów histogramu
     k \approx \sqrt{n}, gdzie n- ilość obserwacji
  4. Określ h - długość każdego przedziału h = \dfrac{max-min}{k} gdzie max i min to odpowiednio wartości największa i najmniejsza
  5. Wyznacz przedziały
    Przydziały są lewostronnie domknięte i prawostronnie otwarte, tzn :  [Xp, Xk) , X_{p} - początek przedziału,  X_{k} - koniec przedziału. Poza ostatnim który musi być domknięty również z prawej strony aby "złapać" wartość największąKoniec jednego przedziału jest początkiem drugiego przedziału- tak by była zachowana ciągłość
  6. Policz ile liczb wpada do każdego przedziału i sprawdź czy ilości sumują się do n!
    Sumujemy w celu uniknięcia błędu- w tym momencie mamy skonstruowany histogram ilości. W celu skonstruowania histogramu częstości należy wykonać punkt 7
  7. Histogram częstości : n_{i} zamień na  \omega_{i} = \dfrac{n_{i}}{n}

Po wykonaniu wyżej wymienionych kroków należy jeszcze narysować histogram.

 

Przykład:

Skonstruuj histogram płac 20 pracowników w pewnej firmie:
2000, 2010, 2020, 2015, 2500, 3000, 2500, 2450, 2060, 2700, 2840, 2550, 2340, 2900, 3000, 2250, 2300, 3000, 2990, 2600.

  1. n = 20
  2. Uszeregowane obserwacje:
    2000, 2010, 2015, 2020, 2060, 2250, 2300, 2340, 2450, 2500, 2500, 2550, 2600, 2700, 2840, 2900, 2990, 3000, 3000, 3000
  3. Ilość przedziałów:
     k = \sqrt{20} \approx 4
  4. Długość przedziałów:
     h = \dfrac{3000-2000}{4} = 250
  5. Przedziały:
     [2000, 2250)
    ,  [2250, 2500) ,  [2500, 2750) ,  [2750, 3000]
  6. Ile obserwacji wpada do każdego przedziału:
    PRZEDZIAŁILOŚCI  n_{i}
     [2000, 2250) 5
     [2250, 2500) 4
     [2500, 2750) 5
     [2750, 3000] 6

  7. Jak często obserwacje wpadają do każdego przedziału:
    PRZEDZIAŁCZĘSTOŚCI  \omega_{i}
     [2000, 2250)  \dfrac{5}{20} = 0.25
     [2250, 2500) 0.2
     [2500, 2750) 0.25
     [2750, 3000] 0.3

Histogramy zostały wyznaczone. Teraz pozostaje tylko je narysować:

hist1

 Histogram ilościowy

hist2

Histogram częstościowy

2 comments:

Dodaj komentarz

Twój adres email nie zostanie opublikowany.