Centralne Twierdzenie Graniczne(CTG) jest jednym z najważniejszych twierdzeń w statystyce. Uzasadnia ono powszechność występowania rozkładów zbliżonych do rozkładu normalnego.
Jeżeli ktoś Cię zapyta dlaczego rozkład normalny jest taki ważny to odpowiedzią jest Centralne Twierdzenie Graniczne.
Centralne Twierdzenie Graniczne: \(\)
Jeżeli mamy zmienne \( X_{i} \) – i.i.d. (czyli są niezależne o jednakowym rozkładzie) o takich samych wartościach oczekiwanych (średniej) \( \mu \) oraz wariancji \( \sigma^{2} \) (dodatkowo zakładamy że wariancja jest skończona \(\sigma^{2} < \infty \) ) wtedy zmienna:
\( \lim_{n\to\infty} \frac{\sum\limits_{i=1}^nX_{i} – n \cdot \mu }{\sqrt{n}\cdot \sigma} \stackrel{d}= N(0,1) \)
Dzieląc licznik i mianownik przez n otrzymamy równie popularne sformułowanie:
\( \lim_{n\to\infty} \frac{\overline{X} – \mu }{\frac{\sigma}{\sqrt{n}}} \stackrel{d}= N(0,1) \)
d nad znakiem równości oznacza, że zbieżność jest względem rozkładu, tzn. że nie poszczególne wartości do siebie dążą a rozkłady.
Czyli im n większe tym \(\frac{\sum\limits_{i=1}^n X_{i} – n \cdot \mu }{\sqrt{n}\cdot \sigma} \) przypomina bardziej rozkład N(0,1).
Można to również zapisać, że rozkład \( \overline{X} \sim N(\mu, \frac{\sigma}{\sqrt{n}}) \) i w tym znaczeniu najczęściej używa się centralnego twierdzenia granicznego.
Nie oznacza to jednak, że dla dużego n X zmienia w rozkład normalny. Rozkład X jest zawsze taki jak początkowy, zmienia się jedynie rozkład \( \overline{X} \).
Słowo o skończonej wariancji \( \sigma^{2} \):
Warunek dotyczący skończoności wariancji jest bardzo ważny i formułując twierdzenie nie możemy o nim zapomnieć. Co prawda nie musimy się zbytnio martwić o to założenie wariancja powinna być podana lub łatwa do wyliczenia- dodatkowo na kursach statystyki opisowej nie spotyka się rozkładów o nieskończonej wariancji.
Zadanie 1:
Na podstawie dancyh dotyczących zarobków w pewnej firmie wyliczono, że
\( \mu = 2000 \) oraz \( \sigma = 400 \). Oblicz prawdopodobieństwo, że 30 losowo wybranych pracowników zarabia więcej niż 68 000zł.
Zadanie 2:
Rzucamy 100 razy sześcienną kostką. Oblicz prawdopodobieństwo, że suma oczek będzie większa niż 300.
Zadanie 3:
W wyniku kradziezy majonezow w supermarkecie firma traci dziennie srednio 105 zl z przecietnym zroznicowaniem 40 zl. Jakie jest prawdopodobienstwo, ze kwartalna (92 dni) strata spowodowana kradzieza majonezow wyniesie co najwyzej 10 000 zl.
Zadanie 4
Prawdopodobieństwo wygrania w pewnej grzej wynosi 0.1. Obliczyć prawdopodobieństwo, że spośród 500 grających wygra więcej niż 60 osób.
Zadanie 5
Prawdopodobieństwo urodzenia chłopca jest równe 0.515. Jakie jest prawdopodobieństwo tego, że wśród 1000 noworodków będzie co najwyżej 480 dziewczynek?
Zadanie 6 (od Karoliny)
Wiadomo, że 14% dorosłych Polaków zalega z płatnościami za telefon. Policzyć prawdopodobieństwo, że w grupie 500 osób nie uregulowało tych należności mniej niż 50 osób.
Co oznacza ten symbol ~ ?
Jak się go czyta?
X ~ N(0,1) czytamy: X jest z rozkładu normalnego o średniej 0 i wariancji 1.
O tej falce można myśleć jako o znaku równa się.