Reguła Trzech Sigm

\(\)

Reguła Trzech Sigm dla danego rozkładu normalnego \( N(\mu, \sigma) \) oznacza że w przedziale \( [\mu – 3\sigma, \mu + 3\sigma ] \) znajduje się 99.7 % wszystkich obserwacji. Oznacza to że obserwacje, które nie należą do tego przedziału będą się zdarzały bardzo rzadko.  Dzięki tej regule w łatwy sposób można też zlokalizować obserwacje odstające.

Ilustracja Reguły Trzech Sigm:

Krzywa Gaussa, Rozkład Gaussa, Rozkład Normalny

Po pierwsze korzystając z symetryczności rozkładu Normalnego widzimy te same procenty po obu stronach \( \mu \).

Po drugie w łatwy sposób możemy odczytać przedziały procentowe dla kolejnych sigm, tzn:

PRZEDZIAŁ:PROCENT OBSERWACJI:
\(\Large [ \mu - \sigma, \mu + \sigma ]\)\(\Large 68.2\% \)
\(\Large [ \mu - 2\sigma, \mu + 2\sigma ]\)\(\Large 95.4\% \)
\(\Large [ \mu - 3\sigma, \mu + 3\sigma ]\)\(\Large 99.7\% \)

Reguła Trzech Sigm jest wykorzystywana jak sygnał ostrzegawczy dotyczący anomalnych zachowań, np. przypadków wyłudzeń, manipulacji, oszustw itd. Oczywiście takie wartości mogą się zdarzyć bez ingerencji człowieka ale zawsze warto sprawdzić czy ktoś nie brał w tym udziału.

Przykład:
Załóżmy taką sytuację: jesteśmy właścicielami firmy produkującej obuwie. Zastanawiamy się nad tym w jakich rozmiarach mamy produkować buty. Załóżmy, że średni rozmiar męskiego buta wynosi \( \mu = 42 \) a odchylenie standardowe \( \sigma 1.5 \). Korzystając z Reguł Trzech Sigm produkując buty w rozmiarach od 37.5 do 46.5 w naszych butach będzie mogło chodzić 99.7 % mężczyzn. To bardzo dobry wynik ale załóżmy, że nasza firma nie ma za dużo pieniędzy na wyprodukowanie partii butów, co wtedy?

Być może lepszym wyjściem jest zrobienie butów w rozmiarach od 39 do 45. Wtedy w naszych butach będzie mogło chodzić 95.4% mężczyzn a zaoszczędzimy trochę na produkcji dużych numerów.

Dzięki rozkładowi normalnemu wiemy również których rozmiarów wyprodukować więcej- tych najbliżej średniej- od 40.5 do 43.5 prawie 70% butów.