Próbą prostą nazywamy podzbiór danych wybrany z populacji. Każda wartość w podzbiorze jest wybrana w sposób niezależny i losowy, tzn. że nie ważne czy losujemy wartość o numerze 1 czy numerze 100 szansa na to że będzie to wartość M wynosi tyle samo. Jeżeli mamy 2 różne próby losowe o tej samej liczności to są one tak samo prawdopodobne– prawdopodobieństwo ich wystąpienia jest takie same.
O co chodzi w próbie prostej?
Załóżmy, że chcemy oszacować wzrost mężczyzn mieszkających w Polsce w przedziale wiekowym 20-35. Aby uzyskać dokładne wyniki musielibyśmy przepytać wszystkich mężczyzn w Polsce. Byłoby to czasochłonne i drogie. Zamiast tego chcielibyśmy przepytać małą grupę mężczyzn, która odzwierciedlała by wzrost mężczyzn w Polsce- czyli wybrać grupę reprezentatywną. Dodatkowo chcielibyśmy by wybór był niezależny i losowy, czyli np. nie przepytalibyśmy klubów koszykarskich ani siatkarskich. Zamiast tego udalibyśmy się w jakieś ruchliwe miejsce i pytali każdego napotkanego mężczyznę.
Przykład:
N kolegów chce pójść na mecz ale mają tylko k biletów. Chcąc być sprawiedliwym każdy z nich losuje liczbę z przedziału \( [0 , N] \). Najmniejsze k liczb wyznacza nam zwycięzców.