Rozkład próbkowania
Rozkład próbkowania, rozkład z próby[1] – pojęcie z obszaru statystyki oznaczające rozkład prawdopodobieństwa określonej statystyki, czyli liczby podsumowującej próbę losową pobraną z danej populacji. Gdy do obliczenia statystyki (takiej jak na przykład średnia z próby lub wariancja w próbie) użyje się wielu -elementowych prób losowych, wówczas rozkład próbkowania opisuje prawdopodobieństwa wartości przyjmowanych przez statystykę. Zwykle w praktyce pobiera się tylko jedną próbę, zaś rozkład próbkowania dla statystyki obliczanej z tej próby możemy określić teoretycznie.
Rozkłady próbkowania odgrywają istotną rolę w statystyce, ponieważ upraszaczają wnioskowanie statystyczne.
Wstęp
Rozkład próbkowania statystyki to rozkład tej statystyki, traktowanej jako zmienna losowa, wyprowadzonej z losowej próby o określonej wielkości . Można go uważać za rozkład statystyki dla wszystkich możliwych próbek o liczebności z tej samej populacji. Rozkład próbkowania zależy rozkładu w populacji, rozpatrywanej statystyki, zastosowanej procedury pobierania próbek oraz wybranej liczebności próby .
Jako przykład rozważmy populację, w której cecha ma rozkład normalny ze średnią i wariancją . Załóżmy, że wielokrotnie pobieramy próbki o danej wielkości z tej populacji i obliczamy średnią arytmetyczną dla każdej próbki – statystykę tę nazywa się średnią w próbie, średnią z próby lub średnią próbkową[2]. Rozkład tych średnich nazywany jest „rozkładem próbkowania średniej z próby”. Rozkład próbkowania jest w tym przypadku normalny z wartością oczekiwaną i odchyleniem standardowym , gdzie n to wielkość próby. Rozkłady próbkowania średniej z próby mogą często być bliskie rozkładowi normalnemu, nawet jeśli rozkład w populacji taki nie jest (patrz centralne twierdzenie graniczne).
Średnia w próbie pobranej z populacji o rozkładzie normalnym jest przykładem prostej statystyki pobranej z jednej z najprostszych populacji statystycznych. W przypadku innych statystyk i populacji rozkłady próbkowania są bardziej skomplikowane i często nie mają wzoru jawnego. W takich przypadkach rozkłady próbkowania można aproksymować za pomocą symulacji Monte Carlo[3], metod bootstrapowych lub wykorzystywać rozkłady asymptotyczne.
Błąd standardowy
Odchylenie standardowe rozkładu próbkowania statystyki z próby nazywa się błędem standardowym tej statystyki. Na przykład gdy statystyką jest średnia w prostej próbie losowej, błąd standardowy wynosi: gdzie to odchylenie standardowe w rozkładzie cechy w populacji, a to liczebność próby (liczba jednostek w próbie).
Ważną konsekwencją tego wzoru jest to, że wielkość próby musi zostać zwiększona czterokrotnie (pomnożona przez 4), aby dwukrotnie zredukować błąd pomiaru. Podczas projektowania badań statystycznych, w których koszt jest czynnikiem, może to mieć znaczenie dla zrozumienia relacji między kosztami a korzyściami.
W przypadku, gdy statystyką jest suma wartości obserwacji w prostej próbie losowej, błąd standardowy wynosi:
Przykłady

| Populacja | Statystyka | Rozkład próbkowania |
|---|---|---|
| Rozkład normalny: | Średnia z próby o wielkości n | .
Jeżeli odchylenie standardowe w populacji nie jest znane, można skorzystać ze statystyki , mającej rozkład t Studenta z stopniami swobody. to wariancja w próbie, zaś to statystyka bazowa, której wartość nie zależy od . |
| Rozkład zero-jedynkowy z parametrem . | Częstość „sukcesów” (proporcja w próbie): | |
| Dwie niezależne populacje o rozkładzie normalnym: i |
Różnica pomiędzy średnimi w próbach: | |
| Dowolny bezwzględnie ciągły rozkład F z funkcją gęstości f | Mediana z próby o liczebności n = 2k − 1, gdzie próba jest uporządkowana od do | |
| Dowolny rozkład z dystrybuantą F | Maksimum w próbce o liczebności n |