Rozkład próbkowania

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Rozkład próbkowania, rozkład z próby[1] – pojęcie z obszaru statystyki oznaczające rozkład prawdopodobieństwa określonej statystyki, czyli liczby podsumowującej próbę losową pobraną z danej populacji. Gdy do obliczenia statystyki (takiej jak na przykład średnia z próby lub wariancja w próbie) użyje się wielu n-elementowych prób losowych, wówczas rozkład próbkowania opisuje prawdopodobieństwa wartości przyjmowanych przez statystykę. Zwykle w praktyce pobiera się tylko jedną próbę, zaś rozkład próbkowania dla statystyki obliczanej z tej próby możemy określić teoretycznie.

Rozkłady próbkowania odgrywają istotną rolę w statystyce, ponieważ upraszaczają wnioskowanie statystyczne.

Wstęp

Rozkład próbkowania statystyki to rozkład tej statystyki, traktowanej jako zmienna losowa, wyprowadzonej z losowej próby o określonej wielkości n. Można go uważać za rozkład statystyki dla wszystkich możliwych próbek o liczebności n z tej samej populacji. Rozkład próbkowania zależy rozkładu w populacji, rozpatrywanej statystyki, zastosowanej procedury pobierania próbek oraz wybranej liczebności próby n.

Jako przykład rozważmy populację, w której cecha ma rozkład normalny ze średnią μ i wariancją σ2. Załóżmy, że wielokrotnie pobieramy próbki o danej wielkości z tej populacji i obliczamy średnią arytmetyczną x¯ dla każdej próbki – statystykę tę nazywa się średnią w próbie, średnią z próby lub średnią próbkową[2]. Rozkład tych średnich nazywany jest „rozkładem próbkowania średniej z próby”. Rozkład próbkowania jest w tym przypadku normalny z wartością oczekiwaną μ i odchyleniem standardowym σ/n, gdzie n to wielkość próby. Rozkłady próbkowania średniej z próby mogą często być bliskie rozkładowi normalnemu, nawet jeśli rozkład w populacji taki nie jest (patrz centralne twierdzenie graniczne).

Średnia w próbie pobranej z populacji o rozkładzie normalnym jest przykładem prostej statystyki pobranej z jednej z najprostszych populacji statystycznych. W przypadku innych statystyk i populacji rozkłady próbkowania są bardziej skomplikowane i często nie mają wzoru jawnego. W takich przypadkach rozkłady próbkowania można aproksymować za pomocą symulacji Monte Carlo[3], metod bootstrapowych lub wykorzystywać rozkłady asymptotyczne.

Błąd standardowy

Odchylenie standardowe rozkładu próbkowania statystyki z próby nazywa się błędem standardowym tej statystyki. Na przykład gdy statystyką jest średnia w prostej próbie losowej, błąd standardowy wynosi: σx¯=σn gdzie σ to odchylenie standardowe w rozkładzie cechy w populacji, a n to liczebność próby (liczba jednostek w próbie).

Ważną konsekwencją tego wzoru jest to, że wielkość próby n musi zostać zwiększona czterokrotnie (pomnożona przez 4), aby dwukrotnie zredukować błąd pomiaru. Podczas projektowania badań statystycznych, w których koszt jest czynnikiem, może to mieć znaczenie dla zrozumienia relacji między kosztami a korzyściami.

W przypadku, gdy statystyką jest suma wartości obserwacji w prostej próbie losowej, błąd standardowy wynosi: σΣx=σn

Przykłady

Rozkład próbkowania średniej z próby liczb wylosowanych z rozkładu normalnego. Wraz ze wzrostem liczebności próby rozkład próby staje się coraz bardziej skupiony wokół centrum.
Populacja Statystyka Rozkład próbkowania
Rozkład normalny: 𝒩(μ,σ2) Średnia X¯ z próby o wielkości n X¯𝒩(μ,σ2n).

Jeżeli odchylenie standardowe w populacji σ nie jest znane, można skorzystać ze statystyki T=(X¯μ)nS, mającej rozkład t Studenta z ν=n1 stopniami swobody. S2 to wariancja w próbie, zaś T to statystyka bazowa, której wartość nie zależy od σ.

Rozkład zero-jedynkowy z parametrem p. Częstość „sukcesów” (proporcja w próbie): X¯ nX¯Dwumianowy(n,p)
Dwie niezależne populacje o rozkładzie normalnym:

𝒩(μ1,σ12)  i  𝒩(μ2,σ22)

Różnica pomiędzy średnimi w próbach: X¯1X¯2 X¯1X¯2𝒩(μ1μ2,σ12n1+σ22n2)
Dowolny bezwzględnie ciągły rozkład F z funkcją gęstości f Mediana X(k) z próby o liczebności n = 2k − 1, gdzie próba jest uporządkowana od X(1) do X(n) fX(k)(x)=(2k1)!(k1)!2f(x)(F(x)(1F(x)))k1
Dowolny rozkład z dystrybuantą F Maksimum M=max Xk w próbce o liczebności n FM(x)=P(Mx)=P(Xkx)=(F(x))n

Przypisy

Szablon:Przypisy

Linki zewnętrzne

Szablon:Kontrola autorytatywna