Rozkład Studenta

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Szablon:DopracowaćSzablon:Rozkład prawdopodobieństwa infobox Szablon:Wikiźródła

Rozkład Studenta, rozkład t Studenta, rozkład tciągły rozkład prawdopodobieństwa stosowany często w statystyce w procedurach testowania hipotez statystycznych i przy ocenie niepewności pomiaru. Przy opracowaniu wyników pomiarów często powstaje zagadnienie oszacowania przedziału, w którym leży, z określonym prawdopodobieństwem, rzeczywista wartość mierzona, jeśli dysponuje się tylko wynikami n pomiarów, dla których można wyznaczyć takie parametry, jak średnia X i odchylenie standardowe s lub wariancja s2 („z próby”), nieznane jest natomiast odchylenie standardowe σ w populacji. Zagadnienie to rozwiązał w 1908 r. William Sealy Gosset (pseudonim Student), podając funkcję zależną od wyników pomiarów Xi, a niezależną od σ.

Definicja

Rozkład Studenta z n stopniami swobody jest rozkładem zmiennej losowej T postaci:

T=UZn

gdzie:

Gęstość prawdopodobieństwa

Zmienna losowa T określona powyżej ma gęstość prawdopodobieństwa opisaną wzorem:

f(t,n)=Γ(n+12)Γ(n2)nπ(1+t2n)n+12

gdzie Γ(x) to funkcja gamma.

Dowód. Niech U i Z będą takie jak wyżej. Zmienna Y=Z ma rozkład chi o n stopniach swobody, a więc gęstość Y wyraża się wzorem

fY(y)=21n2yn1ey22Γ(n2).

Rozważmy zmienną

X=1nY.

Wówczas

YX=n

a zatem całkując przez podstawienie obserwujemy, że

fX(x)=fY(nx)|YX|=21n2Γ(n2)(nx)n1e(nx)22n=21n2Γ(n2)nn2xn1en2x2.

Zmienna T ma zatem rozkład U/X. Jej gęstość jest więc postaci

fT(t)=|x|fU(xt)fX(x)dx=0xfU(xt)fX(x)dx=0x12πe(xt)2221n2Γ(n2)nn2xn1en2x2dx=nn22π21n2Γ(n2)0xne12(n+t2)x2dx.

Niech m=x2. Wówczas powyższa całka przyjmuje postać

0xne12(n+t2)mdm2x=120mn12e12(n+t2)mdm(*).

Gęstość f(m;k,θ) rozkładu gamma wyraża się wzorem

f(m;k,θ)=mk1emθθkΓ(k).

Oznacza to, że

k1=n12k*=n+12,1θ=12(n+t2)θ*=2(n+t2)

a stąd

(*)=12(θ*)k*Γ(k*)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1).

Ostatecznie

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1).

Własności

Powyższy wzór określa całą rodzinę rozkładów prawdopodobieństwa zależną od parametru n – liczby stopni swobody rozkładu Studenta. Rozkłady te są symetryczne, jednomodalne, dla dużych wartości n zmierzają do standardowego rozkładu normalnego N(0,1). Dla małych n różnią się jednak od rozkładu normalnego: rozkład Studenta o n stopniach swobody ma skończone momenty tylko do rzędu n1, w szczególności dla n=1 rozkład Studenta jest identyczny z rozkładem Cauchy’ego i nie posiada żadnych skończonych momentów (nie istnieje nawet wartość średnia).

Własności te ilustruje poniższy wykres przedstawiający gęstości rozkładu Studenta dla kilku wartości liczby stopni swobody n w zestawieniu z gęstością standardowego rozkładu normalnego N(0,1).

rozkłady Studenta porównane z rozkładem normalnym
rozkłady Studenta porównane z rozkładem normalnym

Zastosowania

Zastosowania rozkładu Studenta w metrologii i statystyce opierają się w większości na następujących dwóch twierdzeniach:

  1. Niech zmienne losowe X1,X2,,Xn mają jednakowy rozkład prawdopodobieństwa, który jest rozkładem normalnym o średniej m i wariancji σ2, oraz niech zmienna t będzie określona wzorem:
    t=Xmsn
    gdzie X jest wartością średnią z próby, zaś sodchyleniem standardowym z próby.
    Wówczas zmienna t ma rozkład Studenta o ν=n1 stopniach swobody (niezależny od wartości wariancji w populacji σ2).
  2. Jeżeli dwie próby o liczebnościach n1 oraz n2, wartościach średnich X1 oraz X2 i wariancjach wyznaczonych z próby s12 oraz s22 zostały wylosowane z populacji mających taki sam rozkład normalny, to zmienna t określona wzorem:
    t=X1X2n1s12+n2s22n1n2n1+n2(n1+n22)
    ma rozkład Studenta o ν=n1+n22 stopniach swobody.

Rozkład t jest stosowany w estymacji przedziałowej, w testach parametrycznych, w szczególności dla wartości średnich (test t Studenta, test t Welcha) i dla wariancji oraz w testach istotności parametrów statystycznych – zwłaszcza gdy mamy do czynienia z próbami małymi (najczęściej arbitralnie przyjmuje się, że próba jest mała gdy jej liczebność n30).

W metrologii rozkład Studenta wykorzystywany jest m.in. przy estymacji odchylenia standardowego (dla pojedynczego pomiaru oraz wartości oczekiwanej). Dla dużych prób (n > 30) praktycznie pokrywa się z rozkładem normalnym, dla mniejszych estymator odchylenia należy pomnożyć przez wartość krytyczną rozkładu Studenta dla liczby stopni swobody ν=n1 i przyjętego poziomu istotności α.

Najczęściej potrzebne są w zastosowaniach kwantyle rozkładu Studenta, to znaczy takie wartości tα, że P(t>tα)=α lub P(|t|<tα)=α. Wartości te podają tablice rozkładu Studenta.

Bibliografia

  • Zieliński R., Tablice statystyczne, PWN, Warszawa 1972.

Linki zewnętrzne

Szablon:Rozkłady statystyczne

Szablon:Kontrola autorytatywna