Test dla wariancji

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Test dla wariancjitest statystyczny służący do weryfikacji hipotez statystycznych dotyczących wartości wariancji w populacji generalnej lub też do porównania wartości wariancji w dwóch lub kilku populacjach – na podstawie znajomości wartości badanej cechy w losowej próbie (lub w kilku próbach).

Rozstrzygnięcie pytań dotyczących wariancji jest ważne m.in. dlatego, że wiele testów służących do porównania wartości średnich w dwóch lub kilku populacjach wymaga przyjęcia założenia o równości wariancji w tych populacjach (tak zwane założenie o jednorodności wariancji). Ponadto wariancja może być miernikiem dokładności w procesie pomiarowym lub produkcyjnym (zbyt duża wariancja wyników pomiaru może na przykład świadczyć o uszkodzeniu lub rozregulowaniu aparatury lub urządzeń).

Struktura i podział testów

Hipotezy dotyczące wariancji testuje się zgodnie z ogólnymi zasadami testowania hipotez statystycznych: formułujemy hipotezy, zakładamy poziom istotności α – dopuszczalną wartość błędu pierwszego rodzaju (tj. prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej) i na podstawie danych z próby wyznaczamy wartość statystyki testowej, po czym porównujemy ją z wartościami krytycznymi odczytanymi z tablic odpowiedniego rozkładu teoretycznego. Przy konstrukcji wszystkich omawianych niżej testów przyjmowane jest założenie, że badane cechy mają w populacjach generalnych rozkład normalny.

  • Postać stosowanej statystyki testowej zależy od kilku czynników:
    • czy badamy hipotezę dotyczącą jednej, dwóch czy wielu wariancji?
    • czy porównujemy próby niezależne, czy zależne (skorelowane, powiązane)?
    • jaka jest liczebność próby (prób)?. Przyjmuje się na ogół (dość arbitralnie), że próba jest duża, gdy jej liczebność przekracza 30 obserwacji (n>30) (można wtedy zakładać, że statystyki mają rozkład normalny – patrz centralne twierdzenie graniczne). W przypadku przeciwnym – mamy do czynienia z próbami małymi.

Poniżej przedstawiono w skrócie kilka testów najczęściej stosowanych w poszczególnych sytuacjach.

Testy dla jednej wariancji

Porównujemy wariancję w populacji z „wzorcową” wartością σ02.

Hipotezy mają postać:

  • H0:σ2=σ02,
  • H1: postać hipotezy alternatywnej zależy od sformułowania zagadnienia:
Szablon:Wzór

albo

Szablon:Wzór

albo też

Szablon:Wzór

Postać statystyki i dalszy przebieg testu zależy od rozmiaru próby.

Próby małe

Wyznaczamy wartość statystyki

χ2=ns2σ02,

gdzie:

s2 jest wariancją z próby,
n jest liczebnością próby.

Statystyka ta ma przy założeniu prawdziwości hipotezy zerowej rozkład chi-kwadrat z n1 stopniami swobody. Wartość krytyczną χkryt2 odczytujemy z tablic rozkładu chi-kwadrat dla ν=n1 stopni swobody oraz:

  • dla poziomu istotności α gdy hipoteza alternatywna H1 ma postać Szablon:LinkWzór,
  • dla poziomu istotności 1α gdy hipoteza alternatywna H1 ma postać Szablon:LinkWzór,
  • gdy hipoteza alternatywna H1 ma postać Szablon:LinkWzór odczytujemy dwie wartości krytyczne:
    • χkryt12 dla poziomu istotności 1α2 oraz
    • χkryt22 dla poziomu istotności α2.

Obszar krytyczny:

  • w przypadku Szablon:LinkWzór obszar krytyczny jest prawostronny, czyli Q={χ2:χ2>χkryt2},
  • w przypadku Szablon:LinkWzór obszar krytyczny jest lewostronny, czyli Q={χ2:χ2<χkryt2},
  • w przypadku Szablon:LinkWzór obszar krytyczny jest obustronny, tzn. Q={χ2:χ2<χkryt12χ2>χkryt22}.

Jeżeli wyznaczona wartość statystyki χ2 nie należy do obszaru krytycznego Q, to nie ma podstaw do odrzucenia hipotezy zerowej. Jeżeli wyznaczona wartość statystyki χ2 należy do obszaru krytycznego Q, to hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej.

Próby duże

Dla liczebności próby n>30 możemy przekształcić wyznaczoną w poprzednim punkcie statystykę chi-kwadrat w statystykę Z o rozkładzie normalnym obliczając:

Z=2χ22ν1.

Nie oznacza to, że nie można stosować nadal statystyk dla małych prób. Są one nadal dokładniejsze, wymagają jednak komputerowego obliczania rozkładu, gdyż tablice na ogół nie sięgają tak daleko.

W powyższym wzorze χ2 oraz ν=n1 oznaczają statystykę chi-kwadrat i jej liczbę stopni swobody wyznaczone tak, jak w poprzednim paragrafie (dla prób małych).

Wartości krytyczne znajdujemy z tablic dystrybuanty rozkładu normalnego. Jeżeli Fn(z) jest dystrybuantą standardowego rozkładu normalnego, a Fn1(α) – funkcją odwrotną do dystrybuanty, natomiast α – założonym poziomem istotności – to odczytujemy:

Zkryt=Fn1(1α),
Zkryt=Fn1(α2)=Fn1(1α),
Zkryt1=Fn1(1α2)
oraz
Zkryt2=Zkryt1.

Dalszy przebieg testu i wnioski – jak poprzednio.

Testy dla dwóch wariancji

Mamy tu do czynienia z dwiema próbami o liczebnościach n1 i n2, znamy też „wariancje z próby” (estymatory wariancji) s12 i s22 – testujemy hipotezę, że próby te pochodzą z populacji o jednakowych wariancjach. Postać hipotez:

  • H0:σ12=σ22,
  • H1: postać hipotezy alternatywnej zależy od sformułowania zagadnienia:
    Szablon:Wzór

albo

albo też

Testy dla dwóch prób niezależnych

Próby małe

W tym przypadku można wykorzystać kilka testów:

Test F (Fishera)

Niech X1,,Xn i Y1,,Ym będą próbami statystycznymi z rozkładu normalnego (test nie jest odporny na naruszenia tego założenia[1][2]), ze średnimi próbkowymi odpowiednio:

X=1ni=1nXi  i Y=1mi=1mYi.

Niech

SX2=1n1i=1n(XiX)2  i SY2=1m1i=1m(YiY)2

będą wariancjami próbkowymi. Wtedy test statystyczny

F=SX2SY2

ma rozkład F Snedecora z ν1=n1,ν2=m1 stopniami swobody jeśli hipoteza zerowa o równości wariancji jest prawdziwa. Z tablic tego rozkładu, dla testu prawostronnego, odczytuje się wartość krytyczną:

Fkryt1=F(1α,ν1,ν2).

Jeżeli stosuje się test lewostronny, to najprościej jest zamienić miejscami próby 1 i 2.

W przypadku testu obustronnego wyznacza się

Fkryt1=F(α2,ν1,ν2)

oraz drugą wartość graniczną ze wzoru:

Fkryt2=1Fkryt1.
Test t-Studenta

(dwie małe próby o równych liczebnościach)

Stosujemy statystykę

t=s12s222s12s22n1

(n jest tutaj wspólną liczebnością obu prób).

Statystyka ta ma rozkład Studenta o ν=n1 stopniach swobody.

Test t-Studenta stosujemy w przypadku, gdy próby pochodzą z populacji o rozkładzie normalnym i gdy nie znamy wariancji.

Test Linka

Gdy znane są jedynie rozstępy R1 i R2 obu prób, wtedy wyznaczamy statystykę

F*=R1R2,

przy czym w liczniku powinna być większa wartość (hipoteza H1 ma postać Szablon:LinkWzór). Statystykę tę porównujemy z wartością krytyczną odczytaną ze specjalnych tablic dla testu Linka – patrz np. (Zieliński, 1972).

Próby duże

(n1>30,n2>30)

W tym przypadku można wykorzystać statystykę z o rozkładzie normalnym:

z=s12s22s122n1+s222n2

i porównać jej wartość z wartościami granicznymi wyznaczonymi z tablicy standaryzowanego rozkładu normalnego w dokładnie taki sam sposób, jak opisano to dla testu dla jednej wariancji i dużej próby.

Tak jak poprzednio, nie oznacza to, że nie można stosować nadal statystyk dla małych prób. Są one nadal dokładniejsze, wymagają jednak komputerowego obliczania rozkładu, gdyż tablice na ogół nie sięgają tak daleko.

Testy dla dwóch prób zależnych

Przypadek taki zachodzi np. gdy badamy ten sam zbiór obiektów w dwóch różnych sytuacjach (w różnych warunkach) – wtedy na ogół liczebności prób są jednakowe (n1=n2=n).

Test Morgana dla prób małych

Wyznaczamy statystykę o rozkładzie t-Studenta:

t=s12s222s12s22(1r2)n2,

gdzie n jest wspólną liczebnością prób, a rwspółczynnikiem korelacji Pearsona, który jest miarą korelacji pomiędzy wynikami w próbie 1 i próbie 2. Tę wartość statystyki t porównujemy z wartością krytyczną (lub 2 wartościami krytycznymi) odczytanymi z tablic rozkładu t-Studenta dla v=n2 stopni swobody.

Test Morgana dla prób dużych

Test przebiega podobnie, z tą różnicą, że wartości graniczne można odczytać z tablicy rozkładu normalnego (bo dla dużych wartości stopni swobody rozkład t-Studenta zmierza asymptotycznie do rozkładu normalnego).

Testy dla wielu wariancji

Mamy k prób. Hipotezy mają postać:

H0:σ12=σ22==σk2
H1: „nie H0” (nie wszystkie wariancje są równe)

Próby niezależne

Test Bartletta

Gdy liczebności prób są różne – stosujemy test Bartletta, oparty na statystyce chi-kwadrat:

χ2=νlns2j=1k(νjlnsj2)c,

przy czym we wzorze tym:

ni są liczebnościami poszczególnych prób,
si2 – wariancjami z próby,
νi=ni1,
ν=i=1knik,
s2=i=1k(ni1)si2nk,
c=1+13(k1)(i=1k1νi1ν).

Obliczona wartość χ2 jest porównywana z wartością krytyczną wyznaczoną z tablic rozkładu chi-kwadrat dla k1 stopni swobody. Obszar krytyczny jest zawsze prawostronny (zbyt duże wartości statystyki świadczą o niejednorodności wariancji).

Aby można było stosować test Bartletta – musi być spełnione założenie, że liczebności prób nie są skrajnie małe, tzn. że ni5 dla każdego i=1,2,,k.

Gdy mamy k prób równolicznych, każda o liczebności n – możemy stosować też inne testy (prostsze rachunkowo):

Test Hartleya

Mamy k prób o jednakowej liczebności (n1==nk=n). Obliczamy wartość statystyki Fh zgodnie ze wzorem:

Fh=smax2smin2,

gdzie:

  • si2 – estymatory wariancji dla każdej z prób (i=1,2,,k),
  • smax2=max(s12,,sk2) jest największą spośród wariancji si2,
  • smin2=min(s12,,sk2) jest najmniejszą spośród wariancji si2.

Wartość statystyki Fh musi być porównywana z wartościami krytycznymi odczytywanymi z tablic specjalnie skonstruowanych dla tego testu (p. Zieliński 1972). Test Hartleya ma zawsze prawostronny obszar krytyczny.

Test Cadwella

Jest to test do badania hipotezy o jednorodności wariancji dla k prób niezależnych i równolicznych (o liczebności n każda). Test ten jest oparty na wartości rozstępów, wyznaczamy mianowicie wartość statystyki:

C*=RmaxRmin

(stosunek największego do najmniejszego rozstępu w badanych próbach) i porównujemy tę wartość z wartością krytyczną odczytaną z tablic specjalnie dostosowanych do tego testu, która zależy od poziomu istotności α, liczby prób k i ich liczebności n.

Test ten, tak jak poprzednie, jest zawsze prawostronny.

Próby zależne

Test Patnaika

Mamy k prób zależnych o liczebności n każda. Liczebności powinny spełniać warunek nk>10. Test oparty jest na wartościach rozstępów poszczególnych prób. Wyznaczamy dwie wartości:

  • średni rozstęp
R=1ki=1kRi
oraz
  • „rozstęp rozstępów”
RR=RmaxRmin,

po czym porównujemy wartość stosunku qs=cRRR z odpowiednią wartością krytyczną qkryt. Zarówno ta wartość krytyczna, jak i stała c musi być odczytana z tablic specjalnie przygotowanych dla tego testu. Obszar krytyczny testu jest prawostronny, tj. gdy qs>qkryt – wnioskujemy, że wariancje w porównywanych populacjach nie są jednorodne. W takim przypadku – można stosować ten test sekwencyjnie (w kolejnych podgrupach).

Zobacz też

Szablon:Wikiźródła Szablon:Wikiźródła Szablon:Wikiźródła Szablon:Wikiźródła Szablon:Clear

Przypisy

Szablon:Przypisy

Bibliografia

  • Zieliński R., „Tablice statystyczne”, PWN, Warszawa 1972
  • Barańska Z., „Podstawy metod statystycznych dla psychologów”, Wyd. Uniw. Gdańskiego, Gdańsk 2000, Szablon:ISBN (m.in. cytowane są tablice dla testów Patnaika i Cadwella)