Test Shapiro-Wilka

Z testwiki
Wersja z dnia 22:05, 14 sie 2024 autorstwa imported>Chrumps (drobne redakcyjne)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Test Shapiro–Wilka – standardowy test statystyczny, wykorzystywany do testowania normalności danych. Został opublikowany w 1965 roku przez Samuela Shapiro i Martina Wilka. Szablon:Spis treści

Teoria

Załóżmy, że pobraliśmy próbę x1,,xn i chcemy sprawdzić czy pochodzi z rozkładu normalnego. Hipoteza zerowa i alternatywna w teście Shapiro–Wilka ma następującą postać:

H0: Próba pochodzi z populacji o rozkładzie normalnym
H1: Próba nie pochodzi z populacji o rozkładzie normalnym.

W celu przeprowadzenia testu wykorzystuje się statystykę W:

  • Uporządkuj obserwacje niemalejąco: y1y2yn
  • Oblicz: 𝑆𝑆𝐸=i=1n(yiy¯)2
  • Jeżeli n jest parzyste, niech m=n2, w przeciwnym razie m=n12
  • Używając stabelaryzowanych wartości ai oblicz b=i=1mai(yn+1iyi)
  • Oblicz statystykę W=b2𝑆𝑆𝐸
  • Porównaj wynik ze stabelaryzowanymi wartościami dla odpowiednich poziomów ufności i liczebności próby.

Przykład

W celu zilustrowania procesu, załóżmy, że mamy następujące obserwacje:

x1=6,x2=1,x3=4,x4=8,x5=2,x6=5,x7=0.
  • Sortując otrzymujemy: y1=4,y2=2,y3=0,y4=1,y5=5,y6=6,y7=8.
  • Obliczając 𝑆𝑆𝐸=i=17(yiy¯)2=118
  • Dla wartości n=7 z odpowiednich tabel otrzymujemy kolejne wartości: a7=0,6233,a6=0,3031,a5=0,1401,a4=0,0000 oraz wartość b=0,6233(8+4)+0,3031(6+2)+0,1401(50)=10,6049
  • Wartość statystyki W=10,60492118=0,9530

Wartość teoretycznej statystyki W na poziomie istotności 5% i n=7 wynosi 0,803. Ponieważ ta wartość jest mniejsza niż otrzymana z testu, nie mamy powodu odrzucić hipotezy, że próba pochodzi z rozkładu normalnego.

Porównanie z innymi testami

Analiza porównawcza przy użyciu metod Monte Carlo pokazała, że test Shapiro–Wilka ma największą moc spośród testów badających normalność: testu Andersona–Darlinga, testu Kołmogorowa–Smirnowa czy testu Lillieforsa[1].

Modyfikacja testu

Oryginalnie zaproponowane podejście ograniczało się do próbek poniżej 50 obserwacji. Royston w 1995 roku zaproponował algorytm AS R181, który mógł być wykorzystany w zakresie 3n5000.

Zobacz też

Przypisy

Szablon:Przypisy

Bibliografia

  • S.S. Shapiro, M.B. Wilk., An Analysis of Variance Test for Normality, Biometrika, Vol. 52, No. 3/4. (Dec., 1965), s. 591–611
  • Nornadiah Mohd Razali, Yap Bee Wah, Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests, Journal of Statistical Modeling and Analytics, Vol. 2 No. 1, 21–33, 2011

Linki zewnętrzne

Szablon:Kontrola autorytatywna