Poprawka Bessela

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania
Dwuwymiarowy wykres punktowy przedstawiający setki symulacji prób, oraz dopasowane do ich rozkładów linie. Błąd oszacowania z poprawką jest, niezależnie od rozmiaru próby, znacznie bliższy zera.
Błąd oszacowania wariancji (na osi Y) z poprawką i bez (kolor czarny i żółty), w zależności od wielkości próby (na osi X) – ilustrowany na podstawie stu symulacji losowań z rozkładu normalnego (μ=0, σ²=1) dla każdego n. Średni błąd oszacowania z poprawką jest równy zeru. Błąd estymatora bez poprawki jest szczególnie silny w próbach mniejszych niż ok. 30 obserwacji.

Poprawka Bessela – stosowanie n1 zamiast surowej liczby obserwacji n przy statystycznej estymacji wariancji populacji na podstawie próby. Poprawka redukuje obciążenie tego estymatora (systematyczne niedoszacowanie wariancji) wynikające z jednoczesnego szacowania wariancji i średniej ze skończonej próby. Ma znaczenie zwłaszcza przy próbach poniżej ok. 30 obserwacji[1][2]. Jej zwyczajowa nazwa odwołuje się do astronoma Friedricha W. Bessela; technikę opisał w tym samym okresie jednak także Carl Gauss[3].

Poprawka nie jest potrzebna, jeśli do obliczeń wykorzystuje się prawdziwą średnią populacyjną. Jeśli dane nie pochodzą z rozkładu normalnego, poprawka może być nieskuteczna i zwiększać błąd średniokwadratowy estymatora[4]. Nie zapewnia nieobciążenia oszacowania odchylenia standardowego. Inne momenty rozkładu (jak skośność i kurtoza) także wymagają poprawek, jednak jest to bardziej skomplikowane.

Dowód

Oczekiwana rozbieżność pomiędzy obciążonym estymatorem wariancji z próby, a jej prawdziwą wartością w populacji, odpowiada wariancji średniej z próby:

E[σ2sobc.2]=E[1ni=1n(xiμ)21ni=1n(xix)2]=1nE[i=1n((xi22xiμ+μ2)(xi22xix+x2))]=E[μ2x2+1ni=1n(2xi(xμ))]=E[μ2x2+2(xμ)x]=E[μ22xμ+x2]=E[(xμ)2]=Var(x)=σ2n

I analogicznie, oczekiwana wartość obciążonego estymatora to prawdziwa wartość wariancji pomniejszona o tę rozbieżność:

E[sobc.2]=σ2σ2n=n1nσ2

Co pozwala uzyskać następujący wzór na estymator nieobciążony:

snieobc.2=nn1sobc.2

Intuicja

Estymator obciążony jest obliczany przy użyciu średniej z próby, co wprowadza dodatkowe źródło błędu – każde odchylenie obserwacji, xiμ, jest niedoszacowane o odchylenie średniej z próby od średniej z populacji, x¯μ. Wariancja jej estymatora wynosi σ2n. Poprawka Bessela usuwa to systematyczne obciążenie.

Przypisy

Szablon:Przypisy