Przedział predykcji

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Przedział predykcji – wyznaczone na podstawie zebranych danych oszacowanie zakresu, w którym z ustalonym prawdopodobieństwem (równym 1α) będzie mieścić się nowa obserwacja pochodząca z badanej populacji. Przedziały predykcji to narzędzie wnioskowania statystycznego. Są one używane przede wszystkim, ale nie wyłącznie, w analizie regresji.

Przedział predykcji na podstawie próby losowej

Załóżmy, że z populacji, co do której w przybliżeniu możemy założyć rozkład normalny, pobrano n-elementową prostą próbę losową. W takiej sytuacji przedział predykcji dla nowej obserwacji pochodzącej z tej samej populacji można wyznaczyć na podstawie wzoru[1]:

x¯±t(α/2,n1)s1+1n,

gdzie x¯ to średnia z próby, s to odchylenie standardowe z próby, zaś t(α/2,n1) to kwantyl rzędu 1α2 rozkładu t Studenta z n1 stopniami swobody.

Warto zauważyć, że przedział predykcji jest zwykle dużo szerszy niż analogiczny przedział ufności dla średniej wyrażony podobnym wzorem: x¯±t(α/2,n1)s1n. Jest tak dlatego, że przedział ufności stanowi oszacowanie średniej, a przedział predykcji oszacowanie pojedynczej nowej wartości z populacji.

Przedział predykcji w regresji prostej

Korzystając z klasycznego modelu regresji prostej (regresji liniowej z jedną zmienną objaśniającą), można prognozować wartość zmiennej objaśnianej dla nowej obserwacji h, pochodzącej z populacji, używając wzoru[2]:

y^h±t(α/2,n2)σ^1+1n+(xhx¯)2i=1n(xix¯)2

gdzie xh to wartość zmiennej objaśniającej nowej obserwacji, y^h to prognoza punktowa zmiennej objaśnianej, n to liczba obserwacji wykorzystanych do zbudowania modelu (liczebność próby), x¯ to średnia wartość zmiennej objaśniającej w próbie, t(α/2,n2) to kwantyl rzędu 1α2 rozkładu t Studenta z n2 stopniami swobody, zaś σ^ to pierwiastek ze średniego kwadratu reszt σ^2:

σ^2=i(yiy^i)2n2

Przedział predykcji w regresji wielorakiej

Dla modelu klasycznej liniowej regresji wielorakiej przedział predykcji możemy wyznaczyć, stosując wzór[3]:

y^h±t(α/2,nk1)σ^1+𝐱h(𝐗𝐗)1𝐱h,

gdzie 𝐱h to wektor zmiennych objaśniających nowej obserwacji (z elementem równym jeden odpowiadającym wyrazowi wolnemu, zwykle na pierwszej pozycji), y^h to prognoza punktowa zmiennej objaśnianej, n to liczba obserwacji wykorzystanych do zbudowania modelu (liczebność próby), k to liczba zmiennych objaśniających, 𝐗 to macierz układu zawierająca kolumnę jedynek odpowiadającą wyrazowi wolnemu oraz wartości k zmiennych objaśniających (w kolumnach) dla n obserwacji (w wierszach), t(α/2,nk1) to kwantyl rzędu 1α2 rozkładu t Studenta z nk1 stopniami swobody, zaś σ^ to pierwiastek ze średniego kwadratu reszt wyznaczonego za pomocą wzoru:

σ^2=i(yiy^i)2nk1.

Zobacz też

Przypisy

Szablon:Przypisy