Funkcja wiarygodności

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania
Wykres liniowy przedstawiający rozkład o przybliżonym kształcie dzwonu.
Wykres funkcji wiarygodności dla parametru k rozkładu Poissona przy zaobserwowanych danych {3, 5}.

Funkcja wiarygodności (wiarygodność) – w statystyce, funkcja parametru modelu i próby losowej, która jest proporcjonalna do prawdopodobieństwa zaobserwowania próby o konkretnej postaci przy różnych parametrach modelu. Wyraża „wiarygodność” wartości parametru w obliczu danych. Odgrywa kluczową rolę we wnioskowaniu statystycznym[1]. Jej nazwę wprowadził Ronald Fisher w 1922[2].

Definicja

Najbardziej ogólna postać funkcji wiarygodności L(Hθ), zapisywanej także jako L(Hθ|D) lub z użyciem symbolu , to[1]:

L(Hθ|D)=K×P(D|Hθ),

gdzie K to arbitralna dodatnia stała proporcjonalności wynikająca ze specyficzności przyjętego modelu, Hθ to reprezentujący różne hipotezy wektor zmiennych wartości parametru θ, a D to stały, dany wektor obserwacji. P to funkcja gęstości lub masy prawdopodobieństwa, dla przyjętego modelu statystycznego[1][3].

Realizacja funkcji wiarygodności dla wektora obserwacji ma z reguły dla danych iid formę typu[4]:

L(Hθ)=i=1nP(xi|θ).

Wiarygodność to, w uproszczeniu, prawdopodobieństwo parametru w konkretnym kontekście ustalonych obserwacji i modelu. Ma podobną postać do prawdopodobieństwa danych dla parametru (czyli funkcji gęstości lub masy), ale przyjmuje odwrotnie to, który czynnik jest losowy, a który stały[1][2].

Interpretacja

Interpretacja wiarygodności ma sens tylko z zachowaniem kontekstu; bardziej przyjaznym wskaźnikiem jest iloraz wiarygodności, który wskutek dzielenia pozbawiony jest stałej K reprezentującej specyfikę modelu[1].

Oszacowanie wiarygodności nie jest jednak samo w sobie wyczerpującą podstawą do osądzania prawdziwości hipotez. Sam fakt, że jedno wyjaśnienie jest dużo bardziej prawdopodobne od alternatywnego, w oderwaniu od dodatkowych wskaźników i rozumowania, nie jest wyczerpująco diagnostyczny. Ilustruje to problem błędu rozumowania prokuratorskiego, takiego jak sprawa Sally Clark, matki dwójki dzieci, które zmarły z rozpoznaniem nagłej śmierci łóżeczkowej. Po śmierci drugiego dziecka została oskarżona o morderstwo i skazana w 1999, w dużej mierze na podstawie zeznań profesora pediatrii, który oszacował szansę na dwukrotne wystąpienie bardzo rzadkiej w populacji przyczyny śmierci przypadkiem na bardzo małą. Proces ściągnął na Clark dużą antypatię opinii publicznej. Została uniewinniona na podstawie nowo ujawnionych dowodów w 2003, popadła jednak w alkoholizm i zmarła w 2007 w wieku 43 lat, osieracając jedno żyjące dziecko. Sposób argumentacji statystycznej przedstawionej w trakcie procesu był potem głęboko krytykowany jako tragiczne nadużycie[5][6].

Prawo wiarygodności

Pojęcie wiarygodności może być pomocne we wnioskowaniu w przypadku porównywania dwóch hipotez. Zgodnie z prawem wiarygodności, jeżeli obie są zgodne z dostępnymi danymi, większe poparcie w danych ma hipoteza o większej wiarygodnościSzablon:R. Porównując wiarygodności można nie tylko wskazać, która z hipotez ma lepsze poparcie, ale możliwe jest również mierzenie tego poparcia dzięki ilorazowi wiarygodnościSzablon:R.

Zastosowania

Wiarygodność jest wykorzystywana we wszystkich głównych podejściach do wnioskowania statystycznego (np. częstościowym czy bayesowskim). Część statystyków preferuje odrębne podejście oparte wręcz wyłącznie na ilorazach wiarygodności[1].

Ponieważ wiarygodność jest z reguły używana w postaci ilorazów, często wyraża się ją w postaci logarytmu naturalnego. Jest on także łatwiejszy w maksymalizacji, co wykorzystuje metoda największej wiarygodności w estymacji[1].

Iloraz wiarygodności

Iloraz wiarygodności, zapisywany z reguły przy pomocy symbolu Λ, to:

Λ(θ1:θ2x)=L(θ1x)L(θ2x).

Wiele testów statystycznych opiera się o – poprzedzone wyborem odpowiedniego (lub nie) modelu, definiującego P – porównanie wiarygodności dwóch hipotez. Takie porównanie jest częścią lematu Neymana-Pearsona, i było ważnym historycznym źródłem kształtującym testy w podejściu częstościowym. W statystyce bayesowskiej miary tego typu noszą nazwę czynnika Bayesa[1]. Iloraz wiarygodności jest wykorzystywany w teście ilorazu wiarygodności.

Przypisy

Błąd rozszerzenia cite: Znacznik <ref> o nazwie „edwards”, zdefiniowany w <references>, nie był użyty wcześniej w treści.
Błąd rozszerzenia cite: Znacznik <ref> o nazwie „sober”, zdefiniowany w <references>, nie był użyty wcześniej w treści.

Szablon:Kontrola autorytatywna