Pseudo R-kwadrat
Pseudo R-kwadrat – ogólna nazwa miar dopasowania stosowanych do oceny modelu regresji, w którym zmienna objaśniana jest nominalna lub porządkowa, w związku z czym współczynnik determinacji R2 nie może być zastosowany.
W przypadku regresji logistycznej stosuje się kilka konkurencyjnych miar, z których każda ma swoje ograniczenia[1]. Należą do nich między innymi:
- Pseudo R-kwadrat Coxa i Snella
- Pseudo R-kwadrat Nagelkerke'a (Cragga-Uchlera)
- Pseudo R-kwadrat McFaddena
Pseudo R-kwadrat Coxa-Snella
Pseudo R-kwadrat Coxa-Snella wyraża się następującym wzorem:
gdzie to liczebność próby, zaś i to funkcje wiarygodności odpowiednio dla modelu zerowego (zawierającego jedynie wyraz wolny) i modelu ocenianego. Miara Coxa-Snella jest problematyczna ze względu na to, że jej maksymalna wartość , która jest osiągana gdy analizowany model przewiduje zmienną objaśnianą w sposób doskonały, może być wyraźnie mniejsza niż 1[2].
Pseudo R-kwadrat Nagelkerke'a
Miara pseudo R-kwadrat Nagelkerke'a, znana również pod nazwą pseudo R-kwadrat Cragga-Uchlera[2] jest modyfikacją miary , tak żeby jej wartość maksymalna wynosiła 1:
Pseudo R-kwadrat McFaddena
Miara pseudo R-kwadrat McFaddena opiera się na logarytmie funkcji wiarygodności i jest zdefiniowana w następujący sposób[3]: