Pseudo R-kwadrat

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Pseudo R-kwadrat – ogólna nazwa miar dopasowania stosowanych do oceny modelu regresji, w którym zmienna objaśniana jest nominalna lub porządkowa, w związku z czym współczynnik determinacji R2 nie może być zastosowany.

W przypadku regresji logistycznej stosuje się kilka konkurencyjnych miar, z których każda ma swoje ograniczenia[1]. Należą do nich między innymi:

  • Pseudo R-kwadrat Coxa i Snella
  • Pseudo R-kwadrat Nagelkerke'a (Cragga-Uchlera)
  • Pseudo R-kwadrat McFaddena

Pseudo R-kwadrat Coxa-Snella

Pseudo R-kwadrat Coxa-Snella wyraża się następującym wzorem:

RCS2=1(L0LM)2/n=1e2(ln(L0)ln(LM))/n

gdzie n to liczebność próby, zaś L0 i LM to funkcje wiarygodności odpowiednio dla modelu zerowego (zawierającego jedynie wyraz wolny) i modelu ocenianego. Miara Coxa-Snella jest problematyczna ze względu na to, że jej maksymalna wartość 1L02/n, która jest osiągana gdy analizowany model przewiduje zmienną objaśnianą w sposób doskonały, może być wyraźnie mniejsza niż 1[2].

Pseudo R-kwadrat Nagelkerke'a

Miara pseudo R-kwadrat Nagelkerke'a, znana również pod nazwą pseudo R-kwadrat Cragga-Uchlera[2] jest modyfikacją miary RCS2, tak żeby jej wartość maksymalna wynosiła 1:

RN2=RCS21L02/n=1(L0LM)2/n1L02/n

Pseudo R-kwadrat McFaddena

Miara pseudo R-kwadrat McFaddena opiera się na logarytmie funkcji wiarygodności i jest zdefiniowana w następujący sposób[3]:

RMcF2=1ln(LM)ln(L0).

Przypisy

Szablon:Przypisy