D Somersa
D Somersa (Delta Somersa) – jedna z miar zależności, badająca siłę związku pomiędzy zmiennymi porządkowymi. Nazwana jest na cześć amerykańskiego socjologa i statystyka Roberta Somersa, który zaproponował ją w 1962 roku[1].
Definicja
D Somersa można zdefiniować z wykorzystaniem miary tau Kendalla (). Dla dwóch zmiennych: X i Y, nazywanej zależną, D Somersa wynosi[2]:
Wykorzystanie
W praktyce D Somersa wykorzystuje się najczęściej w sytuacji, gdy zmienna Y jest zmienną dychotomiczną (zero-jedynkową). W takiej sytuacji D jest przekształceniem liniowym pola pod krzywą ROC (AUC):
- .
i można je zinterpretować następująco: jeżeli wylosujemy dwie obserwacje, jedną spośród obserwacji spełniających warunek Y=1 z odpowiadającą jej wartością X1 i drugą z grupy Y=0 z odpowiadającą jej wartością X0, to D jest różnicą prawdopodobieństw[2]:
- .
W praktyce bankowych modeli scoringowych D Somersa znane jest pod nazwą statystyki Giniego[3].