Tablica pomyłek
Tablica pomyłek (nazywana również macierzą pomyłek[1] lub macierzą błędów) – tabela przedstawiająca skuteczność działania algorytmu klasyfikacyjnego, najczęściej binarnego (czyli przewidującego przynależność do jednej z dwóch klas). Każda kolumna tablicy przedstawia możliwe rzeczywiste etykiety badanych jednostek, a każdy wiersz przedstawia etykiety przewidywane przez algorytm[2]. Spotyka się również transponowaną wersję macierzy, gdzie klasy rzeczywiste są w wierszach, a przewidywane w kolumnach[1].
W przypadku klasyfikatora binarnego tablica pomyłek ma wymiary 2×2. Badane jednostki są w takiej sytuacji oznaczone dwoma etykietami: pozytywną i negatywną. Algorytm klasyfikacyjny przypisuje im predykowaną (tzn. przewidywaną) klasę pozytywną albo negatywną. Możliwa jest sytuacja, że jednostka w rzeczywistości pozytywna zostanie omyłkowo zaklasyfikowana jako negatywna, a jednostka w rzeczywistości negatywna jako pozytywna – stąd nazwa macierzy.
| |||||||||||||
Na podstawie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg wskaźników oceniających siłę predykcyjną klasyfikatora (np. testu diagnostycznego). Poniższy wykres podsumowuje ich powiązania, przy czym – odwrotnie niż w tablicy powyżej – klasa rzeczywista jest w wierszach, a klasa przewidywana w kolumnach:
| Klasa predykowana – wynik testu | |||||
| Populacja | Klasyfikacja pozytywna | Klasyfikacja negatywna | Częstość występowania, chorobowość
|
||
| Klasa rzeczywista |
Stan pozytywny |
prawdziwie dodatnia, TP (trafienie) |
fałszywie ujemna (błąd drugiego rodzaju, FN, chybienie) |
czułość, TPR
|
FNR
|
| Stan negatywny |
fałszywie dodatnia (błąd pierwszego rodzaju, FP, fałszywy alarm) |
prawdziwie ujemna, TN (poprawne odrzucenie) |
FPR
|
swoistość, SPC, TNR
| |
| dokładność, ACC
|
precyzja, PPV
|
FOR
|
LR+
|
DOR
| |
| FDR
|
NPV
|
LR-
| |||
Oznaczenia jednostek w zależności od ich klasy rzeczywistej i przewidywanej:
- prawdziwie pozytywna (ang. Szablon:K, TP), trafienie (ang. Szablon:K)
- prawdziwie negatywna (ang. Szablon:K, TN), poprawne odrzucenie (ang. Szablon:K)
- fałszywie pozytywna (ang. Szablon:K, FP), błąd pierwszego rodzaju, fałszywy alarm (ang. Szablon:K)
- fałszywie negatywna (ang. Szablon:K, FN), błąd drugiego rodzaju, chybienie (ang. Szablon:K)
- pozytywna P = (TP + FN)
- negatywna N = (TN + FP)
Miary:
- czułość (ang. sensitivity), pełność[3] (ang. recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)
- swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)
- dokładność (ang. accuracy, ACC)
- precyzja (ang. precision) lub dodatnia wartość predykcyjna[2] (ang. positive predictive value, PPV)
- ujemna wartość predykcyjna (ang. negative predictive value, NPV)
- odsetek fałszywie pozytywnych (ang. false positive rate, FPR)
- odsetek fałszywie negatywnych (ang. false negative rate, FNR)
- wskaźnik (iloraz) wiarygodności wyniku dodatniego[4] (ang. positive likelihood ratio, LR+)
- wskaźnik (iloraz) wiarygodności wyniku ujemnego (ang. negative likelihood ratio, LR-)
- diagnostyczny iloraz szans (ang. diagnostic Odds ratio, DOR)
Przykład
| |||||||||||||