Tablica pomyłek

Z testwiki
Wersja z dnia 12:09, 21 lut 2025 autorstwa imported>Blakocha (formatowanie)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Tablica pomyłek (nazywana również macierzą pomyłek[1] lub macierzą błędów) – tabela przedstawiająca skuteczność działania algorytmu klasyfikacyjnego, najczęściej binarnego (czyli przewidującego przynależność do jednej z dwóch klas). Każda kolumna tablicy przedstawia możliwe rzeczywiste etykiety badanych jednostek, a każdy wiersz przedstawia etykiety przewidywane przez algorytm[2]. Spotyka się również transponowaną wersję macierzy, gdzie klasy rzeczywiste są w wierszach, a przewidywane w kolumnach[1].

W przypadku klasyfikatora binarnego tablica pomyłek ma wymiary 2×2. Badane jednostki są w takiej sytuacji oznaczone dwoma etykietami: pozytywną i negatywną. Algorytm klasyfikacyjny przypisuje im predykowaną (tzn. przewidywaną) klasę pozytywną albo negatywną. Możliwa jest sytuacja, że jednostka w rzeczywistości pozytywna zostanie omyłkowo zaklasyfikowana jako negatywna, a jednostka w rzeczywistości negatywna jako pozytywna – stąd nazwa macierzy.

Klasa rzeczywista
pozytywna negatywna
Klasa
predykowana
pozytywna prawdziwie
pozytywna (TP)
fałszywie
pozytywna (FP)
negatywna fałszywie
negatywna (FN)
prawdziwie
negatywna (TN)

Na podstawie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg wskaźników oceniających siłę predykcyjną klasyfikatora (np. testu diagnostycznego). Poniższy wykres podsumowuje ich powiązania, przy czym – odwrotnie niż w tablicy powyżej – klasa rzeczywista jest w wierszach, a klasa przewidywana w kolumnach:

Klasa predykowana – wynik testu
Populacja Klasyfikacja pozytywna Klasyfikacja negatywna Częstość występowania, chorobowość

stan pozytywnypopulacja

Klasa
rzeczywista
Stan
pozytywny
prawdziwie dodatnia, TP
(trafienie)
fałszywie ujemna
(błąd drugiego rodzaju, FN,
chybienie)
czułość, TPR

𝐓𝐏𝐓𝐏+𝐅𝐍

FNR

𝐅𝐍𝐓𝐏+𝐅𝐍

Stan
negatywny
fałszywie dodatnia
(błąd pierwszego rodzaju, FP,
fałszywy alarm)
prawdziwie ujemna, TN
(poprawne odrzucenie)
FPR

𝐅𝐏𝐅𝐏+𝐓𝐍

swoistość, SPC, TNR

𝐓𝐍𝐅𝐏+𝐓𝐍

dokładność, ACC

𝐓𝐏+𝐓𝐍populacja

precyzja, PPV

𝐓𝐏𝐓𝐏+𝐅𝐏

FOR

𝐅𝐍𝐅𝐍+𝐓𝐍

LR+

𝐓𝐏𝐑𝐅𝐏𝐑

DOR

𝐋𝐑+𝐋𝐑

FDR

𝐅𝐏𝐓𝐏+𝐅𝐏

NPV

𝐓𝐍𝐅𝐍+𝐓𝐍

LR-

𝐅𝐍𝐑𝐓𝐍𝐑


Oznaczenia jednostek w zależności od ich klasy rzeczywistej i przewidywanej:

Miary:

  • czułość (ang. sensitivity), pełność[3] (ang. recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)
TPR=TP/P=TP/(TP+FN)
  • swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)
TNR=TN/N=TN/(FP+TN)
  • dokładność (ang. accuracy, ACC)
ACC=(TP+TN)/(P+N)=(TP+TN)/(TP+FN+TN+FP)
PPV=TP/(TP+FP)
  • ujemna wartość predykcyjna (ang. negative predictive value, NPV)
NPV=TN/(TN+FN)
  • odsetek fałszywie pozytywnych (ang. false positive rate, FPR)
FPR=FP/N=FP/(FP+TN)=1TNR
  • odsetek fałszywie negatywnych (ang. false negative rate, FNR)
FNR=FN/P=FN/(TP+FN)=1TPR
  • wskaźnik (iloraz) wiarygodności wyniku dodatniego[4] (ang. positive likelihood ratio, LR+)
LR+=TPR/(1TNR)=TPR/FPR=TP(FP+TN)FP(TP+FN)
  • wskaźnik (iloraz) wiarygodności wyniku ujemnego (ang. negative likelihood ratio, LR-)
LR=(1TPR)/TNR=FNR/TNR=FN(FP+TN)TN(TP+FN)
DOR=LR+LR=TP/FPFN/TN=TPTNFPFN

Przykład

Klasa rzeczywista
pozytywna negatywna
Klasa
predykowana
pozytywna Ludzie chorzy poprawnie
zdiagnozowani jako chorzy
Ludzie zdrowi błędnie
zdiagnozowani jako chorzy
(błąd pierwszego rodzaju)
negatywna Ludzie chorzy błędnie
zdiagnozowani jako zdrowi
(błąd drugiego rodzaju)
Ludzie zdrowi poprawnie
zdiagnozowani jako ludzie zdrowi

Przypisy

Szablon:Przypisy