Tablica pomyłek

Tablica pomyłek (nazywana również macierzą pomyłek^[1] lub macierzą błędów) – tabela przedstawiająca skuteczność działania algorytmu klasyfikacyjnego, najczęściej binarnego (czyli przewidującego przynależność do jednej z dwóch klas). Każda kolumna tablicy przedstawia możliwe rzeczywiste etykiety badanych jednostek, a każdy wiersz przedstawia etykiety przewidywane przez algorytm^[2]. Spotyka się również transponowaną wersję macierzy, gdzie klasy rzeczywiste są w wierszach, a przewidywane w kolumnach^[1].

W przypadku klasyfikatora binarnego tablica pomyłek ma wymiary 2×2. Badane jednostki są w takiej sytuacji oznaczone dwoma etykietami: pozytywną i negatywną. Algorytm klasyfikacyjny przypisuje im predykowaną (tzn. przewidywaną) klasę pozytywną albo negatywną. Możliwa jest sytuacja, że jednostka w rzeczywistości pozytywna zostanie omyłkowo zaklasyfikowana jako negatywna, a jednostka w rzeczywistości negatywna jako pozytywna – stąd nazwa macierzy.

		Klasa rzeczywista
		pozytywna	negatywna
Klasa predykowana	pozytywna	prawdziwie pozytywna (TP)	fałszywie pozytywna (FP)
Klasa predykowana	negatywna	fałszywie negatywna (FN)	prawdziwie negatywna (TN)

Na podstawie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg wskaźników oceniających siłę predykcyjną klasyfikatora (np. testu diagnostycznego). Poniższy wykres podsumowuje ich powiązania, przy czym – odwrotnie niż w tablicy powyżej – klasa rzeczywista jest w wierszach, a klasa przewidywana w kolumnach:

		Klasa predykowana – wynik testu
	Populacja	Klasyfikacja pozytywna	Klasyfikacja negatywna	Częstość występowania, chorobowość $\frac{\sum stan pozytywny}{\sum populacja}$
Klasa rzeczywista	Stan pozytywny	prawdziwie dodatnia, TP (trafienie)	fałszywie ujemna (błąd drugiego rodzaju, FN, chybienie)	czułość, TPR $\frac{\sum 𝐓 𝐏}{\sum 𝐓 𝐏 + \sum 𝐅 𝐍}$	FNR $\frac{\sum 𝐅 𝐍}{\sum 𝐓 𝐏 + \sum 𝐅 𝐍}$
Klasa rzeczywista	Stan negatywny	fałszywie dodatnia (błąd pierwszego rodzaju, FP, fałszywy alarm)	prawdziwie ujemna, TN (poprawne odrzucenie)	FPR $\frac{\sum 𝐅 𝐏}{\sum 𝐅 𝐏 + \sum 𝐓 𝐍}$	swoistość, SPC, TNR $\frac{\sum 𝐓 𝐍}{\sum 𝐅 𝐏 + \sum 𝐓 𝐍}$
	dokładność, ACC $\frac{\sum 𝐓 𝐏 + \sum 𝐓 𝐍}{\sum populacja}$	precyzja, PPV $\frac{\sum 𝐓 𝐏}{\sum 𝐓 𝐏 + \sum 𝐅 𝐏}$	FOR $\frac{\sum 𝐅 𝐍}{\sum 𝐅 𝐍 + \sum 𝐓 𝐍}$	LR+ $\frac{𝐓 𝐏 𝐑}{𝐅 𝐏 𝐑}$	DOR $\frac{𝐋 𝐑 +}{𝐋 𝐑 -}$
		FDR $\frac{\sum 𝐅 𝐏}{\sum 𝐓 𝐏 + \sum 𝐅 𝐏}$	NPV $\frac{\sum 𝐓 𝐍}{\sum 𝐅 𝐍 + \sum 𝐓 𝐍}$	LR- $\frac{𝐅 𝐍 𝐑}{𝐓 𝐍 𝐑}$	DOR $\frac{𝐋 𝐑 +}{𝐋 𝐑 -}$

Oznaczenia jednostek w zależności od ich klasy rzeczywistej i przewidywanej:

prawdziwie pozytywna (ang. Szablon:K, TP), trafienie (ang. Szablon:K)
prawdziwie negatywna (ang. Szablon:K, TN), poprawne odrzucenie (ang. Szablon:K)
fałszywie pozytywna (ang. Szablon:K, FP), błąd pierwszego rodzaju, fałszywy alarm (ang. Szablon:K)
fałszywie negatywna (ang. Szablon:K, FN), błąd drugiego rodzaju, chybienie (ang. Szablon:K)
pozytywna P = (TP + FN)
negatywna N = (TN + FP)

Miary:

czułość (ang. sensitivity), pełność^[3] (ang. recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)

T P R = T P / P = T P / (T P + F N)

swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)

T N R = T N / N = T N / (F P + T N)

dokładność (ang. accuracy, ACC)

A C C = (T P + T N) / (P + N) = (T P + T N) / (T P + F N + T N + F P)

precyzja (ang. precision) lub dodatnia wartość predykcyjna^[2] (ang. positive predictive value, PPV)

P P V = T P / (T P + F P)

ujemna wartość predykcyjna (ang. negative predictive value, NPV)

N P V = T N / (T N + F N)

odsetek fałszywie pozytywnych (ang. false positive rate, FPR)

F P R = F P / N = F P / (F P + T N) = 1 - T N R

odsetek fałszywie negatywnych (ang. false negative rate, FNR)

F N R = F N / P = F N / (T P + F N) = 1 - T P R

wskaźnik (iloraz) wiarygodności wyniku dodatniego^[4] (ang. positive likelihood ratio, LR+)

L R + = T P R / (1 - T N R) = T P R / F P R = \frac{T P \cdot (F P + T N)}{F P \cdot (T P + F N)}

wskaźnik (iloraz) wiarygodności wyniku ujemnego (ang. negative likelihood ratio, LR-)

L R - = (1 - T P R) / T N R = F N R / T N R = \frac{F N \cdot (F P + T N)}{T N \cdot (T P + F N)}

diagnostyczny iloraz szans (ang. diagnostic Odds ratio, DOR)

D O R = \frac{L R +}{L R -} = \frac{T P / F P}{F N / T N} = \frac{T P \cdot T N}{F P \cdot F N}

Przykład

		Klasa rzeczywista
		pozytywna	negatywna
Klasa predykowana	pozytywna	Ludzie chorzy poprawnie zdiagnozowani jako chorzy	Ludzie zdrowi błędnie zdiagnozowani jako chorzy (błąd pierwszego rodzaju)
Klasa predykowana	negatywna	Ludzie chorzy błędnie zdiagnozowani jako zdrowi (błąd drugiego rodzaju)	Ludzie zdrowi poprawnie zdiagnozowani jako ludzie zdrowi

Przypisy

Szablon:Przypisy

[:0-1] 1,0 ^1,1 Szablon:Cytuj

[:1-2] 2,0 ^2,1 Szablon:Cytuj

[3] Szablon:Cytuj

[4] Szablon:Cytuj

[1]

[2]

[3]

[4]

Tablica pomyłek

Przykład

Przypisy

Menu nawigacyjne

Szukaj