Współczynnik korelacji tetrachorycznej

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Współczynnik korelacji tetrachorycznej – jedna z miar zależności, współczynnik określający poziom zależności pomiędzy dwiema zmiennymi dychotomicznymi i porządkowymi. Zakładamy przy tym, że obydwie zmienne są faktycznie zmiennymi ciągłymi i o rozkładzie normalnym, natomiast zostały one sprowadzone do skali dychotomicznej w celu ich uproszczenia lub z innych powodów[1].

Przykład zastosowania: korelacja pomiędzy wynikami uczniów pewnej klasy z egzaminu z matematyki i egzaminu z biologii, przy czym wyniki egzaminów zostały sprowadzone do postaci dychotomicznej (wartości: wynik powyżej mediany dla klasy lub wynik poniżej mediany dla klasy).

Obliczanie

Oznaczmy w następujący sposób liczebności w tablicy kontyngencji o wymiarach 2×2 pokazującej rozkład dwóch zmiennych dychotomicznych:

y = 1 y = 0 total
x = 1 a b a+b
x = 0 c d c+d
total a+c b+d n

Dokładne wyznaczenie wartości współczynnika korelacji tetrachorycznej na podstawie danych z próby wymaga dość złożonych numerycznie obliczeń[2]. Należy znaleźć ρ^, wykorzytując następującą równość:

dn=h^k^12π(1ρ^2)1/2exp[(x22ρ^xy+y2)2(1ρ^2)]dy dx,

gdzie h^=Φ1(a+cn) i k^=Φ1(a+bn).

W 2005 Bonett i Price zaproponowali uproszczony wzór umożliwiający uzyskanie oszacowania o dobrych właściwościach[1]:

ρ^*=cos(π1+ω^c^),

gdzie: π to liczba pi, c^ wyznaczone jest za pomocą następującego wzoru:

c^=12(1|bc|5(n+2)(12min(a+b;a+c;b+d;c+d)+1n+2)2)

zaś ω^ to oszacowanie ilorazu szans z wykorzystaniem liczebności w komórkach tablicy kontyngencji powiększonych o 0,5:

ω^=(a+0,5)(d+0,5)(b+0,5)(c+0,5).

Przypisy

Szablon:Przypisy

Bibliografia