Rozkład Hotellinga

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Statystyka T² Hotellinga[1] – uogólnienie rozkładu Studenta, który jest używany do testowania hipotez wielowymiarowych. Nazwa pochodzi od Harolda Hotellinga.

Statystyka Hotellinga jest definiowana jako:

t2=n(𝐱μ)𝐖1(𝐱μ),

gdzie n jest liczbą obserwacji, 𝐱 jest p-wymiarową kolumną wektorową, a 𝐖 jest p×p macierzą kowariancji.

Jeśli xNp(μ,𝐕) jest zmienną losową z wielowymiarowego rozkładu Gaussa i 𝐖Wp(m,𝐕) (niezależne od x) ma rozkład Wisharta z taką samą macierzą wariancji 𝐕 oraz z m=n1, wówczas rozkład t2 jest T2(p,m), rozkładem T² Hotellinga z parametrami p i m.

Można pokazać, że:

mp+1pmT2Fp,mp+1,

gdzie F jest rozkładem F Snedecora.

Teraz załóżmy, że

𝐱1,,𝐱n

jest p×1 kolumną wektorową, której wartościami są liczby rzeczywiste. Załóżmy, że

𝐱=(𝐱1++𝐱n)/n

są ich średnią. Niech p×p będzie macierzą dodatnie określoną

𝐖=i=1n(𝐱i𝐱)(𝐱i𝐱)/(n1)

jest macierzą „przykładowych wariancji”. (Transpozycja jakiejkolwiek macierzy M jest oznaczona jako M). Niech μ będzie znanym p×1 wektorem. Wówczas statystyka Hotellinga przyjmuje postać:

t2=n(𝐱μ)𝐖1(𝐱μ).

Warto zauważyć, że t2 jest blisko powiązona z kwadratem odległością Mahalanobisa.

W szczególności może to być pokazane poprzez[2]:

Jeśli 𝐱1,,𝐱nNp(μ,𝐕), są niezależne, i 𝐱 i 𝐖 są jak zdefiniowano powyżej, wówczas 𝐖 ma rozkład Wisharta z n1 stopniami swobody

𝐖Wp(V,n1)

i jest niezależna od 𝐱, oraz

𝐱Np(μ,V/n).

To oznacza, że:

t2=n(𝐱μ)𝐖1(𝐱μ)T2(p,n1).

Statystyka T² Hotellinga dla dwóch prób

Jeśli 𝐱1,,𝐱nxNp(μ,𝐕) oraz 𝐲1,,𝐲nyNp(μY,𝐕), są próbkami niezależnymi wyciągniętymi z dwóch niezależnych wielowymiarowych rozkładów Gaussa o takiej samej średniej oraz kowariancji, i definiujemy

𝐱=1nxi=1nx𝐱i𝐲=1nyi=1ny𝐲i

jako średnie próbek, oraz

𝐖=i=1nx(𝐱i𝐱)(𝐱i𝐱)+i=1ny(𝐲i𝐲)(𝐲i𝐲)nx+ny2

jako estymator nieobciążonej macierzy kowariancji, wówczas statystyka T² Hotellinga dla dwóch prób wygląda tak:

t2=nxnynx+ny(𝐱𝐲)𝐖1(𝐱𝐲)T2(p,nx+ny2)

i może być przedstawiona w postaci rozkładu F Snedecora:

nx+nyp1(nx+ny2)pt2F(p,nx+ny1p)[2].

Zobacz też

Przypisy

Szablon:Przypisy

  1. H. Hotelling (1931) The generalization of Student’s ratio, Ann. Math. Statist., Vol. 2, s. 360–378.
  2. 2,0 2,1 K.V. Mardia, J.T. Kent, J.M. Bibby (1979), Multivariate Analysis, Academic Press.