Wielowymiarowy rozkład normalny

Z testwiki
Wersja z dnia 16:54, 10 sty 2025 autorstwa imported>Blakocha (doprecyzowanie opisu obrazka)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania
Funkcja gęstości dwuwymiarowego rozkładu normalnego

Wielowymiarowy rozkład normalnyrozkład wielowymiarowej zmiennej losowej, będący uogólnieniem rozkładu normalnego na n wymiarów.

Definicja

n-wymiarowa zmienna losowa X=[x1,,xn]T podlega n-wymiarowemu rozkładowi normalnemu jeśli dowolna kombinacja liniowa Y=a1x1++anxn jej składowych ma rozkład normalny.

Funkcja gęstości n-wymiarowego rozkładu normalnego wektora losowego X o wektorze wartości oczekiwanych μ=[μ1,,μn]T i macierzy kowariancji Σ dana jest wzorem:

fμ,Σ(X)=1(2π)n/2|Σ|1/2exp(12(Xμ)TΣ1(Xμ)).

Oznacza się to w skrócie zapisem

XN(μ,Σ).

Niezależność zmiennych

Dla wielowymiarowego rozkładu normalnego jeśli składowe wektora losowego X o wielowymiarowym rozkładzie normalnym są niezależne to są nieskorelowane i odwrotnie, jeśli są nieskorelowane to są niezależne. Wówczas funkcja gęstości wektora losowego X jest iloczynem funkcji gęstości każdej ze zmiennych:

fμ,Σ(X)=i=1nfμi,σi(xi).

Zmienne losowe (nawet nieskorelowane) o rozkładzie normalnym nie muszą razem tworzyć wektora o wielowymiarowym rozkładzie normalnym. Wówczas powyższa zależność nie musi być prawdziwa.

Na przykład niech xN(0,1), niech w będzie zmienną losową przyjmującą wartości 1 i –1 z równym prawdopodobieństwem 0,5, niezależną od x, oraz niech y=wx. Wówczas x i y są nieskorelowane, normalne, ale są zależne. Nie tworzą one jednak wielowymiarowego rozkładu normalnego. Cała masa prawdopodobieństwa ich wspólnego rozkładu znajduje się na prostych y=x, y=x, podczas gdy nośnikiem wielowymiarowego rozkładu normalnego jest cała płaszczyzna 2. W szczególności zmienna x+y ma rozkład mieszany (dyskretno-ciągły), i z prawdopodobieństwem 0,5 przyjmuje wartość 0, a więc nie jest spełniona definicja wielowymiarowego rozkładu normalnego: pewna kombinacja liniowa składowych wektora losowego nie ma rozkładu normalnego.

Estymacja parametrów

Mając dane N wektorów pobranych z pewnego wielowymiarowego rozkładu normalnego o wektorze wartości oczekiwanych μ i macierzy kowariancji Σ możemy oszacować jego parametry w następujący sposób:

Estymator wartości oczekiwanej:

μ^=1Ni=1NXi.

Estymator macierzy kowariancji o największej wiarygodności:

Σ^=1Ni=1N(Xiμ^)(Xiμ^)T.

Estymator nieobciążony macierzy kowariancji:

Σ^=1N1i=1N(Xiμ^)(Xiμ^)T.

W celu uzyskania wektora losowego o rozkładzie danym przez wektor średnich μ i macierz kowariancji Σ, postępujemy według następującego algorytmu:

  1. Stosujemy rozkład Choleskiego względem macierzy Σ, tak by otrzymać macierz A, dla której zachodzi: AAT=Σ.
  2. Tworzymy wektor Z n niezależnych zmiennych losowych o standardowym rozkładzie normalnym, stosując np. metodę Boxa-Mullera.
  3. Szukany wektor to X=μ+AZ.

Zobacz też