Odległość Mahalanobisa

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Odległość Mahalanobisa – odległość między dwoma punktami w wielowymiarowej przestrzeni różnicująca wkład poszczególnych składowych współrzędnych punktów oraz wykorzystująca korelacje między nimi. Znajduje ona zastosowanie w statystyce, przy wyznaczaniu podobieństwa między nieznanym wektorem losowym a wektorem ze znanego zbioru. Zdefiniowana przez Prasantę Chandrę Mahalanobisa w 1936 roku.

Definicja

Dane mamy 2 wektory losowe 𝐱=[x1,x2,,xn], 𝐲=[y1,y2,,yn] w przestrzeni n, oraz pewną symetryczną, dodatnio określoną macierz C. Odległość Mahalanobisa zdefiniowana jest jako:

dm(𝐱,𝐲):=(𝐱𝐲)TC1(𝐱𝐲)

Interpretacja

Odległość Mahalanobisa stosuje się w analizie skupień. Mając dany zbiór punktów tworzących pewną klasę, możemy wyznaczyć dla niego wektor średni μ=[μ1,μ2,,μn] oraz macierz kowariancji C, które odzwierciedlają pewien charakter tej klasy. Badając przynależność nieznanego wektora losowego 𝐱 do danej klasy, mierzy się jego podobieństwo do wektora μ, uwzględniając przy tym informację o wariancjach poszczególnych składowych oraz korelacjach między nimi. Miarą takiego podobieństwa jest odległość Mahalanobisa, nazywana ważoną odległością euklidesową, przy czym macierzą wag jest C1.

Rozważmy trzy przypadki różnych zbiorów danych:

Przypadek 1

Poszczególne składowe w zbiorze mają równe wariancje (można przyjąć, że są one równe 1) i nie są skorelowane. Wówczas macierz kowariancji C jest macierzą jednostkową, a odległość Mahalanobisa jest równa odległości euklidesowej:

dm(𝐱,μ)=(x1μ1)2++(xnμn)2=(𝐱μ)𝕀1(𝐱μ)T

Punkty o identycznej odległości od pewnego danego punktu centralnego tworzą na płaszczyźnie okrąg, a w przestrzeni o trzech lub więcej wymiarach odpowiednio sferę i hipersferę. Szablon:Clear

Przypadek 2

Składowe x1,x2,,xn wektora losowego 𝐱 nie są skorelowane, lecz mają różne wariancje: σ12,σ22,,σn2. Aby znormalizować poszczególne składowe należy je podzielić przez odpowiadające im wariancje:

dm(𝐱,μ)=(x1μ1)2σ12++(xnμn)2σn2=(𝐱μ)D1(𝐱μ)T

gdzie D jest macierzą diagonalną diag(σ12,σ22,,σn2).

Punkty o identycznej odległości tworzą na płaszczyźnie elipsę, a w przestrzeni trójwymiarowej elipsoidę, przy czym osie utworzonej figury są równoległe do osi układu współrzędnych. Szablon:Clear

Przypadek 3

Składowe mają różne wariancje i są skorelowane: σij2>0,  1i,jn. Odpowiada to pełnej macierzy kowariancji C, a utworzona przez punkty o tej samej odległości elipsa jest obrócona o pewien kąt względem osi układu współrzędnych. Obrót ten jest dany przez macierz wektorów własnych macierzy C1, zaś długości półosi hiper-elipsoidy są określone przez odwrotności pierwiastków kwadratowych jej wartości własnych 1λ1,,1λn,.

Wartości własne spełniają równanie charakterystyczne, które w ogólności dla macierzy symetrycznej kwadratowej rozmiaru [n x n] sprowadza się do poszukiwania pierwiastków wielomianu n tego stopnia. Szablon:Clear

Zastosowania

  • Kwadrat odległości Mahalanobisa występuje w wykładniku wielowymiarowego rozkładu Gaussa.
  • W zagadnieniach grupowania danych, np. klasteryzacji rozmytej, odległość Mahalanobisa wykorzystana jest do określania kształtu grupy (klastra). Przykładem jest algorytm GK[1] (Gustaffsona-Kessela).

Przypisy

Szablon:Przypisy

Szablon:Kontrola autorytatywna

  1. D.E. Gustafson, W.C. Kessel, Fuzzy clustering with a fuzzy covariance matrix, IEEE Conference on Decision and Control including the 17th Symposium on Adaptive Processes, 1978, 17, s. 761–766.