Kowariancja

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Kowariancja, cov(X,Y) – liczba określająca odchylenie elementów od sytuacji idealnej, w której występuje zależność liniowa. Zależność tę określa się między zmiennymi losowymi X i Y.

Definicja

Matematycznie kowariancję definiuje się wzorem:

cov(X,Y)=E[(XEX)(YEY)].

Wygodniejszym, równoważnym wzorem jest:

cov(X,Y)=E(XY)EXEY,

gdzie:

Ewartość oczekiwana.

Interpretacja

Jeżeli między zmiennymi losowymi X i Y nie istnieje żadna zauważalna korelacja liniowa i istnieją ich wartości oczekiwane, to kowariancja przyjmuje wartość 0 (nie musi to być prawda dla kowariancji w próbie losowej z tych zmiennych).

Innymi słowy: zmienne losowe X i Y są niezależne, a więc

E(XY)=EXEY,

zatem:

cov(X,Y)=E(XY)EXEY=EXEYEXEY=0.

Wartości kowariancji zbliżone, czy nawet równe zero nie świadczą jednak o całkowitej niezależności zmiennych losowych. Zawsze istnieje bowiem możliwość, że są one zależne nieliniowo.

Na przykład jeśli zmienna losowa Z ma rozkład jednostajny na przedziale [0,2π], a zmienne losowe byłyby zdefiniowane jako:

X=sinZ,
Y=cosZ,

to pomimo ich oczywistej zależności (jedynka trygonometryczna) mamy cov(X,Y)=0.

Związek ze współczynnikiem korelacji liniowej

Kowariancja jest powiązana ze współczynnikiem korelacji Pearsona:

cov(X,Y)=corr(X,Y)σXσY,

gdzie:

corr(X,Y) – współczynnik korelacji liniowej pomiędzy zmiennymi X i Y,
σXodchylenie standardowe zmiennej X,
σY – odchylenie standardowe zmiennej Y.

Zobacz też

Szablon:Wikisłownik

Szablon:Kontrola autorytatywna