Współczynnik korelacji Pearsona

Z testwiki
Wersja z dnia 00:44, 11 sty 2023 autorstwa imported>PBbot (wstawienie {{Kontrola autorytatywna}})
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania
Błąd przy generowaniu miniatury:
Przykładowe wykresy danych (x, y) i odpowiadające im wartości współczynnika korelacji liniowej Pearsona

Współczynnik korelacji liniowej Pearsonawspółczynnik określający poziom zależności liniowej między zmiennymi losowymi. Został opracowany przez Karla Pearsona.

Wzory matematyczne

Niech x i y będą zmiennymi losowymi o dyskretnych rozkładach. xi,yi oznaczają wartości prób losowych tych zmiennych (i=1,2,,n), natomiast x,y – wartości średnie z tych prób, tj.

x=1ni=1nxi,y=1ni=1nyi.

Wówczas estymator współczynnika korelacji liniowej definiuje się następująco:

rxy=i=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2,
rxy[1,1].

Ogólnie współczynnik korelacji liniowej dwóch zmiennych jest ilorazem kowariancji i iloczynu odchyleń standardowych tych zmiennych:

rXY=cov(X,Y)σXσY.

W szczególności dla zmiennych losowych o dyskretnych rozkładach ma on postać

rXY=cov(X,Y)σXσY=(i=1nj=1mP(X=xi,Y=yj)xiyj)XY(i=1nP(X=xi)xi2)X2(i=1mP(Y=yi)yi2)Y2.

Wartość współczynnika korelacji mieści się w przedziale domkniętym [−1, 1]. Im większa jego wartość bezwzględna, tym silniejsza jest zależność liniowa między zmiennymi. rxy=0 oznacza brak liniowej zależności między cechami, rxy=1 oznacza dokładną dodatnią liniową zależność między cechami, natomiast rxy=1 oznacza dokładną ujemną liniową zależność między cechami, tzn. jeżeli zmienna x rośnie, to y maleje i na odwrót.

Współczynnik korelacji liniowej można traktować jako znormalizowaną kowariancję. Korelacja przyjmuje zawsze wartości w zakresie [−1, 1], co pozwala uniezależnić analizę od dziedziny badanych zmiennych.

Poziomy korelacji i ich interpretacja

Korelacje Ujemne Dodatnie
Słabe −0,5 do 0,0 0,0 do 0,5
Silne −1,0 do −0,5 0,5 do 1,0

Korelacje można interpretować jako silne, słabe, ujemne[1][2]. Interpretacja taka jest jednak arbitralna i nie możemy jej traktować zbyt ściśle. Na przykład współczynnik równy 0,9 dla socjologów i ekonomistów oznacza silną korelację, a dla fizyków posługujących się wysokiej klasy pomiarami przy badaniu praw przyrody oznacza korelację słabą[2]. Z drugiej strony poziom korelacji ma wpływ na czas życia korelacji[1].

Ograniczenia stosowalności

Zobacz też

Przypisy

Szablon:Przypisy

Szablon:Kontrola autorytatywna

ru:Корреляция#Линейный коэффициент корреляции

  1. 1,0 1,1 A. Buda, A. Jarynowski (2010), Life-time of correlations and its applications vol. 1, Wydawnictwo Niezależne: 5–21, December 2010, Szablon:ISBN.
  2. 2,0 2,1 Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.).