Metoda Pawłowskiego

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Metoda Pawłowskiego – metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona przez Zbigniewa Pawłowskiego.

Załóżmy, że istnieje zbiór X={X1,X2,,Xp} potencjalnych zmiennych objaśniających dla zmiennej objaśnianej Y. Do modelu może wejść m zmiennych, gdzie m<p.

Wybieramy taką kombinację, która zapewnia z góry ustaloną dokładność opisu zmiennej Y oraz możliwie najmniejsze skorelowanie między m-elementową kombinacją zmiennych objaśniających.

Aby model był dokładny zakłada się, że wartość współczynnika korelacji wielorakiej między zmienną endogeniczną a m-elementowym zbiorem zmiennych objaśniających była nie mniejsza niż z góry zadana liczba δ>0.

Oznaczamy rj jako współczynnik korelacji między zmienną objaśnianą Y a zmienną objaśniającą Xj, a także współczynnik korelacji rjl między zmiennymi objaśniającymi Xj i Xl. Otrzymane współczynniki korelacji między zmiennymi objaśniającymi tworzą macierz korelacji R, natomiast współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi wektor korelacji R0:

R=[1r12...r1mr211...r2m............rm1rm2...1],R0=[r1r2...rm].

Następnie budujemy tzw. macierz rozszerzoną R*:

R*=[1R0TR0R].

Macierze R oraz R* wykorzystujemy do budowy współczynnika korelacji wielorakiej R, który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją zmiennych objaśniających. Obliczany jest ze wzoru:

R=1|R*||R|[0,1],

gdzie:

  • |R*|wyznacznik macierzy korelacji m-elementowej kombinacji zmiennych objaśniających, do której dołączono wektor współczynników korelacji zmiennej endogenicznej ze zmiennymi objaśniającymi,
  • |R| – wyznacznik z macierzy korelacji m-elementowej kombinacji zmiennych objaśniających.

Współczynnik korelacji wielorakiej przyjmuje wartości z przedziału [0,1]. Jeżeli R=0, to nie ma zależności liniowej, natomiast gdy R=1, to między zmienną objaśniana a liniową kombinacją zmiennych objaśniających zachodzi zależność funkcyjna liniowa. W związku z tym, im wyższa jest wartość współczynnika, tym większa jest zależność funkcyjna.

Aby wybrać optymalną kombinację, rozpatrujemy wszystkie m-elementowe kombinacje, jakie można utworzyć ze zbioru X potencjalnych zmiennych objaśniających. Następnie wybieramy te kombinacje, które spełniają warunek dokładności (Rδ), a tworzą one zbiór kombinacji dopuszczalnych. Wśród wybranych kombinacji poszukuje się najlepszej, czyli takiej, w której zmienne objaśniające są najsłabiej skorelowane między sobą.

Za optymalną przyjmuje się taką kombinację m zmiennych, gdzie wyznacznik z macierzy korelacji jest największy (R=max), ponieważ im wyznacznik jest bliższy jedności, tym zmienne są słabiej skorelowane.

Bibliografia

  • A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, Szablon:ISBN.
  • J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, Szablon:ISBN.