Metoda Hellwiga

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Szablon:Dopracować Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.

Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.

Liczba kombinacji

Jeżeli mamy m potencjalnych zmiennych objaśniających, to liczba wszystkich kombinacji jest równa

L=2m1.

Indywidualna pojemność nośników informacji

Dla wszystkich otrzymanych kombinacji definiujemy tzw. Indywidualną pojemność nośników informacji, która określona jest wzorem:

hkj=rj21+l=1,ljmk|rlj|,j=1,2,,mk,hkj[0,1],

gdzie:

k – numer kombinacji (k=1,2,,2m1),
mk – liczba zmiennych w k-tej kombinacji,
j – numer zmiennej w rozpatrywanej kombinacji,
rjwspółczynnik korelacji potencjalnej zmiennej objaśniającej o numerze j ze zmienną objaśnianą (element wektora R0),
rlj – współczynnik korelacji między l-tą i j-tą potencjalną zmienną objaśniającą (element macierzy R).

Wskaźnik hkj mierzy wielkość informacji jaką wnosi zmienna Xj o zmiennej objaśnianej Y w k-tej kombinacji. W związku z tym hkj wzrasta, jeżeli współczynnik korelacji rj wzrasta, a maleje im bardziej zmienna Xj jest skorelowana z pozostałymi zmiennymi objaśniającymi.

Pojemność integralna kombinacji nośników informacji

Dopiero, gdy policzymy indywidualną pojemność nośników informacji dla wszystkich kombinacji, możemy obliczyć pojemność integralną kombinacji nośników informacji według wzoru:

Hk=j=1mkhkj,k=1,2,,2m1,Hk[0,1],

gdzie:

k – numer kombinacji (k=1,2,,2m1),
mk – liczba zmiennych w k-tej kombinacji,
j – numer zmiennej w rozpatrywanej kombinacji.

Pojemność integralna kombinacji nośników informacji dla k-tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie Hk jest największa. Ze względu na znacząca liczbę kombinacji zmiennych, które należy porównać skonstruowana została metoda wykorzystująca kryterium Hellwiga w postaci zadania programowania binarnego, w którym licznik z kryterium Hellwiga jest funkcją celu, a mianownik jest podstawą do zbudowania warunków ograniczających.

Przykład

Dane są:

  • zmienna endogeniczna Y,
  • zbiór potencjalnych zmiennych objaśniających
X={x1, x2, x3},
  • wektor współczynników korelacji liniowej między zmiennymi egzogenicznymi i zmienną endogeniczną
R0=[  0,40,9  0,6],
  • macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi,
R=[10,20,70,210,50,70,51].

Liczba możliwych kombinacji zmiennych endogenicznych wynosi

L=231=7.
  • Kombinacje jednoelementowe:
K1={x1},
K2={x2},
K3={x3}.
  • Kombinacje dwuelementowe:
K4={x1, x2},
K5={x1, x3},
K6={x2, x3}.
  • Kombinacje trójelementowe:
K7={x1, x2, x3}.

Bibliografia

  • A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, Szablon:ISBN.
  • J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, Szablon:ISBN.
  • M. Rocki, Własność koincydencji i zmienne katalityczne w doborze zmiennych objaśniających za pomocą zadania programowania zerojedynkowego, „Przegląd Statystyczny” 1/2, Warszawa 2000, Szablon:ISBN.