Rekurencyjna metoda NK

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Wstęp i oznaczenia

Algorytm ważonej rekurencyjnej metody najmniejszych kwadratów (WRMNK) został wyprowadzony dla obiektu typu ARX, którego postać przytacza się dla wygody:

y(i)=zkB(z1)A(z1)u(i)+1A(z1)e(i).

Zakłada się, że znany jest ciąg wejść obiektu u(1),u(2), oraz ciąg wyjść obiektu y(1),y(2),, natomiast sekwencja białego szumu, modelującego zakłócenie sprowadzone na wyjście obiektu e(1),e(2),, jest nieznana.

Niech 𝜣 oznacza wektor nieznanych parametrów obiektu:

𝜣=[b0 b1 bdB a1a2 adA]T.

Niech 𝜣^(i) oznacza wektor zawierający oszacowania (estymaty) tych parametrów w chwili i, oraz niech 𝝋(i1) oznacza wektor zawierający próbki wejść i wyjść odpowiadające tym parametrom (zwany wektorem regresyjnym):

𝝋(i1)=[u(ik) u(ik1) u(ikdB)y(i1) y(i2) y(idA)]T

Niech ponadto wskaźnik jakości będzie dany jako:

JN(𝜣^)=1Ni=1NλNiε2(i)=1Ni=1NλNi(y(i)𝜣^T(i1)𝝋(i1))2,

gdzie λ(0,1] zwany jest współczynnikiem ważenia lub zapominania, a ε(i) zwany jest błędem predykcji jednokrokowej.

Algorytm WRMNK

Algorytmem, który minimalizuje tak zdefiniowany wskaźnik jakości, jest algorytm ważonej rekurencyjnej metody najmniejszych kwadratów, dany wzorem:

𝜣^(i)=𝜣^(i1)+𝐤(i)ε(i),

gdzie 𝐤(i) zwany jest wektorem wzmocnienia i liczony jest zgodnie z zależnością:

𝐤(i)=𝐏(i)𝝋(i1).

Użyta w powyższym wzorze macierz 𝐏(i) zwana jest macierzą kowariancji. Podstawową zależnością pozwalającą na rekurencyjne wyznaczania tej macierzy jest równanie:

𝐏1(i)=λ𝐏1(i1)+𝝋(i1)𝝋T(i1).

Ponieważ jednak zastosowanie powyższego wzoru wiązałoby się z koniecznością odwracania macierzy, algorytm byłby niezwykle skomplikowany w implementacji i potencjalnie niestabilny numerycznie. Na szczęście udało się wyprowadzić zależność rekurencyjną pozwalającą na aktualizację macierzy kowariancji z pominięciem odwracania macierzy, która jest dana zależnością:

𝐏(i)=1λ[𝐏(i1)𝐏(i1)𝝋(i1)𝝋T(i1)𝐏(i1)λ+𝝋T(i1)𝐏(i1)𝝋(i1)]

Warunek początkowy

Warunek początkowy dla macierzy kowariancji dany jest wzorem:

𝐏(0)=β𝐈,

gdzie β jest pewną, dużą wartością dodatnią (np. 1000).

Zobacz też

Uwagi

W przypadku, gdy λ=1 o metodzie mówi się, że jest bez ważenia (czyli jest to RMNK). Tak sparametryzowana metoda nie nadaje się do identyfikacji obiektów niestacjonarnych (czyli takich, których parametry zmieniają się w czasie), gdyż w macierzy 𝐏 pamiętana jest cała historia zmian wejścia i wyjścia obiektu. W przypadku identyfikacji obiektów niestacjonarnych zazwyczaj wartość parametru λ ustala się na nieco mniejszą od jedności (na przykład 0,99).

Bibliografia