Rekurencyjna metoda NK

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Wstęp i oznaczenia

Algorytm ważonej rekurencyjnej metody najmniejszych kwadratów (WRMNK) został wyprowadzony dla obiektu typu ARX, którego postać przytacza się dla wygody:

y(i)=zkB(z1)A(z1)u(i)+1A(z1)e(i).

Zakłada się, że znany jest ciąg wejść obiektu u(1),u(2), oraz ciąg wyjść obiektu y(1),y(2),, natomiast sekwencja białego szumu, modelującego zakłócenie sprowadzone na wyjście obiektu e(1),e(2),, jest nieznana.

Niech Θ oznacza wektor nieznanych parametrów obiektu:

Θ=[b0 b1 bdB a1a2 adA]T.

Niech Θ^(i) oznacza wektor zawierający oszacowania (estymaty) tych parametrów w chwili i, oraz niech φ(i1) oznacza wektor zawierający próbki wejść i wyjść odpowiadające tym parametrom (zwany wektorem regresyjnym):

φ(i1)=[u(ik) u(ik1) u(ikdB)y(i1) y(i2) y(idA)]T

Niech ponadto wskaźnik jakości będzie dany jako:

JN(Θ^)=1Ni=1NλNiε2(i)=1Ni=1NλNi(y(i)Θ^T(i1)φ(i1))2,

gdzie λ(0,1] zwany jest współczynnikiem ważenia lub zapominania, a ε(i) zwany jest błędem predykcji jednokrokowej.

Algorytm WRMNK

Algorytmem, który minimalizuje tak zdefiniowany wskaźnik jakości, jest algorytm ważonej rekurencyjnej metody najmniejszych kwadratów, dany wzorem:

Θ^(i)=Θ^(i1)+𝐤(i)ε(i),

gdzie 𝐤(i) zwany jest wektorem wzmocnienia i liczony jest zgodnie z zależnością:

𝐤(i)=𝐏(i)φ(i1).

Użyta w powyższym wzorze macierz 𝐏(i) zwana jest macierzą kowariancji. Podstawową zależnością pozwalającą na rekurencyjne wyznaczania tej macierzy jest równanie:

𝐏1(i)=λ𝐏1(i1)+φ(i1)φT(i1).

Ponieważ jednak zastosowanie powyższego wzoru wiązałoby się z koniecznością odwracania macierzy, algorytm byłby niezwykle skomplikowany w implementacji i potencjalnie niestabilny numerycznie. Na szczęście udało się wyprowadzić zależność rekurencyjną pozwalającą na aktualizację macierzy kowariancji z pominięciem odwracania macierzy, która jest dana zależnością:

𝐏(i)=1λ[𝐏(i1)𝐏(i1)φ(i1)φT(i1)𝐏(i1)λ+φT(i1)𝐏(i1)φ(i1)]

Warunek początkowy

Warunek początkowy dla macierzy kowariancji dany jest wzorem:

𝐏(0)=β𝐈,

gdzie β jest pewną, dużą wartością dodatnią (np. 1000).

Zobacz też

Uwagi

W przypadku, gdy λ=1 o metodzie mówi się, że jest bez ważenia (czyli jest to RMNK). Tak sparametryzowana metoda nie nadaje się do identyfikacji obiektów niestacjonarnych (czyli takich, których parametry zmieniają się w czasie), gdyż w macierzy 𝐏 pamiętana jest cała historia zmian wejścia i wyjścia obiektu. W przypadku identyfikacji obiektów niestacjonarnych zazwyczaj wartość parametru λ ustala się na nieco mniejszą od jedności (na przykład 0,99).

Bibliografia