Mnożniki Lagrange’a

Z testwiki
Wersja z dnia 13:13, 9 lip 2024 autorstwa imported>Tarnoob (Przykład – ekstrema funkcji na okręgu: aktualizacja linku)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Mnożnik Lagrange’a – metoda obliczania ekstremum warunkowego funkcji różniczkowalnej[1] wykorzystywana w teorii optymalizacji. Nazwa metody pochodzi od nazwiska matematyka Josepha Louisa Lagrange’a.

Sformułowanie i analiza problemu

Szukanie ekstremów warunkowych funkcji f:n, z warunkiem zerowania G:nm, będących zarazem punktami regularnymi[2], sprowadza się do rozwiązania układu równań operatorowych

{f(x)=ΛG(x)G(x)=0,

gdzie Λ(m). Wiadomo, że każdy taki funkcjonał Λ jest reprezentowany przez układ m liczb rzeczywistych λ1,,λm, a pochodna G(x) jest macierzą wymiaru m×n rzędu m[2]. Układ równań operatorowych sprowadza się więc do układu m+n równań skalarnych:

{f(x)xj=i=1mλiGi(x)xj,j=1,,nGk(x1,,xn)=0,k=1,,m,

gdzie x=(x1,,xn) o n+m zmiennych λi,xk,im,kn. Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby λi spełniają tylko rolę pomocniczą i nazywane są często mnożnikami Lagrange’a. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną) określoność

f(x)ΛG(x)

dla

hX1=kerG(x0),

co sprowadza się do badania formy kwadratowej

i,j=1n(2f(x)xixjk=1mλk2Gk(x)xixj)hihj,

gdzie:

hX1,h=(h1,,hn).

Warunek hX1 jest równoważny równaniu

G(x)h=0,

które w postaci macierzowej przybiera formę

i=1nGk(x)xihi=0,k=1,2,,m.

Do badania określoności tej macierzy można stosować kryterium Sylvestera.

W praktyce, gdy X=2,Y= wprowadzamy funkcję pomocniczą

F(x,y)=f(x,y)+λG(x,y)

i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych[3], tj. rozwiązaniu układu równań F'x=0,F'y=0, a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego λ.
Do otrzymanego warunku dołączamy warunek G(x,y)=0. Równoważnie, wszystkie punkty, które mogą być ekstremami warunkowymi można wyznaczyć z układu równań

{D(f,G)D(x,y)=0G(x,y)=0,

gdzie D(f,G)D(x,y) oznacza jakobian funkcji f i G.

Przykład – ekstrema funkcji na okręgu

Wykresem funkcji f(x,y)=x+y jest płaszczyzna. W przestrzeni trójwymiarowej równanie x2+y2=1 powierzchnię boczną walca (którego podstawą jest leżący na płaszczyźnie xy okrąg jednostkowy). Badanie istnienia ekstremów warunkowych sprowadza się w tym wypadku do analizy punktów ekstremalnych części wspólnej walca i płaszczyzny.

Ilustracją zastosowania metody mnożników Lagrange’a jest problem wyznaczenia ekstremów funkcji:

f(x,y)=x+y

na okręgu jednostkowym, tj. przy warunku

x2+y2=1.

Zatem funkcja G jest postaci

G(x,y)=x2+y21,

a funkcja F wyraża się wzorem:

F(x,y,λ)=f(x,y)+λG(x,y)=x+y+λ(x2+y21).

Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań

{F'x(x,y)=1+2λx=0F'y(x,y)=1+2λy=0G(x,y)=x2+y21=0.

Przy założeniu x0y0 z pierwszego równania uzyskujemy λ=12x, analogicznie z drugiego λ=12y więc x=y oraz dostaje się warunek 2x2=1, skąd wynika x=±22. Funkcja f może zatem przyjmować ekstrema tylko w punktach (22,22),(22,22). Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli zwartym[4]), więc na mocy twierdzenia Weierstrassa, funkcja f osiąga w tych punktach ekstrema (warunkowe):

  • minimum warunkowe: f(22,22)=2,
  • maksimum warunkowe: f(22,22)=2.

Warto zauważyć, że funkcja f, określona na całej płaszczyźnie (bez dodatkowego warunku) nie ma ekstremów.

Przykład – problem maksymalnej entropii

Problem polega na znalezieniu dyskretnego rozkładu zmiennej losowej maksymalizującego entropię. Funkcja entropii prawdopodobieństw p1,,pn wyraża się wzorem

f(p1,p2,,pn)=k=1npklog2pk.

Oczywiście, suma prawdopodobieństw p1,,pn jest równa jeden, więc warunek na G przyjmuje postać

G(p1,p2,,pn)=k=1npk1.

Stosując metodę mnożników Lagrange’a, dostajemy układ n równań:

pk(f(p1,p2,,pn)+λ(G(p1,p2,,pn)))=0,1kn,

który sprowadza się do układu

pk(k=1npklog2pk+λ(k=1npk1))=0,1kn.

Różniczkując każde wyrażenie względem pk, powyższy układ sprowadza się do poniższego:

(1ln2+log2pk)+λ=0,1kn.

Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj. p1==pn, a ponieważ ich suma jest równa jeden, wynika stąd, że dla dowolnego 1kn:

pk=1n.

Zastosowania

Metodę optymalizacji przy pomocy mnożników Lagrange’a powszechnie stosuje się w teorii ekonomii, na przykład w celu rozwiązania problemu wyboru konsumenta, w którym konsument maksymalizuje swoją funkcję użyteczności, tak aby nie przekroczyć ograniczenia budżetowego. Mnożniki Lagrange'a mają zastosowanie również w programowaniu nieliniowym.[5]

Przypisy

Szablon:Przypisy

Bibliografia

Linki zewnętrzne