Gry różniczkowe

Z testwiki
Wersja z dnia 19:59, 25 wrz 2022 autorstwa imported>MalarzBOT (przenoszę szablon {{Teoria sterowania}} na koniec artykułu)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach 50. XX wieku.

Sformułowania problemów teorii gier różniczkowych

W teorii wyróżnia się dwa rodzaje gier:

  • gra dwóch graczy,
  • gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

  • dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
  • zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

x˙=f(t,x,u,v)

gdzie x jest wektorem fazowym układu, u i v – wektorami sterowania odpowiednio graczy I i II, a t czasem. Określona jest klasa strategii 𝒰 gracza I, a dla każdej strategii U𝒰 określony jest wiązką ruchów X(U), która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach x(t),tt0 układu zadany jest funkcjonał γ(x()) nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał γ zależy także od realizacji u(t),v(t),tt0 sterowania obu graczy[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu x()X(U), gdy wybór strategii jest pozostawiony graczowi II, jakość strategii U𝒰 jest oceniana za pomocą wielkości:

κ1(U)=sup{γ(x()):x()X(U)}.

Zadanie gracza I polega na określeniu strategii U0𝒰, na której realizowane jest minimum funkcjonału κ1 (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii Uc𝒰 spełniającej nierówność:

κ1(Uc)c,

gdzie c jest daną liczbą[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia V𝒱 jest oceniana przez wielkość:

κ2(V)=sup{γ(x()):x()X(V)}.

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału κ2, a zadanie jakości – na znalezieniu strategii Vc𝒱, dla której:

κ2(Vc)c.

Jeśli w zadaniach graczy I i II klasy strategii 𝒰 i 𝒱 mają taką własność, że dla każdej pary uporządkowanej (U,V)𝒰×𝒱 można określić choć jeden ruch

x()X(U)X(V),

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii 𝒰×𝒱.

Jeśli w grze różniczkowej spełniona jest równość

infU𝒰supx()X(U)γ(x())=supV𝒱infx()X(V)γ(x())=c0,

to wielkość c0 nazywa się ceną gry różniczkowej[3].

Przykład

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[4]. W tej grze

x=(x1,,xk+l)=(y1,,yk,z1,,zl),

gdzie y=(y1,,yk),z=(z1,,zl) są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

y˙=g(t,y,u),z˙=h(t,z,v)[3].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

uP,vQ,

gdzie P,Q są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania, tzn.:

γ(x())=T(x())=inf{tt0:||{y(t)}m{z(t)}mε},

gdzie {y(t)}m i {z(t)}m są wektorami utworzonymi z pierwszych m współrzędnych wektorów y i z. Zatem zbliżenie punktów {y(t)}m i {z(t)}m na odległość mniejszą od ε jest interpretowane jako spotkanie obiektów.

Przypisy

Szablon:Przypisy

Linki zewnętrzne

Szablon:Teoria sterowania

  1. Szablon:Cytuj książkę
  2. Математическая Энциклопедия, op. cit., s. 329.
  3. 3,0 3,1 3,2 Математическая Энциклопедия, op. cit., s. 330.
  4. Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Szablon:Cytuj książkę