Простейшая дифференциальная игра на плоскости с четырьмя участниками

Обложка


Цитировать

Полный текст

Аннотация

Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли.
Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход.
Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С-ядро и вектор Шепли. В явном виде выписаны компоненты вектора Шепли, показана принадлежность вектора Шепли С-ядру, а также непустота С-ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С-ядра.
Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.

Полный текст

Введение

Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.

Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как кооперативные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.

В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц Γ v ( z 0 ,Τ t 0 )  из начального состояния z 0  и продолжительностью Tt0. Уравнения движения имеют вид:

z = u 1 + u 2 + u 3 + u 4 ,           (1)

z t 0 = z 0 .                  (2)

В равенстве (1) z=zx;yui=ui1;ui2, u i 1, iN= 1,2,3,4     .

Функция выигрыша игрока i определяется следующим образом:

Kt0,z0izt=t0Thiztdt

где z t =z t,  t 0 ,  u 1 ,  u 2 ,  u 3 ,  u 4  – решение системы (1)–(2) при допустимых управлениях u1, u2, u3, u4, h i z t = a i x t + b i y t + c i , a i , b i , c i =const; a i , b i , c i 0, a i 2 + b i 2 + c i 2 0,iN.  

Обзор литературы

Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абрамянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6–8]. В качестве принципа оптимальности в основном рассматривается С-ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.

Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9–11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14–16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во времени, что крайне важно для практических приложений.

Материалы и методы

В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С-ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.

Результаты исследования

Введем следующие обозначения:

u S j = iS u i j , u j S = u S j + u N\S j ,j=1,2; a S = iS a i , b S = iS b i , c S = iS c i ,SN.

Вычислим значение характеристической функции:

vS;Tt0,z0= 1)  maxuSz2SN\S2Tt02iSt0Thizτdτпри S>N\S 2)  minuSz2N\SS2Tt02iSt0Thizτdτпри S<N\S       3)Tt0iSci при S=N\S

Для нахождения v S;T t 0 , z 0  воспользуемся принципом максимума [17]. Для рассматриваемой задачи H=pu i=1 4 h i z t .  

Сопряженное уравнение примет вид: p ˙ = h 1 z t + h 2 z t + h 3 z t + h 4 z t x .  

Т. к. рассматривается задача со свободным правым концом и, следовательно, p(T) = 0, то p= a N tT ; b N tT .  

Тогда

H= a N tT u N 1 + b N tT a N t t 0 u N 1 + x 0 + b N t t 0 u N 2 + y 0 = = a N T t 0 u N 1 + b N T t 0 u N 2 + c N a N x 0 b N y 0 .  

Итак, следует найти

max u N 1 , u N 2 H 1 = max u N 1 2 + u N 2 2 16 a N u N 1 + b N u N 2 ;

max H1 достигается при u ¯ 1 N = 4 a N a N 2 + b N 2 ,  u ¯ 2 N = 4 b N a N 2 + b N 2 .

Следовательно,

x ¯ t = 4 a N a N 2 + b N 2 t t 0 + x 0 , y ¯ t = 4 b N a N 2 + b N 2 t t 0 + y 0 .

Аналогично находим, что   u ¯ 1 S = 2 a S a S 2 + b S 2  , u ¯ 2 S = 2 b S a S 2 + b S 2 ,S= i,j,l ,ijl,i,j,lN;  u¯1S=0,u¯2S=0, где S=i,j,ij,i,jN; u ¯ 1 S = 2 a S a S 2 + b S 2 , u ¯ 2 S = 2 b S a S 2 + b S 2 ,S= i ,iN.  

Тогда  

x¯St=u¯1Stt¯+4aNaN2+bN2t¯t0+x0y¯St=u¯2Stt¯+4bNaN2+bN2t¯t0+y0 t¯t0,T,tt¯,T.  

И, следовательно,

vN;Tt,z¯t=tThNz¯τdτ=tT4aN2aN2+bN2τt0+aNx0+4bN2aN2+bN2τt0+bNy0+cNdτ==tT4aN2+bN2τt0+aNx0+bNy0+cNdτ=2aN2+bN2TtT+t2t0+aNx0+bNy0+cNTt

 

vS;Tt,z¯t=tThSz¯τdτ=tT2aS2aS2+bS2τt¯+4aSaNaN2+bN2t¯t0++aSx0+2bS2aS2+bS2τt¯+4bSbNaN2+bN2t¯t0+bSy0+cSdτ==tT2aS2+bS2τt¯+4aSaN+bSbN/aN2+bN2t¯t0+aSx0+bSy0+cSdτ==aS2+bS2TtT+t2t¯+4aSaN+bSbN/aN2+bN2t¯t0+aSx0+bSy0+cSTt

 

если   S= i,j,l ,ijl,i,j,lN;  

 

vS;Tt,z¯t=tT4aSaNaN2+bN2t¯t0+aSx0+4bSbNaN2+bN2t¯t0+bSy0+cSdτ==4aSaN+bSbNaN2+bN2t¯t0+aSx0+bSy0+cSTt==aS2+bS2TtT+t2t¯+4aSaN+bSbNaN2+bN2t¯t0+aSx0+bSy0+cSTt

 

если   S= i,j , ij,  i,jN;  

 

vS;Tt,z¯t=tThSz¯τdτ==tT2aS2aS2+bS2τt¯+4aSaNaN2+bN2t¯t0+aSx02bS2aS2+bS2τt¯+4bSbNaN2+bN2t¯t0++bSy0+cSdτ=tT2aS2+bS2τt¯+4aSaN+bSbN/aN2+bN2t¯t0+aSx0+bSy0+cSdτ==aS2+bS2TtT+t2t¯+4aSaN+bSbN/aN2+bN2t¯t0+aSx0+bSy0+cSTt

 

если   S= i, , iN.  

Таким образом,   v N;Tt, z ¯ t =2 a N 2 + b N 2 Tt T+t2 t 0 + a N x 0 + b N y 0 + c N Tt ;  

v i,j,l ;Tt, z ¯ t = a ijl 2 + b ijl 2 Tt T+t2 t ¯ +4 a ijl a N + b ijl b N a N 2 + b N 2 t ¯ t 0 + a ijl x 0 + b ijl y 0 + c ijl Tt ;

v i,j ;Tt, z ¯ t = 4 a ij a N + b ij b N / a N 2 + b N 2 t ¯ t 0 + a ij x 0 + b ij y 0 + c ij Tt ;

v i ;Tt, z ¯ t = a i 2 + b i 2 Tt T+t2 t ¯ + 4 a i a N + b i b N a N 2 + b N 2 t ¯ t 0 + a i x 0 + b i y 0 + c i Tt , ijl, i,j,lN.

 

Рассмотрим С-ядро (Сv(T-t0, z0)) данной игры.

Теорема 1

  C v Tt, z ¯ t , t t 0 ,T .  

Доказательство

Необходимым и достаточным условием непустоты С-ядра в игре четырех лиц является выполнение следующих неравенств7:

v ijl + v ijk + v ilk + v jlk 3v N , v ijl + v jlk + v ik 2v N , v ij + v il + v ik +2 v jlk 3v N , i,j,l,kN, ijkl.

В нашем случае эти неравенства примут вид:

v i,j,l ;Tt, z ¯ t +v i,j,k ;Tt, z ¯ t +v i,l,k ;Tt, z ¯ t +v j,l,k ;Tt, z ¯ t 3v N;Tt, z ¯ t ,

v i,j,l ;Tt, z ¯ t +v j,l,k ;Tt, z ¯ t +v i,k ;Tt, z ¯ t 2v N;Tt, z ¯ t  ,

v i,j ;Tt, z ¯ t +v i,l ;Tt, z ¯ t +v i,k ;Tt, z ¯ t +2v j,l,k ;Tt, z ¯ t 3v N;Tt, z ¯ t , i,j,k,lN, ijkl, t t 0 T .

 

Покажем справедливость этих неравенств.

v i,j,l ;Tt, z ¯ t +v i,j,k ;Tt, z ¯ t +v i,l,k ;Tt, z ¯ t +v j,l,k ;Tt, z ¯ t 3v N;Tt, z ¯ t = = a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 + a ilk 2 + b ilk 2 + a jlk 2 + b jlk 2 Tt T+t2 t ¯ + + 4 a ijl + a ijk + a ilk + a jlk a N a N 2 + b N 2 + b ijl + b ijk + b ilk + b jlk b N a N 2 + b N 2 t ¯ t 0 + a ijl + a ijk + a ilk + a jlk x 0 + b ijl + b ijk + b ilk + b jlk y 0 + + c ijl + c ijk + c ilk + c jlk Tt 6 a N 2 + b N 2 Tt T+t2 t 0 3 a N x 0 + b N y 0 + c N Tt =

= a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 + a ilk 2 + b ilk 2 + a jlk 2 + b jlk 2 × Tt T+t2 t ¯ +12 a N 2 + b N 2 Tt t ¯ t 0 6 a N 2 + b N 2 Tt T+t2 t 0 = a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 + a ilk 2 + b ilk 2 + a jlk 2 + b jlk 2 6 a N 2 + b N 2 Tt T+t2 t ¯ 0.

 

Аналогично доказывается, что

v i,j,l ;Tt, z ¯ t +v j,l,k ;Tt, z ¯ t +v i,k ;Tt, z ¯ t 2v N;Tt, z ¯ t = = a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 4 a N 2 + b N 2 Tt T+t2 t ¯ 0;

v i,j ;Tt, z ¯ t +v i,l ;Tt, z ¯ t +v i,k ;Tt, z ¯ t +2v j,l,k ;Tt, z ¯ t 3v N;Tt, z ¯ t = = 2 a jlk 2 + b jlk 2 6 a N 2 + b N 2 × Tt T+t2 t ¯ 0,

t ¯ t 0 ,T , t t ¯ ,T , i,j,k,lN, ijkl.

Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:

Φ i v S;Tt, z ¯ t = SN iS n1 ! s1 ! n! × v S;Tt, z ¯ t v S\ i ;Tt, z ¯ t   (3)

Подставляя значения v S;Tt, z ¯ t  в выражение (3), получим:

Φ i (v)= (41)!(11)! 4! a i 2 + b i 2 (Tt)(T+t2 t _ )+4 a i a N + b i b N a N 2 + b N 2 ( t _ t 0 )+ a i x 0 + b i y 0 + c i × × (Tt)0 + (42)!(21)! 4! × 4 a ij + a il + a ik a N a N 2 + b N 2 + b ij + b il + b ik b N a N 2 + b N 2 ( t _ t 0 )+ + a ij + a il + a ik x 0 + b ij + b il + b ik y 0 + c ij + c il + c ik ×(T t 0 )+ a j 2 + b j 2 + a l 2 + b l 2 + a k 2 + b k 2 (Tt)× ×(T+t2 t _ ) 4 a jlk a N + b jlk b N a N 2 + b N 2 ( t _ t 0 ) + a jlk x 0 + b jlk y 0 + c jlk (Tt)]+ (43)!(31)! 4! ×

× a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 + a ilk 2 + b ilk 2 (Tt)(T+t2 t _ )+ 4 a ijl + a ijk + a ilk a N a N 2 + b N 2 + b ijl + b ijk + b ilk b N a N 2 + b N 2 ( t _ t 0 )+ + a ijl + a ijk + a ilk x 0 + b ijl + b ijk + b ilk y 0 + c ijl + c ijk + c ilk (Tt) 4 a jl + a jk + a lk a N a N 2 + b N 2 + b jl + b jk + b lk b N a N 2 + b N 2 ( t _ t 0 )+ + a jl + a jk + a lk x 0 + b jl + b jk + b lk y 0 + c jl + c jk + c lk ×(Tt) + (44)!(41)! 4! × × 2 a N 2 + b N 2 (Tt)(T+t2 t 0 )+ a N x 0 + b N y 0 + c N (Tt) a jlk 2 + b jlk 2 (Tt)(T+t2 t _ )

4 a jlk a N + b jlk b N a N 2 + b N 2 ( t _ t 0 ) + a jlk x 0 + b jlk y 0 + c jlk (Tt)]= = 1 12 [ 3 a i 2 + b i 2 + a j 2 + b j 2 + a l 2 + b l 2 + a k 2 + b k 2 + a ijl 2 + b ijl 2 + a ijk 2 + b ijk 2 + + a ilk 2 + b ilk 2 + a jlk 2 + b jlk 2 (Tt)(T+t2 t _ )+6 a N 2 + b N 2 (Tt)(T+t2 t 0 )+ + 36 a i a N + b i b N a N 2 + b N 2 ( t _ t 0 )(Tt) 12 a jlk a N + b jlk b N a N 2 + b N 2 ( t _ t 0 )(Tt)+ 12 a i x 0 + b i y 0 + c i (Tt) ,

i,j,l,kN,ijkl,t_[t0,T],t[t_,T]

 

В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].

Перейдем к формальному определению принципа динамической устойчивости в игре Γ v z 0 ,T t 0  .

Пусть z ¯  – условно-оптимальная траектория в игре Γ v z 0 ,T t 0  , Γ v z ¯ t ,T t 0 ,  t 0 tT,  – текущие игры с решениями W v z ¯ t ,Tt E v z ¯ t ,Tt ,

 где

  E v z ¯ t ,Tt = ξ= ξ 1 , ξ 2 ,..., ξ n R n ξ i v i , z ¯ t ,Tt ,iN, iN ξ i =v N, z ¯ t ,Tt .  

Предположим, что W v z ¯ t ,Tt  для всех t0 ≤ tT.

Определение 1 [6; 7; 11]

Дележ ξ W v z 0 ,T t 0  будем называть устойчивым в игре Γ v z 0 ,T t 0 , если существует интегрируемая на [t0, T] вектор-функция β(t) и такая дифференцируемая на [t0, T] вектор-функция ξ (t), что дележ ξ представим в виде:

ξ=ξt, ξit=t0tβiτhiz¯τdτ

и для всех t t 0 ,T  существует такое подмножество W v z ¯ t ,Tt  множества W v z ¯ t ,Tt ,  что

ξt+W'vz¯t,TtWvz0,Tt0

Определение 2

Решение W v z 0 ,T t 0 называется устойчивым, если устойчивы все входящие в него дележи. В таком случае условно-оптимальная траектория z ¯  называется оптимальной.

Данный способ реализации дележа зависит от выбора функции β(τ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени t t 0 ,T  игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.

В качестве решения W v z 0 ,T t 0  рассмотрим С-ядро игры Γ v z 0 ,T t 0 , которое обозначим через C v z 0 ,T t 0 .
Как было показано выше, C v z ¯ t ,Tt ,  t 0 tT,  где z ¯  – условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С-ядра C v z 0 ,T t 0  в кооперативной дифференциальной игре с интегральными выигрышами.

Теорема 2

Для того чтобы С-ядро C v z 0 ,T t 0  кооперативной дифференциальной игры Γ v z 0 ,T t 0  с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа ξ C v z 0 ,T t 0  имело место представление

ξ=t0T;βτhz¯τdτ

где вектор-функция β(t) в каждый момент t t 0 ,T  удовлетворяет условиям:

1) vS;z0,Tt0+vN\S;z¯t,TtvN;z¯t,TtiSt0Tβiτhiz¯τdτvN;z0,Tt0+vN\S;z0,Tt0vS;z¯t,Tt  при всех    SN;

2) iNt0tβiτhiz¯τdτ=iNt0thiz¯τdτ

 

Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].

Исследуем теперь динамическую устойчивость вектора Шепли.

Теорема 3

В рассматриваемой игре вектор Шепли динамически устойчив.

Доказательство

Взяв βi(τ) равным

1 6 t ¯ τ 3 a i 2 + b i 2 + a j 2 + b j 2 + a l 2 + b l 2 + a k 2 + b k 2 + a ijl 2 + b ijl 2 + + a ijk 2 + b ijk 2 + a ilk 2 + b ilk 2 3 a jlk 2 + b jlk 2 + a N 2 + b N 2 t 0 τ + a jlk a N + b jlk b N a N 2 + b N 2 t ¯ t 0 3 a i a N + b i b N a N 2 + b N 2 t ¯ t 0 a i x 0 b i y 0 c i / 4 a i a N + b i b N / a N 2 + b N 2 + h i z 0

получим, что

ΦiTt0,z0=t0Tβiτhiz¯τdτ.

Теорема доказана

Обсуждение и заключение

В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С-ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.

Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.

 

1           Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками // В мире науки и инноваций : сб. науч. ст. междунар. науч.-практ. конф. В 3 ч. Ч. 3. Уфа : АЭТЕРНА, 2016. С. 6–8.

2           Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками. Деп. ВИНИТИ № 1254 – В 98 от 22.04.1998 г. 26 с.

3           Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками.

4           Там же.

5           Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками.

6           Ширяев В. Д., Нестерова Т. Н, Боткина И. А. Простейшая дифференциальная игра четырех лиц. Деп ВИНИТИ № 954 – В 2005 от 07.07.2005. 14 с.

7           Ширяев В. Д. С-ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.

 

×

Об авторах

Виктор Дмитриевич Ширяев

ФГБОУ ВО «МГУ им. Н. П. Огарёва»

Email: shiryaevvd@mail.ru
ORCID iD: 0000-0003-0497-3769
ResearcherId: B-8540-2019

профессор, кафедра фундаментальной информатики, кандидат физико-математических наук, доцент

Россия, 430005, г. Саранск, ул. Большевистская, д. 68/1

Елена Викторовна Шагилова

ФГБОУ ВО «МГУ им. Н. П. Огарёва»

Автор, ответственный за переписку.
Email: shagilova_elena@mail.ru
ORCID iD: 0000-0003-0267-6082
ResearcherId: B-8524-2019

доцент, кафедра фундаментальной информатики, кандидат педагогических наук, доцент

Россия, 430005, г. Саранск, ул. Большевистская, д. 68/1

Список литературы

  1. Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50–57.
  2. Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52–53.
  3. Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М. : Наука, 1991. 96 с.
  4. Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5–15. URL:http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
  5. Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11.С. 54–59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
  6. Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками //Вестник Ленинградского университета. Cер. 1: Математика. Механика. Астрономия. 1977. № 4.С. 46–52.
  7. Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60–64. URL:http://www.sworld.com.ua/konfer39/97.pdf
  8. Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs //Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513–520.
  9. Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета.Сер. 1 : Математика. Механика. Астрономия. 1979. № 1. С. 52–59.
  10. Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33–38.
  11. Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия.1993. № 4. С. 40–46.
  12. Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб. : Изд-во СПбГУ, 2008. 326 с.
  13. Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651–666.DOI: https://doi.org/10.1023/B:JOTA.0000025714.04164.e4
  14. Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econometrica.1987. Vol. 55, Issue 6. P. 1331–1348. DOI: https://doi.org/10.2307/1913559
  15. Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13–34. DOI: https://doi.org/10.1007/BF01254381
  16. Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans //The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473–492. URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
  17. Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М. :Наука, 1969. 384 с.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Ширяев В.Д., Шагилова Е.В., 2019

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Мы используем файлы cookies, сервис веб-аналитики Яндекс.Метрика для улучшения работы сайта и удобства его использования. Продолжая пользоваться сайтом, вы подтверждаете, что были об этом проинформированы и согласны с нашими правилами обработки персональных данных.

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).