Диссертация (1145356), страница 20
Текст из файла (страница 20)
Значение характеристической функциидля коалиции ⊂ находится в два этапа: сначала фиксируется некотораяситуация равновесия по Нэшу = (1 , . . . , ), а затем для игроков , невходящих в коалицию ∈/ , используют стратегии { }, тогда как игрокииз коалиции максимизируют свой суммарный выигрыш.Рассмотрим коалицию = {1, 2}. Применим принцип максимума Понтрягина. Имеем гамильтониан12 = 1(︁(︁1 )︁2 )︁1 −+ 2 2 −− 12 + (1 + 2 + 3 − 3 ( − )) ,22где 12 = 1 + 2 . Отметим, что мы подставляем вместо 3 полученное ранее выражение 3 . Тогда для данной задачи оптимизации имеем следующиеоптимальные стратегии⎛⎜⎜0 () = ⎜⎝1 + ()2 + ()3 − 3 ( − )⎞⎟⎟⎟.⎠Дифференциальное уравнение для сопряженной переменной имеет вид ˙ =12 , решением которого является () = 0 + 12 − 12 0 .
Положим 0 =−12 ( − 0 ) для выполнения условия ( ) = 0. Окончательно получаем() = −12 ( − ).Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью149Подставляя выражение для () в 0 (), имеем⎛ − 12 ( − )⎜ 1⎜0 () = ⎜ 2 − 12 ( − )⎝3 − 3 ( − )⎞⎟⎟⎟.⎠Далее, подставляя полученные управления в уравнение (5.1.28), получаем(︂() = 0 + ( − 0 ) +)︂3+ 12 (2 − 20 ) − (3 + 212 ) ( − 0 ).2Значение характеристической функции ((), , ; {1, 2}) приобретает вид ((), , ; {1, 2}) = −12 ( − ) ()+(︁)︁2˜( − ) 312 + 212 ( − ) − 3 12 ( − ),+6где ˜12 = 2 + 2 .12Аналогично получаем выражения для ((), , ; {1, 3}), ((), , ; {2, 3}): ((), , ; {1, 3})) = −13 ( − ) ()+(︁)︁2˜( − ) 313 + 213 ( − ) − 3 13 ( − )+,6 ((), , ; {1, 3}) = −23 ( − ) ()+(︁)︁2˜( − ) 323 + 223 ( − ) − 3 23 ( − )+,6где ˜13 = 2 + 2 , ˜23 = 2 + 2 .1223Проверим выполнение свойства супераддитивности (5.1.2) для построеннойхарактеристической функции (·, ), ⊆ .
Оказывается, что для любых ̸= ̸= ∈ {1, 2, 3}, справедливо следующее неравенство:1 (, ·) − ( ({, }, ·) + ({}, ·)) = ( − )3 (1 + 2 + 3 )2 ≥ 0.6Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью150Далее, несложно проверить, что1 ({, }, ·) − ( ({}, ·) + ({}, ·)) = ( − )3 (2 + 2 ) ≥ 0.6Таким образом, построенная -характеристическая функция (·, ) являетсясупераддитивной функцией без дополнительных ограничений на параметрымодели.Кроме того, покажем, что построенная характеристическая функция (·, )является выпуклой, т.е.
для нее выполнено неравенство (5.1.12). Будем использовать краткие обозначения. Пусть = ( ∪ ) + ( ∩ ) − () − ( ),тогда ≥ 0 означает, что выполнено неравенство (5.1.12).Пусть = {1, 2}, = {2, 3}. Подставляя выражения для значений характеристической функции (), получаем(1 + 3 ) (T − )3 (1 + 2 2 + 3 )≥ 0.=6Аналогично для = {1, 2}, = {1, 3} имеем:(2 + 3 ) (T − )3 (2 1 + 2 + 3 )=≥ 0.6В случае = {1, 3}, = {2, 3} также получаем:(1 + 2 ) (T − )3 (1 + 2 + 2 3 )=≥ 0.6Таким образом, построенная характеристическая функция обладает свойствомвыпуклости (супермодулярности) без дополнительных ограничений на параметры модели; С–ядро не пусто и может быть построено как множество дележей, таких, что выполнено (5.1.5).Выполнение условия (5.1.12) гарантирует «устойчивость» вектора Шеплив понимании кооперативной (статической) теории, т.е.
его принадлежностьГлава 5. Кооперативные дифференциальные игры с предписанной продолжительностью151С–ядру. Используя значения характеристической функции вектор Шепли может быть вычислен по формуле (5.1.7) (см. [223]). Выражение для компонентвектора Шепли достаточно громоздко, приведем выражение для компонентытолько 1-го игрока:ℎ1 ((), − ) =( − ) (︀ 2181 − 361 () + 12 2 21 + 3 2 22 + 3 2 23 + 1221 2 + 322 2 +=36+ 323 2 − 18 1 1 − 18 2 1 − 18 3 1 + 181 1 + 182 1 + 183 1 ++ 16 2 1 2 + 16 2 1 3 + 4 2 2 3 − 24 21 − 6 22 − 6 23 + 161 2 2 +)︀+ 161 3 2 + 42 3 2 − 32 1 2 − 32 1 3 − 8 2 3 .Графическое представление изменения вектора Шепли для подыгр вдоль кооперативной траектории * () приведено на Рис.
5.2.Рис. 5.2: Вектор Шепли для игроков 1, 2, 3 вдоль кооперативной траектории * ()Поскольку вектор Шепли был получен в аналитическом виде, его компоненты могут быть распределены во времени по правилу ПРД (5.1.19), чтообеспечивает динамическую устойчивость вектора Шепли. Запишем первуюкомпоненту ПРД, соответствующую распределению ℎ1 (для игрока 1) во вре-Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью152мени:1 22(︁3(2 −20 )2)︁1 () =− 1 0 + ( − 3 ) ( − 0 ) +−(︀)︀− (36−) 14( − )21 + 76( − )1 − 6˜ ( − ) − 8( − )2 3 − 18 1 +(︀)︀+ (36−) 9( − )21 +3( − )˜ − 18 1 +16( − )1 ( − 1 )+4( − )2 3 .Графическое изображение ПРД для все трех игроков приведено на Рис.
5.3.Рис. 5.3: ПРД для всех игроковНа Рис. 5.4 изображены компонента ПРД для первого игрока (1 (), ∈[0 , ]), соответствующая выплатам при кооперативном поведении всех игроков, и выигрыш ℎ1 ( (), ()) первого игрока при некооперативном варианте игры. Очевидно, что площадь под графиком 1 () больше, чем дляℎ1 ( (), ()), что соответствует выполнению условия индивидуальной рациональности (ℎ ≥ (0 , 0 , ; {})).Рис. 5.4: Сравнение выигрышей игрока 1 в кооперативном и некооперативном случаеГлава 5. Кооперативные дифференциальные игры с предписанной продолжительностью153Заметим, что для ПРД, соответствующей распределению вектора Шепли вовремени, выполнено условие (5.1.21) защиты от иррационального поведенияучастников.
Действительно, имеем2( − )* () + ( (), , ; {}) =(︁32+ 2˜ + 212)︁≥ 0, ∀,причем неравенство выполняется без дополнительных ограничений на параметры модели. Аналогичным образом можно показать, что выполняются иусиленные условия (5.1.26).5.2Сильно динамически устойчивое С–ядро в игреΓ (0, 0, )Рассмотрим игру Γ (0 , 0 , ). Предположим, что перед началом игры игрокидоговорились об использовании ими С–ядра (0 , 0 , ) в качестве принципаоптимальности (0 , 0 , ).Определение 5.2.1. [27] Будем говорить, что C–ядро (0 , 0 , ) является сильно динамически устойчивым кооперативным решением в игре Γ (0 , 0 , ),если1. (* (), , ) ̸= ∅, ∀ ∈ [0 , ];2. существует такой дележ ¯ ∈ (0 , 0 , ) и такая процедура распреде-¯ ) = (¯1 ( ), .
. . , ¯ ( )), ∈ [0 , ], что ления дележа (¯ =∫︁¯ ( )0и(0 , 0 , ) ⊇{︀∫︁}︀¯ ) + (* (), , ), ∀ ∈ [0 , ],(0где операция сложения в последнем выражении понимается как сумма множеств по Минковскому, [117].Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью154Определение 5.2.2.
[223] Дележ ¯ ∈ (0 , 0 , ), гарантирующий сильно динамическую устойчивость C–ядра, будем называть опорным решением.Определение 5.2.1 незначительно отличается от определения сильной динамической устойчивости, изначально сформулированного в [107]. Сильнаядинамическая устойчивость С– ядра означает, что при развитии игры вдолькооперативной траектории * () в C–ядре существует дележ (опорное решение) ¯ такой, что однократное отклонение в момент от этого дележа в пользудругого дележа {^ ()} из C–ядра (* (), , ) (т.е. другого дележа из C–ядрав подыгре Γ (* (), , )), приведет к суммарным выплатам в игре Γ(0 , 0 , ),соответствующим некоторому дележу {^ } также из C–ядра (0 , 0 , ).Справедлива следующая теорема.Теорема 5.2.1.
Пусть (* (), , ; ) — непрерывно дифференцируемая функция по ∈ [0 ; ]. Пусть (* (), , ) ̸= ∅, ∀ ∈ [0 , ]. Если существуетдележ ∈ (0 , 0 , ) и соответствующая ему ПРД (), ∈ [0 , ], такаячто ∀ ⊂ справедливо∑︁ () ≥ −∈∑︁∈ = − (* (), , ; ),(5.2.35) (* (), , ; ),то дележ ∈ (0 , 0 , ) является опорным решением ¯ , а С–ядро (0 , −0 ) является сильно динамически устойчивым кооперативным решением вигре Γ(0 , − 0 ).Доказательство. По условию теоремы С–ядро не пусто вдоль всей кооперативной траектории * (), ∈ [0 , ].
Выберем дифференцируемый селектор(дележ) () из С–ядра (* (), , ), ∈ [0 , ] и вычислим ПРД согласно(5.1.14). Тогда { =∫︀ 0 ( ) } ∈ (0 , − 0 ), =∫︀ 0 ( ) + ()∀ ∈ [0 , ]. Пусть для ПРД (), ∈ выполнены ограничения (5.2.35).Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью155Развитию игры во времени соответствует движение вдоль кооперативнойтраектории * (), ∈ [0 , ], на которой игроки в каждый момент време-ни попадают в текущие подыгры Γ (* (), , ). Для доказательства сильнойдинамической устойчивости (0 , 0 , ) необходимо показать включение{︀∫︁}︀( ) + (* (), , ) ⊆ (0 , 0 , ), ∀ ∈ [0 , ].0Итак, пусть в момент времени , ∈ [0 , ] произошло отклонение от { } впользу другого дележа {^ } из C–ядра (* (), , ).
Покажем, что результирующий дележ {^ =∫︀ 0 () + ^ } также принадлежит C–ядру.Покажем, что {^ } ∈ (0 , 0 , ), т.е. {^ } — действительно дележ, длякоторого выполнены свойства (5.1.4). Очевидно, что ∫︀∑︀ ∫︀∑︀=1=1=0 ( ) =∑︀=1 −∑︀0 ( ) − ∫︀∑︀=1 ( ) = () = (0 , 0 , ; ) − (* (), , ; ).=1Тогда∑︀∑︀^ = (0 , 0 , ; ) − (* (), , ; ) +^ = (0 , 0 , ; ),=1=1поскольку {^ } также является дележом в подыгре Γ (* (), , ).Кроме того, для {^ } выполнено условие индивидуальной рациональности.Действительно, пусть в неравенстве (5.2.35) = {}. Тогда^ =∫︀ ^ ≥0 ( ) + ∫︀ 0 ( ) + (* (), , , {}) ≥≥ (0 , 0 , ; {}) − (* (), , ; {}) + (* (), , ; {}) = (0 , 0 , ; {}).Теперь покажем, что {^ } ∈ (0 , − 0 ). Будем использовать необходимоеи достаточное условие принадлежности дележа C–ядру в форме (5.1.5).Из условия (5.2.35) имеем, что для ПРД выполнено∑︁∈ () ≥ − (* (), , ; ).Глава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью156Поскольку {^ } ∈ (* (), , ), имеем∑︁^ ≥ (* (), , ; ),∈тогда∑︁ ∫︁ () +0∈∑︁∈^ ≥∑︁ ∫︁∈ () + (* (), , ; ),0тогда, используя нижнее ограничение из (5.2.35), имеем∑︁ ∫︁∈0 () +∑︁^ ≥ (0 , 0 , , ) − (* (), , , )+∈+ (* (), , , ) = (0 , 0 , ; ).∫︀ Последнее означает, что {0 () + ^ } принадлежит C–ядру (0 , 0 , ).Также можно сформулировать следующий результат.Следствие 5.2.1. Пусть (* (), , ; ) — непрерывно дифференцируемаяфункция по ∈ [0 ; ]. Пусть существует дележ ∈ (0 , 0 , ) и соответствующая ему ПРД (), ∈ [0 , ], такая что ∀ ⊂ выполняетсяусловие (5.2.35) Теоремы 5.2.1. Тогда ПРД () удовлетворяет неравенству]︀ ∑︁ [︀**− ( (), , ; ) − ( (), , ; ∖ ) ≥ ()∈∑︁ = − (* (), , ; ).∈Доказательство. По Теореме 5.2.1 имеем∑︁ () ≥ − (* (), , ; ), () = − (* (), , ; )∈∑︁∈(5.2.36)Глава 5.