Диссертация (1145356), страница 24
Текст из файла (страница 24)
Кооперативные дифференциальные игры с предписанной продолжительностью180Итак, имеем следующее определение характеристической функции: (0 , 0 , ; ) =⎧⎪⎪0,⎪⎪⎪⎪∑︀⎪⎪max ( , ⎪ ∖ ),⎪⎪∈⎪⎨ , ∈⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩ = {∅} ⊂ , = ,(5.3.74)∈ ∖max∑︀1 ,2 ,... =1 (1 , 2 , . . . , ), = .Построенная таким образом характеристическая функция имеет следующие преимущества. Во-первых, очевидно, что при построении характеристической функции (5.3.74) требуется меньшее количество вычислительных операций по сравнению с характеристической функцией (5.3.67).
К тому же, вычисление значений (·) основано на уже вычисленном равновесии по Нэшу,что существенно упрощает дальнейшие вычисления. В-третьих, данное определение характеристической функции имеет понятную экономическую интерпретацию, а именно, то, что игроки, не вступившие в коалицию не будутобразовывать анти-коалицию ∖ , что соответствует их «неагрессивному»поведению во многих приложениях теории игр в области экологического менеджмента и пр.
(см. [194, 254]).Тем не менее, следует выделить следующие недостатки предложенного подхода. Отметим, что построенная по формуле (5.3.74) -характеристическаяфункция не является супераддитивной в общем случае в отличие от -характеристической функции (5.3.67).
Кроме того, крайне актуальным становитсявопрос о существовании и единственности равновесия по Нэшу. Рассмотримследующий пример.Пример 2. Найдем равновесие по Нэшу в дифференциальной игре, сфор-Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью181мулированной в примере 1. Имеем следующую задачу оптимизации− − (( )) = max ∈[0,¯](︃ [︃∞∫︁3∑︁ℎ=1)︃]︃ℎ () () − 2 () ,2∈(5.3.75)где фазовая переменная = {1 , 2 , 3 } изменяется согласно (5.3.70). Запишем уравнение типа Гамильтона-Якоби-Беллмана для функции ():{︃ [︃3∑︁]︃ − 2 +2}︃.(5.3.76)1+− если > 0,2 =1[︃]︃3∑︁ () =− если = 0.=1(5.3.77) () = max ∈[0,¯] −=1Имеем () =⎧⎨1 ⎩0> 0 если>0если≤ 0.Тогда имеем два варианта:(︂ () =)︂2[︃3∑︁]︃Таким образом, для второго случая из (5.3.77) сразу получаем явный вид (). Для первого случая, аналогично примеру 1, ищем решение в виде [199,232]: () = + + 2 + ( + ) ( + ) + (2 + 2 ) + ,22где , , , , , , , находятся из системы2 =2 = + , = = 2 − 2, = 2 = − , = 2 .Глава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью182Данная система алгебраических уравнений имеет четыре решения. Таким образом, равновесие по Нэшу не является единственным.Вопрос о выборе одного из множества решений уравнения типа Гамильтона–Якоби–Беллмана может быть рассмотрен с точки зрения экономической интерпретации.
В частности, в работе [173] предлагался один способ для выборарешения, который также может быть использован в данной задаче.5.3.3 – характеристическая функция в игре Γ(0 , 0 , )Рассмотрим дифференциальную игру лиц Γ(0 , 0 , ) (см. Раздел 1.1). Характеристическая функция (0 , 0 , ; ) , , ⊆ может быть определенаследующим образом: игроки из используют стратегии * = {* }∈ из оптимального -набора * , в то время как оставшиеся игроки из множества ∖ минимизируют выигрыш коалиции .∈Имеем: (0 , 0 , ; ) =∑︀⎧⎪0,⎪⎪⎪⎪⎪∑︀⎪⎪⎪min (0 , * , ∖ ),⎪⎪⎪∈⎪⎪ ∈ , ∈ ∖⎪⎨ = {∅} ⊂ , =* , ∈⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩max1 ,2 ,..., ,∑︀(5.3.78) (0 , 1 , 2 , . .
. , ), = .=1 ∈ , ∈Предложенный способ построения характеристической функции в дифференциальной игре с предписанной продолжительностью легко может быть обобщен для других классов игр.Справедлива следующая теорема.Теорема 5.3.1. Характеристическая функция (5.3.78) является супераддитивной функцией.Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью183Доказательство.
Проверим выполнение свойства (5.1.2) для характеристической функции (5.3.78).Рассмотрим (0 , 0 , ; ) =∑︀min , ∈ ∖ ∈ (0 , * , ), ⊂ , где =1 ∪ 2 , т.ч. 1 , 2 ⊂ , 1 ∩ 2 = ∅.По определению, (0 , 0 , ; 1 ∪ 2 ) =∑︀min ,∈(1 ∪2 ) (0 , *(1 ∪2 ) , ) =∈ ∖(1 ∪2 )(︃=)︃∑︀min ,∈1 (0 , *(1 ∪2 ) , ) +∑︀∈2 (0 , *(1 ∪2 ) , ) .∈ ∖(1 ∪2 )Очевидно, что минимум суммы двух функций не меньше суммы минимумовэтих функций. Кроме того, если множество управлений, по которым беретсяинфимум, расширить, то результат может только уменьшиться. Следовательно, справедливы неравенства (0 , 0 , ; 1 ∪ 2 ) =(︃)︃∑︀∑︀min (0 , *((1 ∪2 ) , )+ (0 , *(1 ∪2 ) , ) ≥∈1∈2 ,∈ ∖(1 ∪2 )≥min′ ∈ ,∑︀∈1 (0 , *(1 ∪2 ) , ′ ) +∈ ∖(1 ∪2 )≥∑︀min ,∈1∈ ∖1min′′ ∈ ,∑︀∈2 (0 , *(1 ∪2 ) , ′′ ) ≥∈ ∖(1 ∪2 ) (0 , *1 , ) +min ,∑︀∈2 (0 , *2 , ) =∈ ∖2= (0 , 0 , ; 1 ) + (0 , 0 , ; 2 ).Очевидно, что для коалиций = ∅, = свойство супераддитивностиГлава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью184выполнено тривиальным образом. Тогда (0 , 1 ∪ 2 ) ≥ (0 , 1 ) + (0 , 2 ),∀1 , 2 ⊆ , 1 ∩ 2 = ∅,что и требовалось доказать.Проведем сравнительный анализ существующих классов - , - характеристических функций (х.ф.) и новой характеристической функции (5.3.78).В классическом "максиминном"подходе Неймана-Моргенштерна [141] (х.ф.) характеристическая функция строится на основе вспомогательной антагонистической игры между коалициями и ∖ (см. Рис. 5.6 a).a)b)c)Рисунок 5.6.
К построению a) -х.ф., b) -х.ф., c) -х.ф.В подходе Петросяна-Заккура [303], основанном на равновесии по Нэшу( - х.ф.) характеристическая функция строится в два этапа: сначала находимравновесие по Нэшу, затем «замораживаем» стратегии из равновесия по Нэшудля игроков из множества ∖ , а для игроков из коалиции находиммаксимум их суммарного выигрыша (см.
Рис. 5.6 b).В новом подходе ( - х.ф.) также используется двухэтапная процедура:на первом этапе находим -набор оптимальных управлений, максимизирующий суммарный выигрыш всех игроков; на втором этапе для игроков,входящих в коалицию , используем полученные на первом этапе оптимальные управления, в то время как игроки из множества ∖ минимизируют суммарный выигрыш игроков из коалиции (см. 5.6 c). Построенная -характеристическая функция имеет следующие преимущества. Во-первых,Глава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью185характеристическая функция (5.3.78) удовлетворяет свойству супераддитивности (см. Теорему 5.3.1) в отличие от - характеристической функции. Вовторых, она может быть вычислена в два этапа с использованием выраженийдля оптимальных управлений, что существенно упрощает процесс вычисленийпо сравнению с построением - характеристической функции. Отметим, чтоуправления, максимизирующие суммарный выигрыш игроков, существуют имогут быть вычислены для широкого класса игр при достаточно слабых ограничениях, а вопрос существования и единственности равновесия по Нэшу дляданного класса характеристических функций не является столь существенным, как для класса -характеристических функций.
Кроме того, заданнаяновым образом характеристическая функция может быть использована дляигр с фиксированными коалиционными структурами, в которых на второмуровне кооперации возникают технические сложности с построением характеристических функций (см. далее § 5.4).5.3.4Пример построения -, -, - характеристической функции вигре Γ(0 , 0 , )В дифференциальной игре управления объемами вредных выбросов в атмосферу участвуют два игрока (страны, фирмы), = {1, 2}.
Под управлениямиигроков понимаются ∈ [0; ], = 1, 2 —объемы вредных выбросов. Задача решается в классе позиционных стратегий (, ). Фазовой переменной,описывающей изменение состояния системы, является скалярная величина ,соответствующая общему объему загрязнений, ∈ 1 .Динамика изменения загрязнений имеет следующий вид()˙=2∑︁=1 (),(0 ) = 0 .Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью186Функция выигрыша игрока , = 1, 2:∫︁( ( ( )) − ( )), (0, 0 , 1 , 2 , 3 ) =(5.3.79)0где(︂ ( ()) =)︂1 − .2Будем накладывать дополнительное ограничение на параметры игры: ≥ , где = 1 + 2 (условие регулярности).Оптимальные управления могут быть непосредственно найдены при помощи принципа максимума Понтрягина:* () = (1 − ( − ),2 − ( − )) ,где = 1 + 2 . Условие регулярности гарантирует, что * () ≥ 0 ∀ ∈ [0, ].Для полученных оптимальных управлений имеем значение максимальногосуммарного выигрыша обоих игроков: (0 , 0 , ; ) = (0 , 0 , ; ) = (0 , 0 , ; ) =(5.3.80))︁(︁122˜= − ( − 0 ) 0 + ( − 0 ) 2 ( − 0 ) − 3 ( − 0 ) + 3 ,6где = 1 + 2 , ˜ = 21 + 22 .Вычислим значение характеристической функции для случая одноэлементных коалиций.
Очевидно, что для случая игры с двумя игроками задача имеетупрощенный вид. Для случая - х.ф. необходимо найти два максимина (игрок 1 как максимизирующий, игрок 2 как минимизирующий и наоборот), дляслучая -х.ф. - равновесие по Нэшу и соответствующие этому равновесиювыигрыши игроков, для случая -х.ф. найти минимум выигрыша игрока 2(1) при использовании оптимального управления игроком 1 (2).Для данных классов линейно-квадратичных дифференциальных игр длявсех -, -, -х.ф.