Диссертация (1145356), страница 23
Текст из файла (страница 23)
Множество опорных решений, гарантирующих сильную динамическую устойчивость C-ядру, не пусто. Кроме того, согласно Теореме 5.2.1 вектор Шепли может быть использован в качествеопорного решения, поскольку для него выполнены условия (5.2.35).¯ 0 , 0 , ), построенное по алгоритмуМножество всех опорных решений (§ 5.2.1 для некоторого фиксированного набора параметров модели, представлено на Рис.
5.5. На графике наглядно продемонстрировано, что для данногопримера игры вектор Шепли (красная кривая) содержится в множестве опорных решений.Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью173Рис. 5.5: Множество опорных решений в игре трех лиц5.3О построении характеристической функции в дифференциальных играх с предписанной продолжительностьюРассмотрим кооперативный вариант игры Γ(0 , 0 , ), описанной в § 1.1. Выше в § 5.1.1 было приведено определение игры Γ (0 , 0 , ) в форме характеристической функции, однако способ построения характеристической функции (0 , 0 , ; ), ⊆ , является вопросом, заслуживающим отдельногоизучения.В теории кооперативных игр существуют различные способы построенияхарактеристических функций.
Некоторые из них описаны в работе [309], систематизирующей различные современные подходы. Наиболее часто используемые классы характеристических функций могут быть обозначены в порядкеих появления как -, -, -, - характеристические функции [165, 186, 283, 309].В современной литературе под характеристической функцией в кооперативных играх понимается отображение из множества всех возможных коалиций (·) : 2 → ,Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью174 (∅) = 0.Отметим, что значение () является мерой стратегической силы коалиции . Важным свойством является свойство супераддитивности характеристической функции (5.1.2), которое в настоящее время в работах по кооперативнойтеории игр часто не постулируется [114, 303, 309].Однако использование супераддитивной характеристической функции прирешении различных задач в области кооперативной теории игр как в статической, так и в динамической постановке, дает ряд преимуществ, а именно,супераддитивность1.
обеспечивает выполнение условия индивидуальной рациональности длякооперативных решений (5.1.4) [114],2. побуждает игроков создавать всё большие коалиции и в итоге объединиться в гранд-коалицию ,3. придает понятный смысл вектору Шепли (компонента дележа для каждого игрока равна его среднему вкладу в благосостояние гранд-коалициипри определенном механизме ее формирования) [114],4. необходима при построении сильно-динамически устойчивых принциповоптимальности (см. далее § 5.2, [26]).Таким образом, во многих аспектах более оправданно иметь супераддитивную характеристическую функцию.В настоящее время известны различные способы построения характеристических функций в кооперативных играх.В данной главе анализируются только два подхода, а именно, так называемые - и - характеристические функции, а затем предлагается новый подход,Глава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью175в котором будут устранены некоторые из недостатков указанных классов характеристических функций. Отметим лишь, что - характеристические функции для некоторых достаточно широких классов игр [283] совпадают с -, акласс -характеристических функций является непосредственной модификацией - характеристических функций (подробнее см. [186], см.
также [268]).Пример построения – характеристической функции приведен для дискретного варианта игры в § 9.3.1.5.3.1– характеристическая функция в игре Γ(0 , 0 , )При построении -характеристических функций используется классическийподход Дж. Неймана, О. Моргенштерна, сформулированный в 1944 году вработе [141]. Согласно данному подходу, под () понимается максимальныйгарантированный выигрыш коалиции , а само значение () может бытьвычислено на основе вспомогательной антагонистической игры Γ, ∖ междукоалицией и анти-коалицией ∖ .Рассмотрим кооперативную форму игры Γ(0 , 0 , ).
Для каждой коалиции ⊂ , рассмотрим вспомогательную антагонистическую дифференциальную игру Γ, ∖ (0 , 0 , ) между игроками (коалициями) и ∖ из состояния (0 ) = 0 c продолжительностью −0 и динамикой ˙ = (, 1 , . . . , , ∖ ),где ∈ ⊓∈ , ∖ ∈ ⊓∈ ∖ . Здесь является множеством допустимыхстратегий [70] -го игрока, в частности, могут быть использованы кусочнопрограммные стратегии [101].Определим⎧⎪⎪0, = {∅}⎪⎪⎨val Γ, ∖ (0 , 0 , ), ⊂ , (0 , 0 , ; ) =⎪⎪∑︀⎪⎪ (0 , 0 , , ), = .⎩ max1 ,2 ,...
=1(5.3.67)Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью176Доказано [101], что (0 , 0 , ; ) является супераддитивной функцией, т.е.удовлетворяет свойству (5.1.2).Задание характеристической функции как максимального гарантированного выигрыша (5.3.67) в кооперативных дифференциальных играх долгое время формулировалось как определение.
Данный подход имеет ряд неоспоримыхпреимуществ: при использовании данного подхода имеем четко сформулированную математическую задачу с понятной прикладной интерпретацией, кроме того, построенная характеристическая функция супераддитивна. В то жевремя, стоит выделить следующие проблемы, возникающие при построениихарактеристической функции по методу Неймана, Моргенштерна. Во-первых,необходимо решить 2 − 1 задач оптимизации сложного вычислительного характера, особенно в динамических и дифференциальных играх.
Во-вторых, сточки зрения экономических приложений предположение о том, что игрокииз ∖ будут образовывать анти-коалицию, т.е. играть против коалиции ,является мало реальным. Кроме того, возникает вопрос о существовании значения антагонистической игры val Γ, ∖ . Исходя из последнего, достаточночасто характеристическая функция определяется через нижнее значение игры, а именно⎧⎪⎪0, = {∅}⎪⎪⎪∑︀⎨maxmin (0 , 0 , , ), ⊂ , , , (0 , 0 , ; ) =∈∈ ∈ ∖⎪⎪⎪∑︀⎪⎪⎩ max (0 , 0 , , ), = .(5.3.68)1 ,2 ,... =1В игре Γ(0 , 0 , ), характеристическая функция (5.3.67), редко может бытьполучена в аналитическом виде в силу серьёзных вычислительных сложностей. При построении –характеристической функции нередко возникаютразрывные решения, встаёт вопрос о существовании и единственности решений уравнений типа Гамильтона-Якоби-Беллмана в том случае, если исполь-Глава 5.
Кооперативные дифференциальные игры с предписанной продолжительностью177зуется класс стратегий с обратной связью, да и сам вопрос о выборе классастратегий становится крайне актуальным. Таким образом, первоначальная задача кооперативной теории о разделе максимального суммарного выигрышаигроков, заработанного ими совместно, сводится к нахождению стратегий изадача из «нестратегической» (см.
[16])приобретает стратегический характер.Рассмотрим следующий пример, который основан на одной экономическойзадаче из [240].Пример 1. Имеется = 3 игрока, () ∈ [0; ¯] - управление игрока , = 1, 2, 3 . Функция выигрыша игрока имеет вид]︃(︃ [︃)︃∫︁ ∞3∑︁ℎ () () − 2 () ,− − ( , 0 ) =20(5.3.69)ℎ=1где динамика задается уравнением˙ () = (); (0) , 0 > 0; ∈ {1, 2, 3} , > 0.(5.3.70)Рассмотрим все возможные коалиции из двух игроков: {1, 2}, {1, 3}, {2, 3}и найдем выражение для характеристической функции (, 0 ) для такихкоалиций.Для построения -характеристической функции (5.3.67), необходимо решить уравнение следующего типа [194, 232] для всех возможных вариантовдвухэлементных коалиций ⊂ :(5.3.71) (, ) =maxmin{ℎ∑︁ℎ∈ ∈ ∖ℎ∈3∑︁3 ∑︁ 2 ∑︁ (, ) },[ − ]ℎ −ℎ +2=1=1ℎ∈где ℎ = { }∈ , (, ) – функция Беллмана в соответвующей задаче максимизации выигрыша для коалиции , т.е.
(, ( )) = max={ }=1 ∈[0,¯]∫︁∞(︃ [︃− −3∑︁ℎ=1]︃)︃ℎ () () − 2 () ,2Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью178где фазовая переменная = {1 , 2 , 3 } изменяется согласно (5.3.70).Имеем следующие оптимальные управления дляигроков из коалиции : ℎ =⎧⎨1 (,)ℎ> 0, если (,)ℎ> 0, ℎ ∈ если (,)ℎ≤ 0, ℎ ∈ (5.3.72)⎩ 0,и⎧⎨ 0, еслиоставшегося игрока : =⎩¯, если (,)≥0 (,)< 0.(5.3.73)Очевидно, что задача сводится к рассмотрению следующих случаев.Вариант 1.1: = 0, = 1; 2; 3.Вариант 1.2: ℎ = 0, ℎ ∈ , = ¯.Вариант 2.1: ℎ > 0, ℎ ∈ , = 0.Вариант 2.2: ℎ > 0, ℎ ∈ , = ¯.Содержательный интерес представляет вариант 2.2.
В этом случае характеристическая функция имеет следующий вид [199, 232] (, 0 ) = + ( + ) + + 2( + 2 ) + 2 +22+ + ( + ),где коэффициенты находятся из следующей системы алгебраических уравнений: = 2 + ¯ = + + + ¯ = 2 + ¯ = 2 + 2 − 2 = 22 = 2 − 2 = + − .Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью179Заметим, что данная система алгебраических уравнений имеет четыре решения. Таким образом, характеристическая функция не может быть построенаоднозначно. Данная ситуация усугубляется наличием остальных вариантов1.1, 1.2, 2.1, что связано с использованием max min в определении характеристической функции, поскольку для задачи max min решение часто находитсяна границе компакта.
В настоящее время в литературе встречается подход,связанный с «отсеиванием» результатов при неединственном решении уравнения типа Гамильтона-Якоби-Беллмана при помощи экономической интерпретации (см., например, [173]). Однако математический аппарат для такого«отсеивания» не разработан.5.3.2 -характеристическая функция в игре Γ(0 , 0 , )В работе Л.А. Петросяна, Дж.
Заккура [303] был предложен другой конструктивный подход для построения характеристическая функция ( -характеристическая функция). (0 , 0 , ; ) как сила коалиции может быть вычислена следующим об∑︀разом: игроки из максимизируют свой суммарный выигрыш ( , ∖ ),∈в то время как оставшиеся игроки из множества ∖ используют стратегиииз равновесия по Нэшу ∖ = { }∈ ∖ . Таким образом, имеем 2-этапнуюпроцедуру для построения характеристической функции: 1) находим равновесие по Нэшу { } для всех игроков ∈ , 2) «замораживаем» стратегии изравновесия по Нэшу для игроков ∈ ∖ , а для игроков из коалиции находим максимум их суммарного выигрыша по = { }∈ .Глава 5.