Автореферат (1145355), страница 6
Текст из файла (страница 6)
. . , ), = .1 ,2 ,..., , =1 ∈ , ∈Предложенный способ построения характеристической функции в дифференциальной игре с предписанной продолжительностью легко может быть обобщендля других классов игр.Теорема 5.3.1. Характеристическая функция (31) является супераддитивной функцией.Построенная -характеристическая функция имеет следующие преимущества. Во-первых, характеристическая функция (31) удовлетворяет свойству су23пераддитивности (см. Теорему 5.3.1) в отличие от - характеристической функции. Во-вторых, она может быть вычислена в два этапа с использованием выражений для оптимальных управлений, что существенно упрощает процесс вычислений по сравнению с построением - характеристической функции.
Отметим, что оптимальные управления, максимизирующие суммарный выигрышигроков, существуют и могут быть вычислены для широкого класса игр при достаточно слабых ограничениях, а вопрос существования и единственности равновесия по Нэшу для данного класса характеристических функций не являетсястоль существенным, как для класса -характеристических функций. Кроме того, заданная новым образом характеристическая функция может быть использована для игр с фиксированными коалиционными структурами, в которых навтором уровне кооперации возникают технические сложности с построениемхарактеристических функций.В § 5.3.4 приведен пример построения характеристической функции в игреΓ(0 , 0 , ) всеми тремя описанными способами. Доказано, что в данном примере дифференциальной игры управления объемами вредными выбросами достаточные условия (29), гарантирующие сильную динамическую устойчивость –ядра, выполнены без дополнительных ограничений на параметры моделидля всех рассмотренных способов.
Все результаты получены в аналитическомвиде.В § 5.4 описана кооперативная дифференциальная игра с фиксированнойкоалиционной структурой. Кооперация происходит на двух уровнях: сначалакоалиции объединяются в коалицию с целью максимизации суммарного выигрыша, а затем выигрыши (компоненты вектора Шепли), полученные коалициями, распределяются внутри этих коалиций. В § 5.4.1 предложен подход (процедура распределения дележа), согласно которому можно перераспределить выигрыши игроков во времени так, что кооперация будет динамически устойчивойна обоих уровнях игры. При этом на втором уровне игры используется способпостроения характеристической функции, предложенный в § 5.3.3.
В § 5.4.2 теоретические результаты демонстрируются на примере теоретико- игровой задачиуправления вредными выбросами в атмосферу для случая заданной коалиционной структуры.В Главе 6 проблема динамической и сильной динамической устойчивости принципов оптимальности была адаптирована и решена для кооперативной дифференциальной игры со случайной продолжительностью Γ (0 , 0 , ),а также ее модификаций Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ) (Глава 7).
В§ 6.1, 6.2, 6.3 сформулированы теоремы, гарантирующие выполнение динамической устойчивости и защиты от иррационального поведения участников напримере вектора Шепли.Рассмотрим кооперативную форму игры Γ (0 , 0 , ). Будем полагать = ∞. Для определенности далее будем полагать, что игроки договорилисьиспользовать вектор Шепли для раздела суммы (0 , 0 , ):ℎ (0 , 0 ) =∑︁ ( − )!( − 1)!⊂∈![ (0 , 0 , ) − (0 , 0 , ∖{})], = 1, .
. . , .24Определение 6.2.1. Пусть существует вектор-функция() = { () ≥ 0}=1,..., ,такая что компоненты вектора Шепли ℎ(0 , 0 ) = {ℎ (0 , 0 )}=1,..., в игреΓ (0 , 0 ) представимы в виде∞Zℎ (0 , 0 ) = (1 − ()) (), = 1, . . . , .(32)0Вектор-функцию () = { ()} будем называть процедурой распределения дележа (ПРД) в игре Γ (0 , 0 ).Определение 6.2.2. Будем называть вектор Шепли {ℎ (0 , 0 )} динамически устойчивым вектором Шепли, если существует такая ПРД { () ≥0}, ∈ [0 , ∞), что вектор ℎ(* (), ) = {ℎ }, ∀ ∈ [0 , ∞), вычисленныйпо формуле∞Z1*(1 − ()) (),ℎ ( (), ) =(1 − ()) = 1, . .
. , ,(33)такжеявляетсявекторомШепливсоответствующейподыгре ∈ [0 , ∞).Теорема 6.2.1. Пусть для каждой подыгры Γ (* (), ), ∈ [0 , ∞),*¯вектор Шепли ℎ((), ) является абсолютно непрерывной функцией времени . ПустьΓ (* (), ), ()ℎ (* (), ) − (ℎ (* (), ))′ ≥ 0, ∈ [0 , ∞), = 1, . . . , .(1 − ())(34)¯Тогда в игре Γ (0 , 0 ) вектор Шепли ℎ(0 , 0 ) является динамически устойчивым дележом с ПРД (34).Очевидно, что в игре Γ (0 , 0 ) мы всегда можем распределить во времени вектор Шепли {ℎ }, используя формулу для выплат (34). Однако в общемслучае нельзя гарантировать неотрицательности компонент (), ∀ ∈ [0 , ∞).Вектор Шепли не является динамически устойчивым в общем случае. Алгоритм проверки динамической устойчивости вектора Шепли является следующим: вычислить компоненты ПРД по формуле (34) и проверить выполнениеусловия { () ≥ 0}, ∀ ∈ [0 , ∞).
Если неотрицательность выполнена, то вектор Шепли {ℎ }, распределенный во времени в игре Γ (0 , 0 ) согласно (34),является динамически устойчивым.В противном случае вектор Шепли не является динамически устойчивымпринципом оптимальности. Тогда, при выполнении свойства неотрицательностифункции мгновенного выигрыша ℎ (( ), ( )) ≥ 0, = 1, . . . , , для получения () =25нового динамически устойчивого (регуляризованного) принципа оптимальности на основе первоначально выбранного игроками динамически неустойчивогопринципа оптимальности, может быть использована новая процедура распределения дележа, а именно:ℎ (* (), )¯ () =∑︀ℎ (* (), * ())=1(* (), , ), ∈ [0 , ∞).(35)В § 6.3.
были изучены дополнительные ограничения на ПРД, обеспечивающие защиту игроков от иррационального поведения других участников вкооперативной дифференциальной игре с предписанной продолжительностью.Для кооперативной дифференциальной игры со случайной продолжительностью Γ (0 , 0 , ) условие защиты от иррационального поведения можетбыть сформулировано следующим образом:Z (0 , 0 , {}) ≤ (1 − ( )) ( ) + (1 − ()) (* (), , {}),(36)0 = 1, . . . , ,∀ ∈ [0 ; ∞).Теорема 6.3.1. Пусть (* (), , {}) — непрерывно дифференцируемая функция по , ∈ [0 , ∞). Тогда условие (36) выполнено тогда и только тогда, когда () ≥ () (* (), , {}) − (* (), , {}), = 1, . .
. , .(37)Аналогичным образом условия защиты коалиций от иррационального поведения других игроков могут быть переформулированы для задачи со случайным моментом окончания: (0 , 0 , ) ≤∑︀ R(1 − ()) () + (1 − ()) (* (), , ),∈ 0∀ ∈ [0 , ∞),(38) ⊆ .Теорема 6.3.2. Пусть (* (), ; ) — непрерывно дифференцируемаяфункция при ∈ [0 , ∞) в игре Γ (0 , 0 , ). Тогда условие (38) выполненотогда и только тогда, когда ПРД (), ∈ [0 ; ∞) удовлетворяет неравенству∑︁∈ () ≥ () (* (), , ) − (* (), , ).(39)В § 6.4 приведен пример построения динамически устойчивого вектораШепли на примере дифференциальной игры из § 2.3.4. В § 6.5 предложен алгоритм регуляризации вектора Шепли, который в § 6.5.1 продемонстрирован наиллюстративном примере линейной дифференциальной игры.26В § 6.6 изучается проблема построения сильно динамически устойчивогоС–ядра; результаты, полученные в § 5.2 для игр с предписанной продолжительностью, адаптированы для игры со случайным моментом окончания.
В § 6.6.1для примера, изученного в § 6.5.1, проверяется достаточное условие для непустоты множества опорных решений.Определение 6.6.1. Будем говорить, что C–ядро (0 , 0 ) является сильно динамически устойчивым кооперативным решением в игре Γ (0 , 0 , ), если1. (* (), ) ̸= ∅, ∀ ∈ [0 , ∞);¯ )(0 , 0 ) и такая ПРД (∞Z(¯1 ( ), . . . , ¯ ( )), ∈ [0 , ∞), что ¯ = (1 − ( ))¯ ( ) и2. существует такой дележ ¯∈=0⎧⎫Z⎨⎬¯ˆ = (1 − ()) () + (1 − ())ˆ⎩ ⎭0∀{ˆ }∈∈ (0 , 0 ),∈∈ (* (), ), ∀ ∈ [0 , ∞). (40)Определение 6.6.2.
Дележ ¯ ∈ (0 , 0 ), гарантирующий сильно динамическую устойчивость C–ядра, будем называть опорным решением.Сформулируем необходимые условия, гарантирующие (сильно) динамическую устойчивость С–ядра.Теорема 6.6.1. Пусть (* (), ) ̸= ∅ , ∀ ∈ [0 , ]. Пусть C–ядро (0 , 0 )сильно динамически устойчиво в игре Γ (0 , 0 , ). Тогда существует множество дележей (0 , 0 ) ⊆ (0 , 0 ), т.ч. для любого ∈ (0 , ) ПРД (), вычисленная по формуле (32), удовлетворяет следующим условиям: (0 , 0 ; ) − (0 , 0 ; ∖ ) − (1 − ()) (* (), ; ) ≥∑︁ Z ( )(1 − ( )) ≥∈ 0 (0 , 0 ; ) − (1 − ())[ (* (), ; ) − (* (), ; ∖ )],∀ ⊂ ,∑︁ Z ( )(1 − ( )) = (0 , 0 ; ) − (1 − ()) (* (), ; ).(41)(42)∈ 0Теорема 6.6.2.
Пусть (* (), ; ), ⊆ — непрерывно дифференцируемая функция по ∈ [0 ; ∞). Пусть (* (), ) ̸= ∅, ∀ ∈ [0 , ∞). Если27существует дележ ∈ (0 , 0 ) и соответствующая ему ПРД (), ∈ [0 , ∞),такая что ∀ ⊂ справедливо∑︁ () ≥ () (* (), ; ) −∈∑︁ (* (), ; ), () = () (* (), , ) −∈ (* (), , ; ), (43)то дележ ∈ (0 , 0 ) является опорным решением ¯ , а С–ядро (0 , 0 )является сильно динамически устойчивым кооперативным решением в игреΓ (0 , 0 , ).В Главе 7 в § 7.1 — 7.4 проблема динамической и сильно динамическойустойчивости изучается для игр Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ). В§ 7.2.1 приведен пример построения динамически устойчивого вектора Шеплидля модели § 3.1.2, в § 7.3.1 динамически устойчивый вектор Шепли строитсядля игры § 3.2.1 для -, -, - характеристических функций.В части III «Кооперативные многошаговые игры со случайным числомшагов» проблема динамической и сильно динамической устойчивости кооперативных решений изучается для дискретной постановки задачи.