Диссертация (1145356), страница 5
Текст из файла (страница 5)
В § 3.5.2 доказывается Теорема овиде интегрального выигрыша в игре Γ0 (0 , 0 , ).В Главе IV рассматриваются другие подходы к определению функционала выигрыша в дифференциальной игре Γ (0 , 0 , ) cо случайным моментом окончания. В § 4.1 сформулированы основные требования к конфликтноуправляемой системе, которые будут использованы в данной Главе в дальнейшем. Альтернативным подходом к задаче максимизации математическогоожидания выигрыша является задача минимизации величины, соответствующей той или иной мере риска, основанной на вычислении дисперсии иливторого момента выигрыша.
В § 4.2 и § 4.3 задача минимизации дисперсии выигрыша и второго момента, соответственно, упрощены.В части II «Кооперативные дифференциальные игры со случайной продолжительностью в форме характеристической функции» описанные выше клас-4. Краткое содержание работы26сы дифференциальных игр изучаются в форме характеристической функции.Отдельного внимания в дифференциальных играх заслуживают следующие вопросы: построение характеристической функции (0 , 0 , ; ), ⊆ ; проблема динамической и сильно динамической устойчивости кооперативных решений (принципов оптимальности).В Главе V рассматриваются кооперативные дифференциальные игры с предписанной продолжительностью Γ(0 , 0 , ).
§ 5.1 посвящен вопросу динамической устойчивости кооперативных решений в игре Γ(0 , 0 , ). В § 5.1.1 -§ 5.1.3систематизированы известные результаты, объясняющие концепцию динамической устойчивости принципов оптимальности в кооперативных дифференциальных играх. В § 5.1.4 предлагается обобщение условия защиты от иррационального поведения участников. В § 5.1.5 построен динамически устойчивый вектор Шепли для игры трех лиц, в которой задача управления объемами вредных выбросов моделируется как частный случай дифференциальнойлинейно-квадратичной игры. Все результаты получены в аналитическом виде.В § 5.2 изучается вопрос сильной динамической устойчивости –ядра в игреΓ(0 , 0 , ).
Вводится понятие опорного решения в –ядре, а также доказывается конструктивная теорема о достаточных условиях, гарантирующих сильную динамическую устойчивость –ядра. Подробно анализируются следствияоб ограничениях на характеристическую функцию, гарантирующие непустоту множества опорных решений. В § 5.2.1 предлагается алгоритм построениясильно- динамически устойчивого -ядра для игры лиц. Для игры = 2лиц данный алгоритм может быть существенно упрощен. В § 5.2.2 предложен конструктивный подход для построения множества опорных решений вигре двух лиц.
Данный алгоритм был использован в § 5.2.3 для построениясильно-динамически устойчивого решения в дифференциальной игре сокращения объемов вредных выбросов с ненулевой абсорбцией загрязнений для4. Краткое содержание работы27случая двух игроков. В § 5.2.4 была рассмотрена игра трех лиц из § 5.1.5. Доказано, что в данной игре управления вредными выбросами множество опорныхрешений не пусто и содержит вектор Шепли.В § 5.3 исследуется вопрос построения характеристической функции в кооперативных дифференциальных играх с предписанной продолжительностьюΓ(0 , 0 , ). В § 5.3.1, § 5.3.2 приводятся известные определения - и - характеристических функций, на конкретных примерах дифференциальных игранализируются достоинства и недостатки предложенных подходов. В § 5.3.3формулируется новый подход к построению характеристической функции ( –х.ф.), позволяющий избежать указанных недостатков, доказывается Теоремао супераддитивности. В § 5.3.4 приведен пример построения характеристической функции в игре Γ(0 , 0 , ) всеми тремя описанными способами.
Доказано, что в данном примере дифференциальной игры управления объемамивредными выбросами достаточные условия, гарантирующие сильную динамическую устойчивость –ядра, выполнены без дополнительных ограниченийна параметры модели для всех рассмотренных способов. Все результаты получены в аналитическом виде.В § 5.4 описана кооперативная дифференциальная игра с фиксированнойкоалиционной структурой.
Кооперация происходит на двух уровнях: сначала коалиции объединяются в коалицию с целью максимизации суммарноговыигрыша, а затем выигрыши (компоненты вектора Шепли), полученные коалициями, распределяются внутри этих коалиций. В § 5.4.1 предложен подход(процедура распределения дележа), согласно которому можно перераспределить выигрыши игроков во времени так, что кооперация будет динамическиустойчивой на обоих уровнях игры.
При этом на втором уровне игры используется способ построения характеристической функции, предложенный в § 5.3.3.В § 5.4.2 теоретические результаты демонстрируются на примере теоретико-4. Краткое содержание работы28игровой задачи управления вредными выбросами в атмосферу для случая заданной коалиционной структуры.В Главе VI проблема динамической и сильной динамической устойчивостипринципов оптимальности была адаптирована и решена для кооперативнойдифференциальной игры со случайной продолжительностью Γ (0 , 0 , ), атакже ее модификаций Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ) (Глава VII).В В § 6.1, 6.2, 6.3 сформулированы Теоремы, гарантирующие выполнение динамической устойчивости и защиты от иррационального поведения участников на примере вектора Шепли. В § 6.4 приведен пример построения динамически устойчивого вектора Шепли на примере дифференциальной игры из §2.3.4.
В § 6.5 предложен алгоритм регуляризации вектора Шепли, который в§ 6.5.1 продемонстрирован на иллюстративном примере линейной дифференциальной игры. В § 6.6 изучается проблема построения сильно динамическиустойчивого С–ядра; результаты, полученные в § 5.2 для игр с предписаннойпродолжительностью, адаптированы для игры со случайным моментом окончания. В § 6.6.1 для примера, изученного в § 6.5.1, проверяется достаточноеусловие для непустоты множества опорных решений.В § 7.1 — 7.4 проблема динамической и сильно динамической устойчивостиизучается для игр Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ). В § 7.2.1 приведен пример построения динамически устойчивого вектора Шепли для модели§ 3.1.2, в § 7.3.1 динамически устойчивый вектор Шепли строится для игры§ 3.2.1 для -, -, - характеристических функций.В части III «Кооперативные многошаговые игры со случайным числом шагов» проблема динамической и сильно динамической устойчивости кооперативных решений изучается для дискретной постановки задачи.
В Главе 8 рассматриваются кооперативные многошаговые игры со случайным числом ша-4. Краткое содержание работы29гов. В § 8.1 – 8.8 изучены вопросы регуляризации вектора Шепли и С–ядра,проблема сильной динамической устойчивости, в § 8.9, § 8.10 приведены двапримера многошаговых игр, иллюстрирующие полученные результаты.В Главе 9 рассмотрена другая дискретная постановка с элементом случайности, а именно, кооперативная многошаговая игра на так называемых«деревьях событий».
Игра имеет фиксированную продолжительность, однако динамика игры описывается в § 9.1 при помощи стохастического процессана «дереве событий». В § 9.2 рассматривается кооперативный вариант игры.Проблема динамической устойчивости вектора Шепли также была адаптирована для данного класса игр, результаты сформулированы в виде Теоремы в§9.3. В конце работы в § 9.3.1 приводится иллюстративный пример игрытрех лиц на дереве событий.Заключение содержит обзор полученных результатов.Часть IДифференциальные игры со случайнойпродолжительностью30Глава 1Основные модели и методы1.1Дифференциальные игры с предписанной продолжительностью. Описание игры Γ(0, 0, )В исследованиях в области дифференциальных игр, как правило, изучаютсядифференциальные игры с предписанной продолжительностью.
Это означает,что игра развивается во времени на фиксированном временном промежутке[0 , ], причем момент начала игры 0 и момент окончания игры известнызаранее.Игру лиц с предписанной продолжительностью будем обозначать какΓ(0 , 0 , ). Множество игроков обозначим как , | | = . В дальнейшембудем ассоциировать игроков с их порядковыми номерами: = {1, 2, . . .
, },соответственно -тый игрок будет обозначаться как {} ∈ .Рассмотрим дифференциальную игру лиц Γ(0 , 0 , ) с предписаннойпродолжительностью ( − 0 ) и начальным состоянием 0 , [101]. Динамикаигры задается системой обыкновенных дифференциальных уравнений:˙ = (, 1 , . .
. , ),(0 ) = 0 ∈ ⊂ .(1.1.1)Полагается, что состояние () ∈ принадлежит некоторому открытому подмножеству R для всех ∈ [0 , ], а управления выбираются из множеств31Глава 1.32Основные модели и методыдопустимых управлений , которые состоят из всех измеримых функций из[0 , ] в , = 1, . . .
, . Множества допустимых значений управлений представляют собой выпуклые компактные подмножества R такие что ∋ {0}.В дальнейшем мы будем использовать сокращенные обозначения и писать = (1 , . . . , ), =∏︀=1 , =∏︀=1 и, соответственно, ∈ и() ∈ , ∈ [0 , ].Будем полагать, что для любого допустимого управления ∈ и для любого начального условия 0 ∈ существует решение системы (1.1.1), обозначаемое (0 , 0 , , ), такое что для всех ∈ [0 , ] выполняется (0 , 0 , , ) ∈ .Кроме того, потребуем выполнения следующих условий:Предположение 1.1.1.
Пусть правые части системы дифференциальныхуравнений (1.1.1) удовлетворяют следующим условиям регулярности ([139,184]):1. функция непрерывна на множестве × 1 × . . . × ,2. функция удовлетворяет условию Липшица по с постоянной 1 > 0:‖(′ , ) − (′′ , )‖ ≤ 1 ‖′ − ′′ ‖ ∀′ , ′′ ∈ , ∈ ,3.
существует такая константа 2 > 0, что функция ограничена сверхупо :‖(, 1 , . . . , )‖ ≤ 2 (1 + ‖‖) ∀ ∈ , ∈ ,4. для любого ∈ , множество() = { (, )| ∈ }является выпуклым компактом в R .Выполнение условий Предположения 1.1.1 гарантирует существование, единственность и продолжимость решений системы (1.1.1) для любого набора до-Глава 1.33Основные модели и методыпустимых управлений 1 (·), . . . , (·). Кроме того, условие 3 Предположения1.1.1 гарантирует продолжимость решений на любом конечном интервале [0 , ].Замечание 1.1.1. Отметим, что условие 4 Предположения 1.1.1 автоматически выполняется, если правые части ДУ (1.1.1) аффинны по управлению, т.е.имеют вид (, 1 , . . .