Диссертация (1149189), страница 2
Текст из файла (страница 2)
Единственное, что им было известно, это то, что информационный горизонт является случайной величиной.Подобный класс игр назван в диссертации кооперативными дифференциальными играми с предписанной продолжительностью и со случайным обновлениеминформации. Для них введено понятие случайной подыгры.
В описанных постановках в качестве исходного кооперативного решения использовались векторШепли, пропорциональное решение, С-ядро и сильно динамически устойчивоеПРД-ядро.Дифференциальные игры со случайной продолжительностью в общей постановке были введены в работе Л. А. Петросяна и Е. В. Шевкопляс [16]. В работерассматривались дифференциальные игры со многими участниками, при этоммомент окончания игры не был определен заранее, а представлял собой реализацию некоторой случайной величины с известной функцией распределения.В работах Е. В. Шевкопляс [30, 31] были продолжены исследования кооперативных дифференциальных игр со случайной продолжительностью, полученыважные результаты, относящиеся к проблеме динамической устойчивости кооперативных принципов оптимальности.8Цели и задачи исследования. Целью диссертационной работы является формализация и построение оптимальных решений о распределении выигрышей в конфликтно-управляемых процессах со многими участниками, когдаинформация о процессе обновляется динамически с течением времени.
Для достижения поставленной цели в работе ставятся и решаются следующие задачи:1. Построение сильно динамически устойчивого ПРД-ядра.2. Формализация поведения игроков на периодах между моментами времени, когда информация об игре обновляется, т.е. построение усеченныхподыгр.3. Исследование каждой усеченной подыгры, нахождение кооперативнойтраектории, построение характеристической функции вдоль кооперативных траекторий, получение оптимального решения.4. Нахождение результирующего решения для игры, определенной на совокупности всех временных интервалов.5.
Формализация общей кооперативной игры, определенной на совокупности всех временных интервалов, определение характеристической функции для игры с динамическим обновлением информации.6. Исследование свойства сильной динамической устойчивости (сильной временной состоятельности) результирующего решения дифференциальнойкооперативной игры.7. Построение результирующего решения, соответствующего набору классических решений в каждой усеченной подыгре, а именно пропорционального решения, вектора Шепли, C-ядра, сильно динамически устойчивогоПРД-ядра.8.
Исследование связи результирующего решения и решения в каждой усеченной подыгре, а именно пропорционального решения, вектора Шепли,C-ядра, сильно динамически устойчивого ПРД-ядра.9. Изучение различных вариантов или моделей игр с динамическим обновлением информации, а именно: кооперативные дифференциальные игры9с динамическим обновлением информации, с предписанной или бесконечной продолжительностью, кооперативные дифференциальные игры с динамическим обновлением информации и стохастическим прогнозом, кооперативные дифференциальные игры со случайным обновлением информации.10. Апробация полученных теоретических результатов на теоретико-игровоймодели добычи ограниченного ресурса, демонстрация свойства сильнойдинамической устойчивости полученного решения.Научная новизна полученных результатов.
Научная новизна работызаключается в том, что в ней:1. Определено новое решение для кооперативных дифференциальных игр,обладающее свойством сильной динамической устойчивости - сильно динамически устойчивое ПРД-ядро.2. Построены и исследованы новые математические модели дифференциальной игры с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальной игры с динамическимобновлением информации и стохастическим прогнозом, дифференциальной игры со случайным обновлением информации.3. Предложены конструктивные методы нахождения результирующего кооперативного решения в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играх с динамическим обновлением информации и стохастическим прогнозом, дифференциальных играх со случайнымобновлением информации.4.
Предложена процедура построения характеристической функции в играхс динамическим обновлением информации на основе значений характеристических функций в усеченных подыграх.5. Доказаны теоремы о сильной ∆t-динамической устойчивости в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играх10с динамическим обновлением информации и стохастическим прогнозом,дифференциальных играх со случайным обновлением информации.6. Определена связь кооперативного решения в игре с динамическим обновлением информации и кооперативных решений (пропорциональное решение, вектор Шепли, C-ядро, сильно динамически устойчивое ПРД-ядро),в каждой усеченной подыгре.Практическая значимость.
Полученные в диссертации результаты представляют практический интерес. Кооперативные дифференциальные игры сдинамическим обновлением информации, а также их различные варианты являются удобными математическими моделями для описания процессов, происходящих в экономике, экологии, менеджменте и прочих сферах человеческойдеятельности.Методология и методы исследования. В процессе проведения исследования автор опирался на научную методологию проведения исследования,общепризнанные принципы и подходы к исследовательской деятельности в области прикладной математики, методы теории оптимизации и теории игр.Структура и основное содержание работы.
Диссертация состоит извведения, четырех глав, разбитых на параграфы, заключения, списка используемой литературы, включающего 48 наименований. Объем составляет 108 страниц машинописного текста. Работа содержит 26 рисунков.Первая глава посвящена построению нового решения для кооперативныхдифференциальных игр с предписанной продолжительностью обладающегосвойствами сильной динамической устойчивости - ПРД-ядра. Далее показывается, что оно является подмножеством C-ядра. Стоит отметить, что отличиемданного подхода от подхода, предложенного Петросяном Л.А.
в [15], являетсято, что сначала определяются функции, которые используются в качестве ПРДдля сильно динамически устойчивого ПРД-ядра, а затем на их основе строятсядележи, входящие в ПРД-ядро. В § 1 описывается кооперативная дифференциальная игра с предписанной продолжительностью, описывается процедурапостроения С-ядра в исходной игре, приводятся основные определения из области кооперативных игр.
В § 2 определяется множество ПРД, позволяющие11построить динамически устойчивое ПРД-ядро. В § 3 строится соответствующеемножество дележей и исследуются его необходимые свойства. § 4 посвящен исследованию сильной динамической устойчивости построенного решения, сформулирована конструктивная теорема о сильной динамической устойчивости.
В §5 теоретические результаты продемонстрированы на примере дифференциальной игры управления вредными выбросами, приведены результаты численногомоделирования в среде Matlab и соответствующие графики.Вторая глава посвящена описанию и изучению кооперативных дифференциальных игр с динамическим обновлением информации, как с предписаннойпродолжительностью так и с бесконечной продолжительностью. Для кооперативных дифференциальных игр с динамическим обновлением информацииопределено понятие усеченной подыгры, построена условно кооперативная траектория, построено решение. Было показано, что решение обладает свойством∆t-сильной динамической устойчивости. Также была показана связь между решениями, выбранными игроками в усеченных подыграх и в общей игре.
Быловведено понятие характеристической функции для общей игры, с помощью нееи решения для общей игры удалось показать, что решения, выбранные игроками в усеченных подыграх, соответствуют результирующему решению, построенному на основе новой характеристической функции. В § 1 приводится определение усеченной подыгры, объясняется каким образом на основе этого понятияможно смоделировать поведение игроков. В § 2 описывается решение усеченнойподыгры, строится условно-кооперативная траектория. В § 3 на основе результатов в параграфе 2 строиться решение в игре с динамическим обновлениеминформации, доказывается свойство сильной ∆t-динамической устойчивости.
§4 посвящен построению характеристической функции в игре с динамическимобновлением информации. В § 5 описывается и формализуется математическисвязь решений выбранных игроками в усеченных подыграх с результирующимрешением в исходной игре с динамическим обновлением информации. В § 6демонстрируется использование теоретических результатов для кооперативнойигры добычи ограниченного ресурса трех лиц с предписанной продолжительностью и динамическим обновлением информации, в качестве принципа опти-12мальности используется C-ядро. Приводятся результаты численного моделирования в среде Matlab.Третья глава посвящена описанию и изучению кооперативных дифференциальных игр с предписанной продолжительностью, динамическим обновлением информации и стохастическим прогнозом. Для кооперативной дифференциальной игры с предписанной продолжительностью предлагается подход, когда игроки используют стохастический прогноз для предсказания измененияинформации об игре в будущем.
Вводится понятие комбинированной усеченной подыгры, которое позволяет моделировать поведение игроков, использующих прогноз для принятия решений. Доказывается утверждение о сильной∆t-динамической устойчивости решения. В § 1 приводится определение комбинированной усеченной подыгры, объясняется, каким образом на основе этогопонятия можно смоделировать поведения игроков, которые используют прогноздля принятия решения. В § 2 описывается решение комбинированной усеченнойподыгры, строится условно-кооперативная траектория.
В § 3 описывается решение в игре с динамическим обновлением информации, доказывается свойствосильной ∆t-динамической устойчивости. В § 4 теоретические результаты апробируются (численное моделирование в среде Matlab) на примере кооперативной игре добычи ограниченного ресурса двух лиц с динамическим обновлениеминформации и стохастическим прогнозом, приводится сравнение несколькихвариантов прогнозов и делаются выводы.Четвертая глава посвящена описанию и изучению кооперативных дифференциальных игр с предписанной продолжительностью и случайным обновлением информации.















