Автореферат (1145355), страница 3
Текст из файла (страница 3)
Зубову, Санкт-Петербург (2005, 2010, 2015); Международный семинар «Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби-Беллмана», Екатеринбург (2005), Russian-Finnish Graduate SchoolSeminar «Dynamic Games and Multicriteria Optimization», Petrozavodsk (2006);2nd International Conference on Game Theory and Application, Qingdao, China(2007); International Conference on Game Theory and Management, St.Petersburg(2007 — 2012, 2014, 2016); Международный Конгресс «Нелинейный динамический анализ», Санкт-Петербург ( 2007), Международная конференция по математической теории управления и механике, Суздаль(2009); Int.
ConferenceStochastic Optimal Stopping, Petrozavodsk (2010); Spain-Italy-Netherlands Meetingon Game Theory (Paris 2011, St. Petersburg 2015); 25th IFIP TC 7 Conference onSystem Modeling and Optimization, Berlin (2011), Workshop on Dynamic Games inManagement Science, Montreal, Canada (2008, 2011, 2016); Viennese Workshop onOptimal Control, Dynamic Games and Nonlinear Dynamics, Vienna (2012, 2015);Conference on Constructive Nonsmooth Analysis, St.Petersburg (2012); Международная научная конференция «Математика, экономика, менеджмент: 100 летсо дня рождения Л.В.
Канторовича», Санкт-Петербург (2012); InternationalSymposium on Dynamic Games and Applications (Wroclaw 2008; Amsterdam 2014);28th European Conference on Operational Research, Poznan, Poland (2016).Публикации. Основные результаты диссертации опубликованы в работах[1–38], из которых 10 опубликованы в журналах, входящих в перечень ВАКРФ (работы [1–5], [7–11]), 8 работ опубликованы в журналах, индексируемых внаукометрических базах Scopus/ Web of Science ([17, 18, 24, 27, 28, 30, 33, 38]),работы [6, 16, 29, 31, 32] являются монографиями/главами в монографиях виздательствах «Nova Science Publ.», «Springer», «БХВ-Петербург».Работы [1–8, 17–31, 34, 38] написаны в соавторстве. В работах [2, 5, 8, 29]соавтором была предложена постановка задачи, а диссертантом получены всеосновные результаты; в работе [7] диссертанту принадлежит раздел о кооперативных многошаговых играх со случайной продолжительностью.
В работе[1] диссертанту принадлежит постановка задачи, доказательство теоремы о су10пераддитивности, математическая модель и вычисления в примерах, а соавтору — выбор методов решения. В работе [6] диссертантом проведено систематическое исследование математических моделей принятия решений несколькимисторонами в условиях конфликта при наличии неопределенности.В работах [3, 24, 26] диссертантом формализована теоретико-игровая задача разработки невозобновляемых ресурсов, сформулированы основные результаты в рамках вероятностного подхода, доказано утверждение 1 и следствие 1в [3], получены аналитические выражения в содержательных примерах.
В работах [4, 34] диссертанту принадлежит постановка задачи, а также доказательство утверждения о виде функционала выигрыша для случая неотрицательнойфункции полезности, а соавтору — доказательство утверждения о виде функционала выигрыша в общем случае и построение контрпримера. В работе [31]диссертанту принадлежит постановка задачи и доказательство теорем, а соавтором найдены оптимальные стратегии в игре управления вредными выбросамив окружающую среду.В работе [17] личным вкладом автора является постановка задачи со случайным моментом начала и доказательство теорем, а соавтором выполненывычисления в примере.
В работах [18, 20–23, 28, 38] диссертанту принадлежатвсе основные теоретические результаты, касающиеся дифференциальных игрсо случайным моментом окончания, причем в работах [20–23] аналитическиевыражения для оптимальных управлений, вектора Шепли и процедуры распределения дележа получены лично диссертантом, а соавторами выполнены вспомогательные вычисления, построение графиков, анализ результатов. В работе[19] диссертантом выполнены вычисления в примере дифференциальной игрыуправления вредными выбросами.
В работе [27] соавтором предложена экономическая модель, а диссертантом найдены оптимальные стратегии и построенахарактеристическая функция. В работе [30] диссертантом сформулирована идоказана теорема о динамической устойчивости вектора Шепли, а соавторампринадлежит формулировка игры на деревьях событий в некооперативной постановке и выбор математической модели в примере.Все основные результаты, выносимые на защиту, получены автором лично.Структура и объем. Диссертация изложена на 349 страницах, состоитиз введения, трех разделов, включающих в себя 9 глав, заключения и спискалитературы, содержащего 362 наименования.Содержание работыВ диссертационной работе Громовой Е.В. изучаются динамические игрыс детерминированной динамикой, в которых продолжительность игры является случайной величиной. Работа состоит из частей I, II, III, организованныхследующим образом.Часть I «Дифференциальные игры со случайной продолжительностью»посвящена дифференциальным играм, в которых момент окончания или момент начала игры является случайной величиной с известной функцией рас11пределения.
Часть I состоит из Глав 1, 2, 3, 4.В Главе 1 приводится формулировка классической дифференциальной игры с предписанной продолжительностью Γ(0 , 0 , ), а также некоторые вспомогательные сведения из области оптимального управления, дифференциальных игр и теории вероятностей. Кроме того, описаны динамика и вид функциймгновенного выигрыша (полезности) в теоретико-игровых задачах рационального природопользования, экологического менеджмента и управления рекламной кампанией, которые будут использованы в последующих главах в качествепримеров, иллюстрирующих теоретические результаты.В исследованиях в области дифференциальных игр, как правило, изучаются дифференциальные игры с предписанной продолжительностью.
Это означает, что игра развивается во времени на фиксированном временном промежутке[0 , ], причем момент начала игры 0 и момент окончания игры известнызаранее.Дифференциальную игру лиц с предписанной продолжительностью будем обозначать как Γ(0 , 0 , ). Множество игроков обозначим как , | | =. В дальнейшем будем ассоциировать игроков с их порядковыми номерами: = {1, 2, . .
. , }, соответственно -ый игрок будет обозначаться как {} ∈ .Динамика игры задается системой обыкновенных дифференциальных уравнений:˙ = (, 1 , . . . , ), (0 ) = 0 ∈ ⊂ .(1)Полагается, что состояние () ∈ принадлежит некоторому открытому подмножеству R для всех ∈ [0 , ], а управления выбираются из множеств допустимых управлений , которые состоят из всех измеримых фунций из [0 , ]в , = 1, . . .
, . Множества допустимых значений управлений представляют собой выпуклые компактные подмножества R такие что ∋ {0}. Вдальнейшем мы будемсокращенные обозначения и писать =∏︀ использовать∏︀(1 , . . . , ), = =1 , = =1 и, соответственно, ∈ и () ∈ , ∈[0 , ].Будем полагать, что для любого допустимого управления ∈ и длялюбого начального условия 0 ∈ существует решение системы (1), обозначаемое (0 , 0 , , ), такое что для всех ∈ [0 , ] выполняется (0 , 0 , , ) ∈ .Кроме того, потребуем выполнения следующих условий:Предположение 1.1.1. Пусть правые части системы дифференциальных уравнений (1) удовлетворяют следующим условиям регулярности:1. функция непрерывна на множестве × 1 × .
. . × ,2. функция удовлетворяет условию Липшица по с постоянной 1 > 0:‖(′ , ) − (′′ , )‖ ≤ 1 ‖′ − ′′ ‖ ∀′ , ′′ ∈ , ∈ ,3. существует такая константа 2 > 0, что функция ограничена сверху по:‖(, 1 , . . . , )‖ ≤ 2 (1 + ‖‖) ∀ ∈ , ∈ ,124. для любого ∈ , множество() = {(, )| ∈ }является выпуклым компактом в R .Выигрыш -го игрока определяется следующим образом:Z (0 , 0 , , 1 , . . .
, ) =ℎ (( ), 1 ( ), . . . , ( )), = 1, . . . , ,(2)0где ℎ (, 1 , . . . , ) представляет собой непрерывную функцию и () – решениезадачи Коши для системы ОДУ (1) при управлениях 1 (), . . . , ().Рассмотрим кооперативный вариант игры. Пусть * = (*1 , . . . , * ) – такой-набор управлений, который доставляет максимум суммарному выигрышу игроков:* = arg max∑︁(3) (0 , 0 , , ).=1Траекторию (), ∈ [0 , ], являющуюся решением задачи (1) при управлении * будем называть кооперативной траекторией.Совокупный выигрыш игроков из максимальной коалиции , полученныйпри использовании оптимальных управлений * обозначим (0 , 0 , , ):* (0 , 0 , , ) =∑︁ Z∑︁ (0 , 0 , , *1 , .
. . , * ) ==1ℎ (* ( ), * ( )).(4)=1 0Описанные выше оптимальные управления разыскиваются в классах позиционных или программных стратегий.Развитию кооперативной игры игры во времени соответствует движениевдоль кооперативной траектории * (). Следовательно, в каждый момент времени ∈ [0 , ] игроки попадают в подыгру Γ(* (), , ) с предписанной продолжительностью − . Под выигрышем в подыгре Γ(* (), , ), ∈ [0 , ]будем пониматьZ (* (), , , 1 , . .
. , ) =ℎ (( ), ( )), = 1, . . . , ,(5)где динамика игры описывается системой (1) с начальным условием () =* ().В Главе 2 рассматриваются дифференциальные игры со случайным моментом окончания. В § 2.1 вводится определение игры Γ (0 , 0 , ), являющейся модификацией игры Γ(0 , 0 , ), а именно, предполагается, что игра заканчивается в момент времени , где — случайная величина с известной функцией13распределения (), ∈ [0 , ] с условием нормировки:Z () = 1.0Кроме того, далее предполагается существование функции плотности распределения ().