Диссертация (1145356), страница 4
Текст из файла (страница 4)
Сформулированы и доказаны Теоремы о регуляризации вектораШепли и –ядра для данного класса игр.Апробация работы. Основные результаты диссертационной работы былидоложены на семинарах кафедры математической теории игр и статистических решений Санкт-Петербургского государственного университета, на семинарах Центра теории игр (СПбГУ), на семинаре Механико-математическогофакультета Саратовского государственного университета (2004), на семинарах Болонского университета, Италия (2011), Унив. г. Падуя, Италия (2011),Унив. Ла Сапиенца, Рим, Италия (2011); семинарах научного центра GERADунив.
Монреаля, Канада (2011, 2015, 2016); на семинаре унив. Анауак, Мехико, Мексика (2014); на семинаре кафедры оптимального управления факультета вычислительной математики и математической кибернетики Московского государственного университета (2016), на XXX и XXXI научных кон-3. Положения, выносимые на защиту20ференциях «Процессы управления и устойчивость», Санкт-Петербург(1999,2000), на V Российской мультиконференции по проблемам управления, СанктПетербург (2012), на I Российском экономическом конгрессе, Москва (2009),а также на следующих международных конференциях: «Устойчивость и процессы управления», посвящ. В.И.
Зубову, Санкт-Петербург (2005, 2010, 2015);Международный семинар «Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби-Беллмана», Екатеринбург (2005), RussianFinnish Graduate School Seminar «Dynamic Games and Multicriteria Optimization», Petrozavodsk (2006); 2nd International Conference on Game Theory andApplication, Qingdao, China (2007); International Conference on Game Theoryand Management, St.Petersburg (2007 — 2012, 2014, 2016); МеждународныйКонгресс «Нелинейный динамический анализ», Санкт-Петербург ( 2007), Международная конференция по математической теории управления и механике, Суздаль(2009); Int. Conference Stochastic Optimal Stopping, Petrozavodsk(2010); Spain-Italy-Netherlands Meeting on Game Theory (Paris 2011, St. Petersburg 2015); 25th IFIP TC 7 Conference on System Modeling and Optimization,Berlin (2011), Workshop on Dynamic Games in Management Science, Montreal,Canada (2008, 2011, 2016); Viennese Workshop on Optimal Control, DynamicGames and Nonlinear Dynamics, Vienna (2012, 2015); Conference on ConstructiveNonsmooth Analysis, St.Petersburg (2012); Международная научная конференция «Математика, экономика, менеджмент: 100 лет со дня рождения Л.В.Канторовича», Санкт-Петербург (2012); International Symposium on DynamicGames and Applications (Wroclaw 2008; Amsterdam 2014); 28th European Conference on Operational Research, Poznan, Poland (2016).Основные результаты диссертации опубликованы в работах [26, 27, 96, 109,102, 103, 150, 151, 152, 153, 154, 155, 156, 157, 158, 215, 217, 218, 219, 220, 221,222, 223, 240, 252, 253, 254, 265, 293, 310, 347], из которых 18 работ опубли-21кованы в реферируемых ведущих российских и международных журналах:10 статей опубликованы в журналах, входящих в перечень ВАК РФ (2 изкоторых переведены в журналах, индексируемых в наукометрических базахScopus/ Web of Science), 8 работ опубликованы в журналах, индексируемых внаукометрических базах Scopus/ Web of Science.Структура и объем работы.
Диссертация состоит из введения, трехчастей, разбитых на главы и параграфы, заключения и списка используемойлитературы.В диссертационной работе использована тройная нумерация формул, теорем, определений, следствий, замечаний. Первое число означает номер главы,второе – номер параграфа в главе, третье – номер в параграфе. Параграфыпронумерованы для каждой главы отдельно. Литература приведена в алфавитном порядке.4. Краткое содержание работыВ диссертационной работе Громовой Е.В. изучаются динамические игры с детерминированной динамикой, в которых продолжительность игры являетсяслучайной величиной. Работа состоит из частей I, II, III, организованных следующим образом.Часть I «Дифференциальные игры со случайной продолжительностью» посвящена дифференциальным играм, в которых момент окончания или моментначала игры является случайной величиной с известной функцией распределения. Часть I состоит из Глав I, II, III, IV.В Главе 1 приводится формулировка классической дифференциальной игры с предписанной продолжительностью Γ(0 , 0 , ), а также некоторые вспомогательные сведения из области оптимального управления, дифференциаль-4.
Краткое содержание работы22ных игр и теории вероятностей. Кроме того, описаны динамика и вид функциймгновенного выигрыша (полезности) в теоретико-игровых задачах рационального природопользования, экологического менеджмента и управления рекламной кампанией, которые будут использованы в последующих главах в качествепримеров, иллюстрирующих теоретические результаты.В Главе II рассматриваются дифференциальные игры со случайным моментом окончания. В § 2.1 вводится определение игры Γ (0 , 0 , ), являющейся модификацией игры Γ(0 , 0 , ).
Предполагается, что момент окончания игры не известен заранее, а является реализацией некоторой случайной величины с известной функцией распределения (), ∈ [0 , ]. Кроме того, далее предполагаем существование функции плотности распределения (). В § 2.2 изучается вопрос упрощения функционала выигрыша в игре Γ (0 , 0 , ). Математическое ожидание интегрального выигрыша игрока для игры Γ (0 , 0 , ) является функционалом нестандартного для задачоптимального управления вида, т.к. содержит повторное интегрирование. В§ 2.2 данный функционал приведен к стандартному виду при помощи заменыпорядка интегрирования. Кроме того, в § 2.2.2 рассматривается случай смешанного функционала выигрыша игрока, т.е. интегрального и терминальноговыигрыша. В § 2.2.3 доказана Теорема об упрощении функционала выигрышадля общего случая линейно-квадратичных дифференциальных игр.
Теоретические результаты демонстрируются для дифференциальной игры управления объемами вредных выбросов в атмосферу (§ 2.2.1) и дифференциальнойигры управления капиталовложениями в рекламную кампанию (§ 2.2.4).В § 2.3 игра Γ (0 , 0 , ) изучается в кооперативной форме.
Предполагается, что игроки используют управления * = (*1 , . . . , * ), максимизирующие ихсуммарный выигрыш. В том случае, когда задача решается в классе позиционных управлений, используется уравнение типа Гамильтона– Якоби– Беллма-4. Краткое содержание работы23на, выведенное в § 2.3.1 для случая смешанного выигрыша. В § 2.3.2 уравнениетипа Гамильтона – Якоби – Беллмана выведено другим способом, который непредполагает предварительного упрощения интегрального выигрыша игрока.В § 2.3.3 и в § 2.3.4 оптимальные управления найдены, соответственно, в классепрограммных и позиционных стратегий для приложений дифференциальныхигр в области природоохранного менеджмента (§ 2.3.3) и совместной разработки месторождения игроками (§ 2.3.4).В Главе III рассматриваются некоторые модификации игры Γ (0 , 0 , )со случайным моментом окончания, а именно, в § 3.1 — § 3.4 введены классы дифференциальных игр, обозначенные как Γ, (0 , 0 , ), Γ (0 , 0 , ),Γ , (0 , 0 , ), Γ (0 , 0 ).
Игра Γ, (0 , 0 , ) заканчивается в случайныймомент времени c функцией распределения (), ∈ [0 , ], причем мгновенные выигрыши игроков дисконтируются при помощи функции дисконтирования −(0 , ) . При использовании экспоненциального вида дисконтирования−( −0 ) , будем обозначать такую игру как Γ, (0 , 0 , ). В случае дисконти∫︀ рования с интегральной ставкой дисконтирования 0 ( ) будем использовать обозначение Γ,() (0 , 0 , ). Для игры Γ,() (0 , 0 , ) в § 3.1.1 выводится уравнение типа Гамильтона– Якоби – Беллмана.
В § 3.1.2 приведен примердифференциальной игры 2 лиц, в которой игроки различных типов (развитаяи развивающаяся страны) участвуют в игре управления вредными выбросами.Игра Γ (0 , 0 ) является модификацией игры со случайным моментомокончания Γ (0 , 0 , ), для которой может быть получен ряд специальныхсвойств, основанных на виде функции распределения случайной величины ,заданной следующим образом. Пусть – случайная величина с известнойфункцией распределения (), = 1, , соответствующая моменту окончанияконфликтно-управляемого процесса для игрока , = 1, .
Будем предполагать, что { }=1 – независимые случайные величины. В данной задаче пред-244. Краткое содержание работыполагаем, что игра начинается в момент 0 и заканчивается в момент первойостановки игры для какого-либо из игроков, т.е. = min{1 , 2 , . .
. , }.Для случайной величины имеем: () = 1 −∏︀=1 (1− ()). В § 3.2 инте-гральный выигрыш игрока приведен к стандартному виду. Приведены примеры в классе программных и позиционных стратегий. В § 3.2.1 изучается дифференциальная игра управления вредными выбросами, в которой случайныевеличины имеют распределение Вейбулла с параметрами , . В § 3.2.2одна теоретико-игровая задача оптимальной разработки невозобновляемогоресурса решена для произвольной функции распределения ().В § 3.2 предложена следующая модификация игры Γ (0 , 0 , ). Пусть вигре принимают участие два игрока ( = 2), причем временной горизонт , = 1, 2, будет различным для игроков.
Игра прекращается в момент времени = min{1 , 2 }, однако в отличие от предыдущей постановки задачи,асимметрия заключается в том, что оставшийся игрок также получает терминальный выигрыш Φ (( )). Для данной постановки в § 3.2.1 выигрышприводится к стандартному виду, в § 3.2.2 сформулировано уравнение типаГамильтона– Якоби – Беллмана.Далее в Главе III в § 3.4 рассматривается теоретико-игровая задача Γ (0 , 0 ),в которой вероятностное распределение момента окончания игры не можетбыть описано с помощью некоторого стандартного распределения.
Эта ситуация имеет место, когда режим функционирования системы меняется со временем ∈ [0 , ∞), причем каждый режим характеризуется своим распределениеммомента окончания игры. В этом случае предлагается использовать составнуюфункцию распределения (), ∈ [0 , ∞), заданную специальным образом. В§ 3.4.1 доказывается Теорема о том, что построенная функция удовлетворяетстандартным свойствам функции распределения, а также является абсолютнонепрерывной функцией с асимптотическим стремлением к единице.254. Краткое содержание работыВ § 3.4.2.
описаны различные подходы к определению составной функциираспределения (), ∈ [0 , ∞). Переключения функции распределения ()в моменты времени = { },0 = 0 < 1 < · · · < −1 < = ∞ могутбыть одного из двух типов, соответствующих фиксированному набору = −1{ }=1либо зависеть от состояния системы ( определяются как решенияуравнений ( (− )) = 0). В § 3.4.3 рассмотрена теоретико-игровая задачаразработки невозобновляемого ресурса как пример игры Γ (0 , 0 ) с одниммоментом переключения для обоих указанных вариантов переключений.В конце Главы III в § 3.5 рассматривается игра со случайным моментомначала Γ0 (0 , 0 , ). Предполагается, что дифференциальная игра лиц начинается в случайный момент времени 0 и заканчивается в фиксированныймомент времени . Будем считать известной функцию распределения случайной величины 0 : (), ∈ [0 ; ], а также значение фазовой переменной в момент времени 0 ((0 ) = 0 ) (§ 3.5.1).