Диссертация (1149189), страница 15
Текст из файла (страница 15)
Видно, каким образом происходила генерация T j , и как менялась плотность распределения fj (t)(4.2) информационного горизонта.Рисунок 4.1. Плотность распределения fj (t) информационного горизонта,j = 0, 1, 2 (4.2) для каждой случайной усеченной подыгры.На графике 4.2. изображены оптимальные стратегии (стратегии соответствующие кооперативной траектории) для первого игрока, рассчитанные в игресо случайным обновлением информации (сплошная линия) и в исходной игретрех лиц [48] (пунктирная линия).На графике 4.3. представлено следующее сравнение: условно кооперативнаятраектория x̂∗ (t) (толстая сплошная линия) в игре со случайным обновлениеминформации, условно кооперативная траектория x̄∗ (t) (тонкая пунктирная линия) в игре с динамическим обновлением информации, описанной в главе 2 ив [40] (где значение временного горизонта T = 2), и кооперативная траекторияx∗ (t) (пунктирная линия) в исходной игре трех лиц.
На следующем графике 4.4.отображена условно кооперативная траектория x̂∗ (t) (сплошная линия) в игресо случайным обновлением информации и траектории, которые были частьюкооперативных траекторий в каждой из случайных усеченных подыграх, но неявляются оптимальными во всей игре (пунктирные линии).Далее для того, чтобы распределить суммарный выигрыш между игроками98Рисунок 4.2. Оптимальные стратегии игрока 1 в игре со случайнымобновлением информации (сплошная линия) и в исходной игре трех лиц [48](пунктирная линия).необходимо рассчитать значения характеристической функции Vj (S; x∗j (t), t),S ⊂ N для каждой случайной усеченной подыгры Γ̂jv (x∗j,0 , t0 + j∆t). ИспользуяVj (S; x∗j (t), t), построим множество ПРД Bj (t, x∗j ), j = 0, . .
. , l (3.1) для каждойслучайной усеченной подыгры и результирующее множество ПРД B̂(t, x̂∗ ).Продемонстрируем свойство сильной динамической устойчивости результирующего решения Ŵ (x0 , T − t0 ). Предположим, что в начале игры Γ(x0 , T − t0 )∗ˆигроки договорились использовать пропорциональное решение P rop(x̂(t), T −∗ˆt) (5.1) (далее покажем, что при заданных параметрах P rop(x̂(t), T − t) ∈Ŵ (x̂∗ (t), T − t)). Теперь предположим, что в некоторый момент времени tbr ∈[t0 , T ] (пусть tbr ̸= t0 + j∆t, j = 0, . .
. , l) игроки решили, что пропорциональноерешение больше их не устраивает, и выбрали другой вектор из результируюˆ ∗ (tbr ), T − tbr ),щего решения Ŵ (x̂∗ (tbr ), T − tbr ), например, вектор Шепли Sh(x̂t ∈ [tbr , T ] (5.2). Рассчитаем результирующее ПРД для пропорционального решения и вектора Шепли. Пусть tbr = 1.2, тогда ПРД для результирующего комбинированного решения (3.2) имеет следующий вид: β̂ P rop (t, x̂∗ ), t ∈ [t0 , tbr ],∗β̂(t, x̂ ) = β̂ Sh (t, x̂∗ ), t ∈ (t , T ].br(4.4)99Рисунок 4.3. Траектория запасов ресурсов x̂∗ (t) (толстая сплошная линия) вигре со случайным обновлением информации, траектория x̄∗ (t) (тонкаясплошная линия) в игре с динамическим обновлением информации, икооперативная траектория x∗ (t) в исходной игре трех лиц (тонкая пунктирнаялиния).На графике 4.5.
изображены результирующее ПРД пропорционального решения, который выбрали игроки в начале игры β̂ P rop (t, x̂∗ ) (глава 1, (5.3)) (сплошная линия) и результирующее ПРД β̂(t, x̂∗ ) для комбинированного решения (4.4)(пунктирная линия).Проинтегрируем комбинированное решение β̂(t, x̂∗ ) (4.4) по t (3.3) и получимˆ ∗ (t), T − t).соответствующий результирующий вектор, обозначим его через ξ(x̂ˆ ∗ (t), T − t) игроки разделят суммарный выигрыш вВ соответствии с ним ξ(x̂игре Γ(x0 , T − t0 ) со случайным обновлением информации следующим образом:ˆ ∗ (t), T − t) = (12.3, 30.2, 16.8).ξ(x̂На рисунках 4.6., 4.7.
можно наблюдать, что результирующее ПРД β̂(t, x̂∗ )(4.4) (пунктирная линия) принадлежит B̂(t, x̂∗ ) (выделенная область) для всехt ∈ [t0 , T ]. Это показывает свойство сильной динамической устойчивостиŴ (x̂∗ (t), T − t).На графике 4.8. видна разница между результирующим вектором∗ˆP rop(x̂(t), T − t) для пропорционального решения (сплошная линия) и резуль-100Рисунок 4.4. Траектория запасов ресурсов x̂∗ (t) (толстая сплошная линия) вигре со случайным обновлением информации и соответствующие частикооперативных траекторий, которые были частью оптимальных траекторий вкаждой из усеченных подыграх (пунктирные линии).ˆ ∗ (t), T −t) для комбинированного решения (пунктирнаятирующим вектором ξ(x̂линия).101Рисунок 4.5.
ПРД β̂ P rop (t, x̂∗ ) для пропорционального решения (сплошнаялиния), ПРД β̂(t, x̂∗ ) для комбинированного решения (4.4) (прерывистаялиния).Рисунок 4.6. Оси: β1 , β3 , t. β2 можно вычислить используя нормировочноеусловие.102Рисунок 4.7. Оси: β1 , β3 , t. β2 можно вычислить используя нормировочноеусловие.∗ˆРисунок 4.8. Результирующий вектор P rop(x̂(t), T − t) дляпропорционального решения (сплошная линия), результирующий векторˆ ∗ (t), T − t) для комбинированного решения (пунктирная линия).ξ(x̂103ЗАКЛЮЧЕНИЕОсновными результатами, полученными в ходе диссертационного исследования и выносимыми на защиту, являются следующие:1. Определено новое решение для кооперативных дифференциальных игр,обладающее свойством сильной динамической устойчивости - сильно динамически устойчивое ПРД-ядро.2.
Построены и исследованы новые математические модели дифференциальной игры с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальной игры с динамическимобновлением информации и стохастическим прогнозом, дифференциальной игры со случайным обновлением информации.3. Предложены конструктивные методы нахождения результирующего кооперативного решения в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играх с динамическим обновлением информации и стохастическим прогнозом, дифференциальных играх со случайнымобновлением информации.4.
Предложена процедура построения характеристической функции в играхс динамическим обновлением информации на основе значений характеристических функций в усеченных подыграх.5. Доказаны теоремы о сильной ∆t-динамической устойчивости в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играхс динамическим обновлением информации и стохастическим прогнозом,дифференциальных играх со случайным обновлением информации.6. Определена связь кооперативного решения в игре с динамическим обновлением информации и кооперативных решений (пропорциональное решение, вектор Шепли, C-ядро, сильно динамически устойчивое ПРД-ядро),в каждой усеченной подыгре.104ЛИТЕРАТУРА1. Воробьев Н.
Н. Теория игр для экономистов-кибернетиков. ЕМ: Наука. 1985.272 с.2. Громова Е. В., Петросян Л. А. Сильно динамически устойчивое кооперативное решение в одной дифференциальной игре управления вредными выбросами // Управление большими системами. 2015.
N 55. С. 140-159.3. Громова Е. В., Петросян Л. А. Об одном способе построения характеристической функции в кооперативных дифференциальных играх // Математическая теория игр и ее приложения. 2015. N 7. С. 19-39.4. Данилов Н. Н. Кооперативные многошаговые игры с побочными платежами// Изв. Вузов. Мат. 1991. N 2. С. 33-42.5. Клейменов А.
Ф. К кооперативной теории бескоалиционных позиционныхигр // Докл. АН СССР. 1990. Т. 312. N 1. С. 32-35.6. Клейменов А. Ф. Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей // Прикл. математика и механика. 1990. Т. 54. Вып. 3. С. 389-394.7. Клейменов А. Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. УРО. 1993. 185 с.8. Клейменов А. Ф. О решениях в неантагонистической позиционной дифференциальной игре // Прикл. математика и механика. 1997. Т.
61. Вып. 5. С.739-746.9. Кононенко А. Ф. О равновесных позиционных стратегиях в неантагонистических дифференциальных играх // Доклады АН СССР. 1976. Т. 231. N 2.С. 285-288.10. Костюнин С. Ю., Шевкопляс Е. В. Об упрощении интегрального выигрышав дифференциальных играх со случайной продолжительностью // Вестн.С.-Петерб. ун-та Сер.10: Прикладная математика, информатика, процессыуправления. 2011. N 4. С. 47-56.11. Красовский Н.
Н. Управление динамической системой. Задача о минимумегарантированного результата. М.: Наука, 1985. 469 с.10512. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры.М.: Наука, 1974. 456 с.13. Нейман Д. фон, Моргенштерн О. Теория игр и экономическое поведение.М.: Наука, 1970. 983 с.14. Петросян Л.
А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. ЛГУ. 1977. N 19. С. 46-52.15. Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестн. ЛГУ. 1993. N 4. С. 35-40.16. Петросян Л. А., Шевкопляс Е. В. Кооперативные дифференциальные игрысо случайной продолжительностью // Вестн. СПбГУ. 2000. Сер. 1.















