Диссертация (1149189)
Текст из файла
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТНа правах рукописиПЕТРОСЯН Ованес ЛеоновичКООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ СДИНАМИЧЕСКИМ ОБНОВЛЕНИЕМ ИНФОРМАЦИИ01.01.09 — Дискретная математика и математическая кибернетикаДИССЕРТАЦИЯна соискание ученой степеникандидата физико-математических наукНаучный руководитель:доктор физико-математических наук,профессор В.В. ЗахаровСанкт-Петербург20172СОДЕРЖАНИЕВВЕДЕНИЕ.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4ГЛАВА 1. СИЛЬНО ДИНАМИЧЕСКИ УСТОЙЧИВОЕ ПРД-ЯДРО ВКООПЕРАТИВНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ С ПРЕДПИСАННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ15§ 1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . .
.15§ 2. О процедуре распределения дележей . . . . . . . . . . . . . . . . .17§ 3. Определение соответствующего множества дележей . . . . . . . . .19§ 4. Свойство сильной динамической устойчивости ПРД-ядра . . . . . .22§ 5. Сильно динамически устойчивое ПРД-ядро в дифференциальнойигре управления объемами вредных выбросов . . . . . .
. . . . . .24ГЛАВА 2. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ДИНАМИЧЕСКИМ ОБНОВЛЕНИЕМ ИНФОРМАЦИИ32§ 1. Определение усеченной подыгры . . . . . . . . . . . . . . . . . . . .32§ 2. Решение кооперативной усеченной подыгры . . . . . . . . . . . . .35§ 3. Концепция решения в исходной игре с динамическим обновлениеминформации . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .38§ 4. Построение характеристической функции в игре с динамическимобновлением информации . . . . . . . . . . . . . . . . . . . . . . . .45§ 5. Связь решения в усеченных подыграх и результирующего решения 48§ 6. Кооперативная игра добычи ограниченного ресурса с динамическим обновлением информации . . . . . . . . . . . . .
. . . . . . .58ГЛАВА 3. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ СПРЕДПИСАННОЙПРОДОЛЖИТЕЛЬНОСТЬЮ,ДИНАМИЧЕ-СКИМ ОБНОВЛЕНИЕМ ИНФОРМАЦИИ И СТОХАСТИЧЕСКИМПРОГНОЗОМ§ 1. Определение комбинированной усеченной подыгры . . . . . . . . .69693§ 2. Решение комбинированной кооперативной усеченной подыгры . . .71§ 3. Концепция решения в исходной игре с динамическим обновлениеминформации и стохастическим прогнозом . . . .
. . . . . . . . . .73§ 4. Кооперативная игра добычи ограниченного ресурса с динамическим обновлением информации и стохастическим прогнозом . . . .77ГЛАВА 4. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ПРЕДПИСАННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ И СО СЛУЧАЙНЫМОБНОВЛЕНИЕМ ИНФОРМАЦИИ84§ 1. Определение случайной усеченной подыгры . . . . . . . . . . . .
.84§ 2. Решение кооперативной случайной усеченной подыгры . . . . . . .86§ 3. Концепция решения в исходной игре со случайным обновлениеминформации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .88§ 4. Кооперативная игра добычи ограниченного ресурса со случайнымобновлением информации . . .
. . . . . . . . . . . . . . . . . . . . .ЗАКЛЮЧЕНИЕЛИТЕРАТУРА91. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .103. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1044ВВЕДЕНИЕАктуальность темы. Теория дифференциальных игр в настоящее времяявляется одним из наиболее бурно развивающихся разделов математическойтеории игр.
Главным образом это связано с тем, что математический аппарат дифференциальных игр позволяет реалистично моделировать конфликтноуправляемые процессы, непрерывно развивающиеся во времени. Так динамика фазовой переменной, описывающей состояние процесса, задается системойдифференциальных уравнений на некотором временном промежутке заданнойпродолжительности.Теория дифференциальных игр сформировалась как отдельный раздел математической теории игр в пятидесятых годах двадцатого века. Одними из первых интересные результаты в этой области получили Р. Айзекс, Л.
Берковитц[33], В. Флеминг [36]. Долгое время исследования были посвящены в основномантагонистическим дифференциальным играм. Значительные успехи в даннойобласти связаны с представителями отечественной научной школы Н. Н. Красовским [11, 12], Л. С. Понтрягиным [25], Е. Ф. Мищенко, Б. Н. Пшеничным,Л. А. Петросяном [20].Толчком для развития теории неантагонистических дифференциальных игрпослужили задачи конфликтного управления со многими участниками из различных практических областей. В качестве принципа оптимальности в неантагонистических дифференциальных играх чаще всего рассматривается равновесие по Нэшу в программных или позиционных стратегиях. Основные результаты, посвященные исследованию вопроса существования и проблемы построенияравновесия по Нэшу, получены в работах А. Ф. Клейменова [7, 8], А.
Ф. Кононенко [9], С. В. Чистякова [29].Особый интерес представляют также кооперативные дифференциальные игры [5, 6, 18, 21]. Естественным подходом к изучению кооперативных дифференциальных игр, как игр дележей, является попытка переноса результатов классической кооперативной теории "однократных"игр Неймана-Моргенштерна [13].Однако при использовании результатов классической теории необходимо допол-5нительно исследовать вопрос о динамической и сильно динамической устойчивости полученного решения. Попытки применения динамически неустойчивыхпринципов оптимальности при решении прикладных задач в области экономики, экологии, менеджмента приводят к не реализуемости таких принципов,поскольку в некоторый момент времени возникают условия, когда соглашение о кооперации могут быть пересмотрено.
Это обстоятельство впервые было замечено Л. A. Петросяном в 1977 году. В [14] он сформулировал строгоематематическое определение динамической устойчивости принципа оптимальности (кооперативного решения), а в работе [17] предложен способ решенияпроблемы динамической неустойчивости кооперативного решения при помощисхемы выплат, получившей название процедуры распределения дележа (ПРД).Определение сильной динамической устойчивости впервые было дано в работе[15].
Исследованиям проблемы динамической устойчивости посвящены работы[4, 18, 19, 21] и др.В литературе по кооперативной теории игр и ее приложениям в качествекооперативного решения часто применяется C-ядро. В частности, в работе [27]приводятся условия существования сильно динамически устойчивого C-ядра вкооперативных динамических (дискретных) играх.
В работе [2] впервые былисформулированы достаточные условия для выполнения сильной динамическойустойчивости кооперативного решения в неантагонистической дифференциальной игре двух лиц, а в работе [37] данная проблема изучалась для игры трехлиц.В диссертационной работе для кооперативных дифференциальных игр спредписанной продолжительностью строится новое кооперативное решение ПРД-ядро, являющееся подмножеством C-ядра. Далее показывается, что этокооперативное решение обладает свойством сильной динамической устойчивости. Стоит отметить, что отличием данного подхода от подхода, предложенного Петросяном Л.А.
в [15], является то, что сначала определяются функции,которые используются в качестве ПРД для сильно динамически устойчивогоПРД-ядра, а затем на их основе строятся дележи, входящие в ПРД-ядро.Отметим, что чаще всего дифференциальные игры рассматриваются на6конечном временном промежутке (дифференциальные игры с предписаннойпродолжительностью). Наряду с ними также рассматриваются и дифференциальные игры с дисконтированием на бесконечном временном промежутке.Теория кооперативных дифференциальных игр изучает вопросы построенияоптимальных (кооперативных) решений в конфликтно-управляемых процессахсо многими участниками на определенном временном интервале.
Но множество подобных процессов развивается во времени непрерывно, а их участникинепрерывно получают обновленную информацию и адаптируются. Именно длятаких процессов был предложен подход позволяющий моделировать кооперативные игры с динамическим обновлением информации. Но возникает многовопросов, например, как для таких игр построить кооперативную траекторию,стратегии, ее порождающие, суммарный выигрыш вдоль кооперативной траектории, определить распределение суммарного выигрыша между игроками.В диссертации описывается новый подход к определению решения кооперативной дифференциальной игры в условиях, когда игроки не имеют полнуюинформацию об игре (уравнения движения, функция выигрыша) на всем временном интервале, на котором задана игра.
В любой момент времени игрокипринимают решение, используя информацию на временном интервале с продолжительностью меньшей, чем продолжительность исходной игры. Информацияоб игре обновляется в определенные моменты времени и неизвестна заранее.Согласно описанному подходу решение в игре определяется как комбинациярешений в усеченных подыграх. В диссертации предложен метод для построения кооперативной траектории и соответствующего решения.
Ключевым дляпостроения решения является понятие усеченной подыгры, в рамках которойудается описать поведение игроков между моментами обновления информации.Оказывается, что в подобных играх любое построенное решение обладает свойством сильной динамической устойчивости.В диссертации были исследованы несколько моделей и подходов для определения решений в кооперативных дифференциальных играх с динамическимобновлением информации. Для кооперативных дифференциальных игр с предписанной продолжительностью и динамическим обновлением информации бы-7ло определено понятие усеченной подыгры, предложены способы построенияусловно кооперативной траектории и решений обладающих свойством ∆tсильной динамической устойчивости.
Аналогичный результат получен для кооперативных дифференциальных игр с бесконечной продолжительностью. Длякооперативной дифференциальной игры с предписанной продолжительностьюбыл предложен подход для нахождения решений кооперативной игры, когдаигроки используют стохастический прогноз для предсказания изменения информации. Было определено понятие комбинированной усеченной подыгры,с использованием которой моделировалось поведение игроков, использующихстохастический прогноз для принятия решений. На примере теоретико-игровоймодели загрязнения окружающей среды была изучена зависимость выигрышейигроков от горизонта обновления информации (информационного горизонта).Был также рассмотрен случай, когда игроки, получая обновленную информацию о структуре игры, не имели точной информации, в течение какого срокаэта информация будет является актуальной.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.















