Диссертация (1149783)
Текст из файла
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙУНИВЕРСИТЕТНа правах рукописиКОЛАБУТИН НИКОЛАЙ ВАЛЕРЬЕВИЧМОДЕЛИ УСТОЙЧИВОЙ ДВУХУРОВНЕВОЙ КООПЕРАЦИИ ВДИФФЕРЕНЦИАЛЬНЫХ ИГРАХСпециальность 01.01.09 – Дискретная математика и математическаякибернетикаДИССЕРТАЦИЯна соискание ученой степеникандидата физико-математических наукНаучный руководительдоктор физико-математическихнаук профессор Петросян Л.А.’Санкт-Петербург2015 г.ОглавлениеВведение . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Глава 1. Модель некооперативной игры коалиций . . . . . . . . . . . . . . . . . 171.1 Математическая модель. . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171.2 Равновесие по Нэшу в игре Γ∆ x0 , T − t0 . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3 Распределение выигрыша внутри коалиции Kl . . . . . . . . . . . . . . . . . . . . . . 241.3.1 Вычисление значений характеристической функциив игре ΓKl x0 , T − t0 . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.2 Супераддитивность характеристической функцииV Kl (t0 ) (K, xK (t), T − t) . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . 291.3.3 Процедура распределения выигрыша в игре ΓKl x0 , T − t0 . . . . 331.4 Коалиционное решение. Построение устойчивого PMS-вектора вигре Γ∆ x0 , T − t0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . 361.5 Численный пример . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38Глава 2. Двухуровневая кооперация в игре технологическогоальянса . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.1 Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.2 Кооперация коалиций . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . 452.3 Построение характеристической функции в игре технологическогоальянса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.3.1 Вычисление значения характеристической функции длямаксимальной коалиции (технологического альянса коалиций) . . . . . . . 482.3.2 Вычисление значений характеристической функции дляпроизвольной коалиции K̆ ⊆ N̆ . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.3.3 Супераддитивность полученной характеристической функции . . 53232.4 Процедура распределения выигрыша в технологическом альянсекоалиций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . 542.5 Построение кооперативной игры между членами коалиции Kl . . . . . . 582.6 Вектор Шепли в игре ΓKl (x0Kl , T − t0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 612.7 ES-вектор в игре ΓKl (x0Kl , T − t0 ) . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.8 Пропорциональное решение в игре ΓKl (x0Kl , T − t0 ) . . . . . . . . . . . . . . . . . . 672.9 Численные примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.9.1 Пример 1. Распределение выигрыша по вектору Шепли. . .
. . . . . . 712.9.2 Пример 2. Распределение выигрыша по вектору Шепли иES-вектору. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .772.9.3 Пример 3. Распределение выигрыша по вектору Шепли исогласно пропорциональному решению. .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .81Глава 3. Двухуровневая кооперация в кооперативной игресокращения выброса вредных веществ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853.1 Постановка задачи . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853.2 Кооперация между коалициями (игра Γ∆ (s0 , t0 )). . . . . . . . . . . . . . . . . . . .873.3 Характеристическая функция в игре Γ∆ (s0 , t0 ) . . . . . . . . . . . . . . . . . . . . . . 883.4 Процедура распределения выигрыша в игре Γ∆ (s0 , t0 ) . . .
. . . . . . . . . . 1013.5 Распределение выигрыша внутри коалиции Kl . . . . . . . . . . . . . . . . . . . . . 1043.6 Вычисление характеристической функции в игреΓKl (s0 , t0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 1063.7 Процедура распределения выигрыша внутри коалиции Kl . . . . . . . . . 112Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116Литература. . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1174ВведениеАктуальность темы. Кооперативные дифференциальные игры – один из наиболее актуальных разделов теории игр, поскольку с их помощью возможно моделирование непрерывно развивающихся во времени конфликтно-управляемыхпроцессов в различных областях, в первую очередь в менеджменте и в экономике. Диссертационная работа посвящена исследованию устойчивости кооперативных соглашений в моделях двухуровневой кооперации.
Теория дифференциальных игр возникла в середине 20 века. До середины шестидесятых годовисследовались в основном антагонистические дифференциальные игры, в которых рассматривался конфликт между двумя сторонами с противоположными интересами. В 1965 году Р. Айзекс опубликовал фундаментальную работупо теории дифференциальных игр, в которой исследовались антагонистическиеигры преследования [29], и которая оказала заметное влияние на развитие динамического программирования и оптимального управления. Появились работыЛ.С. Понтрягина [23], Н.Н.
Красовского [13], Л.А. Петросяна [14] и др. Однакоданный класс был применим только для ограниченного числа задач, в которыхконфликтное взаимодействие носило антагонистический характер.Затем стал рассматриваться класс неантагонистических дифференциальных игр [16]. Они использовались для моделирования различных социальноэкономических процессов. В качестве принципа оптимальности, как правило,использовалось равновесие по Нэшу, полученное в программных или позиционных стратегиях.
После стали рассматриваться кооперативные дифференциальные игры, в которых участники имеют возможность кооперироваться с цельюполучения большего совместного выигрыша с его последующим распределением между участниками. В случае кооперации участники получали больше, чемв условиях конкуренции.Следует отметить, что уровень строгости решений дифференциальных игр,5в частности, игр преследования, которые базируются на решении уравненияАйзекса-Беллмана, ограничен областью фазовых переменных, для которых указанное уравнение имеет смысл.
Строгое обоснование этих решений можно получить, используя фундаментальные результаты Н.Н. Красовского и его учеников. Именно на основе той формализации дифференциальной игры, которуюпредложил Н.Н. Крассовский [12], оказывается возможным связать дескриптивную теорему о значении игры и ситуации равновесия с обобщенным минимаксным решением уравнения Айзекса-Беллмана. То же самое относится ик неантагонистическим дифференциальным играм, для которых также былиполучены подобные результаты [5].Решением кооперативной дифференциальной игры является соглашениео максимизации суммарного выигрыша и связанное с этим соглашением оптимальное поведение участников (игроков), а также выбор принципа оптимальности, по которому распределяется этот выигрыш.
Поскольку дифференциальныеигры всегда рассматриваются на некотором временном интервале, то появилосьтребование устойчивости кооперативного решения. Прежде всего, рассматривался вопрос о динамической устойчивости (временной состоятельности) выбранного принципа оптимальности. Это понятие было впервые формализованоЛ.А. Петросяном [15].Динамическая устойчивость (временная состоятельность) означает, что выбранный в начале игры принцип оптимальности сохраняет свою состоятельность на протяжении всего игрового процесса.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.