Диссертация (Модели устойчивой двухуровневой кооперации в дифференциальных играх)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Модели устойчивой двухуровневой кооперации в дифференциальных играх". PDF-файл из архива "Модели устойчивой двухуровневой кооперации в дифференциальных играх", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст из PDF
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙУНИВЕРСИТЕТНа правах рукописиКОЛАБУТИН НИКОЛАЙ ВАЛЕРЬЕВИЧМОДЕЛИ УСТОЙЧИВОЙ ДВУХУРОВНЕВОЙ КООПЕРАЦИИ ВДИФФЕРЕНЦИАЛЬНЫХ ИГРАХСпециальность 01.01.09 – Дискретная математика и математическаякибернетикаДИССЕРТАЦИЯна соискание ученой степеникандидата физико-математических наукНаучный руководительдоктор физико-математическихнаук профессор Петросян Л.А.’Санкт-Петербург2015 г.ОглавлениеВведение . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Глава 1. Модель некооперативной игры коалиций . . . . . . . . . . . . . . . . . 171.1 Математическая модель. . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171.2 Равновесие по Нэшу в игре Γ∆ x0 , T − t0 . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3 Распределение выигрыша внутри коалиции Kl . . . . . . . . . . . . . . . . . . . . . . 241.3.1 Вычисление значений характеристической функциив игре ΓKl x0 , T − t0 . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.2 Супераддитивность характеристической функцииV Kl (t0 ) (K, xK (t), T − t) . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . 291.3.3 Процедура распределения выигрыша в игре ΓKl x0 , T − t0 . . . . 331.4 Коалиционное решение. Построение устойчивого PMS-вектора вигре Γ∆ x0 , T − t0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . 361.5 Численный пример . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38Глава 2. Двухуровневая кооперация в игре технологическогоальянса . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.1 Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.2 Кооперация коалиций . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . 452.3 Построение характеристической функции в игре технологическогоальянса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.3.1 Вычисление значения характеристической функции длямаксимальной коалиции (технологического альянса коалиций) . . . . . . . 482.3.2 Вычисление значений характеристической функции дляпроизвольной коалиции K̆ ⊆ N̆ . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.3.3 Супераддитивность полученной характеристической функции . . 53232.4 Процедура распределения выигрыша в технологическом альянсекоалиций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . 542.5 Построение кооперативной игры между членами коалиции Kl . . . . . . 582.6 Вектор Шепли в игре ΓKl (x0Kl , T − t0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 612.7 ES-вектор в игре ΓKl (x0Kl , T − t0 ) . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.8 Пропорциональное решение в игре ΓKl (x0Kl , T − t0 ) . . . . . . . . . . . . . . . . . . 672.9 Численные примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.9.1 Пример 1. Распределение выигрыша по вектору Шепли. . .
. . . . . . 712.9.2 Пример 2. Распределение выигрыша по вектору Шепли иES-вектору. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .772.9.3 Пример 3. Распределение выигрыша по вектору Шепли исогласно пропорциональному решению. .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .81Глава 3. Двухуровневая кооперация в кооперативной игресокращения выброса вредных веществ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853.1 Постановка задачи . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 853.2 Кооперация между коалициями (игра Γ∆ (s0 , t0 )). . . . . . . . . . . . . . . . . . . .873.3 Характеристическая функция в игре Γ∆ (s0 , t0 ) . . . . . . . . . . . . . . . . . . . . . . 883.4 Процедура распределения выигрыша в игре Γ∆ (s0 , t0 ) . . .
. . . . . . . . . . 1013.5 Распределение выигрыша внутри коалиции Kl . . . . . . . . . . . . . . . . . . . . . 1043.6 Вычисление характеристической функции в игреΓKl (s0 , t0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 1063.7 Процедура распределения выигрыша внутри коалиции Kl . . . . . . . . . 112Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116Литература. . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1174ВведениеАктуальность темы. Кооперативные дифференциальные игры – один из наиболее актуальных разделов теории игр, поскольку с их помощью возможно моделирование непрерывно развивающихся во времени конфликтно-управляемыхпроцессов в различных областях, в первую очередь в менеджменте и в экономике. Диссертационная работа посвящена исследованию устойчивости кооперативных соглашений в моделях двухуровневой кооперации.
Теория дифференциальных игр возникла в середине 20 века. До середины шестидесятых годовисследовались в основном антагонистические дифференциальные игры, в которых рассматривался конфликт между двумя сторонами с противоположными интересами. В 1965 году Р. Айзекс опубликовал фундаментальную работупо теории дифференциальных игр, в которой исследовались антагонистическиеигры преследования [29], и которая оказала заметное влияние на развитие динамического программирования и оптимального управления. Появились работыЛ.С. Понтрягина [23], Н.Н.
Красовского [13], Л.А. Петросяна [14] и др. Однакоданный класс был применим только для ограниченного числа задач, в которыхконфликтное взаимодействие носило антагонистический характер.Затем стал рассматриваться класс неантагонистических дифференциальных игр [16]. Они использовались для моделирования различных социальноэкономических процессов. В качестве принципа оптимальности, как правило,использовалось равновесие по Нэшу, полученное в программных или позиционных стратегиях.
После стали рассматриваться кооперативные дифференциальные игры, в которых участники имеют возможность кооперироваться с цельюполучения большего совместного выигрыша с его последующим распределением между участниками. В случае кооперации участники получали больше, чемв условиях конкуренции.Следует отметить, что уровень строгости решений дифференциальных игр,5в частности, игр преследования, которые базируются на решении уравненияАйзекса-Беллмана, ограничен областью фазовых переменных, для которых указанное уравнение имеет смысл.
Строгое обоснование этих решений можно получить, используя фундаментальные результаты Н.Н. Красовского и его учеников. Именно на основе той формализации дифференциальной игры, которуюпредложил Н.Н. Крассовский [12], оказывается возможным связать дескриптивную теорему о значении игры и ситуации равновесия с обобщенным минимаксным решением уравнения Айзекса-Беллмана. То же самое относится ик неантагонистическим дифференциальным играм, для которых также былиполучены подобные результаты [5].Решением кооперативной дифференциальной игры является соглашениео максимизации суммарного выигрыша и связанное с этим соглашением оптимальное поведение участников (игроков), а также выбор принципа оптимальности, по которому распределяется этот выигрыш.
Поскольку дифференциальныеигры всегда рассматриваются на некотором временном интервале, то появилосьтребование устойчивости кооперативного решения. Прежде всего, рассматривался вопрос о динамической устойчивости (временной состоятельности) выбранного принципа оптимальности. Это понятие было впервые формализованоЛ.А. Петросяном [15].Динамическая устойчивость (временная состоятельность) означает, что выбранный в начале игры принцип оптимальности сохраняет свою состоятельность на протяжении всего игрового процесса.