Диссертация (1145356), страница 3
Текст из файла (страница 3)
Петросяном, предлагался спо-1. Актуальность и степень разработанности темы исследования14соб решения данной проблемы.Отдельным актуальным направлением в теории игр является использование элементов случайности (или неопределенности) при моделировании конфликтных процессов. Развитие данной области непосредственно связано с развитием теории стохастических игр, введенных Шепли в 1953 году [327], а также дифференциальных игр при наличии неопределенности (см. ЖуковскийВ.И., [37, 39], Кононенко А.Ф. [64], Петросян Л.А.
и Янг Д.В. К. [354]), поскольку использование при моделировании фактора той или иной неопределенности позволяет наиболее адекватно описывать самые разнообразные процессы, происходящие в экономике, экологии, менеджменте, торговле, при принятии решений в области международных отношений, систем безопасности ипр. (см., например, [190, 191, 225, 202, 200]).
Важные результаты в областитеории оптимального управления при наличии неопределенностей полученыА.Б. Куржанским [74], см. также [255].В данной работе рассматривается новый класс дифференциальных игр —кооперативные дифференциальные игры лиц со случайной продолжительностью. Случайность времени существования любого организма, системы, процесса заложена в окружающую человека реальность, поэтому спектр приложений кооперативных дифференциальных игр со случайной продолжительностью может быть велик. Отметим, что в работе Л.А.
Петросяна и Н.В.Мурзова "Теоретико-игровые задачи механики"в 1966 г. [108] впервые былиисследованы дифференциальные игры преследования двух лиц со случайнойпродолжительностью. В рассматриваемой авторами задаче игроки получалитерминальный выигрыш в случайный момент времени . В этой же работевпервые было выведено уравнение типа Айзекса-Беллмана для заданной таким образом антагонистической дифференциальной игры.Стоит отметить, что управляемые процессы со случайным моментом окон-15чания для задач с одним агентом (игроком) также были независимо рассмотрены в области оптимального управления, начиная с работы М.
Яари [348], вкоторой формулировалась задача оптимального страхования жизни потребителя при условии, что момент окончания жизни являлся случайной величиной(см. также [187], [308]). В работе [182] задача оптимального управления со случайным моментом остановки была сформулирована в общем виде. Результатыданной работы использовались далее в прикладных задачах [212], [291].Продолжительность игры является важным параметром, влияющим на оптимальное поведение игроков. Отдельной областью теории игр, в которыхобъектом исследования также является момент окончания игры, являютсятак называемые игры с оптимальной остановкой (см. Е.
Б. Дынкин[35]). Вэтой области следует выделить работы В.В. Мазалова, Сакагучи, К. Шайовски, В. К. Доманского, Э. Пресмана и др. [76, 267, 269, 197, 120], см. такжемногочисленные работы А.Н. Ширяева [335] и библиографию к ним.В диссертационной работе Громовой Е.В.
изучаются кооперативные дифференциальные и многошаговые игры, в которых динамика является детерминированной, а выигрыш рассматривается в смысле его математического ожидания на случайном интервале [0 , ]. Некоторые вспомогательные сведения ирезультаты из области теории оптимального управления, теории дифференциальных игр, теории вероятностей и математического моделирования, которыебыли использованы в исследовании, также сформулированы в § 1.1 — § 1.5.2.
Цели, задачи, новизна исследованияОсновной целью диссертационной работы является построение конструктивной теории кооперативных дифференциальных игр со случайной продолжительностью и разработка подходов к определению динамически устойчивых2. Цели, задачи, новизна исследования16принципов оптимальности для указанного класса кооперативных игр.
В связис поставленной целью, можно выделить следующие основные задачи диссертационной работы:— формально описать и исследовать широкий класс теоретико-игровых динамических задач со случайной продолжительностью в форме дифференциальных игр со случайной продолжительностью;— разработать математический аппарат для построения принципов оптимальности в кооперативной постановке дифференциальных игр со случайной продолжительностью;— сформулировать алгоритм построения динамически и сильно динамически устойчивых принципов оптимальности для указанного класса игр;— адаптировать полученные результаты для дискретной постановки игры.Научная новизна диссертационной работы.
В работе впервые рассмотрена общая постановка дифференциальных игр со случайной продолжительностью; предложен математический аппарат для построения кооперативной теории для указанного класса игр; описаны и решены новые проблемы,возникающие при непосредственном переносе результатов классической теории кооперативных игр для данного широкого класса динамических игр.Теоретическая и практическая значимость. Диссертационная работаносит в основном теоретический характер. Построена кооперативная теориядифференциальных игр со случайной продолжительностью, получены достаточные, а в ряде случаев и необходимые условия существования динамическии сильно динамически устойчивых принципов оптимальности для указанногокласса игр.
Однако круг практических приложений разработанных алгоритмов может быть достаточно велик, в том числе в изученных в диссертации17математических моделях управления объемами вредных выбросов, разработки месторождения несколькими фирмами, управления капиталовложениямиво время рекламной кампании и пр., в которых присутствует конфликт интересов, основа для кооперации и наличие неопределенности.3. Положения, выносимые на защитуОсновные результаты, выносимые на защиту:∙ Формализован класс кооперативных дифференциальных игр лицΓ (0 , 0 , ) со случайным моментом окончания , где является абсолютно непрерывной случайной величиной с функцией распределения (), ∈ [0 , ].∙ Впервые предложены и исследованы следующие модификации игры лиц Γ (0 , 0 , ): дифференциальная игра лиц Γ, (0 , 0 , ) со случайным моментом окончания и дисконтированием подынтегральных функций полезности игроков; дифференциальная игра лиц Γ (0 , 0 , ),со случайным моментом окончания = min{1 , 2 , .
. . , }, где { }=1— независимые случайные величины, описывающие момент окончанияигрового процесса для игроков {} ∈ .∙ Впервые введена и изучена дифференциальная игра лицΓ (0 , 0 ), вкоторой функция распределения случайной величины может менятьсяпри развитии игры во времени ∈ [0 , ∞), предложен способ заданиясоставной функции распределения (), ∈ [0 , ∞), доказана Теоремао том, что () принадлежит к классу допустимых функций.∙ Определена дифференциальная игра лиц Γ0 (0 , 0 , ) со случайныммоментом начала игры 0 , где 0 — случайная величина.3. Положения, выносимые на защиту18∙ Доказаны Теоремы об упрощении математического ожидания интегрального выигрыша игрока для игр Γ (0 , 0 , ), Γ, (0 , 0 , ), Γ (0 , 0 , ),Γ0 (0 , 0 , ).∙ Для кооперативной формулировки игры Γ (0 , 0 , ) выведено уравнение типа Гамильтона–Якоби–Беллмана и доказана Теорема о достаточных условиях существования оптимальных управлений в классе позиционных стратегий.∙ Доказана Теорема о достаточных условиях существования оптимальныхуправлений в классе позиционных стратегий для частного случая игрыΓ, (0 , 0 , ), в которой дисконтирование осуществляется с интеграль∫︀ ной ставкой дисконтирования 0 ( ) .∙ Для класса кооперативных дифференциальных игр с предписанной продолжительностью Γ(0 , 0 , ) предложен новый способ построения характеристической функции (0 , 0 , ; ), ⊆ , доказана Теорема осупераддитивности (0 , 0 , ; ).∙ Для игр с предписанной продолжительностью Γ(0 , 0 , ) введено понятие опорного решения в –ядре, а также доказана конструктивная Теорема о достаточных условиях, гарантирующих сильную динамическуюустойчивость –ядра.
Алгоритм построения сильно динамически устойчивого С–ядра описан в общем случае для игры лиц. Конструктивныйалгоритм построения опорного решения описан для игры 2 лиц.∙ Проблема динамической устойчивости кооперативных решений изученаи решена для дифференциальных игр с предписанной продолжительностью Γ(0 , 0 , ) с фиксированным коалиционным разбиением игроков.Предложен алгоритм вычисления процедуры распределения дележа для3. Положения, выносимые на защиту19описанной модели с двухуровневой кооперацией игроков.∙ Проблема динамической и сильной динамической устойчивости принципов оптимальности изучена и решена для кооперативной дифференциальной игры со случайной продолжительностью Γ (0 , 0 , ), а такжеее модификаций Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ). Сформулированы Теоремы, гарантирующие выполнение динамической устойчивостии защиты от иррационального поведения участников во всех указанныхклассах игр.∙ Предложен алгоритм регуляризации вектора Шепли в игре Γ (0 , 0 , ).∙ Для игры Γ (0 , 0 , ) доказаны Теорема о необходимых и Теорема одостаточных условиях непустоты множества опорных решений в –ядре.∙ Введен класс кооперативных многошаговых игр со случайным числомшагов.