Автореферат (1145355), страница 2
Текст из файла (страница 2)
Кидланд, Е. Прескотт обнаружили динамическую неустойчивость решений в некоторых экономических задачах, А. Ори заметил динамическую неустойчивость вектора Шепли в задаче о переговорах, также проблема динамической неустойчивости вповторяющихся играх была обозначена в работе И.
Куриель, однако только вконцепции, предложенной Л.А. Петросяном, предлагался способ решения данной проблемы.Отдельным актуальным направлением в теории игр является использование элементов случайности (или неопределенности) при моделировании конфликтных процессов. Развитие данной области непосредственно связано с развитием теории стохастических игр, введенных Шепли в 1953 году, а также дифференциальных игр при наличии неопределенности (см. Жуковский В.И., Кононенко А.Ф., Петросян Л.А.
и Янг Д.В. К.), поскольку использование при моделировании фактора той или иной неопределенности позволяет наиболее адекватноописывать самые разнообразные процессы, происходящие в экономике, экологии, менеджменте, торговле, при принятии решений в области международныхотношений, систем безопасности и пр. Важные результаты в области теорииоптимального управления при наличии неопределенностей получены А.Б. Куржанским.В данной работе рассматривается новый класс дифференциальных игр —кооперативные дифференциальные игры лиц со случайной продолжительно6стью.
Случайность времени существования любого организма, системы, процесса заложена в окружающую человека реальность, поэтому спектр приложенийкооперативных дифференциальных игр со случайной продолжительностью может быть велик. Отметим, что в работе Л.А. Петросяна и Н.В. Мурзова "Теоретико-игровые задачи механики"в 1966 г. впервые были исследованы дифференциальные игры преследования двух лиц со случайной продолжительностью.
Врассматриваемой авторами задаче игроки получали терминальный выигрыш вслучайный момент времени . В этой же работе впервые было выведено уравнение типа Айзекса-Беллмана для заданной таким образом антагонистическойдифференциальной игры.Стоит отметить, что управляемые процессы со случайным моментом окончания для задач с одним агентом (игроком) также были независимо рассмотрены в области оптимального управления, начиная с работы М. Яари, в которойформулировалась задача оптимального страхования жизни потребителя приусловии, что момент окончания жизни являлся случайной величиной.
Е.К. Букасом задача оптимального управления со случайным моментом остановки была сформулирована в общем виде.Продолжительность игры является важным параметром, влияющим наоптимальное поведение игроков. Отдельной областью теории игр, в которыхобъектом исследования также является момент окончания игры, являются такназываемые игры с оптимальной остановкой. В этой области следует выделитьработы В.В. Мазалова, Сакагучи, К.
Шайовски, В. К. Доманского, Э. Пресманаи др., см. также многочисленные работы А.Н. Ширяева и библиографию к ним.В диссертационной работе Громовой Е.В. изучаются кооперативные дифференциальные и многошаговые игры, в которых динамика является детерминированной, а выигрыш рассматривается в смысле его математического ожидания на случайном интервале [0 , ]. Некоторые вспомогательные сведения ирезультаты из области теории оптимального управления, теории дифференциальных игр, теории вероятностей и математического моделирования, которыебыли использованы в исследовании, также сформулированы в § 1.1 — § 1.5.Целью диссертационной работы является построение конструктивнойтеории кооперативных дифференциальных игр со случайной продолжительностью и разработка подходов к определению динамически устойчивых принципов оптимальности для указанного класса кооперативных игр.
В связи с поставленной целью, можно выделить следующие основные задачи диссертационнойработы:— формально описать и исследовать широкий класс теоретико-игровых динамических задач со случайной продолжительностью в форме дифференциальных игр со случайной продолжительностью;— разработать математический аппарат для построения принципов оптимальности в кооперативной постановке дифференциальных игр со случайной продолжительностью;— сформулировать алгоритм построения динамически и сильно динамиче7ски устойчивых принципов оптимальности для указанного класса игр;— адаптировать полученные результаты для дискретной постановки игры.Методика исследования.
Результаты диссертации получены с использованием строгого математического аппарата теории оптимального управления,динамических игр, кооперативных игр, теории вероятностей и теории надежности.Научная новизна диссертационной работы. В работе впервые рассмотрена общая постановка дифференциальных игр со случайной продолжительностью; предложен математический аппарат для построения кооперативной теории для указанного класса игр; описаны и решены новые проблемы,возникающие при непосредственном переносе результатов классической теориикооперативных игр для данного широкого класса динамических игр.Теоретическая и практическая значимость.
Диссертационная работа носит в основном теоретический характер. Построена кооперативная теориядифференциальных игр со случайной продолжительностью, получены достаточные, а в ряде случаев и необходимые условия существования динамическии сильно динамически устойчивых принципов оптимальности для указанногокласса игр.
Однако круг практических приложений разработанных алгоритмовможет быть достаточно велик, в том числе в изученных в диссертации математических моделях управления объемами вредных выбросов, разработки месторождения несколькими фирмами, управления капиталовложениями во времярекламной кампании и пр., в которых присутствует конфликт интересов, основа для кооперации и наличие неопределенности.Основные результаты, выносимые на защиту:∙ Формализован класс кооперативных дифференциальных игр лицΓ (0 , 0 , ) со случайным моментом окончания , где является абсолютно непрерывной случайной величиной с функцией распределения (), ∈ [0 , ].∙ Предложены и исследованы следующие модификации игры лицΓ (0 , 0 , ): дифференциальная игра лиц Γ, (0 , 0 , ) со случайныммоментом окончания и дисконтированием подынтегральных функцийполезности игроков; дифференциальная игра лиц Γ (0 , 0 , ), сослучайным моментом окончания = min{1 , 2 , .
. . , }, где { }=1 —независимые случайные величины, описывающие момент окончания игрового процесса для игроков {} ∈ .∙ Введена и изучена дифференциальная игра лиц Γ (0 , 0 ), в которойфункция распределения случайной величины может меняться при развитии игры во времени ∈ [0 , ∞), предложен способ задания составнойфункции распределения (), ∈ [0 , ∞), доказана теорема о том, что () принадлежит к классу допустимых функций.∙ Определена дифференциальная игра лиц Γ0 (0 , 0 , ) со случайныммоментом начала игры 0 , где 0 — случайная величина.8∙ Доказаны теоремы об упрощении математического ожидания интегрального выигрыша игрока для игр Γ (0 , 0 , ), Γ, (0 , 0 , ),Γ (0 , 0 , ), Γ0 (0 , 0 , ).∙ Для кооперативной формулировки игры Γ (0 , 0 , ) выведено уравнение типа Гамильтона–Якоби–Беллмана и доказана теорема о достаточныхусловиях существования оптимальных управлений в классе позиционныхстратегий.∙ Доказана теорема о достаточных условиях существования оптимальныхуправлений в классе позиционных стратегий для частного случая игрыΓ, (0 , 0 , ), в которой дисконтирование осуществляется с интегральнойRставкой дисконтирования 0 ( ) .∙ Для класса кооперативных дифференциальных игр с предписанной продолжительностью Γ(0 , 0 , ) предложен новый способ построения характеристической функции (0 , 0 , ; ), ⊆ , доказана теорема о супераддитивности (0 , 0 , ; ).∙ Для игр с предписанной продолжительностью Γ(0 , 0 , ) введено понятие опорного решения в –ядре, а также доказана конструктивная теорема о достаточных условиях, гарантирующих сильную динамическуюустойчивость –ядра.
Алгоритм построения сильно динамически устойчивого С–ядра описан в общем случае для игры лиц. Конструктивныйалгоритм построения опорного решения описан для игры 2 лиц.∙ Проблема динамической устойчивости кооперативных решений изученаи решена для дифференциальных игр с предписанной продолжительностью Γ(0 , 0 , ) с фиксированным коалиционным разбиением игроков.Предложен алгоритм вычисления процедуры распределения дележа дляописанной модели с двухуровневой кооперацией игроков.∙ Проблема динамической и сильной динамической устойчивости принципов оптимальности изучена и решена для кооперативной дифференциальной игры со случайной продолжительностью Γ (0 , 0 , ), а такжеее модификаций Γ, (0 , 0 , ), Γ (0 , 0 , ), Γ (0 , 0 ). Сформулированы теоремы, гарантирующие выполнение динамической устойчивостии защиты от иррационального поведения участников во всех указанныхклассах игр.∙ Предложен алгоритм регуляризации вектора Шепли в игре Γ (0 , 0 , ).∙ Для игры Γ (0 , 0 , ) доказаны теорема о необходимых и теорема о достаточных условиях непустоты множества опорных решений в –ядре.∙ Введен класс кооперативных многошаговых игр со случайным числом шагов.
Сформулированы и доказаны теоремы о регуляризации вектора Шепли и –ядра для данного класса игр.9Апробация работы. Основные результаты диссертационной работы были доложены на семинарах кафедры математической теории игр и статистических решений Санкт-Петербургского государственного университета, на семинарах Центра теории игр (СПбГУ), на семинаре Механико-математическогофакультета Саратовского государственного университета (2004), на семинарахБолонского университета, Италия (2011), Унив. г. Падуя, Италия (2011), Унив.Ла Сапиенца, Рим, Италия (2011); семинарах научного центра GERAD унив.Монреаля, Канада (2011, 2015, 2016); на семинаре унив.
Анауак, Мехико, Мексика (2014); на семинаре кафедры оптимального управления факультета вычислительной математики и математической кибернетики Московского государственного университета (2016), на XXX и XXXI научных конференциях «Процессы управления и устойчивость», Санкт-Петербург(1999, 2000), на V Российской мультиконференции по проблемам управления, Санкт-Петербург (2012),на I Российском экономическом конгрессе, Москва (2009), а также на следующих международных конференциях: «Устойчивость и процессы управления»,посвящ. В.И.