Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 47
Текст из файла (страница 47)
Демьянов, В.Н. Малоземов развили общую теорию нелинейныхминимаксных задач, где отдельно рассмотрены дискретный и непрерывный случаи при наличии и отсутствии ограничений на параметры. В работе [94] ими выведены необходимые условия минимакса, достаточныеусловия локального минимакса, приведены методы последовательныхприближений для нахождения стационарных точек. В рамках данногонаправления В.В. Федоровым в [250] приводятся конкретные алгоритмычисленного решения минимаксных задач иерархического вида, основанные на методе штрафных функций.Основное свойство максиминных и минимаксных гарантирующих критериев заключается в определении минимума или нижней границы – инmax J (максимума или верхней границыфинума функции Ψ ( u P ) =u E ∈U Eсупремума функции Ψ ( u E ) =min J ) при описании динамического проu P ∈U Pцесса в виде (7.1) (7.2).РассмотримантагонистическуюконфликтнуюситуациюJP =−J E =J ( u P , u E ) и ограничимся исследованием минимаксной постановки, поскольку свойства максиминной подобны.Утверждение 7.1 [94].
Пусть множество U E как множество точекu E ( t ) , t ∈ [to , T ] – ограниченное замкнутое в Em или как множество функ-цийuE (t ){–компактное вL2 m ,}UP–выпуклое множествоUP =u E ∈U E J ( u P , u E ) =ϕ ( u P ) , функционал J ( u P , u E ) выпуклый поu P и непрерывен вместе с ∂J / ∂u P по совокупности переменных вГлава 7. Программно-корректируемое позиционное управление245U P xU E . Тогда ϕ ( u P ) выпуклая на U P и существует uoP такое, чтоJ o =inf ϕ ( u P ) =inf max J ( u P , u E ) . Если условие на U P не являетсяu P ∈U P u E ∈U EuPзначительно ограничивающимu P , то существует такоеuoP , чтоJ o = min max J .uPuE1) Утверждение теоремы справедливо, если выполняются свойства гладкости и единственности решения системы (7.2).2) Компактность U P в L2 m , аналогично и U E , имеет смысл компактностиj 1,=m, i P, E , и проверяется по критерию Колмогоро=uij в L2 j , гдева [121, 138]:а) cуществует K такое, что для любой функцииTuij ∈ U i j ,∫ uijto2dt ≤ K 2j ; U i = U i1 × ...
× U im ;K = ( K1 ,..., K m ) .(7.13)б) для любого ε > 0 найдется δ > 0 такое, что для любой функцииuij ∈ U i j имеет место2t +h1−uij∫ 2h ∫ uij ( t ) d t dt < ε , если h < δ .to t −hT(7.14)3) При наличии вогнутости J ( u P , u E ) по u E компактность U E не является необходимой.Аналогичное утверждение может быть сформулировано и для максимина, где вводится условие вогнутости J по u E .Понятия вогнутости и выпуклости функции формулируются следующим образом.Функционал J ( u P , u E ) является выпуклым по u P (вогнутым по u E ),(если для каждых u′P , u′′P ∈U P , u′E , u′′E ∈U E( )) и 0 ≤ t ≤ 1 существует такоеu′′′P , u′′′E , что при всех u P ∈ U P ( u E ∈ U E )tJ ( u′P , u E ) + (1 − t ) ⋅ J ( u′′P , u E ) ≥ J ( u′′′P , u E ) ,( tJ ( u P , u′E ) + (1 − t ) ⋅ J ( u P , u′′E ) ≤ J ( u P , u′′′E ) ) .(7.15)Дополним свойства выпуклостии-вогнутости свойствами квазивыпуклости и квазивогнутости.Задачи управления двухкоалиционными ММС.
Часть II246Функционал J ( u P , u E ) является квазивыпуклым (квазивогнутым), еслидля любого u E ( u P ) и любого вещественного c для каждой пары u′P иu′′P ( u′E и u′′E ), для которой J ( u′′P , u E ) ≤ c , J ( u P , u′E ) ≥ c , J ( u P , u′′E ) ≥ c ,имеемJ ( tu′P + (1 − t ) u′′P ) , u P ≤ c,(7.16)J u P , ( tu′E + (1 − t ) u′′E ) ≥ c .Рассмотрим основные условия существования равновесных управлений.Утверждение 7.2 [24, 54, 60, 129].
Пусть U P и U E – компактные мно-()жества (одно из множеств компактно). J ( u P , u E ) – функционал, выпукловогнутый или квазивыпукло-квазивогнутый и непрерывный на U P xU E .Тогдаmax inf J ( u P , u E ) = min sup J ( u P , u E ) = n,uEuPuPuE sup inf J ( u P , u E ) = inf sup J ( u P , u E ) = n1 .uP uE uE uPКак видно, теорема формулирует типовые условия существования равновесия и ε -равновесия.В последнем равенстве отклонения от найденных решений могутулучшить результат «отклоняющегося» не более чем на малоеε > 0 ( ν1 ± ε ) .Сделаем некоторые замечания.1) Если J является лишь полунепрерывным, то существование равновесия возможно лишь при его вогнуто-выпуклости.
J ( u P , u E ) называется полунепрерывной снизу по u P (сверху по u E ) в точке u′P ( u′E ) , еслидля любого c > 0 существует такая окрестность точки, в которойJ ( u P , u E ) > J ( u′P , u E ) − c ( J ( u P , u E ) < J ( u P , u′E ) + c ) .2) Для существования ε -равновесия компактность одного из множествU i может быть заменена слабой компактностью. Это следует из теоремы Вейерштрасса, см., например, [121].3) Условия равновесия и ε -равновесия для стохастической модели (см.пункт 8.1.3) приводят к обобщению утверждения 7.2, (см., например,[9, 54, 60, 65] и пункт 8.5.2).4) Существование равновесных управлений обеспечивается, если имеетместо следующее «расщепление» (или разделение) правых частей (7.2)Глава 7.
Программно-корректируемое позиционное управление247=x f ( x=, u P , u E , t ) f P ( x, u P , t ) + f E ( x, u E , t ) и подынтегральной функ-ции(7.1) f o f oP ( x, u P , t ) + f oE ( x, u E , t ) .=5) Как было отмечено выше, равновесие-«седло» является частным случаем равновесия по Нэшу двух и более игроков (объекта и неопределенной среды, активных партнеров и т.д.), которое обобщает рассмотренные условия.Кроме рассмотренных выше направлений необходимо отметить работуА.Б. Куржанского [140] на основе методов наблюдения и управления ансамблем траекторий и взаимосвязанные с ними работы Д.А. Овсянникова[184], Ф.Л. Черноусько [258], А.И. Овсеевича [183]. Самостоятельный интерес представляют работы Ю.С.
Осипова, например, [187], Б.Н. Пшеничного, Л.А. Петросяна [258], В.М. Кейна [118], Л.Н. Лысенко [98], А.Ф. Кононенко [122, 123] и многие другие (см. расширенный список литературы).7.1.2.О дифференциальных играх группового противодействияЗадачи противодействия групп-коалиций с противоположными интересами занимают особое место в теории дифференциальных игр. Оставаясь врамках антагонистических подходов, будем рассматривать те из них, где вконфликте участвуют две группы-коалиции динамических объектов. Здесьследует отметить работы Л.С. Понтрягина [210], Л.А. Петросяна [200,201], А.А. Чикрия [261], С.Ф.
Кривого [133], Н.Н. Петрова [197],Е.П. Маслова, Е.Я. Рубиновича [157], А.Г. Пашкова [372], Ф.Л. Черноусько [257], П.Б. Гусятникова [90], Н. O’Меаrа [370], Y. Yavin [420] и др.Л.А. Петросян в [200] приводит решение игры с одним преследуемым инесколькими преследователями, действующими как один игрок. Подробнорассмотрена задача «простого преследования» с двумя преследователями ификсированной продолжительностью T . Выводится связь между максиминным временем преследования и временем поглощения.В [370] разработан алгоритм определения оптимальных стратегий в задаче одновременной атаки при защите области и предсказании точек перехвата.
Защищаемая область состоит из дискретных точек (целей). Целиподвергаются одновременной атаке с разных направлений. Изучен способотыскания оптимальной цены последовательной минимаксной задачи.А.Г. Пашков и С.Д. Терехов [372] исследовали задачу преследованияодиночной цели двумя игроками при невыпуклой функции цены игры.Проводится оптимизация этой функции при различных начальных позициях игроков.Задачи преследования одним преследователем группы убегающих рассмотрены в [157, 197, 201, 260, 420].Н.Н. Петров [197] рассматривает обобщенный пример Л.С.
Понтрягина[210] со многими участниками и фазовыми ограничениями применительно кслучаю одинаковых динамических и инерционных возможностей игроков.248Задачи управления двухкоалиционными ММС. Часть IIПолучены достаточные, а в отдельных случаях и необходимые условия поимки при условии, что убегающие используют программные стратегии, акаждый из преследователей ловит не более одного убегающего.В [420] приводится численное решение стохастического варианта игрыпреследования-уклонения. Две цели преследуются одним преследователемР и в некоторый момент времени к перехвату подключается еще один объект Q, имеющий более высокую маневренность и скорость.
Объекты описываются нелинейными уравнениями. Получены решения для «плоского»случая и исследуются способы численного решения в трехмерном пространстве.Следует отметить, что игры группового противодействия намногосложнее по сравнению с играми двух лиц. Поэтому более или менее строгие доказательства существования решений приводятся в литературе, какправило, только для плоского случая. Для пространственных игр поискрешений осуществляется численными методами.
Кроме того, следует отметить, что практический интерес в большей мере представляют игры преследования-уклонения группы и одного убегающего (см., например, [145,174, 261]), так как игры противодействия двух групп и игры преследованияодним игроком группы убегающих можно интерпретировать как задачуцелераспределения, т.е. назначение отдельным преследователям своих целей, что в свою очередь приводит к вырождению групповой игры в несколько антагонистических игр двух лиц. В результате имеем «иерархическую» дифференциальную игру, где на верхнем уровне осуществляетсяцелераспределение, а на нижнем – поиск оптимальных стратегий конфликтной двухобъектной системы.7.1.3.Основные структурные особенности принципаэкстремального прицеливания и его применение в классахлинейных и нелинейных дифференциальных игрПринцип экстремального прицеливания Н.Н.