Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 46
Текст из файла (страница 46)
Данная классификация не претендует на полноту, но дает определенную базовую информацию.Л.С. Понтрягин и его школа рассматривают задачу преследования, решая ее за преследователя Р, и задачу убегания, решая ее за убегающего Е.В первом случае задача состоит в отыскании начальных состояний процесса, из которых преследователь Р может гарантировать сближение с убегающим Е. Задача убегания заключается в описании множества начальныхсостояний, из которых преследуемый может гарантировать избежаниевстречи.
При этом для линейного случая получено исчерпывающее решение обеих задач [163, 209, 210], в рамках данного направления также следует отметить работы М.С. Никольского [176, 177].В работе [146] формируется необходимое условие оптимальности длязадач с нелинейным описанием. Для того чтобы функции u0P ( t ) , u0E ( t ) доставляли минимакс (максимин) функционалуTJ=Ф ( t , x ( Т ) ) + ∫ f 0 ( x, u p , u E ) dt =J (uE , uP )(7.1)t0Д.П. Ким. Методы поиска и преследования подвижных объектов. – М.: Наука.
Гл. ред.физ.-мат. лит., 1989. – 336 с.1Задачи управления двухкоалиционными ММС. Часть II240приx = f ( x, u P , u E , t ) ,(7.2)необходимо существование ненулевого непрерывного вектора Ψ, определяемого уравнением•Ψ =− ∂H ∂x ;nH =∑ Ψ i f i =Ψ 0 f 0 + H + Ψ n +1 ⋅ 1,(7.3)i =0при котором:• функция H достигает своего максимума по u P и минимума по u E ,0, Ψ 0 ( T ) ≤ 0 ;при этом max min H =uPuE• выполняется условие трансверсальности [158]:[δJ − H δt + ΨδX ]Tt =0 ,(7.4)0где=J Ф ( xn +1 ( T ) , x ( T ) ) + x0 ( T ) ; x0 ( T=)T∫ f0 ( x, u P , u E ) dt;t0x0 = f 0 ( x, u P , u E ) ; xn +1 = 1.В рамках этого подхода, например, в работе [146] А.М. Летовым представлено решение нелинейной задачи преследования-уклонения на плоскости по критерию времени до встречи.
Рассматривались объекты с постоянной скоростью движения и управлением в виде нормальных ускорений,ограниченных по модулю. Оптимальным является релейное управление относительно некоторой поверхности переключения в пространстве состояний.М.Г. Андерсон [269] разработал итеративный способ отыскания близкого к оптимальному решения в нелинейной дифференциальной игре, используя метод линеаризации краевой задачи с граничными условиями, заданными в двух точках, и использовал совместно с Р.
Пултером [202] этирезультаты для решения задачи наведения ракеты «воздух-воздух». Полученный закон обладает преимуществами как по сравнению с пропорциональным наведением, так и по сравнению с линейным оптимальным наведением [270]. Однако это достигается ценой большого объема вычисленийдаже в рассмотренном плоском случае.В общем случае, использование принципа максимума приводит к классической краевой задаче. Эта краевая задача часто оказывается достаточносложной для конкретного вычисления управляющих функций.А.М.
Батков и И.Б. Тарханов [14] обобщили игровую задачу на случайнеточных измерений и случайных возмущений η в системе=x f ( x, u P , u E , η, t ) при x ( to ) = xo – случайной величине.Глава 7. Программно-корректируемое позиционное управление241Л.Н. Лысенко в [98] рассмотрел нелинейные задачи игрового управления космическим летательным аппаратом в стохастической постановке, частично используя результаты, полученные в [30] на основе комбинации фильтрации по Калману, методов наблюдения и синтеза управлений.
К данной комбинации приводится также задача оптимальногосближения-уклонения двух движущихся объектов, поставленнаяВ.М. Александровым, Д.С. Иргером, А.Д. Шараборовым с учетом помехи ограничений управлений.Приведенные задачи в стохастической постановке развиты в работахВ.Ф.
Бирюкова, Е.М. Воронова и А.П. Карпенко [7, 26, 27, 63 – 65] при использовании принципа сложности и фильтрации с учетом прототипа иограничений координат, а также в работах А.П. Маслова [156] с учетомаддитивной помехи общего вида.В целом, исследование стохастической постановки игровых задач вдифференциальной форме является достаточно сложным.
При ослабленииограничений на один из векторов u P или u E , исходная стохастическаяпостановка оказывается взаимосвязанной с интегро-дифференциальнойпостановкой стохастической задачи сближения-уклонения [3, 4, 13, 27, 63– 65, 413], которая комбинирует методы фильтрации, накопления возмущений, принципа максимума, гарантированных решений и позволяетнайти позиционно-программное управление, например, u P ( x ) , u E ( t ) .Решение, например, максиминной задачи с критерием типа (7.1) состоит изэтапа аналитической статистической оптимизации матрицы импульсныхпереходных функций, связывающей входной сигнал преследователя с вектором нормальных ускорений jP ( t ) и этапа синтеза гарантирующегоуправления при уклонении с использованием принципа максимума.
Решение минимаксной задачи состоит из этапов накопления возмущений и нелинейной фильтрации [3].Метод графоаналитического синтеза законов управлений в условияхантагонизма среды или активного партнера формирует подход Р. Айзекса[2, 22, 98], который основывается на предположении, что игра имеет седловую точку и протекает в некоторой области ε n-мерного евклидова пространства и на границе этой области. В качестве условия окончания игрыпринимается условие достижения точкой x некоторой терминальной поверхности F ( ( x ( T ) ) = 0 , являющейся границей пространства ε .Важное место в теоретических построениях Р.
Айзекса занимает модель, согласно которой игра с интегральной или смешанной платой(7.1) всегда может быть приведена к эквивалентной игре с терминальной платой(7.5)=J xo ( T ) + Φ ( x ( T ) ) ,242гдеЗадачи управления двухкоалиционными ММС. Часть IIxo = f o ( x, u P , u E ) .(7.6)При этом к уравнениям, задающим терминальную поверхность, добавляется уравнение(7.7)x=g=xo (T=) So .ooРешение игры подразделяется на две фазы. Чаще всего пространствоигры оказывается разделенным на некоторое число областей сингулярными поверхностями, представляющими собой ( n − 1) -мерное многообразиев En , в точках которого регулярность поведения решения нарушается.В каждой такой области решение будет гладким. На сингулярных поверхностях возникают особенности различного рода, зависящие от типа поверхности. Существует пять основных типов сингулярных поверхностей:• поверхность переключения несет информацию о точках переключенияуправлений uoP , uoE ;• универсальная поверхность содержит информацию об особых управлениях;• рассеивающая поверхность – из каждой точки исходят две оптимальные траектории;• экивокальная поверхность – в каждой точке можно выбрать два различных оптимальных управления;• барьерная поверхность – траектории могут только огибать ее или терпят разрыв в ином случае.Анализ состояния системы в области между сингулярными поверхностями носит название решения «в малом», а выявление сингулярных поверхностей и объединение гладких частей решения носит название решения «в большом».
Решение «в малом» основывается на применении принципа перехода, эквивалентным, по существу, принципу оптимальностиБеллмана [22]. Применение этого принципа приводит к получению основного уравнения Айзекса–Беллмана, которое в условиях (7.5) – (7.7) имеетвидn(7.8)min max ∑ n xi f i ( x, u P , u E ) =0,uPuE i =0где()J o = J uoP , uoE = ν;∂νν xi =∂xi;(7.9)ν ( x (T ) , T ) =Φ ( x (T ) , T ) .Откуда при подстановке u P = uoP и u E = uoE в уравнение (7.8) следуетГлава 7. Программно-корректируемое позиционное управление0.∑ n x fi ( x, uoP , uoE ) =243ni =0i(7.10)Решение уравнения (7.10) осуществляется с помощью уравнений характеристикd n xk dt= ∑ n xk ⋅ ∂f i ∂xk + ∂f o ∂xk ;(7.11)oo=dxk dt f=k 1, n.k x, u P , u E ;()Решение уравнений характеристик производится в обратном времени,поскольку краевые условия известны для всех уравнений (7.11) только натерминальной поверхности.
В общем случае, не вся терминальная поверхность оказывается приемлемой для окончания игры. Приемлемыми считаются точки, в которых выполняется соотношениеnmin max ∑ mi f i ≤ 0 ,uPuE(7.12)i =1где μ =[µµ1 ,..., n ] – вектор нормали к терминальной поверхности.TМного примеров содержит фундаментальная работа [2]. Решение «вмалом» игровой задачи перехвата содержится, например, в [98]. Оптимальной стратегией является постоянное управление, при котором векторы ускорений перехватчика и цели ориентированы параллельно линии визирования в момент окончания игры.Решение «в большом» заключает в себе процедуру графоаналитического синтеза оптимальных управлений, которая имеет следующий смысл: вокрестности терминального множества в области регулярности находитсярешение «в малом», затем определяется «примыкающая» сингулярная поверхность, которая, в свою очередь, определяет терминальное множестводля следующей области регулярности и соответствующего решения «в малом».
Дальнейшее развитие направления Р. Айзекса прослеживается в работах [340, 353, 356, 401, 427, 433]. Так, в [356] рассматриваются способырешения уравнения Айзекса–Беллмана относительно цены, удовлетворяющей условиям Липшица. В [401] исследуется получение общего уравнения для цены игры, где уравнение Айзекса–Беллмана является частнымслучаем. Связь между подходом динамического программирования, антагонистической игрой и вводимым понятием «вязких» решений уравненияГамильтона–Якоби прослеживается в работе [353], где показано, чтофункция цены игры является «вязким» решением системы Гамильтона–Якоби–Айзекса–Беллмана.Как справедливо отмечает Л.Н. Лысенко в [98], практическое использование этого подхода для целей управления движением ЛА осложняетсятем, что, во-первых, получаемые в результате решения представляют собой программные законы, а не законы позиционного управления, и, во-Задачи управления двухкоалиционными ММС.
Часть II244вторых, программа синтезируется, исходя из условий на терминальной поверхности, а не из естественных условий, отвечающих точке начала игры.При этом, поскольку время сближения неизвестно, трудно увязать терминальные условия с начальными. Более целесообразным в этом смысле является способ определения оптимальных управлений на основанииначального состояния динамической системы и располагаемых ресурсовуправления преследователя и преследуемого.
При этом игровая задача решается от начального момента времени к конечному на основе принципаэкстремального прицеливания Н.Н. Красовского [129], который более подробно рассматривается ниже.Ю.Б. Гермейер рассмотрел в [83] задачу поиска гарантирующих решений при исследовании операций. Им подробно рассмотрены условия существования минимакса, ситуации равновесия, показана роль информациив игре и предложены методы решений антагонистических дифференциальных игр.В.Ф.