Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 52
Текст из файла (страница 52)
замечание 4 в утв. 7.2) и, крометого, объекты однотипны [98, 129], то, в случае K = K h ( u P , u E ) , имеет место седловая точка.При интегральном показателе (7.54) K = Kt ( u P , u E ) Гамильтонианимеет вид(7.67)H=ΨT ⋅ f ( x P , x E , u P , u E ) − 1 .Повторяя выкладки (7.62), можно показать, что в случае интегральногокритерия также имеет место седловая точка.Оптимальные стратегии uoP , uoE , доставляющие седловую точку (7.59),обладают тем свойством, что P (E) невыгодно отклоняться от оптимальнойстратегии uoP ( uoE ), поскольку при таком отклонении выигрыш E (P)только увеличится, а собственный выигрыш уменьшится. Кроме того, оптимальные стратегии uoP и uoE являются устойчивыми по отношению кполучаемой информации об используемой противником стратегии.Глава 7.
Программно-корректируемое позиционное управление269Свойство (7.59) означает, что решение задач преследования можетбыть получено из известного решения задач уклонения (и наоборот).Если заменить множества U P на U P (или любое другое), а U E на U E(или любое другое), то свойство (7.59) принимает видmin max K ( u P , u E ) = max min K ( u P , u E ) .u P ∈U P u E ∈U Eu E ∈U E u P ∈U P(7.68)Свойство (7.68) будет использовано в дальнейшем.7.3.
ОЦЕНКА ОБЛАСТИ ДОСТИЖИМОСТИ ЦЕНТРА МАССЛЕТАТЕЛЬНОГО АППАРАТА СО СТАЦИОНАРНЫМ МНОЖЕСТВОМДОПУСТИМЫХ УПРАВЛЕНИЙ7.3.1.Общая характеристика способа оценкиобласти достижимостиОбласть достижимости G (t0 , T ) в момент времени T из начальнойточки x g (t0 ) и начального момента t0 определяется как множество значений вектора координат У g (T ) в момент времени T , полученные при всевозможных допустимых законах управленияхu(t ) ∈ U (t0 ≤ t ≤ T )иначальном условии x g (t0 ) .
Динамика области достижимости (ОД) можетбыть описана динамикой ее границ [193]. Граница ОД определяется траекториями предельного быстродействия [118, 193]. Если движение исследуемого объекта описывается линейной системой уравнений, то существуютотносительно простые способы построения границы ОД с использованиемфундаментальной матрицы решений [118, 129]. Эта методика существенноиспользует выпуклость ОД линейных систем. Для нелинейных системсвойство выпуклости ОД, в общем случае, не имеет места. Поэтому дляних задача определения границ ОД, или граничных управлений (т.е. приводящих на границу ОД), может быть сформулирована в следующем виде[118, 264]. Необходимо в пространстве координат Og X gYg Z g каким-либообразом задать направление ν , например, задав прямую, проходящую через начальное положение центра масс ЛА O0 и некоторую другую точкуO′ этого пространства (рис.
7.10), и решить две отдельные задачи:1) найти управление, максимизирующее расстояние R 2 (T ) , пройденноеобъектом за фиксированное время T в направлении ν ;2) найти управление, минимизирующее расстояние R 2 (T ) , пройденноеобъектом за фиксированное время T в направлении ν .Задачи управления двухкоалиционными ММС. Часть II270υYgmaxY0υ0R 2 (T )Y0V = X00′min R2υ1υ2δ G (t0 , T )(T )υm −100υmZ0υm +1XgVZgРис.
7.10. Задача достижения экстремумарасстояния в направлении υза фиксированное время ТX0Z0Рис. 7.11. Поточечная оценка ОДВарьируя направлением ν в пространстве координат и каждый раз решая эти две поставленные задачи, можно сделать поточечную [193] оценкуОД для фиксированного T (рис. 7.11).При решении обеих задач весьма желательно выявить структурныесвойства оптимального в смысле общих критериев (max R 2 (T ) иmin R 2 (T ) ) управления, не зависящие от конкретного направления ν ивремени T .
Знание структуры граничного управления существенно упрощает определение границ ОД в фиксированный момент времени T . Заметим, что решению задачи минимизации R 2 (T ) соответствует управлениесо структурными свойствами предельного быстродействия, а решению задачи максимизации R 2 (T ) – в общем случае, некоторая другая структурауправления, которую также необходимо определить.Рассмотрим кратко вопрос существования оптимальных управлений врамках данных задач.В общем случае существуют такие направления ν0 , νm+1 , для которыхвообще не найдется никаких управлений, удовлетворяющих краевымусловиям за фиксированное время T . Также возможна ситуация, когдасуществует единственное допустимое управление.В этом случае оно является решением для обеих задач (см.
ν1 , νm ).Наконец, существуют такие направления (от ν2 до νm−1 ), для которых допустимое управление не единственно. Тогда решения поставленных задачсуществуют и совпадать не могут.Формирование управляющего воздействия u10 или u02 в каждый момент управляемого движения t ′(t ′ ≥ t0 ) основывается на гипотезе посто-Глава 7. Программно-корректируемое позиционное управление271янcтва скорости Vi обоих объектов в прогнозируемом времени τ на программном такте ПКЗУ [t ′, T ] , где t= T − t ′ , т.е. Vi (T ) = Vi (t ′) , но векторскорости изменяется.Кроме того, величина скорости изменяется при изменении программного такта.Поэтому структуры граничного управления объекта, определяющиепоточечную оценку границ ∂G (t ′, T ) , должны быть найдены с учетом этойгипотезы.
Таким образом, динамика центра масс ЛА с постоянной скоростью движения V в нормальной земной СК Og X gYg Z g описывается дифференциальными уравнениямиdVdΘ g dY g n ⋅ sin g c=0;= ⋅ ( n ⋅ cos g c − cos Θ);=− ⋅;dtdt V dt V cos Θ(7.69)dXdYdZ===−V cos Θ sin Y.V cos Θ cos Y;V sin Θ;dtdtdt( )Yk Ykn∂G (T )nm∂G (T )∂G (T )Рис.
7.12. Области суб- и супердостижимостиn01(02)( )Z k Z kРис. 7.13. Новые множествадопустимых управленийИспользуя подход [183, 258], определим понятия субдостижимостиG (T ) , супердостижимости G (T ) следующим образом:(7.70)G (T ) ⊂ G (T ) ⊂ G (T ) .Здесь G (T ) – область достижимости объекта (7.69). Таким образом,субдостижимость G (T ) оптимально оценивает ОД ЛА G (T ) снизу и даетгарантированную оценку того, что G (T ) заведомо не меньше, чем G (T ) .Супердостижимость G (T ) оптимально оценивает ОД ЛА G (T ) сверхуи дает гарантированную оценку того, что G (T ) заведомо не больше, чемG (T ) (рис. 7.12). На рис.
7.12 ∂G – символ границы области G .Задачи управления двухкоалиционными ММС. Часть II272Учитывая минимаксный или максиминный характер решаемых задач,для игрока-союзника необходимо использовать оценку снизу – субдостижимость G (T ) , а для игрока-противника – использовать оценку сверху –супердостижимость G (T ) .Проведем анализ системы (7.69), учитывая, что:=u [n, γ c ]T ; n ≤ n , γ c ≤ π.(7.71)m(7.72)Располагаемая перегрузка n m определяет максимально возможную,нормальную к скорости ϑg , перегрузку, действующую на ЛА в процессеполета при отсутствии ускорения свободного падения g . Оно изменяетмаксимально возможную нормальную перегрузку на величину ∆ :(7.73)nΣm= n m + ∆ ,причем(7.74)− 1 ≤ ∆ ≤ +1 .Введем обозначение (рис.
7.15)(7.75)=n nm − 1 ;=n nm + 1 ,тогда n − 1 ≤илиmnΣm(7.76)≤ n + 1,m(7.77)n ≤ nΣm ≤ n .Таким образом, в процессе полета максимально возможная действующая на ЛА нормальная перегрузка будет не меньше величины n (оценкаснизу), но и не больше величины n (оценка сверху). Это позволяет получить новое математическое описание движения центра масс ЛА для определения его суб- и супердостижимости, которое в нормальной земной неподвижной СК Og X gYg Z g имеет следующий вид:dΘ g dY g n ⋅ sin g c==− ⋅; ⋅ ( n ⋅ cos g c );dt V dt V cos ΘdXdYdZ===−V cos Θ sin Y.V cos Θ cos Y;V sin Θ ;dtdtdtОграничения на управление имеют видγc ≤ π(7.78)(7.79)иn ≤n– для определения субдостижимости, или(7.80)Глава 7. Программно-корректируемое позиционное управление273n ≤n(7.81)– для определения супердостижимости.Необходимо отметить, что описание в виде (7.69) будет справедливымдля любой неподвижной СК (в том числе и для O0 X 0Y0 Z 0 , поскольку силатяжести в уравнениях отсутствует (но ее действие учтено в ограничениях(7.80) и (7.81)).Направление ν однозначно определяется прямой ( O0O ′ ).
Координатыточки O ′ в СК O0 X 0Y0 Z 0 обозначим ν X , νY , ν Z .Введем угол γ ν , определяемый согласноν(7.82)γ ν = arctg Z .νYВведем дополнительные СК (рис. 7.14, 7.15):• O0 X νννY Z – неподвижная земная СК, задаваемая поворотом системыO0 X 0Y0 Z 0 вокруг оси O0 X 0 на угол γ ν ;O1 X скYск Z ск – специальная траекторная СК, в которой ось O1Yск лежит•в плоскости ( YννO0 X ). Ее можно определить поворотом траекторнойСК O1 X кYк Z к на угол γ ν вокруг оси O1Yк .YνY0=Yk(t0)0'Yν(νν2Y+ν2Z)Z00'θK01νyV(t0)Vνγν00XCKσ ck1/ 2−Y KZCKX=X=0 X k ( t0 )ννz00νxνxXνZνZνРис. 7.14. Новые системы координатРис.
7.15. Движение объекта в новойсистеме координатВектор управления в СК Og X gYg Z g или O0 X 0Y0 Z 0 имеет видnu= .γc Вектор управления в системе координат O0 X νννY Zu=[n, γ ск ]T .n(7.83)(7.84)274Задачи управления двухкоалиционными ММС. Часть IIПо известным параметрам управления uν можно легко найти требуемый вектор управления u с помощью соотношенияn n 0(7.85)=u = + . γ c γ ск γ n В координатах O0 X νννY Z динамика центра масс ЛА для определениясуб- и супердостижимости имеет вид (рис.
7.15)d Θn g d Yn g n ⋅ sin g cк;==− ⋅ ⋅ ( n ⋅ cos g cк );dtdtV V cos Θn(7.86)dX ndYndZ nV cos Θn cos Y n ;V sin Θn ;===−V cos Θn sin Y n .dtdtdtПрямая ( O0O′ ), задающая направление ν , лежит в плоскости( X ννO0Y ), причем для различных направлений ν этого всегда можно добиться, повернув систему O0 X 0Y0 Z 0 на соответствующий угол γ ν .Координаты точки O′ в новой системе координат O0 X νννY Z имеютвид X ′νX 0 Y ′ = ( ν2 + ν2 )1/ 2 .(7.87)Z 0 Y0Z ′ 0 Далее приведены процедуры решения:1) задачи определения оптимального управления, минимизирующего расстояние, пройденное объектом (7.69) за фиксированное время T внаправлении ν ;2) задачи определения управления, максимизирующего расстояние, пройденное объектом в направлении ν .Понятно, что решения этих задач будут одинаковы как для определения субдостижимости, так и для определения супердостижимости ЛА.Разница только в ограничениях на максимальную перегрузку, определяемых соотношениями (7.80) и (7.81) соответственно.7.3.2.Решение задачи минимизации R 2 (T )Движение объекта описывается системой нелинейных дифференциальных уравнений (для упрощения записей опустим все индексы)dΘgdYg= n ⋅ cos g ⋅ ;= − n ⋅ sin g ⋅;dtVdtV ⋅ cos Θ(7.88)dXdYdZ===−V cos Θ sin Y.V cos Θ cos Y;V sin Θ;dtdtdtГлава 7.
Программно-корректируемое позиционное управление275Вектор управления имеем в видеu=[n, γ ]T .(7.89)Ограничения имеют видn ≤ n′ ;(7.90)γ ≤ π.(7.91)При этом n ′ = n в случае определения субдостижимости; n ′ = n в случае определения супердостижимости.Параметр управления γ фактически не ограничен (так как функцииcos γ и sin γ являются периодическими) и ограничение (7.91) имеет смыслв том, что на интервале [ −π, π] всегда найдется требуемый угол γ .Критерий минимизации=J min( X (T )2 + Y (T )2 ) .Начальные условия системы (7.88 )X =Y = Z = Θ= Y =0.Конечные условия системы (7.88)tk = T = const; F1 = X (T ) − C ⋅ Y (T ) = 0;F2 = Z (T ) = 0; Θ(T ) = var;Y (T ) = var .(7.92)(7.93)(7.94)Здесь F1 и F2 – условия, которым должен удовлетворять правый конецтраектории в момент t = T , аC=νx( νY2 + ν2Z )1/ 2– заданная константаГамильтониан системы (7.88) имеет видH = Y X ⋅V cos Θ cos Y + YY ⋅V sin Θ − Y Z ⋅V cos Θ sin Y −−YgY ng sin /(V cos Θ) + YgΘ ng cos / V .(7.95)(7.96)Сопряженная система имеет вид∂H∂H∂H = = =0; Y0; Y0;Y−=−=−=XYZ∂X∂Y∂Z = − ∂H = Y ⋅V sin Θ cos Y − Y ⋅V cos Θ − Y ⋅V sin Θ sin Y +YXYYΘ∂Θ(7.97)+Y Y ⋅ ng sin g sin Θ /(V cos2 Θ); = − ∂H = Y ⋅V cos Θ sin Y + Y V cos Θ cos Y.YXZY∂YКраевые условия сопряженной системы имеют следующий характер.Начальные условия неизвестны по всем переменным.276Задачи управления двухкоалиционными ММС.