Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 51
Текст из файла (страница 51)
Более того, предполагается,что угол крена жестко стабилизирован и равен нулю.Для того чтобы использовать математическое описание вектора управления в виде (7.36) для ЛАi с управлением в «полярных координатах»,необходимо определить nYi , nZi по следующим соотношениям:(7.37)=nYi ni cos γ ci ,=nZi ni sin γ ci .(7.38)Тогда множество допустимых управлений U i вида (7.35) будет определяться(7.39)ui ≤ nim ,где символ • обозначает евклидову норму, т.е.2 1/ 2=ui ( nYi2 + nZi) .(7.40)Глава 7. Программно-корректируемое позиционное управление263В качестве ЛА-противника будет всегда рассматриваться объект, длякоторого известно ограничение на нормальную к вектору скорости Vi перегрузку.
Поэтому и для ЛА-противника вектор управления имеет вид(7.36), а множество допустимых управлений U i имеет вид (7.39).Если длительность этапа управляемого движения невелика, то множества допустимых управлений (множества располагаемых перегрузок)U i ,(i = P, E ) изменяются незначительно и этими изменениями можнопренебречь.Алгоритмы преследования и уклонения являются позиционными«в обратных связях», поэтому возмущения, возникающие в системе P – Eиз-за неидеальной работы системы стабилизации ЛА-союзника и возможного неоптимального поведения ЛА-противника, учитываются при формировании закона управления.7.2.2.Уравнения движенияВводятся в рассмотрение следующие системы координатных осей(рис.
7.7):• OX gYg Z g – нормальная земная система координат (СК), центр которойзафиксирован произвольным образом;• O1 XYZ – нормальная подвижная СК, центр которой совпадает с центром масс Р, а оси параллельны осям нормальной земной СК; – определяется аналогично O XYZ . Центр совпадает с цен• O2 XYZ1тром масс Е.• O1 X k Yk Z k – траекторная подвижная СК, центр которой совпадает сцентром масс P, ось O1Yk лежит в вертикальной плоскости и можетслужить для отсчета величины γ ci , а ось O1Z k , лежащая в горизонтальной плоскости ( O1 XZ ), образует с осями O1 X k и O1Yk правую систему;• O2 X k Yk Z k – определяется аналогично СК O1 X k Yk Z k , но для Е;•Oo X oYo Z o – земная неподвижная СК, центр которой с положениемцентра масс Р в начальный момент времени t = to , а оси совпадают сосями траекторной СК O1 X k Yk Z k ;• Oo X oYo Zo – определяется аналогично СК Oo X oYo Z o , но для E.Координаты центров масс E и P в системе OX gYg Z g задаются как{X gP , YgP , Z gP }– для P и{X gE , YgE , Z gE }– E.
Положение СК O1 X k Yk Z kотносительно O1 XYZ задается углами Θ P и Ψ P .264Задачи управления двухкоалиционными ММС. Часть IIУглы Θi являются углами наклона траекторий ЛА, а Ψ i – углами поворота траекторий ЛАi ( i = Р,Е).Положение точки O2 относительно O1 XYZ задается параметрами задается параметрамиr, ϕ, χ . Положение точки O1 относительно O2 XYZr , ϕ , χ (на рис. 7.7 не показаны ϕ , χ ).Движение центров масс P и E в системе координат OX gYg Z g описывается системой нелинейных дифференциальных уравнений [143]:dVi= g ( n xi − sin Θi );dtd Θi g=( nYi − cos Θi );dtVid Yi=− g ⋅ nZi (Vi cos Θi );dtdX gi(7.41)= Vi cos Θi cos Y i ;dtdYgi= Vi sin Θi ;dtdZ gi=−Vi cos Θi sin Y i ,dti = P, E ,где g – ускорение свободного падения; Vi – скорость ЛА.Вектор управления ЛАi является двумернымui = [nYi , nZi ]T .Ограничение на управление имеет вид (7.39) или (7.36).При активном маневрировании E на малой высоте полета возможностолкновение с Землей, поэтому необходимо формировать закон управления ui (i = P, E ) с учетом требованияYgE > 0.(7.42)Предполагается, что высота полета P всегда положительна и поэтомуподобное ограничение на движение P не накладывается.7.2.3.Критерии управленияВектором координат ЛАi в СК OX gYg Z g будем называтьУ gi = [ X gi , Ygi , Z gi ]T .Вектором позиции ЛАi в СК будем называть(7.43)Глава 7.
Программно-корректируемое позиционное управлениеx gi [ X gi , Ygi , Z gi ,Vi , Θi , Y i ]T ,=265(7.44)где Vgi= [Vi, Θi , Ψ i ]T – вектор скорости ЛАi, а V i – модуль скорости ЛАi.Множество позиционных стратегий ЛАi обозначаетсяU i ( x gP , x gE ) ⊂ U i .(7.45)Множество программных стратегий ЛАi обозначается(7.46)U i (t ) ⊂ U i .Предполагается, что ЛА-союзнику в каждый момент управляемогодвижения t ′(t ′ ≥ to ) точно известны векторы позиций и множества допустимых управлений P и E. Процесс принятия решения от замера позицийдо выдачи оптимального управления осуществляется мгновенно.
Способыопределения векторов позиций рассматриваются ниже.Расстояние между P и E обозначается(7.47)=r (t ) У gP (t ) − У gE (t ) .Пусть управляемое движение системы (7.41) началось в некоторый момент времени t = t0 , и зона перехвата P имеет радиус действия L.Тогда целью управления P является обеспечение в некоторый моментвремени t = t ∗ условия(7.48)r (t*) ≤ L, t* > t0 ,которое называется L-встречей, при этом E стремится не допустить выполнения условия (7.48).Введем критерии управления.1. Пусть t = t h – момент времени, когда выполняется условие (рис. 7.9)r (t h ) = inf r (t ) .(7.49)tКонечный промах h определим следующим образом: r (t ), r (t h ) > L;h=h 0, r (t ) ≤ L.Тогда в качестве первого критерия управления принимается=K h K=h ( u P , u E ) h.(7.50)(7.51)266Задачи управления двухкоалиционными ММС.
Часть IIxge (t0 )xge (t L )r(t h )xgp(t L )Lxgp (t0 )Рис. 7.9. Минимальный промах и время до L-встречиТаким образом, P стремится достичь минимально-возможного конечного промаха h, а E – наоборот, стремится увеличить конечный промах,причем никаких дополнительных условий на момент t h конечного промаха не накладывается.2.
Пусть t = t L – момент времени, когда впервые выполняется условие(7.48) (рис. 7.9), где(7.52)t0 < t L ≤ t *.То есть(7.53)=t L inf{=t* : r (t*) L} .P стремится обеспечить выполнение условия (7.48), причем за минимальное время, а E стремится не допустить L-встречи (7.48) или хотя быотдалить ее во времени. Поэтому в качестве второго критерия управленияпринимаетсяtL)K=K t ( u P , u E=t∫ 1⋅ dt .(7.54)toСледует заметить, что момент существует всегда, поскольку для каждой пары траекторий P и E всегда найдется момент времени, когда расстояние (7.47) между ними минимально.
Момент существует только в томГлава 7. Программно-корректируемое позиционное управление267случае, если выполняется условие (7.48), а если t* – единственный, тоt* = t L .Сформулируем задачи преследования и уклонения в соответствии свведенными критериями K h (7.51) и Kt (7.54).З ад ач а 1 : K h . В классе позиционных стратегий U P ( x gP , x gE ) требуется найти оптимальное управление uPo , удовлетворяющее условиюmax K h ( uoP , u E ) =u E ∈U Emminmax K h ( u P , u E )u P ∈U P ( x gP ,x gE ) u E ∈U Em(7.55)и условию (7.42), какими бы ни были начальные позиции объектов.Вектора управления ui , (i = P, E ) являются двумернымиT=ui [n=P, E .Yi , nZi ] , iДопустимыемножества управлений U im задаются2 1 2( nYi2 + nZi)≤ nim .(7.56)в виде (7.39)(7.57)З ад ач а 1 : Kt .
Формулируется аналогично задаче 1: K h , но вместокритерия K h используется критерий Kt (7.54).З ад ач а 2 : K h . В классе позиционных стратегий U E ( x gP , x gE ) требуется найти оптимальное управление uEo , удовлетворяющее условиюmin K h ( u P , uoE ) =u P ∈U Pmmaxmin K h ( u P , u E )u E ∈U E ( x gP ,x gE ) u P ∈U Pm(7.58)и условию (7.42), какими бы ни были начальные позиции объектов. Вектора управления ui являются двумернымиT=ui [n=P, E .Yi , nZi ] , iДопустимые множества управлений U im задаются в виде (7.39).З ад ач а 2 : Kt . Формулируется аналогично задаче 2: K h , но вместокритерия K h используется критерий Kt (7.54).7.2.4.Анализ условий существования равновесия(седловой точки)Приведенное ниже доказательство базируется на приведенных в п.
7.1.1теоремах существования равновесия. В антагонистической дифференциальной игре имеет место равенствоmin max K ( u P , u E ) = max min K ( u P , u E ) ,(7.59)u P ∈U P u E ∈U Eu E ∈U E u P ∈U Pесли оптимальные управления, uoE доставляют седловую точку [129,242].Соотношение (7.59) соответствует выполнению равенстваuoPЗадачи управления двухкоалиционными ММС. Часть II268max min H = min max H ,u P ∈U P u E ∈U E(7.60)u E ∈U E u P ∈U Pгде H – функция Гамильтона для данной игры.В случае терминального показателя (7.51) K h ( u P , u E ) = h , гамильтониан имеет вид(7.61)H=ΨT ⋅ f ( x P , x E , u P , u E ),hгде Ψ – сопряженный вектор, f ( X , u P , u E ) – векторная запись уравнений(7.51).Поскольку движение всей системы (7.41) есть две отдельные траектории P и E (т.е.
уравнения, описывающие движения одного объекта, не зависят от вектора управлений другого), то уравнение (7.61) представимо ввиде (7.62)(7.62)H = ΨTP ⋅ f P ( x P , u P ) + ΨTE ⋅ f E ( x E , u E ) = H P + H E .Поскольку H P явно зависит только от u P , а H E – только от u E , то=maxmin H Pu P ∈U P u E ∈U Emax=min H Eu P ∈U P u E ∈U E=minmax H P max H P ;(7.63)min=max H E(7.64)u E ∈U E u P ∈U Pu E ∈U E u P ∈U Pu P ∈U Pmin H E .u E ∈U EТаким образом,max min =H max min ( H P + H=max H P + min H E ;E)u P ∈U P u E ∈U Emin max =Hu E ∈U E u P ∈U Pu P ∈U P u E ∈U Eu P ∈U Pu E ∈U Emin max ( H P + H=max H P + min H E .E)u E ∈U E u P ∈U Pu P ∈U Pu E ∈U E(7.65)(7.66)Поскольку правые части уравнений (7.65) и (7.66) равны друг другу ивыполняется условие «разделения» (см.