Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 68
Текст из файла (страница 68)
Так как [24] из выпуклости и вогнутости функционала Jследует его квазивыпуклость и квазивогнутость (см. (7.16)), то утверждение 8.6 справедливо и для квазивогнуто-квазивыпуклых J (см. утверждение 7.2).Следствие 8.2. Если U – компактное, утверждение 8.6 близко к теоремеСайона [24], а при X k ограниченном и замкнутом, еще сильнее компактном,всегда имеет место ситуация равновесия [80] ( ε =0 ) (см.
утверждение 7.2).Утверждение 8.7 (условия равновесия). Если к условиям утверждения 8.6 добавить условие: X k – ограничено и замкнуто и нижняя граньдостижима, то всегда имеет место ситуация равновесия.Если к условиям утверждения 8.6 добавить условие: X k – компактно вС1 [t0 , tk ] , а U – слабо компактно в L2 , то также имеет место ситуацияравновесия.Утверждение 8.7 частично дополняет утверждения 7.2, 8.6.Данные утверждения предполагают выпукло-вогнутость функционалаJ ( u, K ) .
Как показано в следствии 8.1 утверждения 8.6, из выпуклостивогнутости следует квазивыпуклость-квазивогнутость, поэтому утверждения возможны и для квазивогнуто-квазивыпуклых J ( u, K ) .Утверждение 8.8. Функционал J ( u, K ) вида (8.116) является выпуклым по К и квазивогнутым по u. Условием квазивогнутости по u является(8.121)ε д ( tk ) ≠ 0 ( ε д ( tk ) > 0 или ε д ( tk ) < 0 )при любых допустимых значениях u ∈ U , K ∈ X k .Доказательство приведено в [54, с. 474–475].Утверждение 8 может быть обобщено для описания (8.109) и для вводимого мультипликативного возмущения ( Г ( t ) ≠ E ) .Без доказательства сформулируем следующее утверждение.Утверждение 8.9. Условие квазивогнутости (8.121) будет выполненопри нелинейном описании объекта Q в виде (8.109).Глава 8.
Стохастическая интегро-дифференц. модель конфликта369В достаточно общем случае задания динамической ошибки (8.117)ε=д ( tк )tk∫ K ( tk , t ) H∆ ( t ) x q ( t ) d t − H∆ ( tk ) x q ( tk ) условие квазивогнутостиt0J будет иметь вид H ∆ ( tk ) x q ( tk ) < 0H ∆j ( tk ) xq ( tk ) < 0( > 0)в смысле( > 0) ,j=1, n.(8.122)Таким образом, для решения линейной интегро-дифференциальной задачи или линейной по управлению в условиях ε-равновесия без учетаограничений (8.14), (8.16) максиминным методом необходимо на второмэтапе (максимизации) учесть условие (8.122).Замечание 8.3.
Учет ограничений (8.14), (8.16) на сложность с введением новой искомой матрицы, линейно связанной с K ( tk , t ) выражением (8.20), промежуточной координаты и заданной части объекта Р (8.12),(8.13), (8.20) (рис. 8.10) позволяет войти в условия утверждения 8.7(в условия равновесия). Действительно, интегральные ограничения(8.14), (8.16) с весовыми функциями Ω(τ) в (8.24) и Ω(τθ, ) в (8.16)обеспечивают множеству матриц K ∆ ( t , t ) при линейных связях (8.20) имножеству X k матриц K ( tk , t ) ограниченность и замкнутость, обеспечивая равновесие.Данные вопросы рассмотрены в [60, 65] и других работах. Метод решения с учетом мультипликативных и аддитивных помех, заданной частиограничений рассмотрен в п. 8.2 – 8.4.8.6.
ПРИМЕРЫ ПРИМЕНЕНИЯ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНОЙ ЗАДАЧИСБЛИЖЕНИЯ-УКЛОНЕНИЯКак было указано в главе 1 и пункте 1.3 главы 8, данная методиканашла применение в двух практически полезных задачах сближенияуклонения, которые, как известно [65, 93, 154, 173, 182, 188, 243, 256],имеют место в конфликтной ситуации ЛС СВН – ЛС ПВО.
Это задача защиты РЛС от управляемой противорадиолокационной ракеты (ПРР) с помощью дополнительных источников излучения (ДИИ) и задача уклоненияпрограммно-маневрирующего аэродинамического объекта (АДО) от зенитно-управляемой ракеты (ЗУР).В данном пункте рассматриваются частные случаи приведенных задачв качестве иллюстративных примеров. Более полное исследование приведено в главе 10.Задачи управления двухкоалиционными ММС.
Часть II3708.6.1.Защита РЛС от СУ ПРР (объект Р)с помощью ДИИ (объект Q)При обращении ДИИ вокруг РЛС с частотой в полосе пропусканияПРР с РГСН с опережающим РЛС импульсным излучением ДИИ или свыключением РЛС на малом интервале времени (см. главу 10) задачаможет быть описана следующей моделью, для которой приводятся полученные результаты.Рассматривается программно-управляемый объект Q, равномерно движущийся по окружности радиуса l0 в плоскости, перпендикулярной осиОХ системы координат OXYZ, и самонаводящийся объект Р, находящийсяв момент времени t0 = 0 в начале координат системы OXYZ (рис.
8.11).YVηQXO1l0ZψOVpPlРис. 8.11. Равномерное движение программно-управляемого объекта QОбъект Q описывается (см. рис. 8.10, 8.11) в разрешенном относительно системы координат OXYZ виде xq=, n 2) :∆ ( L E==ψ ( t ) arctg ( l0 l ) sin ( ut + b=η ( t ) arctg ( l0 l ) cos ( ut + b ) ,),где u ( t ) = u = const ∈ U ( u : 0 ≤ u ≤ u ) – угловая скорость движения объекта( r = 1) ; b – угол, задающий начальное положение объекта; u – определя-ется полосой частот СУ ПРР.В качестве опорного используется движение объекта Р по прямой OO1со скоростью=( l ( l − V p 0t ) ) E ,H ∆ (t ) =V p 0 = const .
Кроме того, полагается, чтоA∆ ( tk ,=t)( ( tk − t ) (V p0tk ) ) E , (см. рис. 8.10).Рассматривается случай ограничения сложности стратегии объекта Р с( 2)помощью функционала сложности E2 ( K ∆ ) , где в качестве прототипаиспользуется матрица ИПФ K n∆ ( t , t ) =(δe−α( t −t ))sin ( w ( t − t ) + β ) E .Глава 8. Стохастическая интегро-дифференц. модель конфликта371На рис. 8.12 приведены величины ∆ отн (отношения преобразованной вдекартову систему координат гарантированной оценки динамической ком-{} ( )поненты tr M ε д ( tk ) M ε дT ( tk ) = f K * «промаха» (8.21) к l0 ) для различных стратегий объекта Q, разных уровней ограничения сложностиS (2) (8.96) и двух начальных углов b. Случайная компонента «промаха»(8.21) в широком диапазоне изменения уровня спектральной плотностипомехи здесь мала по сравнению с динамической компонентой.
Таким образом, оптимальной (гарантирующей) стратегией объекта Q является приb = 0 движение с угловой скоростью u = 0,8 c −1 , а при b = 1,57 – с угловойскоростью u = 0,3c −1 . Представляет интерес также рис. 8.13, на которомприведены осредненные по начальному углу b, полагаемому равномернораспределенным в интервале ( 0, 2π ) , величины ∆ отн . Приведенные результаты получены при l0 = 200 м , l = 2500 м , V p 0 = 521 м/с , tk = 4,7 c;22t , t ) E, =Г ( t ) E, N=δ= 5; α= 0,35; ω= 0, 41c −1; β= 0; λ q= 1, Ω (=n ( t ) N n E,N n2 = const = 1 ⋅ 10−6 − 1 ⋅ 10−8 c −1 , (8.21), (8.16), (8.35), (8.36).ΔотнS(2) = 0,1(2)−S =1(2)− S = 10∆ отн−6554433221100,40,81,21,6Рис.
8.12. Графики ∆ отнu, 1/cS(2) = 0,1(2)−S =1(2)− S = 10−600,40,81,21,6u, 1/cРис. 8.13. Графики ∆ отнСледует отметить, что возможность получения оптимального решениядля Р в «окрестности» прототипа (ПРР – СТАНДАРТ, ХАРМ и т.д.) отражает возможную для Q неопределенность действий объекта Р (отсутствияточной информации о методе наведения объекта Р, ресурсах и т.п.).
Поэтому данная методика, кроме всего остального, позволяет получать решение для Q в условиях неопределенности относительно объекта Р [26].Задачи управления двухкоалиционными ММС. Часть II372Уклонение программно-маневрирующегоаэродинамического объекта (объект Q)от системы управления ЗУР (объект Р)8.6.2.В соответствии с рис. 8.14 простейшее описание объекта Q, программно-маневрирующего в вертикальной плоскости, имеет вид:1 0x q∆ = A q x q∆ + B q u q , t0 ≤ t ≤ tk , A q = r2 r , dim x = n = 2,− r − r 0 0TB q= , u q= (0, u ) , dim u q= r= 1,01где xq1∆ ( t0 ) =xq 2 ∆ ( t0 ) =r0 − Vq t , Vq =Vq 0 =H 02 + L20 .0, rq =const, r0 =ΘDXxq1rq(t)Vq0prp(t)xp1Vp0H0εΘ0L0D0Рис. 8.14.
Объект Q, программно-маневрирующий в вертикальной плоскостиВ данном примере=n 2,=r 1 . Множество допустимых управлений Qопределяется условием=U U ( u : u ≤ at ) (см. рис. 8.15).Примем,xq1∆ ( t ) ,N12чтообъектуРдоступна дляизмерениякоордината= const .
Тогда=y1 xq1 ( t ) + n1 ( t ) и H ∆ = (1, 0 ) . Кинематиче-ские связи объекта Р имеют вид:t −tA∆ ( tk , t ) = k, где=z p ( t ) V=p t , V p const .z p (t )Величина tk определяется из равенства rP ( tk ) = rQ ( tk ) .(1)В данной задаче рассматривается функционал ограничений вида E2(8.14) с ограничением среднего квадрата ускорений объекта Р j p (t ) .Глава 8. Стохастическая интегро-дифференц. модель конфликта373На рис.
8.15 – 8.17 приведены некоторые результаты решения задачи[65] для трех правых условий задачи максимизации:1) xq1∆ ( tk ) = −0, 065;2) xq1∆ ( tk ) = −0, 05 ;3) xq1∆ ( tk ) = −0, 01 .На рис. 8.15 изображены графики оптимальных управлений и траекто-рий xq01∆ ( tk ) . Характерной особенностью управлений является наличиеодной точки переключения (для данных вариантов tn ≈ 8 − 9 c).x(t)0,05W(t)=at0− 0,05t46121021232u(t)3tk=17c1Рис. 8.15. Графики оптимальных управлений и траекторий xq01∆ (tk )ε12 (tв ), м806040120235 10–85 10 –75 10 –6N12Рис. 8.16. Зависимости среднеквадратической оптимальной ошибки от уровня шумаНа рис.
8.16 отмечается характер роста среднеквадратической оптимальной ошибки при увеличении уровня спектральной плотности N12 помехи. На рис. 8.17 дана зависимость величины M ε12 ( tk ) на оптимальной траектории от уровня ограничения нормальных ускорений объекта Р.Задачи управления двухкоалиционными ММС. Часть II374На этом же рис. 8.17 приведены столбцами максимальные на траекторияхР среднеквадратические значения j p ( t ) , значения дисперсии и математического ожидания j p ( t ) . Показан характер роста ошибки с увеличениемуровня ограничений (или уровня сложности) (8.14) и убывания трех характеристик ускорения. Рис. 8.16, 8.17 позволяют построить параметрическиеобласти возможного ускорения и перехвата объекта Q.M [ε12 (tk )], м210385753042411114102101514410 – 72,01,01,72,01,51,510 – 510 – 3ρРис.
8.17. Зависимость величины M [ε12 (tk )] на оптимальной траекторииПри обеспечении условий ε-равновесия в обоих примерах (см. пункт8.5) за счет компактности множеств управлений в обоих примерах, выпукло-вогнутости показателя в примере 6.1, выпуклости и квазивогнутостипоказателя в примере 6.2 и ограничений (8.14), (8.16) на ИПФ можно получать и использовать оптимальные оценки ИПФ K ∆ ( t , t ) для модификации свойств СУ ПРР и СУ ЗУР соответственно. Так, в примере 6.2 оптимальная ИПФ СУ ЗУР при обобщении помехи до нестационарного «белого» шума с Rn1 ( t ,=t ) N12 ( t ) δ ( t − t ) принимает вид:K ∆0 (=t , t ) N1−2 ( t ) xq1∆ ( t ) xq1∆ ( tk )( tk − t ) r1 ( tk ) ×tt× 1 − a ( t ) ∫ η ( ϕ ) d ϕ + ∫ a ( ϕ ) η ( ϕ ) d ϕ t0t0( t − t )3 − t η ϕ d ϕ , rr12 ( tk ) + k( ) ∫3t 0гдеa ( t )=tk2 t − tk t2t3+ , η ( ϕ )=3xq1∆ ( ϕ )−1 2( t − ϕ )3 rr1 ( tk ) + k .3 ϕ x ( q ) q1∆2N1 ( ϕ ) 1 + ∫ 2d q t0 N1 ( q )Глава 8.
Стохастическая интегро-дифференц. модель конфликта375Полученная система имеет не менее чем второй порядок, так как описывается суммой двух вырожденных ядер, и в соответствии с рис. 8.18а можетбыть поставлена задача получения описания модифицированного методанаведения с упреждением на основе ИПФ K 1 ( t , t ) (получения кинематической траектории xq1∆K ( t ) (рис. 8.18б) и ИПФ K 2 ( t , t ) (блока выработки команд). На рис. 8.18а ИПФ W0 ( t , t ) соответствует заданному описанию системы стабилизации ЗУР.n (t )r1xq1∆KK1(t, t)xq1∆r1M xp∆ K2 (t, t)ht()W0(t, t)jp ()tδδ (( tt −− tt))r1 ( t )r1 (t )(t − t)x p∆K1(t, t)M xp∆ δδ((tt −− tt))rr11((tt))x p∆(t −t)A0(t,t)K0(t,t)Рис.