Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 62
Текст из файла (страница 62)
Там же приведены условия ограниченности и непрерывности операторов Н 0 , Н ∆ , П 0 , П ∆ , ∑ в R3 для любого t ≥ 0 .Таким образом, в данном пункте показана возможность представитьобщие структурные схемы теле- и самонаводящегося объектов в виде единой структурной схемы.8.1.3.Постановка задачи оценки эффективности и поискаоптимальных (гарантирующих) стратегий уклоненияпрограммно-управляемого объекта Q от позиционноуправляемого объекта Р. Краткая характеристикаэтапов исследованияВ пункте 8.1.3 приводится постановка задачи оценки эффективностии поиска оптимальных (гарантирующих) стратегий уклонения программно управляемого объекта Q.
При этом используется терминология [83].Задача ставится как задача исследования операции объекта Q при наличии противника (объекта Р) и случайных неконтролируемых факторов(мультипликативных и аддитивных помех). Множество стратегий противника – матрица ИПФ K ∆ ( t , t ) – ограничено с помощью двух интегральных функционалов сложности [26]. Первый функционал сложностииспользует вектор ускорений j p∆ ( t ) объекта Р; второй – МИПФ «прототипа» оптимизируемой части этого объекта.
Исходная задача исследования операции сводится к позиционно-программной «бесшумной» игре сидеальной информацией (см. 8.1.1), решение которой распадается на дваэтапа. В работе получены матричные интегральные уравнения, задающиенеобходимые и достаточные условия «оптимальности» МИПФ K ∆ ( t , t )(см.
[26, 27, 60, 64]).Постановка задачи. Расчетная схема задачи, справедливая, как показано в 8.1.2, для телеуправляемого и самонаводящегося объектов Р, приведена на рис. 8.10.Глава 8. Стохастическая интегро-дифференц. модель конфликтаx q0 ( t )x q0 ( t )L (t )y0H0K0j p0A0x p0П0n (t )u q0 ( t )uq ( t )Qx q ( t )Г (t )L (t )x q∆(t )xq ( t )K∆+H∆j p∆A∆337∂x∂p∆ x px p∆П∆+-ε∂x∂q ( t )∑Рис. 8.10. Расчетная схема задачиАктивным средством лица, принимающего решение (ЛПР), являетсяуклоняющий от встречи с объектом Р объект Q, описываемый векторнымдифференциальным уравнением(8.10)=x ( t ) f=( x , u , t ) , x (t ) x 0 ,q0qqq0qгде t 0 = 0 – момент начала операции; tk > t0 – момент окончания операции;x q ( t ) ∈ X q ( t )m×1 – вектор фазовых координат, где X q – непустое ком-пактное и непрерывное в R m множество допустимых значений фазовыхкоординат, задаваемое с помощью конечного или бесконечного семействадействительных непрерывных функций=hi : X q ( t ){xq( t ) : hi ( x q=( t ) ) ≥ 0, i}1, 2,3,...
;u q (t ) ∈ U q (t ) − r × 1 вектор управления – стратегия ЛПР (Q), где U q (t ) =={uq, i( t ) : uqi ( t ) ≤ uqi ( t )=}1, r – множество измеримых функций – про-странство стратегий ЛПР (Q); f0 ( x q ( t ) , u q , t ) – удовлетворяющая условиюЛипшица на прямом произведении X q ( t ) × U q ( t ) × [t0 , tk ] вектор-функция;множество{ f ( x , u , t ) : u0qqq}∈U q ( t )векторов скорости полагается прикаждом фиксированном наборе (x q , t ), x q ( t ) ∈ X q ( t ) , t ∈ [t0 , tk ] непрерывным, выпуклым и ограниченным. В число фазовых координат x q ( t )входят координаты центра масс объекта в системе координат O0' X q' Yq' Z q' илиO0' rϕχ . Эти координаты составляют n-мерный вектор x q ( t ) , n ≤ m ( n ≤ 3) .Задачи управления двухкоалиционными ММС.
Часть II338Так что x q ( t )= L ⋅ x q ( t ) , где L − n × m матрица, «вырезающая» из вектора x q ( t ) координаты x q ( t ) .Активное средство противника – стремящийся к сближению с объектом Q объект Р – полагается линеаризованным относительно опорной траектории x p 0 ( t ) , соответствующей «опорной» траектории объекта Qx q0 (t ) ∈ X q (t ) 1:() q 0 , u q 0 , t , x q 0 ( t0 ) x 0q ,=x q 0 ( t ) f=0 x(8.10')где u q 0 (t ) ∈ U q (t ) – «опорное» управление, назначаемое ЛПР.На опорной траектории ЛПР принята следующая модель объекта Р.Объект Р описывается нелинейными непрерывными ограниченными известными операторами H0 , K 0 , A 0 из R n в R n , соответствующими связям векторов x q ( t ) , y ( t ) ; y ( t ) , j p ( t ) ; j p ( t ) , x p ( t ) на опорной траектории.
Так что y 0 ( t ) = H0 ( x q 0 ( t ) ) , j p 0 ( t ) = K 0 ( y 0 ( t ) ) , x p 0 ( t ) = A 0 ( j p 0 ( t ) )( ())и x p 0 ( t ) = A 0 K 0 H0 ( x q 0 ( t ) ) . Выражения для операторов H0 и A 0приведены, например, в [64]; оператор K 0 определяется конкретной системой.На линеаризованной траектории принята следующая модель объекта Р.Объект описывается известной n × n матрицей H=∆ ( t ) {h∆ij ( t ) ∈ C [t0 , tk ]},i, j = 1, n , неизвестной n × n МИПФ K ∆ (t , t), t0 ≤ t ≤ t ≤ tk (стратегия про-тивника)иизвестнойневырожденнойn×nМИПФ∀t < t ,A ∆ ( t , t ) = {α∆ij ( t , t ) ∈ C∆ [t0 , tk ]}, i, j = 1, n , которые соответствуют связямвекторов x q ( t ) , y ( t ) ; y ( t ) , j p ( t ) ; j p ( t ) , x p ( t ) на этой траектории. Таким образом,=y ∆ ( t ) H ∆ ( t ) Г ( t ) x q ( t ) − x q 0 ( t ) ,(8.11)где Г ( t ) – диагональная n × n матрица случайных функций с единичнымсредним значением и положительно определенной корреляционной матрицей1Полагается, что множество X q ( t ) , t ∈ [t0 , tk ] достаточно «узко», т.е.
∀x∀ q ( t ) ∈ X∀ q ( t )x q ( t ) − x q 0 ( t ) «невелика» и линеаризация объекта Р относительно траектории x p 0 (t ) допустима.Глава 8. Стохастическая интегро-дифференц. модель конфликта339R Г ( t1 , t2 ) = diag ( rg11 ( t1 , t2 ) , rg 22 ( t1 , t2 ) ,..., rgnn ( t1 , t2 ) ) ,rgii ( t1 , t2 ) ∈ L 2 [t0 , tk ] × L 2 [t0 , tk ] ,где i = 1, n – мультипликативная векторная помеха, допускающая аппроксимацию нестационарным «белым» шумом (случайный фиксированныйфактор).
При нулевых начальных условиях:x p∆=(t )t∫ A∆ (t, t) j p ( t) d t ,(8.12)∆t0j=p∆ ( t )t∫ K ∆ ( t , t ) y ∆ ( t ) + n ( t ) d t ,(8.13)t0где n( τ) – аддитивная векторная помеха (случайный фиксированный фактор) не коррелированная с Г ( t ) , допускающая аппроксимацию нестационарным «белым» шумом и имеющая нулевое среднее значение и симметричную положительно определенную корреляционную матрицуR n ( t1 , t2 ) ={rnij}( t1 , t2 ) ∈ L 2 [t0 , tk ] × L 2 [t0 , tk ] ,i, j = 1, n .
Множество допу-стимых стратегий U p объекта Р задается с помощью «функционала слож-()=U p {K ∆ ( u=q , t , t ) K ∆ ( u q ( ⋅ ) , t , t ) : E2 ( u q , tk , K ∆ ) ∈ S ( u q , tk ) ± ε S } ,где S ( u q , tk ) , ε S – принятые ЛПР известная положительная функцияности» [240] E2 u q , tk , K ∆ . Именно,–уровень ограничения сложности и требуемая точность соответственно.Рассматриваются два функционала сложности.Функционал сложности E2(1) u q , tk , K ∆ , ограничивающий полосу про-)(пускания контура наведения объекта Р: tk(1)E2 ( u q , tk , K ∆=) tr ∫ Ω ( t ) × M j p∆ ( t ) − M j p∆ ( t ) [− // −]T d t , t0{()}(8.14)где=Ω ( τ ) diag ( w11 ( τττ) , w 22 ( ) ,.., w nn ( ) ) , 1 ≤ wii ( τ ) < ∞ , i = 1, n – из-вестная матрица веса;j p∆ ( t ) − M j p∆=( t )t∫ K ∆ ( t, q){H ∆ ( q) Г ( q) − E x q ( q) + n ( q)}d q.t0((8.15))Функционал сложности E2(2) u q , tk , K ∆ , ограничивающий «удаленность» параметров контура наведения объекта Р от «прототипа», в качестве которого может быть использован объект-аналог объекта Р:Задачи управления двухкоалиционными ММС.
Часть II340E2(2) ( u q , tk , K ∆ ) = tk t(8.16)T= tr ∫ ∫ Ω ( t, q ) × K ∆ ( t, q ) − K n∆ ( t, q ) × [ − // − ] d qd t , t0 t0где =, )∈Ω ( τθ, ) diag ( w11 ( τθτθτθ, ) , w 22 ( , ) ,..., w nn ( , ) ) , 1 ≤ w ii ( τθ, ) < ∞ , w ii ( τθ∈ C� [t0 , tk ] , i = 1, n – известная матрица веса;K n∆=(t , t ){kn∆iji, j( t , t ) ∈ C� [t0 , tk ] ,=}1, n – МИПФ «прототипа».Критерий эффективности операции строится на основе n × 1 векторадекартовых компонент «промаха» объектов в момент времени tk :д=ε д ( tk ) ε=( uq , tk , K ∆ ) ε1д ( uq , tk , K ∆ ) + ε0д ( uq , tk , K 0 ) ,гдеε 0д ( u q , tk , K 0 ) = x дp 0 ( tk ) − x дq ( tk ) = П 0 x p 0 ( tk ) − ∑ x q ( tk ) ≠ 0,(8.17)(8.18)tkε1д=( uq , tk , K 0 ) П∆ ( tk ) ∫ K ( tk , t ) y ∆ ( t ) + n ( t ) d t.Здесь П 0 и(8.19)t0∑– нелинейные непрерывно ограниченные операторыиз R в R , соответствующие кинематическим связям векторов x po ( t ) иnnx q ( t ) с этими же векторами xдp 0 ( t ) , xдq ( t ) в декартовой системе коорди-{}нат; Π ∆ ( t ) = π∆ij ( t ) ∈ C [t0 , tk ] , i, j =1, n − n × n матрица, соответствующая кинематическим связям вектора x p∆ ( t ) с этим же вектором xдp∆ ( t ) вдекартовой системе координат; n × n МИПФK=(tk , t)Операторы П 0 ,tk∑) K ∆ ( , t ) d θ,∫ A ∆ ( tk , θθtt0 ≤ t ≤ t k .(8.20)и матрица П ∆ ( t ) приведены, например, в [64].В качестве критерия эффективности операции, который ЛПР стремитсямаксимизировать, рассматривается критерий Солодовникова–Баткова –неотрицательный вещественный функционал 1:E1 ( u q , tk , K ∆ ) = tr M ε д ( tk ) ⋅ M ε дT ( tk ) +(8.21)T+λ q tr M ε д ( tk ) − M ε д ( tk ) [ − // − ] ,{{ {1}}}Связь этого критерия с критерием максимума вероятности и рекомендации по выборувесового множителя λ q приведены в [143, 241].Глава 8.
Стохастическая интегро-дифференц. модель конфликта341где λ q =const , 0 < λ q < ∞ – известная величина,ε д ( tk ) − M ε д ( tk ) =t= Π ∆ ( tk ) ∫ K ( tk , t ) {H ∆ ( t ) [Г( t) − E ] x q ( t ) + n ( t )} d t.(8.22)t0Ставится задача поиска:гарантированной оценки эффективности заданной стратегии uq ( t )()*=E1* ( uq , tk ) E=1 u q , tk , K ∆minK ∆ ( t ,t )∈U pE1 ( uq , tk , K ∆ ) ;(8.23)оптимальной (гарантирующей) стратегииuq* ( t ) = arg max E1* ( uq , tk ) .(8.24)uq ( t )∈U qВследствие того что задача 1 входит в задачу 2, далее рассматриваетсятолько задача 2, которая называется при этом просто «задача».В результате того, что для фигурирующих в (8.22) – (8.24) математических ожиданий и дисперсий легко найти аналитические выражения, такчто критерий качества операции и функционалы сложности оказываютсяизвестными детерминированными функциями u q ( ⋅) , K ∆ , tk , ρ , сформулированная задача представляет собой детерминированную «бесшумную»позиционно-программную игру с идеальной информацией (см.