Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 55
Текст из файла (страница 55)
Для направлений от ν1 до ν3 ненайдется допустимых управлений в третьей структуре с l ≥ 3 и т.д. Приувеличении l до бесконечности множество удовлетворяемых краевыхусловий превращается в единственное направление ν∞ , совпадающее сначальным положением вектора скорости V ( t0 ) .n0n0n′t−n′t+TTtt−n′Рис. 7.23. Структура оптимальных управленийТаким образом, сделаем окончательный вывод: ближняя граница области достижимости определяется релейным управлением перегрузкой n содной точкой переключения, а дальняя граница – релейным управлением сучастком особого управления (рис.
7.23).7.3.5.Алгоритм вычисления границ области достижимостиКоординаты точки дальней границы области достижимости объекта(7.124) с множеством управлений (7.127) определяются с помощью выра-Глава 7. Программно-корректируемое позиционное управление291жений (7.178) – (7.180) в специально введенной неподвижной системе координат O0 X νYν Z ν . Система O0 X νYν Z ν задана поворотом на угол γ ν вокруг оси O0 X 0 системы O0 X 0Y0 Z 0 .
Из соотношения (7.123) следует, чтоγ 0с = γ 0ск + γ ν = О + γ ν = γ ν ,поэтому координаты точки дальней границы в базовой системе будутиметь следующий вид:V2n ′gt +n ′gt +(7.189)X 0 (T ) =⋅ sin+ V cos⋅ T − t+ ,n ′gVV(V 2 n ′gt +Y0 ( T =) ⋅ 1 − cosV n ′g )n ′gt +⋅ T − t + ⋅ cos g 0с , + V sinV2++V n ′gt n ′gtZ 0 (T =⋅ T − t + ⋅ sin g 0с .) ⋅ 1 − cos + V sinV V n ′g ()(7.190)()(7.191)Здесь n=′ n= n m + 1 – для определения точки границы супердостижимости ∂ + G ( T ) ; n ′= n= n m − 1 – для определения точки границы субдостижимости ∂ + G ( T ) ; t + – момент выключения управления.Координаты точки ближней границы области, супер(суб)достижимостиобъекта (7.124) с множеством управлений (7.127) определяются с помощью выражений (7.172 ) – (7.174) при l = 1 (одна точка переключения наинтервале [ t0 , T ] в координатах O0 X νYν Z ν ).Переходя в СК O0 X 0Y0 Z 0 , получим(n ′g T − 2t −V 2 n ′gt −X 0 (T ) =⋅ 2sin+ sinn ′g VV(n ′g T − 2t −V 2 n ′gt − Y0 ( T ) =⋅ 1 − 2 cos + cosn ′g V V(n ′g T − 2t −V 2 n ′gt − Z0 (T ) =⋅ 1 − 2 cos + cosn ′g V V) ,(7.192)) ⋅ cos g0с,(7.193)) ⋅ sin g0с.(7.194)Здесь t − – момент переключения управления.Варьирование параметрами t − и t + в пределах [t0 , T ] , параметром γ C0в пределах [ −π, π] и использование аналитических выражений позволяютопределить совокупность точек с координатами X 0 (T ) , Y0 (T ) , Z 0 (T ) ,принадлежащих дальней и ближней границам ∂G областей достижимости292Задачи управления двухкоалиционными ММС.
Часть IIG (T ) ; G (T ) (при n ′ = n или n ). Тем самым определяются области супер-и субдостижимости G (T ) и G (T ) в системе координат O0 X 0Y0 Z 0 . Блоксхема алгоритма приведена на рис. 7.25.Для получения координат точки границы ОД в нормальной земной СКнеобходимо воспользоваться соотношением X g (T ) X g (t0 ) Yg (T ) Yg (t0 ) += Z g (T ) Z g (t0 ) (7.195) cos Y (t0 ) cos Θ(t0 ) − cos Y (t0 ) sin Θ(t0 ) sin Y (t0 ) X 0 (T ) ⋅ Y (T ) .sin Θ(t0 )cos Θ(t0 )0+ 0 − sin Y (t0 ) cos Θ(t0 ) sin Y (t0 ) sin Θ(t0 ) cos Y (t0 ) Z 0 (T ) На рис.
7.24 представлена динамика изменения области супердостижимости G (T ) ( i = 1, 4 ) во времени. При дальнейшем увеличении Tвнутренняя полость, определяемая ближними границами, исчезает, адальняя граница постепенно приближается по форме к окружности (показано сечение).Рис. 7.24. Динамика изменения ОДГлава 7. Программно-корректируемое позиционное управление293НачалоВводV , T , n ′, x τ 0ВычислениешагаВычислениешагов+∆∆τττ;− , ∆∆ τ+γ c > 2πАрхивTτ− > Tττ++ >>TTПечать:ВычислениекоординатВычислениекоординат{X 0 , Y0 , Z 0 }⊂ ∂ −G{X 0 , Y0 , Z 0 }⊂ ∂ + G∂ + G (T )∂ − G (T )КонецРис.
7.25. Блок-схема алгоритма формирования границ ОДТаким образом, в данном разделе описан необходимый набор системкоординат, для которого описание движения объекта и вектора управленияимеет компактную форму, наиболее удобную для оценки области достижимости ОД. Задача оценки ОД нелинейного объекта в трехмерном пространстве сводится к задаче экстремума расстояния, пройденного объектом за фиксированный интервал времени и дается решение задача оценкипространственной ОД рассматриваемого нелинейного объекта с учетомгипотезы постоянства модуля его скорости в будущем времени. Получено294Задачи управления двухкоалиционными ММС.
Часть IIпараметрическое описание границ ОД, при этом параметрами являютсяγ C и положение точки переключения или выключения n . На основе параметрического описания обсуждается алгоритм вычисления границ пространственной ОД рассматриваемого нелинейного объекта на основе параметрического описания, обладающий экономичностью вычислительныхпроцедур.7.4. ФОРМИРОВАНИЕ НЕЛИНЕЙНЫХ АЛГОРИТМОВ ПРЕСЛЕДОВАНИЯИ УКЛОНЕНИЯ НА ОСНОВЕ ПРИНЦИПА ЭКСТРЕМАЛЬНОГО ПРИЦЕЛИВАНИЯН.Н.
КРАСОВСКОГО7.4.1.Алгоритм оптимального нелинейногопозиционного уклоненияПусть управляемое движение системы (7.69) началось в некоторый момент времени t = t0 . Формирование оптимального управления u0E в каждыймомент времени t ′ ( t ′ ≥ t0 ) основывается на точном знании векторов позиции x g P ( t′) и x g E ( t′) , прогнозировании будущего хода игры на основе гипотезы постоянной величины скорости движения обоих объектов P и E натакте ПКЗУ. На программном такте ПКЗУ прогнозируемое время, в отличиеот реального или прошлого времени t , обозначается символом τ .Таким образом,Vi ( τ )= Vi ( τ0 ) , i = P, E , τ ≥ τ0 ,t ′ и в каждый момент t ′ решается вспомогательная задачагде t0 =()min K h u P , u0E = maxu P ∈U P ( τ )min K h ( u P , u E ) ,u E ∈U E ( τ ) u P ∈U P ( τ )(7.196)решение которой является оптимальным решением исходной задачи в момент t ′ .
Символы U P ( τ ) , U E ( τ ) обозначают множества программныхуправлений, где U P ( τ ) ⊂ U P , U E ( τ ) ⊂ U E , а K h ( u P , u E ) – прогнозируемый промах на любой паре траекторий, определяемых управлениямиu P ∈ U P ( τ ) , u E ∈ U E ( τ ) . Прогнозируемый промах определяется так же,как и в постановке задачи с заменой t на τ inf r ( τ ) , если inf r ( τ ) > l ;τ(7.197)Kh ( u P , u E ) = τесли inf r ( τ ) ≤ l.0,τВеличина l предполагается известной, в частном случае можно принять l = 0 .Глава 7.
Программно-корректируемое позиционное управление295Программные траектории У g P ( τ ) и У g E ( τ ) , определяемые управлениями u P ∈ U P ( τ ) и u E ∈ U E ( τ ) , подвержены возмущениям, вносимымсилой тяжести, причем эти возмущения могут как «помогать», так и «мешать» E в решении задачи уклонения. По «принципу наибольшей неприятности» будем предполагать, что возмущения всегда «мешают».
Это приводит к необходимости расширения множества допустимых управленийP U P на максимальную величину возможного возмущения и необходимости сужения множества допустимых управлений E на эту величину.Возмущение, вносимое силой тяжести, не превышает единицы перегрузки,поэтому вместо множеств U P и U P ( τ ) используются U P и U P ( τ ) , авместо множеств U E и U E ( τ ) используются U E и U E ( τ ) .Множество U P задаетсяnY2P + nZ2 P ≤ nP ,(7.198)гдеn=nPm + 1 .P(7.199)Множество U E задаетсяnY2E + nZ2 E ≤ nE ,(7.200)гдеn=nEm + 1 .E(7.201)С учетом указанных замен равенство (7.196) принимает вид()(7.202)K h u P , u0E = maxmin K h ( u P , u E ) .u E ∈U E ( τ ) u P ∈U P ( τ )Было показано, что в случае неполного поглощения на прогнозируемомminu P ∈U P ( τ )участке τ GE ( τ ) ⊄ GPl ( τ ) оптимальное управление u0E является граничным, т.е.u0E ∈ U E∂ ,(7.203)где U E∂ ⊂ U E ( τ ) .В случае полного поглощения на прогнозируемом участкеGE ( τ ) ⊂ GPl ( τ ) в соответствии со способом, предложенном В.М.
Кейном[89*], оптимальное управление u0E также является граничным. Поэтому,независимо от вида поглощения, равенство (7.202) приобретает видminu P ∈U P ( τ )()K h u P , u0E = maxu E ∈U E∂ ( τ )min K h ( u P , u E ) .u P ∈U P ( τ )(7.204)Задачи управления двухкоалиционными ММС. Часть II296Ранее было показано, что граница субдостижимости ∂G E (T ) состоитиз двух частей: ближней границы ∂ − G E (T ) , достигаемой с использованием управления u2 ∈ U −E , и дальней границы ∂ + G E (T ) , достигаемой с использованием управления u2 ∈ U +E (см.
рис. 7.23). Поэтому∂+−U=U −E ∪ U +E ,E U=E(7.205)а равенство (7.204) приобретает вид()min K h u P , u0E = maxmin K h ( u P , u E ) .u P ∈U P ( τ )u E ∈U E+ − ( τ ) u P ∈U P ( τ )(7.206)Как известно, чтобы найти максиминное значение промаха (7.206),необходимо сформировать последовательно два этапа оптимизации:а) этап минимизации выражения()K h u*P , u*E =minu P ∈U P ( τ )()K h u P , u*E ,(7.207)где u*E – любое управление из множества U +−E ;б) этап максимизации показателя* =maxK h u*P , u*Emax min K h u P , u E .
(7.208)+−+−**u E ∈U E ( τ )u E ∈U E u P ∈U P ( τ )Этап минимизации. Для граничной траектории E , определяемой гра-()(=K h u*P , u0E)()ничным управлением u*E ∈ U +−E , необходимо подобрать такую траекториюP , определяемую управлением u*P ∈ U P , которая будет минимизироватьконечный промах в момент τh , причем сам момент τh заранее неизвестен.Траектория движения E должна удовлетворять ограничению по высоте.Алгоритм решения такой задачи состоит из трех шагов.1 шаг.Предположим, что множество U P не ограничено. Обозначим символом U Pc множество всевозможных постоянных управлений во времени τи найдем потребное управление unP ∈ U Pc , необходимое для обеспеченияравенства()=K h unP , u*E()=min K h u P , u*E0,u P ∈U Pc ( τ )(7.209)cгде u*E ∈ U +−E , UP ⊂ U P .TВектор координат объекта Р X K P , YK P , Z K P в системе OP X K YK Z K(рис. 7.26), являющихся функциями τ , nP , γ cP , обозначается символомГлава 7.
Программно-корректируемое позиционное управление()297TУ K p τ, γ cP , nP = X K P , YK P , Z K P ,где τ – любой будущий момент времени, а nP и γ c p определяются из со-отношений:= nYP nP cos γ cP ;nZ P nP sin γ cP .=TПусть P использует постоянное управление u P = nYP , nZ P , u P ∈ U Pcна интервале τ . При использовании соотношений (7.37), (7.38) могут бытьполучены аналитические выражения, определяющие вектор координатУ K P в момент τn p gτVP2⋅ sinnpgVp 2n p gτ VP У K= n g ⋅ 1 − cos V ⋅ cos g c p .pp p 2 VP ⋅ 1 − cos n p g τ ⋅ sin g cp n p g V p (7.210)YYgV ( τ0 )02Z0gX g ( τ0 )θ ( τ0 )X−Y ( τ 0 )Yg ( τ 0 )XgZ g ( τ0 )Рис. 7.26.
Позиция ЕЗадачи управления двухкоалиционными ММС. Часть II298TВектор координат объекта Е X K E , YK E , Z K E в системе OE X K YK Z K(рис. 7.26), являющихся функциями τ , γ cE , τ+E или τ−E , обозначается символом)(+ * − TУK E τ, γ cE , τ E ∨ τ E = X K E , YK E , Z K E .(7.211)Пусть E использует управление u E ∈ U E+ , т.е. приводящее в дальнююграницу области субдостижимости ∂ + G E ( τ ) , где τ+E – момент перехода срелейного на особый участок управления. Тогда аналитические выражения, определяющие вектор координат УK E в момент τ , имеют вид()+УK E τ, g cE , τ E =n g τ+n g τ+VE2⋅ sin E E + VE ⋅ cos E E ⋅ τ − τ +EnE gVEVE . (7.212) VE2 n E g τ+E n E g τ+E+ = ⋅ 1 − cos+ VE ⋅ sin⋅ τ − τ E ⋅ cos g cE VE VE n E g n E g τ+E n E g τ+E VE2 + ⋅ τ − τ E ⋅ sin g cE + VE ⋅ sin n g ⋅ 1 − cos VVEE E ()()()Если E использует управление u*E ∈ U E− , т.е.