Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 57
Текст из файла (страница 57)
Затем формируетсямножество управлений U P* , минимизирующих прогнозируемый конечныйпромах в соответствии с третьим шагом этапа минимизации и множество()+−K h U +−E , U P минимальных для каждого u E ∈ U E конечных промахов.abKhaYknP(U,1U,U)2 )KKhh(U1 2bcc0ZknUU 1n01ТЭПPdKh00dРис. 7.31. ТЭП при U Pn ⊄ U PYkKhaab0ZknNUU1n ==UU1 ∗01PТЭПlb 0KKU12,)U 2 )h 1(,Uh(U0 lP0bbРис.
7.32. ТЭП при U Pn ⊂ U PKhГлава 7. Программно-корректируемое позиционное управлениеYkmaxnPn n nmaxZk011307∗U11n ==UU1 1NUnТЭПРис. 7.33. ТЭП при U P , неизвестном ЕЕсли U Pn ≠ U P* и, следовательно, U Pn ⊄ U P , то из множества конечных(промахов K h U +−E ,U P) необходимо выбрать максимальный элемент, удо-влетворяющий равенству (7.240) и являющийся точкой экстремальногоприцеливания (ТЭП) (рис. 7.31):()()K h u*P , u0E = max+ − K h u*P , u E .u E ∈U EСоответствующее управление u0E является оптимальным.(7.240)(Если U Pn = U P* и, следовательно U Pn ⊂ U P , то множество K h U +−E ,U P)состоит из нулевых элементов. Это означает, что для любого управлениясуществует управление, приводящее к встрече.
В этом случае точка экстремального прицеливания ищется на множестве U Pn как элемент этогомножества, обладающий максимальным по модулю параметром управления nPn . Тогда соответствующее управление u0E является оптимальным, изадача решена.В заключение отметим особенности алгоритма решения задачи без информации о множестве допустимых управлений P .Случай неполного поглощения U Pn ⊄ U P всегда более выгоден E , потому что E может уклониться от прогнозируемой встречи. Когда множество U P неизвестно, то по «принципу наибольшей неприятности» Eдолжен предположить, что имеет место полное поглощение U Pn ⊂ U P .Точка экстремального прицеливания ищется тогда аналогично случаюполного поглощения в условиях полной информации о U P (рис.
7.33).Информация о множестве U P для формирования множества потребныхуправлений U Pn не требуется.Задачи управления двухкоалиционными ММС. Часть II3087.4.2.Алгоритм оптимального нелинейногопозиционного преследованияПовторяя рассуждения, приведенные в п. 7.4.1, легко показать, что решение задачи K h будет совпадать в каждый момент времени t ′ с решением вспомогательной задачи()max K h u0P , u E =u E ∈U E∂max K h ( u P , u E ) ,minu P ∈U p ( τ ) u E ∈U E∂(7.241)где U E∂ ⊂ U E ( τ ) .Программные траектории У g P ( τ ) и У g E ( τ ) , определяемые управлениями u P ∈ U p ( τ ) и u E ∈ U E ( τ ) , подвержены возмущениям, вносимымсилой тяжести, причем эти возмущения могут как «помогать», так и «мешать» P в решении задачи сближения.
По «принципу наибольшей неприятности» предполагается, что возмущения всегда «мешают». Это приводитк необходимости расширения множества допустимых управлений E U Emна максимальную величину возможного возмущения и необходимостисужения множества допустимых управлений P U mp на эту величину.Возмущение, вносимое силой тяжести, не превышает единицы перегрузки,поэтому вместо множеств U mp и U p ( τ ) используются U p и U p ( τ ) , авместо множеств U Em и U E ( τ ) используются U E и U E ( τ ) .Поэтому равенство (7.241) приобретает вид()max K h u0P , u E =∂u E ∈U Emax K h ( u P , u E ) .minu P ∈U p ( τ ) u ∈U ∂EE(7.242)Поскольку∂+−UE =UE ,то равенство (7.242) приобретает видmax K h ( u0P , u E ) =+−u E ∈U Emin(7.243)max K h ( u P , u E ) .u P ∈U p ( τ ) u ∈U +E−E(7.244)В данной игре имеет место седловая точка и справедливо равенство(7.68), поэтому справедливо и следующее равенство:max+ −u E ∈U E()min K h u0P , u E =u P ∈U p ( τ )minmax K h ( u P , u E ) .u P ∈U p ( τ ) u ∈U +E−E(7.245)Алгоритм решения максиминной задачи уже известен (см.
п. 7.4.1).Особенность его применения для решения минимаксной задачи (7.241) со-Глава 7. Программно-корректируемое позиционное управление309стоит в использовании множеств управлений U P ( τ ) и U E ( τ ) вместоU P ( τ ) и U E ( τ ) соответственно.Выбор точки экстремального прицеливания – элемента множества(K h U p ,U E)в случае неполного поглощения U Pn ⊄ U P или элементамножества U Pn в случае полного поглощения U Pn ⊂ U P – определяет нетолько оптимальное управление u0E , но и оптимальное управление u0P .7.4.3.Формирование программно-корректируемогозакона управленияСхема формирования программно-корректируемого закона управленияв задаче преследования приведена на рис. 7.34.
ПКЗУ реализуется в видемноготактового алгоритма. Длительность такта определяется необходимойточностью наведения с учетом полосы пропускания системы стабилизацииЛА. На каждом такте осуществляется коррекция программного законауправления преследователя, полученного на предыдущем такте. Алгоритмсинтеза ПКЗУ на отдельно взятом такте состоит из 5-ти этапов (рис. 7.34).Рассмотрим эти этапы.На первом этапе осуществляется ввод исходных данных с бортовыхизмерительных устройств о текущей позиции и параметрах относительного движения цели, а также о параметрах движения преследователя.На втором этапе полученные данные подвергаются предварительнойобработке, в результате чего рассчитываются параметры математическихмоделей ЛА (7.78).Третий и четвертый этапы реализуют алгоритм нелинейного позиционного преследования (п.
7.4.2). На третьем этапе формируется ансамбльтраекторий E путем задания множества значений параметров τ− ∨ τ+ ; γ cE(7.212, 7.213). Для каждой траектории E рассчитывается соответствующая траектория P определяются параметры управления преследователеми конечный промах. Затем проверяется выполнение ограничения по высоте полета (7.42) и исключаются из рассмотрения не удовлетворяющиеограничению траектории. На четвертом этапе проводится оптимизация намножестве прогнозируемых конечных промахов по критерию (7.55, 7.58),выбирается точка прицеливания и определяются параметры закона управления преследователем.На пятом этапе в соответствии с полученным программным закономуправления вычисляются для текущего момента времени t оптимальныеo . Далее, для учета силы тяжестизначения вектора управления P nPo , γ cPЛА они корректируютсяЗадачи управления двухкоалиционными ММС.
Часть II310( ){(nPk sign nPo==g kcParctg(nPo sin g ocP) ((2+ nPo cos g ocP + cos θPooonPo sin ggcP nP cos cP+ cos θP)))}2 1/ 2;(7.246)и формируются и выдаются команды для системы стабилизации.t = t j −11Ввод данных с бортовых измерительных устройство параметрах движения цели преследователяИисходные данные от бортовыхизмерительных устройств2Обработка данных измерений, получение параметровматематических моделей объектов управления3Формирование ансамбля экстремальных траекторийдвижения цели, построение области достижимостис учетом ограничения на вектор состояния.Определение множества потребных траекторийдвижения преследователя, расчет параметров законовуправления. Вычисление множества прогнозируемыхконечных промахов4Оптимизация на множестве прогнозируемых конечныхпромахов, выбор точки прицеливания (мгновеннойточки встречи) и определение оптимального управленияпреследователем на такте5Коррекция вектора управления для учета влияния силытяжести, формирование и выдача команд управлениясистеме стабилизации преследователяВых.
данные к системестабилизации ЛАt = t j−1 +tДаt ≥tjНетРис. 7.34. Схема формирования ПКЗУ на программном интервале [t j–1 ,T]Глава 7. Программно-корректируемое позиционное управление311Необходимо отметить, что для реализации данного алгоритма в реальных условиях необходима мощная вычислительная база борта. Для обеспечения требуемой точности наведения для высокоскоростных ЛА каждаяграница области достижимости должна аппроксимироваться массивом из∼200 точек. Внутри цикла по их расчету выполняется сложная итерационная процедура оптимизации нелинейного функционала (7.218).
Благодаряхорошей геометрической интерпретации алгоритм может быть распараллелен и реализован в многопроцессорной вычислительной системе,например, на транспьютерах [73]. Однако, учитывая, что в настоящее время параллельные системы еще не нашли широкое применение в системахуправления ЛА, ниже будет рассмотрен упрощенный (субоптимальный)алгоритм преследования-уклонения, предъявляющий значительно меньшие требования по быстродействию и поэтому легко реализуемый в реальном времени.ПКЗУ может быть адаптирован к реальным условиям воздушного боя,когда в конфликте находятся не один, а несколько ЛА. Различные варианты применения ПКЗУ при коалиционном преследовании и уклонении откоалиции ЛА рассмотрены в п. 7.4.5, 7.4.6.