Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 60
Текст из файла (страница 60)
Здесь τ+ τ− определяют соответственно моментвремени «выключения» («переключения») при движении по экстремальной траектории на дальнюю (ближнюю) границы области достижимости, а( ) – скоростной угол крена.γ c+ γ c−7.5.2.Алгоритмическое обеспечение поиска ПКЗУИсследование свойств поставленной в п. 7.5.1 задачи и нахождение еерешений может быть проведено численными методами с помощью программной системы «МОМДИС» [48, 213] (см. также п. 9.1).Алгоритм оптимизации задачи (7.260) – (7.262) представлен на рис. 7.40.Оптимизация проводится как многотактовая процедура. На каждомтакте осуществляется перенастройка оптимальных значений параметровПКЗУ.
Затем при проектировании ПКЗУ моделируется динамика полетакаждого ЛА и определяется текущая позиция объектов к концу шага реализации управления. При применении ПКЗУ управление реализуется вСУЛА, а к концу шага реализации в БЦВМ поступают измерения позицийобъектов. После этого осуществляется проверка на достижение конечногорезультата (на рис. 7.40 это время взаимодействия T ) и принимается решение о переходе к следующему такту или выходе из процедуры. В каче-Глава 7. Программно-корректируемое позиционное управление323стве начальных приближений на i + 1 такте берутся оптимальные значенияпараметров ПКЗУ, полученные на предыдущем i-м такте.ti = t 0Ввод начальных приближений параметров ПКЗУt + t - ,γ Ct0 < ti < TНетДаПроведение Парето-Нэш оптимизацииПКЗУ на тактеJ P , J E → optМоделирование полета P и Е на такте с оптимальнымизначениями параметров ПКЗУОпределение текущих значений критериев управленияи векторов состояний системыt i = ti + 1Рис.
7.40. Алгоритм оптимизации задачи (7.260) – (7.262)В п. 7.5.3 приведен практический пример исследования задачи преследования-уклонения с двумя показателями для каждого ЛА и антагонистическим ядром K h .7.5.3.Пример противодействия ЛА с вектором показателей(промах, время и энергетические затраты)Рассмотрим следующую практически полезную задачу конфликтноговзаимодействия двух ЛА. Преследующий P и преследуемый E объектыописываются системой уравненийЗадачи управления двухкоалиционными ММС.
Часть II324dΘ g dY g n ⋅ sin g c==− ⋅, ⋅ ( n ⋅ cos g c ) ;dt V dt V cos Θ(7.263)dXdYdZ=V cos Θ cos Y;=V sin Θ;=−V cos Θ sin Y.dtdtdtВектор управления в параметрическом виде (7.262). Для упрощения()анализа ограничимся особым управлением u + τ+ , γ c+ .Критерии управления:TJ1 = αK h + (1 − α ) ∫ nP 2 dt = αJ11 + (1 − α ) J12 → min,uPt0J 2 = β ( − K h ) + (1 − β )( −T ) = βJ 21 + (1 − β ) J 22 → min,(7.264)uEJ = γJ1 + (1 − γ ) J 2 → min ,uP ,uE0 ≤ α ≤ 1, 0 ≤ β ≤ 1, 0 ≤ γ ≤ 1.Здесь показатель J12 характеризует энергетические затраты преследователя при перехвате, а J 22 выражает «стремление» цели затянуть моментвремени встречи T с объектом P . Антагонистическое ядро образуют показатели J11 и J 21 , где K h – конечный промах.Данная постановка увеличивает практическую значимость оптимизации конфликта с приоритетом конечного промаха, так как позволяет перехватчику с допустимыми потерями по промаху контролировать перегрузку, а цели «затянуть» время перехвата.На основе программного модуля ПС «МОМДИС» для стабильноэффективной настройки ПКЗУ на бескоалиционный конфликт произведенаоптимизация конфликтной ситуации.Моделирование проводилось на поперечных, догонных и встречныхкурсах.
Соответствующие начальные условия (1,2,3) даны в табл. 7.1.Параметры моделирования: Tmod = 7,5 c – время моделирования,шаг = 0,01с, точность = 0,01, n1 = [015] , n2=[0…8] ,γ c1 и γ c 2 ∈ [ −π; π] ,V1 = 700 , V2 = 500 .Та блица 7 .1Н ач а ль ные ус ло в ия1X1Y1Z1Θ1Ψ1X2Y2Z2Θ2Ψ202000100010101000200015004510Глава 7. Программно-корректируемое позиционное управление325Про дол жени е таб л. 7 .12100020005010102200200050101031000200050101060005005010170Результаты оптимизации антагонистического варианта ( α = β = 1) даны в табл. 7.2.Р ез ул ьт а ты о пт им из а ции ( α = β = 1 )Та блица 7 .2№αβJτ1+γ c1τ2+γc2111103,11203,311021133,8874,28331114,56,21546,381На рис.
7.41 дана динамика оптимальных по Нэшу значений показателей в зависимости от степени одновременного ухода от антагонизма.Как следует из рис. 7.41, при степени конфликтности в пределах от1 до 0,7 антагонистическое ядро сохраняет свою значимость, так какпромах при исходных малых значениях изменяется в 1,5–2 раза.
Поэтому применение антагонистических оптимальных структур управления в бескоалиционном конфликте правомерно. Кроме того, уход отоптимального значения ядра промаха в допустимых пределах позволяетбольше чем в два раза увеличить оптимальное время перехвата цели,что очень важно при быстроменяющейся ситуации с парной поддержкой в звене ЛА.В режиме одновременного ухода соответственно на рис.
7.42 даны результаты по СТЭК на основе Парето–Нэш-подхода для поперечных, догонных, встречных начальных положениях с одновременным и поочередным уходом соответственно. При этом результаты имеют аббревиатуру« mnk », что означает:m – номер исходных данных в табл. 7.1;n – «уход» P от антагонизма с вариантами α =1; 0,9; 0, 7; 0,3 , которые обозначены 0, 1, 2, 3 соответственно;k – соответствует аналогичному «уходу» цели.Так рис. 7.42 показывает, что при одновременном «уходе» от антагонизма на догонном курсе значительный одинаковый уход обоих ЛАα = β = 0,3 (mnk = 233) делает Нэш-решение наимение эффективным иприводит к большим потерям обоих ЛА. При уходе α = β = 0,9 ; 0,7 точкаравновесия в 2–3 раза ближе к эффективному пределу, хотя по энергетиче-Задачи управления двухкоалиционными ММС.
Часть II326ским и временным показателям получено улучшение по сравнению с антагонизмом.1J11J11303020201010260 J124020J11J1120201010040203J1160 J1230J113025252020151510203456 J 224567 J 22104060перехватчик80100 J12678J 22цельРис. 7.41. Результаты оптимизации при одновременном уходе Р и Еот антагонизма ( Dc = α = β )Таким образом, данные материалы позволяют проанализировать тригруппы факторов: настройку управления, точностную оптимальность Нэшравновесия в зависимости от временных, энергетических затрат и степениконфликтности и, наконец, относительную эффективность Нэш-решений(относительно Парето-границы) в зависимости от начальных взаимоположений, степени конфликтности и уходов от антагонизма.В заключение п.
7.5 можно утверждать, что при сохранении значимости антагонистического ядра могут быть получены практически по-Глава 7. Программно-корректируемое позиционное управление327лезные решения дифференциальной игры двух объектов с векторнымипоказателями на основе принципа экстремального направленияН.Н. Красовского.2110− J 2i ,0−0,05− N 0,0 −0,10− J 2i ,1− N1,00,050,01J 1i ,0 , N 0,1− N 2,00,152220−0,1−0, 2−0,3−0, 4НП0,10, 2J 1i ,1 , N1,00− J 2i ,2НП0−0,50,3233НП−1,50,02 0,04 0,06J 1i ,2 , N 2,00,080,1Рис. 7.42.
Анализ эффективности стабильных решенийЗадачи управления двухкоалиционными ММС. Часть II328ГЛАВА 8СТОХАСТИЧЕСКАЯ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНАЯ МОДЕЛЬСТАБИЛЬНОГО АНТАГОНИСТИЧЕСКОГО КОНФЛИКТАВ ДВУХКОАЛИЦИОННЫХ ММС В УСЛОВИЯХ ε -РАВНОВЕСИЯНА ОСНОВЕ КОМБИНАЦИИ ФИЛЬТРАЦИИ И УПРАВЛЕНИЯС УЧЕТОМ ОГРАНИЧЕНИЯ ПРОМЕЖУТОЧНЫХ КООРДИНАТ,ПРОТОТИПА, ЗАДАННОЙ ЧАСТИ МОДЕЛИ, ПОМЕХ8.1. ОСНОВНЫЕ ПОНЯТИЯ, СРАВНИТЕЛЬНЫЙ АНАЛИЗ РАБОТИ МАКСИМИННАЯ ПОСТАНОВКА ЗАДАЧИ СБЛИЖЕНИЯ-УКЛОНЕНИЯПОЗИЦИОННО- (Р) И ПРОГРАММНО-УПРАВЛЯЕМОГО (Q) ОБЪЕКТОВС ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНОЙ МОДЕЛЬЮ,АДЕКВАТНОЙ РЕАЛЬНЫМ СИСТЕМАМ8.1.1.Общая характеристика подхода, формализацияи сравнительный анализ позиционно-программных задачсближения-уклоненияВ данной главе в качестве основного рассматривается максиминный вариант задачи сближения-уклонения программно-управляемого уклоняющегося объекта Q и позиционно-управляемого объекта Р, который при наличии ε-равновесия (см.
8.5), кроме гарантированного решения для Q, позволяет оценивать оптимальное решение для Р более простым способом, чемминимаксный. Излагается разработанный метод оценки эффективности ипоиска оптимального (гарантирующего) управления (стратегии) и оценкиоптимальной СУ объекта Q в условиях антагонизма и частичной неопределенности описания СУ объекта Р при аддитивных и мультипликативныхпомехах в его каналах измерения [26, 27, 54, 60, 63 – 65, 413] и др.В зависимости от класса стратегий, в котором ищется «наихудшая»стратегия объекта Р, необходимая для нахождения оптимальной гаранти-Глава 8. Стохастическая интегро-дифференц. модель конфликта329рующей стратегии объекта Q, укрупненно возможны два подхода к рассматриваемой задаче.
Наиболее естественным путем является поиск«наихудшей» стратегии объекта Р в классе стратегий, использующих длясвоего построения «зашумленную» информацию о координатах объекта Q,которая доступна каналам измерения объекта Р. Второй подход связан споиском «наихудшей» стратегии объекта Р в классе стратегий, использующих для своего построения «бесшумную» информацию об объекте Q.Ясно, что такая информация недоступна фактически объекту Р и для реализации стратегии необходимо использовать процедуру получения качественной оценки информации об объекте Q.
Для гарантирующей стратегииобъекта Q допущение о «бесшумности» информации, используемой дляпостроения стратегии объекта Р, естественно становится одним из элементов этой гарантированности. Таким образом, в задачу вносится еще одинэлемент гарантированности – допущение о возможности использованияобъектом Р для построения своей стратегии «идеальной» информации[195] об объекте Q, т.е. «бесшумной» информации на весь интервал времени противодействия вперед. В рамках дополнительного элемента гарантированности формируются также методы исследования гарантирующихфильтров [27, 117].В процессе решения основной задачи обеспечивается адекватность используемых моделей объекта Р реальным объектам.
Прежде всего имеетсяв виду учет специфики теле- и самонаводящихся объектов, опорного режима, кинематических связей в объекте, ограничения сложности его стратегий. Момент времени окончания операции всюду фиксирован, но показана возможность содержательно расширить постановку задачи путем отказа от фиксации момента времени окончания операции tk без выхода зарамки основного содержания развиваемого метода поиска оптимальных(гарантирующих) стратегий 1.Учет мультипликативных и аддитивных помех в каналах измеренияобъекта является актуальным для рассматриваемых прикладных задач [23,192]. Условия близости максиминного гарантированного результата для Qи минимаксного гарантированного результата для Р (существование εравновесия) позволяют, во-первых, увеличить гарантированное значениеэффективности Q (как известно, max min J ≤ min max J ), во-вторых, использовать для получения оценки гарантирующей стратегии Р более простой алгоритм точного решения для Р из максиминной задачи по сравнению с более сложным алгоритмом приближенного минимаксного решениядля Р [3]).1В работе показана возможность сведения общих структурных схем теле- и самонаводящихся объектов к схеме, содержащей указанные элементы, причем эти элементы определены для различных систем координат и составов измерений (см.
8.1.2).Задачи управления двухкоалиционными ММС. Часть II330При формализации игровой обстановки полагается, что исследователюдоступно объективное описание этой обстановки, т.е. полагается, что исследователь знает модели игроков, их критерии эффективности, ограничения и т.д. В общепринятом формализме исследователь знает описание антагонистической игры в нормальной форме с полной информацией:Г=Q, K2 =P, U ⊂ ∏ U K , ∑ E K ( u ) =0 ,(8.1) K1 =КKгде K1 , K 2 – множество коалиций, U K – множество стратегий K-й коалиции, U – множество ситуаций,∑ ЕK ( u ) = 0– нулевая сумма показателейКпри антагонизме, EK ( u ) – вещественнозначный стохастический функционал выигрыша k-го игрока, u ∈ U .Полагается, чтоu ∈Uu1 u 2 , еслиK( )( )EK u1 > EK u 2 , и для любогоEQ ( u ) =EP ( u ) =E .
Состояния игроков Q и Р описываются с по-мощью вектора состояния x ∈ X , где X – конечномерное евклидово пространство состояний (позиций). Игроки задаются отображениемϕ qp : U → T × X , где Т –множество моментов времени, а само отображение задается с помощью системы дифференциальных уравнений:x = f ( K ( x, t ) , u q ( x, t ) , x, t ) .(8.2)Здесь K ( x, t ) ∈ U p , u q ( x, t ) ∈ U q , x ( t0 ) =x 0 , t ∈ [t0 , T ] .Кроме данного описания игры для нахождения оптимальных стратегийв игре необходимо решить проблему выбора и обоснования принципа оптимальности.