Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 27
Текст из файла (страница 27)
Стабильные и эффективные оптимальные решения131ется на интервале [t j-1 ,t j ]. После этого повторяется процедура поиска вектора оптимальных параметров для следующих интервалов. При этомначальные условия для вектора состояния динамической системы на всехпоследующих интервалах выбираются из условия:x 0j = x kj−1 ,где x 0j – начальные условия вектора состояния системы на интервале[t j ,t j+1 ], j = 1, n ; x kj−1 – конечное значение вектора состояния системы на интервале [t j-1 ,t j ], j = 1, n .3.4.2.Анализ эффективности коалиционного перехватаподвижной целиВыбор плотности параметрической сети и точности определения векторного равновесия (ВР) для анализа эффективности ММС. При поискеВР-точек на области параметров Q используется «сеть» размерности nq игустоты l (см. рис.
3.1).Густота сети l неявно характеризует точность определения области показателей I в целом, а также Парето-множества и ВР-точек в частности.Помимо этого густота сети и размерность области Q напрямую связаны синтервалом времени оптимизации, поэтому уменьшение шага сети ведет кзначительному увеличению времени поиска обобщенного равновесия, таккак количество областей локальной оптимизации («ячеек сети») определяется из выраженияnqqHi − qLi(3.69)∏ l ,ii =1где nq – размерность области параметров Q; l i – густота сети по i-й координате; qHi , qLi – верхняя и нижняя границы i-го компонента вектора параметров на области Q.J1maxJ1min00J 2 minJ 2 maxJ3J3J 3minJ 3min−J3Рис.
3.7. Отображение сети пространства параметров на пространство показателейСтабильные эффективные решения и компромиссы. Часть I132На рис. 3.7 и рис. 3.8 даны допустимая область пространства показателей для разной плотности сети параметров на пространстве параметров Q.J1maxJ1min00J3J 2 minJ 2 maxJ3J 3minJ 3min−J3Рис. 3.8. Отображение сети пространства параметров на пространство показателейТа блица 3 .1Вар и а нт ы «с е те й» з наче ний п ар аме тровПараметрДиапазон измененияqLqHРис. 3.7Рис. 3.8Количество интерваловn1, ед.–383γ1– 606011n2 , ед.–3835γ 2– 606011n3 , ед.–1523γ 3– 3030Число «ячеек» в сети5113245625Из рисунков видно, что более густая сеть точнее отображает всю область пространства показателей.
Однако нас интересует не вся область, атолько ее часть – Парето-множество и точки векторного Нэш-равновесия.А их с достаточной точностью можно определить и при менее густой сети,выиграв при этом во времени поиска решения. Так, оптимизация на сетииз 324 «ячеек» выполняется в 17 раз быстрее, чем на сети из 5625 ячеек.Анализ эффективности перехвата для догонных, поперечных ивстречных курсов. В программной реализации алгоритма векторнойНэш-оптимизации (ВНО) рассматривается случай коалиционного перехвата цели (типа бомбардировщик F-111) двумя высокоманевренными летательными аппаратами (типа МиГ-21) в режиме ближнего наведения перехватчиков.Расчет динамики конфликта проводился в [54] при следующих конфигурациях коалиций: перехват истребителями-перехватчиками цели «вдогон» (а), на поперечных (б) и встречных (в) курсах (рис.
3.9).Глава 3. Стабильные и эффективные оптимальные решенияYДИП1ИП2ЦZДвбаYДZДXДYДИП1ИП2133ИП1ИП2ЦЦZДXДXДРис. 3.9. Начальные конфигурации коалицийИсходные данные и диапазоны изменения параметров для указанныхконфигураций приведены в соответствующих таблицах (см. табл. 3.2, –табл. 3.4).Та блица 3 .2Н ач а ль ные ус ло в ияКонфигурацияИП 1ИП 2АБВАБВАБВЦельθ00000Ψ000– 90180XД, мYД , мZД, м0050005000500032003200200020002000– 5050000З нач е ния па рам е тров-к онс та нт№ПараметрЗначение1V1, м/с6002V2 , м/с6003V3 , м/с3004Rmax , м20005Rmin , м506λ117λ218λ39g , м/сТа блица 3 .319,8Та блица 3 .4Д иа па зо ны изм е нения о пт им из ир уе мых пар аметров№ПараметрqLqH1n1, ед.–3+82n2 , ед.–3+83n3 , ед.– 1… – 3+5Стабильные эффективные решения и компромиссы. Часть I134Про дол жени е таб л.
3 .44γ1– 60+605γ 2– 60+606γ 3– 30+30Для всех исходных конфигураций коалиций были получены параметризованные программно-корректируемые законы управления для интервалов времени (где T определяется из условия сближения центра коалицииперехватчиков и цели на минимальное расстояние) в соответствии с алгоритмом, изложенным в пункте 3.3.Перехват на догонных курсах.− n12,34t = 12,9t = 8,6t = 17,21,780,44γ1− n2t−2,29−5,27−8,92t2,723,12γ22,28t2,340,51t− n3−3,212,421,47γ32,30,89−0,96tt−1,23Рис.
3.10. Вариант временной реализации закона управления ЛА на догонных курсахНа рис. 3.11 и рис. 3.12 представлены области допустимых значенийпоказателей эффективности системы для интервалов времени [0,T] и[t 1 ,T] (n = 2), где t 1 = 8,6 сек; T = 17,2 сек. На этих же рисунках отображены множества Нэш-равновесных точек. Из полученных результатоввидно, что при сближении перехватчиков с целью происходит уточнениезакона управления, так как при данных условиях перехвата и малых вре-Глава 3. Стабильные и эффективные оптимальные решения135менах у цели остается меньше вариантов маневра для ухода от перехватчиков.
Данный результат объясняется тем, что при перехвате на догонных курсах цель всегда будет находиться в области достижимости коалиции перехвата.00J1maxJ 2 maxJ=J=01min2 minJ3J3J 3minJ 3min−J3Рис. 3.11. Область показателей на догонных курсах для t∈[0,T]00J1maxJ 2 maxJ3J3J 3minJ 3min−J3Рис. 3.12. Область показателей на догонных курсах для t∈[t 1 ,T](белая звездочка – СТЭК)На рис. 3.13 представлены траектории движения летательных аппаратов для оптимального программно-корректируемого закона управления, ана рис. 3.10 представлены законы управления для каждого летательногоаппарата.Стабильные эффективные решения и компромиссы.
Часть I136YДYДИП1ИП2ЦКЦ00XДЦентр коалиции ИП (ЦК)ZДρ1 =23 м;ИП1ρ2 =40 м;ρ3 =10 м0ИП2ЦXДZДРис. 3.13. Приближенный характер траекторий ЛА на догонных курсах3.5. ЭЛЕМЕНТЫ ПОВЫШЕНИЯ БЫСТРОДЕЙСТВИЯ СИСТЕМЫАнализ эффективности коалиционного алгоритма перехвата на основевекторного равновесия показал, что время расчета ПКЗУ превышает времявзаимодействия, поэтому необходимо увеличение быстродействия системы с целью приблизить такт выдачи управлений к реальному.При дополнительном изучении поставленной задачи и разработанногоалгоритма было выявлено несколько наиболее значимых, с точки зрениябыстродействия, путей ускорения данного метода оптимизации управления в рамках рассмотренного примера.3.5.1.Получение аналитического решения системы (3.50)Одной из наиболее трудоемких и многократно циклическиповторяемых в данном алгоритме является процедура моделирования(численного интегрирования системы (3.50) 5-го порядка методом Рунге–Кутта).
Используя современные программные продукты (пакет символьных вычислений и преобразований MAPLE 5.04) удалось найти аналитическое решение данной системы (см. выше) в виде суммы ряда: θ(t , x0 , y0 , z0 , θ0 , Y 0 , n, γ ) = a0 + a1t + a2t 2 + a3t 3 + ... + o();23 Y (t , x0 , y0 , z0 , θ0 , Y 0 , n, γ ) = b0 + b1t + b2t + b3t + ... + o();23 X (t , x0 , y0 , z0 , θ0 , Y 0 , n, γ ) = c0 + c1t + c2t + c3t + ... + o();23Y (t , x0 , y0 , z0 , θ0 , Y 0 , n, γ )= d 0 + d1t + d 2t + d 3t + ...
+ o();23 Z (t , x , y , z , θ , Y , n, γ )= γγ0 0 0 000 + 1t + γ 2 t + γ 3t + ... + o(),где a i , b i , c i , d i , g i – сложные выражения специального вида.Глава 3. Стабильные и эффективные оптимальные решения3.5.2.137Выбор области начальных приближенийна основе минимаксного подходаВо многих задачах группового противодействия часто бывает возможным выделить главные объекты коалиций (лидеры).
Остальные объектыкоалиций выбирают свои параметры управления уже с учетом выбранныхуправлений главным объектом. Такая ситуация имеет место и в примере,где в качестве лидеров выступают цель и один из перехватчиков (ведущий). Взаимодействие «ведущий–ведомый» внутри звена легко учесть,введя понятие «конуса доминирования» для коалиции истребителейперехватчиков. При малых λ для ведущего и цели можно рассмотреть ситуацию J1 = ρ2 , J 3 = −ρ2 , где ρ = ρ12 .Такое чисто антагонистическое противодействие может рассматриваться с позиции минимаксного подхода.Были построены области значений показателя для ведущего (рис. 3.14)и для цели (рис. 3.15). Каждое вертикальное сечение областей представляет собой область достижимости показателей ведущего (рис.
3.14) или цели(рис. 3.15), полученную на диапазоне изменений собственных параметровпри фиксированных параметрах «партнера». Поэтому на рис. 3.14, 3.15 получена динамика областей достижимости ведущего и цели соответственнов зависимости от параметров «партнера».Анализ области показателя ведущего (см. рис. 3.14) при переборе параметров управлений цели показал, что среди параметров имеются заведомо худшие решения, которые не имеет смысла рассматривать при поиске векторного равновесия.6000ρ2500040003000ρ02�2000γ 3 ≤ 301000−1 ≤ n3 ≤ 50∆γ, ∆n3Рис. 3.14. Область достижимости показателя ведущего138Стабильные эффективные решения и компромиссы.
Часть Iρ2600050004000ρ0230002000γ1 ≤ 60−3 ≤ n1 ≤ 810000∆γ1 , ∆n1Рис. 3.15. Область достижимости показателя целиКак видно из рис. 3.14 и 3.15, области показателей перехватчика и целивыпуклы и имеют единственную точку равновесия (оптимальную как дляперехватчика, так и для цели):min {max J1} = max {min J1} = ρ02 .Данный метод позволил уменьшить сеть начальных приближений повектору параметров. Был выбран достаточный диапазон изменения параметров, который составил около 20% от модульных значений в точке равновесия.С учетом результатов, полученных в пунктах 3.5.1, 3.5.2, время вычислений алгоритмов уменьшилось в 60 раз. Некоторое повышение величиныпролета при рассмотренных приближениях алгоритма является допустимым для задачи ближнего наведения ЛА и выгодным для противника.3.5.3.Оценка эффективности параллельной реализацииПроведенные замеры времени выполнения отдельных блоков алгоритма выявили, что второй блок (поиск множества равновесных точек наячейках сети) в процентном отношении (96,9%) является наиболее трудоемким.Временная диаграмма, приведенная в табл.