Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 31
Текст из файла (страница 31)
Если начало координат попадает внутрь области ОД, то не существуеткасательных гиперплоскостей, проходящих через начало координат, и решение отсутствует.ДляреализацииалгоритмаприменяетсяметодмоментовН.Н. Красовского [129], так как он апеллирует к ОД и позволяет найтинормали ℓ касательных к ОД гиперплоскостей.Теорема 4.3 [50]. Оптимальное управление, приводящее траекториюξ j (t ) системы(4.42)ξ (t ) =A ⋅ ξ (t ) + B ⋅ u , ξ (t ) =0jjjjj0в точку касания ОД и гиперплоскости, а также вектор нормали ℓ в точкекасания определяются при решении задачиГлава 4.
Стабильные коалиционные решения в ММС на основе УКУ157Tmin max ∫ T ⋅ X (T , t) ⋅ B j ⋅ u j ( t ) ⋅ d t =0 , =1uj(4.43)t0где X ( T , τ ) – матрица фундаментальных решений системы (матрица перехода): x11 (T , t ) x1n (T , t ) .X (T , t ) = xn1 (T , t ) xnn (T , t ) (4.44)До к аз ат е льс тво . Н а основании необходимых и достаточных условий разрешимости задачи об управлении [129, стр. 381], сформулированной в [129] в форме проблемы моментов, область достижимости имеет вид({}max T ⋅ q − T ⋅ ξ 0 (t , ξ0 , T ) =1m)− ρ T ⋅ {X (T , t )}m ≤ 0 ,(4.45)где q ∈ G – ограниченное, выпуклое, замкнутое множество ОД,T=ξ 0 X (T , t0 ) ⋅ ξ0 + ∫ X (T , t) ⋅ f ( t) ⋅ d t ,t0ξ0 – начальные условия, f ( τ) – возмущение, приложенное к системе(4.42), ℓ – некоторый вектор z = {li } , m – размерность G в позиционной задаче управления (m – размерность позиции),Tρ T ⋅ {X (T=, t )}m max ∫ T ⋅ {X (T , t)}m ⋅ B j ⋅ u j ( t ) ⋅ d t .uj(4.46)t0Для каждой точки q, лежащей на границе области G, условие (45) выполняется со знаком равенства.Минимизация (4.46) позволяет получить управление, переводящее систему (4.42) из начального состояния в некоторую точку границы G.Вектор нормали ℓ = ℓ0 к гиперплоскости, проведенной в точку касания,определяется из условия максимума равенства в выражении (4.45).Совместное решение этих задач [129, стр.
385] позволяет получитьуравнение гиперплоскости (рис. 4.3)0T ⋅ q − 0T ⋅ ξ 0 − ρ ⋅ 0T ⋅ {X ( T , t )}m = 0T ⋅ q − σ= 0 .mВ данной задаче ξ ( t0=0 , возмущение f (t ) не учитывается, по) ξ=0{ }этому ξ 0 = 0 .158Стабильные эффективные решения и компромиссы. Часть Iξ2Tl0 ⋅ q − σ =0Tl0 ⋅ q − σ > 0m=2Gξξ1Рис. 4.3.
Касательная гиперплоскость к G ξВ достаточных условиях рассматриваются лишь касательные гиперплоскости, проходящие через начало координат (рис. 4.2). Поэтому σ =0и 0T ⋅ q =0.Следовательно, выражение (4.45) для точек границы G принимает вид)(max −ρ T ⋅ {X (T , t )}m = 0 . =1Раскрывая, при полной позиции m = n получимTmax(-=ρ ) min=ρ min max ∫ T ⋅ X (T , t) ⋅ B j ⋅ u j ( t ) ⋅=dt 0 , 1= 1 =1 =ujt0что и требовалось доказать.В соответствии с полученными результатами общая структура этапа 2метода оптимизации управлений на основе объединения модифицированных достаточных условий ЛУКУ (МДУ ЛУКУ) и метода моментовН.Н.
Красовского можно представить итерационным процессом, основойкоторого являются следующие шесть шагов:Ша г 1 : приведение исходной постановки к виду (4.34) – (4.38);Ша г 2 : формирование системы неравенств (4.39) (МДУ ЛУКУ);Ша г 3 : итерация 1: задание начальных приближений u0 и «ячейки»U допустимых значений u ∈ U на основе сетевых решений этапа 1;итерация i > 1: формирование текущих приближений u0 ∈ U ;Ша г 4 : формирование системы (4.42) (A, B, X(T,t)) на основе приближений u0 ∈ U ; решение задачи (4.43) для определения границ конусовнормалей Con ℓ (рис.
4.2), удовлетворяющих МДУ ЛУКУ:���� I 0 II ; − II 0 − I − IV 0 − III ; − II 0 III ,Глава 4. Стабильные коалиционные решения в ММС на основе УКУ159а также соответствующих конусов Con ξ , образованных векторамиξK (T ), ξ N / K (T ) касательных к ОД ξ ;Ша г 5 : решение задачи Парето–оптимизации u ∈ U (или Ωоптимизации) для набора коалиций K и N/K на множестве U , начальныхили текущих приближениях u0 ∈ U и дополнительных ограничениях,сформированных на шаге 4 в одном из двух видах: – u0 ∈ Con ; –u0 ∈ Con ξ , т.е.
удовлетворяют системе неравенств (4.39) МДУ ЛУКУ приξK (T ) и ξ N / K (T ) – векторах касательных, соответствующих ОД ξ и являющихся границами множеств Con ξ ;Ша г 6 : а) задача решена, если управление u0 ∈ U оптимизирует (экстремизирует) набор ΦΦK,N / K внутри «ячейки» U сети при удовлетворении неравенств МДУ ЛУКУ; б) если ограничения не выполняются, товозвращаемся к шагу 3 на итерации i > 1.Итерация 1Шаг 1Шаг 2Итерация iШаг 3Шаг 4Шаг 5Шаг 6ОкончаниеРис. 4.4. Итерационная процедура 2-го этапаСтруктурная схема алгоритма в обобщенном виде приведена нарис.
4.4.Стабильные эффективные решения и компромиссы. Часть I1604.5. ПРИМЕНЕНИЕ ДВУХЭТАПНОГО МЕТОДА ПОЛУЧЕНИЯУКУ-ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПРОГНОЗОМ ДИНАМИКИ КОНФЛИКТАЛС СВН – ЛС ПВО4.5.1.Постановка задачиРассмотрим этап задачи противодействия локальной системы воздушного нападения (ЛС СВН) и локальной системы ПВО (ЛС ПВО) [173].Противодействие ЛС СВН – ЛС ПВО состоит в том, что ЛС СВН стремится преодолеть ЛС ПВО для поражения защищаемого объекта, а ЛС ПВОпрепятствует прорыву.Задача получения программно-корректируемого закона управления активными средствами при взаимодействии ЛС СВН–ЛС ПВО представляетсобой итерационную процедуру, на каждой итерации которой выполняются четыре шага [54]:Ша г 1. формирование конфигурации конфликта;Ша г 2 .
ц елераспределение АС СВН и ПВО по активным и пассивнымсредствам ПВО и СВН соответственно;Ша г 3. имитация конфликта;Ша г 4. прогнозирование динамики конфликта.Далее рассматривается упрощенный вариант последнего шага прогнозадинамики конфликта (полное исследование задачи дано в главе 10).1 − q1q1ЛС СВНПСАСАСПСX2X1X3X4ЛС ПВОq21 − q2Система АСистема БРис. 4.5. Структура взаимодействия в ММС:АС – совокупность активных средств коалиции,ПС – совокупность пассивных средств коалицииГлава 4.
Стабильные коалиционные решения в ММС на основе УКУ161В данной задаче естественным является поиск таких режимов функционирования ЛС СВН – ЛС ПВО, которые были бы конфликтнооптимальными.Каждая система состоит из двух подсистем: активной и пассивной. Активные средства каждой коалиции воздействуют на активные и пассивныесредства противоположной коалиции.
Для ЛС СВН активными средствамиявляются истребители-перехватчики с ракетами «воздух-земля» и противорадиолокационными ракетами, а для ЛС ПВО – зенитно-ракетные комплексы. Пассивные средства для ЛС СВН – бомбардировщики, для ЛСПВО – радиолокационные станции [173].На рис. 4.5 приведена структура взаимодействия сторон.Система задается следующим образом:− P31 ⋅ q2 ⋅ x3 ⋅ R( x1 ) x1 = – система А; x2 =− P32 ⋅ (1 − q2 ) ⋅ x3 ⋅ R( x2 ) (4.47)− P13 ⋅ q1 ⋅ x1 ⋅ R( x3 ) x3 =– система Б, x =− P ⋅ (1 − q ) ⋅ x ⋅ R( x ) 14114 4где P ij – эффективность воздействия одного объекта i-го вида одной системы на один объект j-го типа другой системы, 0 ≤ Pij ≤ 1 ; q i – доли активных средств воздействия на активные средства партнера, 0 ≤ qi ≤ 1 ; (1 –q i ) – доля активных средств воздействия на пассивные средства партнера;x i – текущая средняя численность объектов i-го типа. xi , xi ≤ 1;R(xi ) = 1, xi > 1.Рассмотрим данную систему в пошаговом варианте.
Шаг – конечныйинтервал времени; число шагов конечно ( k = 1, r ). Каждое активное средство делает на шаге один ход.TШаг равен ∆T = .rВ пошаговом варианте система (4.16) преобразуется в систему:= x1 ( k ) − P31 ⋅ q2 ⋅ x3 ( k ) ⋅ R( x1 ),x1 ( k + 1)x2 ( k + =1) x2 ( k ) − P32 ⋅ (1 − q2 ) ⋅ x3 ( k ) ⋅ R( x2 ), (4.48)= x3 ( k ) − P13 ⋅ q1 ⋅ x1 ( k ) ⋅ R( x3 ),x3 ( k + 1)x4 ( k + =1) x4 ( k ) − P14 ⋅ (1 − q1 ) ⋅ x1 ( k ) ⋅ R( x4 ). Здесь k = 1, 2,..., 0 ≤ q i ≤ 1 (i = 1,2), 0 ≤ P ij ≤ 1 (i = 1,3; j = 1,2,3,4); x i > 0,x i (k) – численность к началу k-го шага.В качестве показателя терминальных потерь (J) выберем показатель,имеющий смысл суммарного перевеса по активным и пассивным средствам и скорости убывания активных средств «партнера».162Стабильные эффективные решения и компромиссы.
Часть ITJ A = α11 ⋅ x32 ( T ) − x12 ( T ) + α12 ⋅ x42 ( T ) − x22 ( T ) + α13 ⋅ ∫ x3 ⋅ dt; t0 (4.49)T2222J Б = α21 ⋅ x1 ( T ) − x3 ( T ) + α22 ⋅ x2 ( T ) − x4 ( T ) + α23 ⋅ ∫ x1 ⋅ dt; 0J А ⇒ min; J Б ⇒ min.J А – показатель потерь коалиции А. Чем меньше J А , тем больше выигрыш коалиции А; J Б – показатель потерь коалиции Б.
Чем меньше J Б , тембольше выигрыш коалиции Б; α ij – весовые коэффициенты, определяющиецелевой приоритет каждой стороны в поражении активных или пассивныхсредств противоположной стороны (терминальная составляющая) или вувеличении интегральной скорости убывания активных средств противника (интегральная составляющая). (0 ≤ α ij ≤ 1; α i1 + α i2 + α i3 = 1; i = {1,2}),значения коэффициентов задаются в зависимости от тактики каждой изсторон.4.5.2.Применение сетевого подхода для полученияначального приближения УКУПолучение начального приближения УКУ.