Пупков К.А., Коньков В.Г. Интеллектуальные системы (1-е изд., 2001) (1245264), страница 15
Текст из файла (страница 15)
21)0является алгоритмической основой для получения u (t ) из достаточныхусловий теоремы 2.Область ОД N/S ( ОД S ) может деформироваться в двух основныхнаправлениях:1. «Приближаться» к началу координат, разворачивая касательныегиперплоскости.2. «Вырождаться» в фигуру с малым конусом при вершине при уменьшенииугла между гиперплоскостями или увеличении пространственного угла конуса(lI 0 lII).Утверждение 5. При касании ОД N/S начала координат или привключении начала координат во внутреннюю точку области ОД N/S ( ОД S )задача решения не имеет.Доказательство. Действительно, при «приближении» границы ОД N/Sк началу координат касательные гиперплоскости “расходятся”, конический угол(lI 0 lII) уменьшается и в “момент” касания направление lI и lII совпадает ивнутренних точек не имеется, а, следовательно, решения нет.
Если началокоординат попадает внутрь области ОД, то не существует касательныхгиперплоскостей, проходящих через начало координат и решение отсутствует.Для реализации алгоритма применяется метод моментов Красовского Н.Н., таккак он апеллирует к ОД и позволяет найти нормали l касательных к ОДгиперплоскостей.Теорема 3. [108] Оптимальное управление, приводящее траекториюTmin max l T X (T , ) B j u j d 0 ,где X T , перехода):— матрица фундаментальных решений системы (матрица x11 (T , t ) L x1n (T , t ) .X T , t MM xn1 (T , t ) L xnn (T , t )Доказательство. На основании необходимых и достаточных условийразрешимости задачи об управлении, сформулированной в форме проблемымоментов, область достижимости имеет видmax l T q l T 0 (t , 0 , T ) m l T X (T , t )m 0 (122)l 1где q G — ограниченное, выпуклое, замкнутое множество ОД,T 0 X (T , t0 ) 0 X (T , ) f ( ) d ,t0 0 — начальные условия,f ( ) - возмущение, приложенное к системе (120),l — некоторый вектор l li ,m — размерность G в позиционной задаче управления (m — размерностьпозиции), j ( t ) системы(121)l 1 u j t0T l T X (T , t )m max l T X (T , )m B j u j d (123)& j (t ) A j (t ) B j u j , j (t0 ) 0 ,uj t0(120)49Для каждой точки q, лежащей на границе области G, условие (122) выполняетсясо знаком равенства.Минимизация (123) позволяет получить управление, переводящее систему (120)из начального состояния в некоторую точку границы G.Вектор нормали l=l0 к гиперплоскости, проведенной в точку касания,определяется из условия максимума равенства в выражении (122).Совместное решение этих задач позволяет получить уравнение гиперплоскости(рис.
22) m l 0T X T , t m l 0T q 0 .l 0T q l 0T 0В данной задаче t0 0 0 , возмущение f (t ) — не учитывается, поэтому0 0.Tmax (-) min min max l T X (T , ) B j u j d 0 ,l 1l 1l 1 u j t0что и требовалось доказать.В соответствии с полученными результатами общая структура этапа 2алгоритма оптимизации управлений на основе объединения модифицированныхдостаточных условий ЛУКУ (МДУ ЛУКУ) и метода моментов КрасовскогоН.Н. можно представить итерационным процессом, основой которого являютсяследующие шесть шагов:Шаг 1: приведение исходной постановки к виду (113)—(117);Шаг 2: формирование системы неравенств (118) (МДУ ЛУКУ);Шаг 3: итерация 1: задание начальных приближений u 0 и «ячейки» Uдопустимых значений u U на основе сетевых решений этапа 1;итерация i>1: формирование текущих приближений u 0 U ;Шаг 4: — формирование системы (120) (A, B, X(T,t)) на основе приближений2l0l0TTu0 U ;— решение задачи (121) для определения границ конусов нормалей Con l (рис.2), удовлетворяющих МДУ ЛУКУ:q 0q 0m = 2Gl I 0 l II ;l II 0 - l I I l IV 0 l III ,а1такжесоответствующихконусовCon ,образованныхвекторами S (T ), N / S (T ) касательных к ОД;Шаг 5: решение задачи Парето–оптимизации u U (или -оптимизации) длянабора коалиций Kl=S и K=N/S на множестве U , начальных или текущихРис.
22приближениях u 0 U и дополнительных ограничениях, сформированных наВ достаточных условиях рассматриваются лишь касательныегиперплоскости, проходящие через начало координат (рис. 18). Поэтому 0шаге 4 в одном из двух видах: – u 0 Con l ; – u 0 Con , то естьи l 0T q 0 .Следовательно, выражение (122) для точек границы G принимает вид max l T X (T , t )m 0 .l 1Раскрывая, при полной позиции m=n получимудовлетворяют системе неравенств (118) МДУ ЛУКУ при S (T ) и N / S (T ) —векторах касательных соответствующих ОДи являющихся границамимножеств Con ;Шаг 6: а) задача решена, если управление u 0 Uоптимизируетвнутри «ячейки» Uсети при(экстремизирует) набор S , N / Sудовлетворении неравенств МДУ ЛУКУ; б) если ограничения не выполняются,то возвращаемся к шагу 3 на итерации i>1.Структурная схема алгоритма в обобщенном виде ниже:50И т е р а ц и яШа г1Ша г2Ша г3Ша г4Ша г5Ша г61 x&1 P31 q2 x3 R( x1 ) – система А& x2 P32 (1 q2 ) x3 R( x2 ) , x&3 P13 q1 x1 R ( x3 ) x& P (1 q ) x R( x ) – система Б14114 41-q1q1ЛС СВНО к о н ч а н и еПрименение двухэтапного алгоритма оптимального управлениядля прогноза динамики конфликта локальных систем воздушногонападенияипротивовоздушнойобороны.Рассмотримзадачупротиводействия локальной системы воздушного нападения (ЛС СВН) илокальной системы ПВО (ЛС ПВО) [35], состоящего в том, что ЛС СВНстремится преодолеть ЛС ПВО для поражения защищаемого объекта, а ЛС ПВОпрепятствует прорыву.
Задача получения программно-корректируемого законауправления активными средствами при взаимодействии ЛС СВН-ЛС ПВОпредставляет собой итерационную процедуру, на каждой итерации которойвыполняются: формирование конфигурации конфликта; целераспределениеактивных средств (АС) СВН и ПВО по активным и пассивным средствам (ПС)ПВО и СВН; имитация конфликта; прогнозирование его динамики.В дальнейшем будем рассматривать задачу только на последнем шаге:прогнозе динамики конфликта. В данной задаче находят такие режимуфункционирования ЛС СВН-ЛС ПВО, которые были бы конфликтнооптимальными.Каждая система состоит из двух подсистем: активной и пассивной.Активные средства каждой коалиции воздействуют на активные и пассивныесредства противоположной коалиции. Для ЛС СВН [35] активными средствамислужатистребители-перехватчикисракетами«воздух-земля»ипротиворадиолокационными ракетами, а для ЛС ПВО [35] - зенитно-ракетныекомплексы.
Пассивные средства для ЛС СВН - бомбардировщики, для ЛС ПВО- радиолокационные станции.На рис. 23 приведена структура взаимодействия сторон, где АС и ПС совокупности активных и пассивных средств коалиции.Система задается следующим образом:ПСАСАСПСX2X1X3X4ЛС ПВОq21-q2Система АСистема БРис. 23 Структура взаимодействия в ММС.Pij — эффективность воздействия одного объекта i-го вида одной системы наодин объект j-го типа другой системы, 0 Pij 1 .qi — доли активных средств воздействия на активные средства партнера,0 qi 1 :(1-qi) — доля активных средств воздействия на пассивные средства партнера.xi — текущая средняя численность объектов i-го типа. xi , xi 1R(xi )= .1, x i 1Рассмотрим данную систему в пошаговом варианте. Шаг - конечный интервалвремени; число шагов конечно (К = 1, 2,..., r).
Каждое активное средство делаетна шаге один ход.TШаг T .r51В пошаговом варианте система преобразуется в систему:На шаге 1 алгоритма формируется двухмерная равномернаяортогональная сеть.На шагах 2-8 формируется множество УКУ-оптимальных сетевыхрешений, которые можно использовать в качестве начальных приближений дляэтапа 2 получения оптимального управления ММС. Структура алгоритма (шаги2-8) приведена на рис. 24.x1(K+1 )=x1(K)-P31 q2 x3(K) R(x1 )x2(K+1 )=x2(K)-P32 ( 1-q2 ) x3(K) R(x2 )x3(K+1 )=x3(K)-P13 q1 x1(K) R(x3 )x4(K+1 )=x4(K)-P14 ( 1-q1 ) x1(K) R(x4 ) Н ач ал ош аг 2Здесь: K = 1, 2, ..., 0qi1 (i=1,2), 0Pij1 (i=1,3; j=1,2,3,4) xi >0, xi(k) –численность к началу k–того шага.В качестве показателя терминальных потерь (J) выберем показатель, имеющийсмысл суммарного перевеса по активным и пассивным средствам и скоростиубывания активных средств “партнера”.J A=11 x32 T x12 T +12 x42 T x22 T 13 x3 dt t0T2222J Б= 21 x1 T x3 T + 22 x2 T x4 T 23 x1 dt 0TJА min; JБ min.JА — показатель потерь коалиции А.
Чем меньше JА, тем больше выигрышкоалиции А.JБ — показатель потерь коалиции Б. Чем меньше JБ, тем больше выигрышкоалиции Б.ij — весовые коэффициенты, определяющие целевой приоритет каждойстороны в поражении активных или пассивных средств противоположнойстороны (терминальная составляющая) или в увеличении интегральнойскорости убывания активных средств противника (интегральная составляющая).(0 ij 1; i1 + i2 + i3=1; i = {1,2}), значения коэффициентов задаются взависимости от тактики каждой из сторонПрименение сетевого подхода для получения начальногоприближения УКУ.