Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 19
Текст из файла (страница 19)
Часть I− P31 ⋅ q2 ⋅ x3 ⋅ R ( x1 ), x1 = x =− P ⋅ (1 − q ) ⋅ x ⋅ R( x ), 232232− P13 ⋅ q1 ⋅ x1 ⋅ R ( x3 ), x3 = x4 =− P14 ⋅ (1 − q1 ) ⋅ x1 ⋅ R( x4 ),(2.50)где P ij – эффективность воздействия одного объекта i-го вида одной системы на один объект j-го типа другой системы, 0 ≤ Pij ≤ 1 (см. гл. 4); q i –доли активных средств воздействия на численность партнера, 0 ≤ qi ≤ 1 ;x i – текущая средняя численность объектов i-го типа ( xi ≥ 0 ) ; xi , xi ≤ 1;(2.51)R( xi ) = 1, xi > 1.В пошаговом варианте система (2.50) преобразуется в систему:= x1 ( k ) − P31 ⋅ q2 ⋅ x3 ( k ) ⋅ R( x1 ),x1 ( k + 1)x2 ( k + =1) x2 ( k ) − P32 ⋅ (1 − q2 ) ⋅ x3 ( k ) ⋅ R( x2 ), (2.52)= x3 ( k ) − P13 ⋅ q1 ⋅ x1 ( k ) ⋅ R( x3 ),x3 ( k + 1)x4 ( k + =1) x4 ( k ) − P14 ⋅ (1 − q1 ) ⋅ x1 ( k ) ⋅ R( x4 ).
Здесь k = 0, 1, ... , T; 0 ≤ q i ≤ 1 (i = 1, 2); 0 ≤ P ij ≤ 1, (i = 1, 3; j = 1, 2, 3, 4);( xi ≥ 0 ) .В качестве показателя терминальных потерь (J) выберем показатель,имеющий смысл суммарного терминального перевеса противника по активным и пассивным средствам и интегральной составляющей измененияактивных средствTJ A = α11 ⋅ x32 ( T ) − x12 ( T ) + α12 ⋅ x42 (T ) − x22 (T ) + α13 ⋅ ∫ x3 ⋅ dt; t0 (2.53)TJ Б = α21 ⋅ x12 (T ) − x32 (T ) + α22 ⋅ x22 (T ) − x42 (T ) + α23 ⋅ ∫ x1 ⋅ dt , 0где J А ⇒ min; J Б ⇒ min; J А – показатель потерь коалиции А. Чем меньшеJ А , тем больше выигрыш коалиции А. J Б – показатель потерь коалиции Б.Чем меньше J Б , тем больше выигрыш коалиции Б; α ij – весовые коэффициенты, определяющие целевой приоритет каждой стороны в пораженииактивных или пассивных средств противоположной стороны (терминальная составляющая) и в увеличении скорости монотонного убыванияактивных средств противника (интегральная составляющая) (0 ≤ α ij ≤ 1;α i1 + α i2 + α i3 = 1; i = {1, 2}).
Значения коэффициентов заданы в зависимости от тактики каждой из сторон.Глава 2. Модифицированный метод скалярной Нэш-оптимизации2.5.2.91Выбор начальных приближений на основе сетевыхподходов (этап 1)1-й вариант реализации сетевого подхода для выбора начальныхприближений. Воспользуемся подходом, предложенным в пункте 2.4.2, исформируем сеть параметров q 1 и q 2 с учетом ограничения на параметры.Исследовался вариант ( 20 × 20 = 400 точек и 50 × 50 = 2500 точек).
Расчеты проводились в пакете Maple 5.0. Время расчета: 9 секунд (400 точек) и50 секунд (2500 точек).Согласно принятому критериюmin[ I i (q ф || qiopt )] = min minI i (q || qi ) = εiqфqфqвыбрана точка (0,75; 0,05).2-й вариант реализации сетевого подхода для выбора начальныхприближений. Решается задача Парето-оптимизации для указанной системы. Далее, все точки полученной Парето-области проверяются на оптимальность согласно приведенному выше критерию. В частности, длячисла точек Парето-сети равным 400 Парето-область выглядит так:Та блица 2 .1П аре то-об ла с тьq10,990,980,990,910,850,830,790,54q20,250,170,0010,0080,0270,0080,0150,02Оптимальной является точка (0,79; 0,015).2.5.3.Построение оптимальных программных управлений,используемых для прогноза динамики конфликта, а такжедля уточнения Нэш-решения, полученногона третьем этапе метода Нэш-оптимизацииДанный подход может служить альтернативой третьему этапу Нэшоптимизации (градиентный метод Ермольева).
Применение спектральногометода к задаче оптимизации многообъектных многокритериальных систем на этом этапе обосновано, поскольку в качестве функционала качества рассматривается обобщенный показатель качества (сумма показателей коалиций), в остальном постановка задачи оптимизации многообъектных многокритериальных систем совпадает с постановкой задачи Нэшоптимизации, рассмотренной выше.В качестве базиса воспользуемся аппаратом блочно-импульсных функций, достаточно эффективным для решения задач оптимизации нелинейных систем высокого порядка.Стабильные эффективные решения и компромиссы.
Часть I92Для решения задачи оптимизации был использован пакет прикладныхпрограмм «МОМДИС», пакет символьных вычислений Maple 5.0, оптимизатор пакета Quattro Pro 5.0.В качестве начальных приближений функций программного управления для решения задачи спектральным методом использовались числа q 1 ,q 2 – параметры управления, полученные на втором этапе алгоритма Нэшоптимизации.Приведем результаты решения задачи оптимизации методом математического программирования.Исследования проводились в следующих направлениях (приβ ):α13 =α23 =0; α11 =α; α21 =1. Влияние соотношения весовых коэффициентов вектора показателей αij ;2. Влияние соотношения эффективности воздействия P ij .Та блица 2 .2Вл и я ние соот нош е ния в е сов ых коэ ф фицие нтовв е ктор а пок а за т еле й α i jЭкспериментq1q2J1J 1 НОВW1J 2 НОВJ2W2α73, β190,640,30– 21,5– 29,436%– 15,5– 19,626%α73, β370,660,42– 10,1– 16,360%– 7,28– 11,355%α37, β910,690,90– 3,47– 19,1450%– 4,42– 16,3268%Здесь q 1 , q 2 – параметры функции управления, полученные на этапеПао–Нэш-оптимизации; J 1 , J 2 – значения показателей качества, полученные на этапе Пао–Нэш-оптимизации; J 1 НОВ, J 2 НОВ – значения показателейкачества, полученные на третьем этапе с помощью спектрального метода;W 1 , W 2 – улучшение показателей качества в процентах.
При этом первыйэксперимент: α =0,7 ; 1 − α = 0,3 ; β =0,1 ; 1 − β = 0,9 и т.д.Та блица 2 .3Вл и я н ие соот нош е ния э ф фе кт ив нос т и воз де йст в ия P i jЭкспериментP ij = 0,8(α73, β37)P ij = 0,5(α73, β37)q1q2J1J 1 НОВW1J 2 НОВJ2W20,660,42– 10,1– 16,360%– 7,28– 11,355%0,790,27– 23,7– 27,616%– 17,3– 29,369%Графики функций координации (управления) q 1 (t), q 2 (t), графики изменения численностей активных и пассивных средств коалиций x i (t) представлены на рис. 2.3 – 2.6.Глава 2. Модифицированный метод скалярной Нэш-оптимизацииqi (t ),1qi (t ),1xi (t )xi (t )q1q10,80,80,60,60,40,4q20,200,511,5qi (t ), xi (t )02 t10,80,8q10,40,20,20,51,52tq10,60,4010,5qi (t ), xi (t )q210,60Рис. 2.4.
Исследование влияния весовыхкоэффициентов (α73, β19)Рис. 2.3. Базовый вариант (α73, β37)0q20,209311,5Рис. 2.5. Исследование влияниявесовых коэффициентов (α37, β91)2 t0q200,511,52 tРис. 2.6. Исследование влияния соотношенийэффективности воздействия (P ij = 0,5, α73, β37)Таким образом, спектральный метод может служить достаточно эффективным средством для уточнения Нэш-решения на этапе 3, а также дляпрогноза динамики конфликта.2.5.4.Верификация оптимального закона управленияна основе подхода Э.Н. Вайсборда, В.Н.
ЖуковскогоВ данном пункте, опираясь на теоретические положения пункта 2.2.2,показано, что для исследуемого примера необходимое условие локальногоравновесия по Нэшу является также и достаточным.Стабильные эффективные решения и компромиссы. Часть I94Известно, что для верификации или определения управления ui локально оптимального по Нэшу необходимо и достаточно выполнения соотношений (2.31).Следует отметить, что для проверки полученного решения (u*, x*) наоптимальность достаточно выполнения знака неравенства, так как можнопоказать, что первое равенство обеспечено необходимым условием Пао.Для верификации оптимального решения используем упрощенную математическую модель ММСx1 = −0,8u2 x3 ,x2 =−0,8 x3 + 0,8u2 x3 , (2.54)x3 = −0,8u1 x1 ,x4 =−0,8 x1 + 0,8u1 x1.
Рассмотрим первое равенство системы (2.31). Для коалиции i = 1 величина∂Фi (T , x *(T ))запишется так∂x −1, 4 x1* *∂Фi (T , x *(T )) −0, 6 x2 .=* ∂x 1, 4 x3 * 0, 6 x4 (2.55)T ∂Фi (T , x *(T )) Раскроем произведение ξ i (T ) :∂xT ∂Фi (T , x *(T )) ξ i (T ) =∂x=−1, 4 x1*x11 (T )−0,6x2*x12(T )+ 1, 4 x3*x13 (T ) + 0,6 x4*x14 (T )Исходя из уравнений (2.54)x1 =−0,8u2 x3 =−0,8u2 ( −0,8u1 x1 ) =0,64u1u2 x1;x3 =−0,8u1 x1 =−0,8u1 ( −0,8u2 x3 ) =0,64u1u2 x3 .(2.56)0.=(2.57)Поскольку x 1 (0) = x 3 (0), то, на основании (2.57), можно утверждать, чтоx 1 *(T) = x 3 *(T). Аналогично получаем равенство x 2 *(T) = x 4 *(T).Как указано выше, первое равенство системы (2.31) выполняется, таккак оно обеспечено необходимым условием Пао.
Таким образом, для обеспечения равенства необходимо, чтобы ξ11 (T ) =ξ13 (T ) и ξ12 (T ) =ξ14 (T ) .Для коалиции i = 2 можно получить аналогичные результаты. Рассмотрим неравенство системы (2.31).Глава 2. Модифицированный метод скалярной Нэш-оптимизации95∂2 f ∂2 f,равны нулю, и, сле∂x 2∂u 2довательно, уравнение для определения функций χi (t ) принимает видχ i (t ) Aχ==i (t ); χ (t0 ) 0.Указанная выше система является однородной системой. Посколькуначальные условия для решения данной системы χ (t0 ) = 0 , то имеемДля исследуемого примера величиныχi (t ) ≡ 0 .
Таким образом, неравенство системы (2.31) принимает видξ iT (T )∂ 2 Фi (T , x *(T ))ξ i (T ) ≥ 0 .∂x 2∂ 2 Фi (T , x *(T ))имеет вид∂x 2000 −1, 4 020 −0, 6 0∂ Фi (T , x *(T )) .= 001, 4 0 ∂x 200 0, 6 0Выше было доказано, что ξ11 (T ) =ξ13 (T ) и ξ12 (T ) =ξ14 (T ) . В такомслучае для данной математической модели всегда выполняется неравенствоДля коалиции i = 1 величина∂ 2 Фi (T , x *(T ))ξ i (T ) ≥ 0 .∂x 2Для коалиции i = 2 получены аналогичные результаты.Таким образом, для исследуемого примера необходимое условие локального равновесия по Нэшу является также и достаточным.ξ iT (T )Глава 3. Стабильные и эффективные оптимальные решения95ГЛАВА 3СТАБИЛЬНЫЕ И ЭФФЕКТИВНЫЕ ОПТИМАЛЬНЫЕ РЕШЕНИЯНА ОСНОВЕ КОАЛИЦИОННОГО РАВНОВЕСИЯ3.1.