Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 36
Текст из файла (страница 36)
ПРИМЕНЕНИЕ ДВУХЭТАПНОГО МЕТОДА ДЛЯ ПОЛУЧЕНИЯУКУ–ШЕПЛИ-ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПРОГНОЗОМ ДИНАМИКИ КОНФЛИКТА ЛС СВН–ЛС ПВОПостановка данной задачи подобна постановке рассмотренной в 4.5.1.Структура взаимодействия в ММС совпадает со структурной схемой нарис. 4.5. Описание модели дается выражениями (4.47), (4.48). Показателиописываются формулами (4.49). Вариант прогноза также упрощенный,полное исследование дано в главе 10.В отличие от 4.5.1 рассматривается двухтактный прогноз с получениемаппроксимированного программного управления, который при повторениидвухтактного прогноза на следующем временном интервале позволяет получить ПКЗУ. Кроме того, как показано ниже, данный пример реализуетстабильно-эффективный компромисс на основе Парето–Нэш–УКУ–Шепли-комбинации (СТЭК-7, см.
главу 6).За основу взят аналогичный базовый вариант условий и начальныхзначений. Далее приводятся результаты оптимизации на основе двухэтапного алгоритма при двухтактном прогнозе (0,Т/2,Т).Первый такт прогноза:0, 7 N1 = 10 P31 = 0,8 α11 = α = P==N100,8 2 32 12 0, 3 xi (1) = ,,,0, 3 N 3 = 10 P13 = 0,8 α21 = N 4 = 10 P14 = 0,8 α22 =0, 7 J A = J1 = α11[ x32 − x12 ] + α12 [ x42 − x22 ] → min, J Б = J 2 = α21[ x12 − x32 ] + α22 [ x22 − x42 ] → min. 1. Определение значений вектора дележа Шепли на основе Парето–Нэш-оптимизации (первый этап алгоритма).Общий вид множества показателей J 1 , J 2 на основе ортогональной иЛП-сетей дан на рис.
5.3.Стабильные эффективные решения и компромиссы. Часть I190УКУ, Парето-граница, точки Нэша и Шепли даны на рис. 5.4:• точка min(J 1 +J 2 ): q 1 = 1; q 2 = 0; J 1 = – 38,7; J 2 = − 40,4;• точка Нэша: q 1 r = 0,668; q 2 r = 0,430; J 1 r = – 10,2; J 2 r = – 7,29;• точка Шепли: Ф 1 = – 41,005; Ф 2 = – 38,095 (в соответствии с (5.24)).Рис. 5.3. Множество показателей J 1 , J 2 (на сетевой основе)Рис. 5.4. Результаты первого этапа алгоритма2. Векторная оптимизация управления коалициями для минимизацииотклонения от точки Шепли (на основе Ω-оптимизации) (второй этап алгоритма) на множестве показателей(рис.
5.5 и 5.6).J1 , J 2 , где J i =−1, 2( J i Фi ) , i =2Глава 5. Оценка эффективности кооперативного компромисса191Точки Парето, Нэша и Шепли, полученные на первом этапе, в даннойсистеме координат принимают следующие значения:1, q2 =0, J1 =5,313; J 2 =5,313 (рис. 5.5, 5.6);• точка min (J1 + J 2 ) : q1 =• точка Нэша=q1r 0,668;=q2r 0,==J 2r 948,948 (рис. 5.5);430; J1r 948,948,• точка Шепли=Ф1 0,=Ф2 0 (рис. 5.6).Результатом оптимизации является точка сильной предпосылки игры иУКУ (СТЭК при однотактовом прогнозе) (рис. 5.5):q1 =====0,995; q2 0,003; J1 0,043; J 2 0,003; J1 −41,003; J 2 =−38,094.Таким образом, Парето–УКУ–Шепли-оптимальный вектор параметровна первом такте: q1opt = 0,995 opt. q2 = 0,003J2J1Рис. 5.5. Результаты второго этапа алгоритма на первом такте прогнозаJ2Точка min( J 1 + J 2)Множество показателейТочка ШеплиТочка сильной предпосылкиигры и УКУJ1СТЭКРис.
5.6. СТЭК при однотактовом прогнозе (окрестность начала координат (рис. 5.5))Стабильные эффективные решения и компромиссы. Часть I192Вектор состояния к концу первого такта: x 1 = 9,972; x 2 = 2,027;x 3 = 2,039; x 4 = 9,96.Второй такт прогноза:x1 (2)= x=P31 = 0,8 0,7 α11 =01 9,972 2,027x2 (2)= x=0,8P=0,3 α=023212,,.x3 (2) = x03 = 2,039 α21 = 0,3 P13 = 0,8 0,7 α22 =9,960 x4 (2)= x=P14 = 0,8 04J2J1Рис. 5.7. Результаты первого этапа алгоритма на втором тактеJ2J1Рис. 5.8. Результаты второго этапа оптимизации на двух тактах1) Определение значений вектора дележа Шепли на основе Парето–Нешоптимизации (на первом этапе алгоритма) (см. рис.
5.7).Глава 5. Оценка эффективности кооперативного компромисса193Множество значений показателей J 1 , J и УКУ–Парето-граница даны нарис. 5.7:• точка min(J 1 +J 2 ): q 1 = 1; q 2 = 0; J 1 = – 39,7; J 2 = – 39,6;• точка Нэша: q 1 r = 0,321; q 2 r = 0,988; J 1 r = – 50,1; J 2 r = 23,8;• точка Шепли: Ф 1 = – 76,6; Ф 2 = – 2,7.2) Векторная оптимизация управления коалициями для минимизации отклонения от точки Шепли (на основе Ω-оптимизации) (на втором этапеалгоритма) на множестве показателей J1 , J 2 (рис. 5.8, 5.9).Точки Парето, Нэша и Шепли, полученные на первом этапе, принимают вид:1; q2 =0; J1 =1361,61; J 2 =1361,61 (рис. 5.8,• точка min (J1 + J 2 ): q1 =рис.
5.9);• точка Нэша:=q1r 0,321;=q2r 0,988;=J1r 702,=25; J 2r 702, 24 (рис. 5.8);• точка Шепли=Φ1 0=, Φ2 0 (рис. 5.8 и рис. 5.9).Результатом оптимизации является точка сильной предпосылки игры иУКУ (СТЭK на двух тактах прогноза):q1 =0, 295; q2 =0,068; J1 =301,67; J 2 =68,96; J1 =−59, 23; J 2 =5,6 .Парето–УКУ–Шепли-оптимальный вектор параметров на втором тактеq1 = 0, 295, q2 = 0, 068.Вектор состояния после двух тактов прогноза=x1 (T ) 9,86;=x2 (T ) 0;x3 (T ) = 0 ; x 4 (T) = 4,335.СТЭКРис.
5.9. СТЭК на двух тактах прогноза (окрестность начала координат (рис. 5.8))Стабильные эффективные решения и компромиссы. Часть I194Таким образом, изменение численностей и Парето–УКУ–Шеплиоптимального параметризованного управления имеют вид (рис. 5.10, 5.11).На двух тактах формируется оптимальное управление активными средствами ЛС СВН и ЛС ПВО – q1opt , q2opt .ЛС СВН отдает предпочтение поражению активных средств ЛС ПВО( α11= 0, 7; α12= 0, 3 ), так как ее задача подавить активные средства ЛСПВО с целью обеспечения прорыва своих пассивных средств к охраняемому ЛС ПВО объекту.ЛС ПВО отдает предпочтение поражению пассивных средств ЛС СВН( α21= 0,3; α22= 0,7 ), т.е.
задача ЛС ПВО не пропустить противника, аименно пассивные средства ЛС СВН к охраняемому объекту, тем самымне допустить поражения объекта.x1 = 10x2 = 10x3 = 10x4 = 10x1 = 9,972x2 = 2,027x3 = 2,039x4 = 9,960q1 = 0,995q2 = 0,00301-й тактx1 = 9,860x2 = 0x3 = 0x4 = 4,335q1 = 0,295q2 = 0,068Т/22-й тактТРис. 5.10. Изменения численностейВ начале первого такта имеют место равные начальные количества активных и пассивных средств ЛС СВН и ЛС ПВО: x=x=x=x=1234 10 .На первом такте получены следующие численности активных и пас=x1 9,972;=x2 2,027; x3 = 2, 039;сивных средств ЛС СВН и ЛС ПВО:x4 = 9,96 и оптимальный вектор параметров:=q1opt 0,995;=q2opt 0,003 .Результаты в конце первого такта соответствуют точке сильной предпосылке игры первого такта.Результаты показывают, что ЛС СВН, выбрав оптимальное управлениеoptq1 = 0, 995 , направив тем самым практически все активные средства напоражение активных средств ЛС ПВО, добьется нужного результата – активные средства ЛС ПВО уменьшаются в численности до x 3 = 2,039.
ЛСoptoptПВО, выбрав оптимальное управление q=0, 003; (1 − q=0, 997) ,22направляет практически все активные средства на уничтожение пассивныхсредств ЛС СВН, также выполняет свою задачу – пассивные средства ЛССВН уменьшились по численности до x 2 = 2,027.Глава 5. Оценка эффективности кооперативного компромисса195Активные средства ЛС СВН и пассивные средства ЛС ПВО существенно не изменяются (x 1 = 9,972; x 4 = 9,960), так как они по приоритетам стоят на втором месте для обеих систем соответственно.На втором такте численности активных и пассивных средств ЛС СВН иx1 9,860;=x2 0;=x3 0;=x4 4,335 , а опЛС ПВО убывают до значений:=тимальный вектор параметров q1opt = 0, 295, q2opt = 0, 068.
Результаты вконце второго такта соответствуют точке сильной предпосылки игры.Результаты показывают, что ЛС СВН, задав оптимальное управлениеoptq1 = 0, 295 , не только завершит выполнение своей главной задачи – численность активных средств ЛС ПВО x 3 = 0, но и, выделив практическибольшую часть своих активных средств на поражение пассивных средствЛС ПВО, нанесет урон противнику по пассивным средствам x4 = 4, 335.q1q21q1 = 0,9951q2 = 0,732q2 = 0,003q1 = 0,2950T/2aT0T/2TбРис.
5.11. Оптимальное параметризованное управление активными средствами ЛС СВН(а) и ЛС ПВО (б) на двух тактахЛС ПВО, выбрав оптимальное управление q2opt = 0,068 , практическивсе активные средства направляет на поражение пассивных средств ЛССВН из-за того, что в результате 1-го такта взаимодействия ее активныесредства значительно уменьшились. В результате ЛС ПВО достигает своейцели – численность пассивных средств ЛС СВН x 2 = 0.Окончательно Парето–УКУ–Шепли-оптимальные параметризованныеуправления (СТЭК-7, см.
главу 6) ЛС СВН и ЛС ПВО даны на рис. 5.11.Применение полученных программных управлений обеспечивает Парето–Нэш–УКУ–Шепли-компромисс с двухтактным прогнозом. В общемслучае, повторение данной процедуры на следующем временном интервале (Т, 2Т) с измеренным вектором x(Т) позволяет получить ПКЗУ.Глава 6. Методы комбинирования решений195ГЛАВА 6МЕТОДЫ КОМБИНИРОВАНИЯ РЕШЕНИЙ ПО НЭШУ(СКАЛЯРНЫЙ И ВЕКТОРНЫЙ ВАРИАНТЫ), ПАРЕТО, УКУ,ШЕПЛИ, «ИДЕАЛЬНОЙ ТОЧКИ», ε -РАВНОВЕСНЫХПРИБЛИЖЕНИЙ И АРБИТРАЖНЫХ СХЕМ ДЛЯ ПОЛУЧЕНИЯСТАБИЛЬНО-ЭФФЕКТИВНЫХ КОМПРОМИССОВ ММС(СТЭК ММС)6.1.
АНАЛИЗ ПОДХОДОВ ПО ПРОБЛЕМЕ КОМПРОМИССОВАктуальность данного направления исследований кратко и точно выражена в фундаментальной работе Ю.Б. Гермейера [84] следующим тезисом: «классическая теория игр, во всяком случае, в части теории принятиярешений преждевременно и чрезмерно заформализована». Отмечаетсяслабая связь методов бескоалиционной, коалиционной и кооперативнойтеории игр, которая оказывается необходимой во многих приложениях.Поэтому по-прежнему весьма полезна разработка методов «по информационно-тактическим компромиссам интересов, стратегий и условий, отражающих потребности игровых приложений».При недостаточной систематизации проблеме компромисса в современной теории и практике управления ММС посвящены многочисленныеработы.
В [54, гл. 6] проанализировано более пятидесяти работ.Придерживаясь по проблеме компромисса предлагаемой в главе классификации от предельного СТЭК (ПСТЭК) до СТЭК-14, в условиях необязательных соглашений и строгой договорной основы можно сформировать представление о важности проблемы и полноте данной классификации.Некоторые условия существования и определения ПСТЭК приводятсяв работах [32, 85, 199, 248, 281, 326, 405]. В работе [32] на основе подходаСталфорда–Кротова рассматриваются условия совпадения Парето–Нэш-196Стабильные эффективные решения и компромиссы. Часть Iрешений.
Подобного результата можно добиться и подбором параметровММС [248]. В обзоре [248] приводится работа, в которой рассмотрен случай, когда равновесное решение совпадает с арбитражным, которое, какизвестно, реализуется на Парето-области.Примыкающему к ПСТЭК понятию кооперативного равновесия, а также его существованию и оценкам посвящена работа [405], причём кооперативное равновесие базируется на угрозе тому, кто отклонился от равновесного кооперативного управления.