Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 41
Текст из файла (страница 41)
Методы комбинирования решений213Знак неравенства меняется, если эффективность заключается в минимизации потерь.Как известно, при В = Е многогранный конус Ω становится прямоугольным, а процедура оптимизации на основе конуса Ω сводится к Парето-оптимизации.В терминах рассмотренной ранее реализации данного метода конечноемножество значений вектора J задаёт таблицу испытаний, по которой происходит попарное сравнение точек таблицы и выделение недоминируемой.При этом на каждой итерации исключаются точки J ′′ , обеспечивающиеобратный знак соотношения (6.27), таким образом, итерация алгоритмадля получения СТЭК-1 состоит из трёх этапов.Эт а п 1.
Получение решения, равновесного по Нэшу.Эт а п 2. Сравнение данного решения с ранее полученными на основе(6.27).Эт а п 3. Исключение доминируемых решений на данном подмножестве.Данная схема реализуется на интерактивной комбинации программныхмодулей ПС «MOMДИС».Выбор компромиссного недоминируемого Нэш-решения по критерию уравновешивания потерь в окрестности наилучшего для каждойкоалиции Нэш-решения (СТЭК-2). Предыдущий СТЭК-1 может иметьнеединственное недоминируемое решение uri, i = 1,2,...,n. Тогда сужениеполученного множества может быть достигнуто дополнительными компромиссными условиями близости к наилучшему (идеальному) для каждой коалиции значению показателя max J Kri j и/или уравновешиванию поiтерь∆ iK jв связи с его недостижимостью, гдеmax J Kri − J Kri=∆ iK jjimax J Kriij≥ 0.(6.28)jПо данным двум условиям может быть введён дополнительный критерий оптимизации на конечном множестве недоминируемых Нэш-решений2(6.29)=+ ρ∑ ( ∆ iK )2 ,R(i ) min ∑ ∆ iK − ∆ iKminjmjii j ,mjгде j, m = 1,...,l; j ≠ m.В (6.29) первая сумма обеспечивает уравновешивание потерь, вторая –близость к идеальной, на основе Нэш-решений, точке, а множительρ(1 ≥ ρ ≥ 0) определяет влияние степени близости на компромисс.В частном случае, при l = 3 и ρ = 0 критерий принимает следующийпростой вид:ii2ii2ii2min[( ∆ K − ∆ K ) + ( ∆ K − ∆ K ) + ( ∆ K − ∆ K ) ] .)(i121323214Стабильные эффективные решения и компромиссы.
Часть IПри достаточно ограниченном числе недоминируемых Нэш-решенийпосле вычисления наборов ∆i Kj остаётся осуществить прямой перебор наконечном множестве для получения компромиссного решения uri.Поэтому общая схема метода для получения СТЭК-2 имеет следующую общую этапную структуру.Эт а п 1. Получение решения, равновесного по Нэшу.Эт а п 2. Сравнение данного решения с ранее полученными на основесоотношения (6.27).Эт а п 3. Исключение доминируемого решения и переход к этапу 1.Эт а п 4.
Нахождение полного набора недоминируемых решений и переход к этапу 5.riи переход к этапу 6.Эт а п 5. Получение точек max J KjiЭт а п 6. Вычисление разностей ∆ iK , i = 1,...,n, j = 1,...,l и переход кjэтапу 7.Эт а п 7. Формирование процедуры перебора недоминируемых Нэшрешений по критерию (6.29) при фиксированном ρ.Интерактивные процедуры Нэш-оптимизации и оптимизации таблицыиспытаний Нэш-решений дополняются процедурами вычисленияri, наборов ∆i Kj и функции R(i), которая познаибольших значений max J Kjiволяет выбрать компромиссное недоминируемое решение равновесноепо Нэшу.Выбор векторного Нэш-решения относительно идеальной (утопической) для множества допустимых решений точки (СТЭК-3).
Как следует из материалов главы 3, раздела 6.1 данной главы и работ [32, 39], коалиционное равновесие при фиксированном разбиении М K = P ММС вырождается в векторное равновесие. Из материалов главы 3, а также из работ [45, 47, 49, 54, 213, 230] следует, что поиск векторного равновесия(векторного Нэш-равновесия и Ω-равновесия), является достаточно сложной задачей с собственным программным обеспечением.Каждая коалиция теперь имеет векторный показатель, что учитываетэлемент субъективности взаимной информации о приоритетности показателей партнёров.
Естественно, что скаляризация показателей коалиции сзаданными весами приводит к частному случаю векторного Нэшравновесия: скалярному равновесию по Нэшу.Поэтому при исследовании векторного равновесия по сравнению соскалярным, во-первых, возрастает размерность множества показателей, вовторых, возрастает число равновесных решений, так как даже при единственности скалярного равновесия перебор вектора весов приводит к множеству решений.
Увеличение размерности задачи и расширение множества равновесных решений на множестве допустимых решений приводит кГлава 6. Методы комбинирования решений215необходимости искать компромиссное решение среди недоминируемыхвекторных равновесий ( u ri ), наиболее близкое к идеальной точке надмножеством допустимых решений по критерию:m∑ ( J j (uri ) − J *j )2 → min;ij =1(6.30)j ∈ M (1,..., m ),где=J *j max J j ( u), u ∈ U=, U U K1 , ,U Km , ,U Kl ,u∈U(6.31)где U Km – множество параметризованных управлений (решений) коалицииKm, m = 1,...,l.
Полученное на основе (6.30), (6.31) решение являетсянаилучшим векторно-равновесным решением для всех коалиций, а поэтому является компромиссным в условиях необязательных соглашений.Общий метод определения компромисса принимает вид следующеймногоэтапной последовательности.Эт а п 1. Получение векторных Нэш-равновесий.Эт а п 2. Получение множества недоминируемых векторных равновесий.Эт а п 3.
Получение идеального решения на основе критерия (6.31).Эт а п 4. Получение компромиссного решения на конечном множественедоминируемых векторных равновесий на основе критерия (6.30).Ввиду сложности решения данной задачи, особенно на первом этапе,данный алгоритм реализован в универсальной программной среде«MATLAB» (глава 3). Надлежащая параметризация программнокорректируемого закона управления и использование параллельной вычислительной среды позволяет реализовать алгоритм в реальном времени.Формирование Парето–Нэш-области компромиссов (ПНОК)(СТЭК-4).
Предыдущие СТЭК-1 – СТЭК-3 позволяли получить лучшиерешения в рамках одного и того же множества стабильных решений. Данная ПНОК позволяет выделить на области допустимых решений или наобласти допустимых значений показателей подобласть, где наиболее вероятны следующие шаги по формированию стратегических и нестратегических компромиссов на основе соответственно необязательных соглашенийс определённой устойчивостью к отклонениям и строго договорных процедур с обязательными соглашениями и процедурами наказания при невыполнении соглашений, а также определённой «смеси» необязательных иобязательных соглашений.
Поэтому, с одной стороны, данная ПНОК является базой для формирования новых компромиссов, с другой стороны, приопределенной близости компромиссного значения показателей на основепредыдущих СТЭК к Парето-границе области показателей выделяется малая ОК, каждая точка которой с определённой степенью грубости играетроль собственно СТЭК-4, а в пределе превращается в ПСТЭК.216Стабильные эффективные решения и компромиссы. Часть IВсё это следует из определения ПНОК на области допустимых значений показателей – свёрток в смысле СТЭК-1 и СТЭК-2 или полного вектора в смысле СТЭК-3.Определение 6.4.
ПНОК удовлетворяет системе неравенств:1 (2,3),BJ ( u) ≥ J ( uСТЭК-i ), u ∈ U , i =(6.32)СТЭК-iПСТЭК-i) ≤ J(u )J(u) , u П ∈U П ,J ( u) - J ( uгде первое неравенство системы (6.32) имеет смысл многогранного конусадоминирования с матрицей В = Е и вершиной в точке J(uСТЭК-i), а второеимеет смысл семейства лучей, соединяющих точку СТЭК и соответствующее лучу решение uП из подмножества UП Парето-оптимальных решений, также удовлетворяющих первому неравенству. Рисунок 6.1 иллюстрирует данное определение для двухобъектной ММС со скалярными показателями объектов.Метод получения ПНОК базируется на комбинации алгоритмов Парето-оптимизации, Нэш-оптимизации и получения СТЭК-1 (2,3), что можетбыть представлено в упрощённом виде следующей процедурой.Эт а п 1.
Получение множества скалярных (векторных) недоминируемых Нэш-равновесий.Эт а п 2. Определение стабильно-эффективных решений СТЭК-1 (2,3).Эт а п 3. Формирование конуса доминирования (6.32) на области значений показателей, как на отображении области решений.Эт а п 4. Получение области Парето-оптимальных решений и подобласти U П на основе конуса (6.32).Эт а п 5. Формирование системы значений показателей и системы решений, удовлетворяющих ПНОК, с элементами проективно-графическогоанализа.Для реализации данного алгоритма с использованием СТЭК-1, СТЭК-2формируются интерактивные процедуры на основе модулей Парето–Нэшоптимизации в программной среде ПС «MOMДИС» с использованиемграфических экранных отображений. Данный алгоритм с использованиемСТЭК-3 реализован в среде «MATLAB».Взаимосвязь ПНОК и области УКУ-решений (СТЭК-5). Как былоупомянуто в пункте 6.1.2, векторное и скалярное равновесие при фиксированной коалиционной структуре являются частными случаями коалиционного равновесия [39, 50, 54], так как каждая коалиция стремится обеспечить свою локальную Парето-оптимальность в рамках всей локальной области, ее подобласти или точки соответственно, а равновесное решение поопределению является V-решением [39] (не содержит эффективных угроз,против которых нет контругроз).Как известно (глава 4, а также дополнения в реферате работы [39]),УКУ-равновесие по Вайсборду – Жуковскому [32, 50] является модификацией V-решения и принадлежит к множеству коалиционных равновесий,если допустимое множество коалиционных структур позволяет сформировать контругрозу.Глава 6.
Методы комбинирования решений217Если точка УКУ-равновесия единственная и попадает на ПНОК, то всравнении с Нэш-равновесной точкой она более выгодная для ММС(рис. 6.2) и является устойчивым компромиссным решением с предостережением к отклонению в условиях необязательных соглашений.В более общем случае может иметь место подмножество УКУравновесий, для которого по определению Нэш-вершина ПНОК являетсяграничной точкой (из-за обращения неравенства угрозы). Тогда вступают вдействие три ранее рассмотренные вида СТЭК в применении к множествуУКУ или формируется алгоритм выбора точки УКУ, наиболее близкой кПарето-границе и, например, учитывающий уравновешивание потерь(рис. 6.3).Из анализа прикладных результатов выявляются некоторые общие закономерности, которые сложно получить «прямыми» теоретическими исследованиями, – это неединственность УКУ-решений и попадание большей части решений на ПНОК.Если ресурсы коалиций не равны, то ПНОК содержит подмножествоточек УКУ, которые смещены в пользу коалиции с большими ресурсами.При выравнивании ресурсов число УКУ-решений увеличивается, а множество УКУ существенно пересекается с ПНОК (применяя в некоторых случаях очертания ПНОК), причём часть точек УКУ попадает на Паретограницу ПНОК.Следовательно, может быть сформулировано следующее утверждениеобщего характера.Утверждение 6.10.