Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 33
Текст из файла (страница 33)
Стабильные коалиционные решения в ММС на основе УКУ171управления, проверяемые процедурой на удовлетворение условий оптимальности, заложенных в методе Ω-оптимизации, также проверяются и насоблюдение МДУ ЛУКУ. В случае, если данное управление не удовлетворяет МДУ ЛУКУ, то показателю присваивается заведомо не оптимальноезначение, и алгоритм «отбраковывает» данное решение, повторяя итерацию для поиска другого варианта.
Результаты Ω-оптимизации с проверкойна ЛУКУ-оптимальность представлены на рис. 4.8.JБJАq10 , q20Рис. 4.8. Точное решение УКУ-оптимизацииПолучение УКУ-решений дифференциальной игры. Для того, чтобы{}набор u0 (t ) = u0K (t ), u0N / K был локальной угрозой и контругрозой для коалиции K, достаточно выполнения неравенств 4.25 (теорема 5.2). Для коалиции N/K аналогично должны выполняться три неравенства.{Таким образом, для того, чтобы набор u0 (t ) = u0K (t ), u0N / K}являлсяУКУ-решением дифференциальной игры, достаточно, чтобы для любых допустимых векторов управлений выполнялась система из шести неравенств.Отсюда аналогично случаю для одной коалиции получаем на основе метода момента Н.Н. Красовского систему из шести неравенств, выполнение172Стабильные эффективные решения и компромиссы.
Часть Iкоторых будем проверять для получения точных УКУ-решений дифференциальной игры. −α11 ⋅ x10 ⋅ K Б − α12 ⋅ x20 ⋅ K Б + α11 ⋅ x30 ⋅ K Б + α12 ⋅ x40 ⋅ K Б > 0,1234 −α21 ⋅ x10 ⋅ K Б − α22 ⋅ x20 ⋅ K Б + α21 ⋅ x30 ⋅ K Б + α22 ⋅ x40 ⋅ K Б < 0,1234 −α11 ⋅ x10 ⋅ K A − α12 ⋅ x20 ⋅ K A + α11 ⋅ x30 ⋅ K A + α12 ⋅ x40 ⋅ K A ≠ 0,12340000 α21 ⋅ x1 ⋅ K A1 + α22 ⋅ x2 ⋅ K A2 − α21 ⋅ x3 ⋅ K А3 − α22 ⋅ x4 ⋅ K А4 > 0,0000 −α11 ⋅ x1 ⋅ K A1 − α12 ⋅ x2 ⋅ K A2 + α11 ⋅ x3 ⋅ K A3 + α12 ⋅ x4 ⋅ K A4 < 0,0000 α21 ⋅ x1 ⋅ K Б1 + α22 ⋅ x2 ⋅ K Б2 − α21 ⋅ x3 ⋅ K Б3 − α22 ⋅ x4 ⋅ K Б4 ≠ 0.Проверяя неравенства во время выполнения процедуры Ω-оптимизации,получаем решение дифференциальной игры, которое в данной задаче совпадает с решением для коалиции K (рис. 4.8). Это является следствием тогофакта, что сетевые решения – начальные приближения УКУ-решений дифференциальной игры.Таким образом реализуется двухэтапный метод определения УКУрешения.
На первом этапе приближенного сетевого анализа на множествепоказателей практически решается вопрос существования УКУ-решений, вчастности, для рассмотренной конфликтной задачи было обнаружено, чтомножество УКУ-решений имеет существенное пересечение с Парето–Нэшобластью компромиссов.На втором этапе вновь решается задача определения точныхУКУ-решений в форме управления нелинейной динамической системойна основе предложенной комбинации полученных в работе достаточных условий для локальных УКУ и метода моментов Н.Н. Красовского.Данный метод формирует класс стабильно-эффективных компромиссов(СТЭК) на базовом Парето–Нэш-множестве компромиссов. СТЭК на основе УКУ обладает дополнительной эффективностью по сравнению сНэш-решением и сохраняет свойства равновесной стабильности в условиях необязательных соглашений.172Стабильные эффективные решения и компромиссы.
Часть IГЛАВА 5ОЦЕНКА ЭФФЕКТИВНОСТИ КООПЕРАТИВНОГОКОМПРОМИССА И ОПТИМИЗАЦИЯ РЕШЕНИЙ В ММСНА ОСНОВЕ ВЕКТОРА ДЕЛЕЖА ШЕПЛИВ данной главе приводится способ оценки средней эффективности игры с позиции каждого объекта ММС на полном множестве возможных коалиционных структур с его участием без формирования сложного коалиционного компромисса.
Основой является Парето–Нэш-множество предпосылок, заданное в критериальной и параметрической форме и вектор дележа Шепли.Целью главы является изучение двухэтапного метода формированияоценки эффективности кооперативного компромисса в ММС на основе соглашений и выбора параметров ПКЗУ каждой системой в точке компромисса. Приводится практически полезный пример применения алгоритма.Данное исследование формируется на основе анализа подходов в кооперативных играх в форме характеристической функции.5.1. ОБОБЩЕНИЕ ХАРАКТЕРИСТИЧЕСКОЙ ФУНКЦИИ, ПРЕДПОСЫЛКА ИГРЫ,ДЕЛЁЖ И ЕГО СВОЙСТВАРассмотрим обобщение понятия характеристической функции на основе Нэш-равновесия.Определение 5.1.
Характеристической функцией игры N лиц { i ∈ N }называется вещественная функция ν , определённая на подмножествахмножества N и ставящая в соответствие любой коалиции K ⊂ N равновесное значение (для K ) бескоалиционной игры (или гарантирующее значение антагонистической игры) двух лиц, которую сыграли бы K и N | K(множество N без K ), если бы эти две коалиции действительно возникли;при этом показатель коалиции K есть сумма взвешенных показателейучастников коалицииГлава 5.
Оценка эффективности кооперативного компромиссаФK=∑ αi J i ; αi > 0; ∑ αi=i∈K1731i∈K(в типичном случае «без приоритетов» ai = 1/ l , где l – число элементов K ).Далее, без ограничения общности будем считать величины J i показателя эффективности ФK выигрышами систем-игроков. Для показателейпотерь все неравенства в определениях и результатах меняются на противоположные.Тогда характеристическая функция для коалиции K на основе бескоалиционного равновесия имеет видrrr(5.1)=ν( K ) max Ф=K ( K ,( N \ K ) ) ФK ( K ,( N \ K ) ),Kгде K , ( N \ K ) ) находятся из системы неравенствrr(5.2)ФN ( K r ,( N \ K )) ≤ ФN ( K r ,( N \ K ) r ).
KKХарактеристическая функция для коалиции K на основе гарантирующих решений(5.3)max min ФK ( K , N \ K ).n( K ) =ФK ( K ,( N \ K ) r ) ≤ ФK ( K r ,( N \ K ) r ),KN /KВ отличие от традиционных структур характеристической функции(5.3) введение характеристической функции более общего вида (5.1) повышает значимость оценки самостоятельных действий коалиции (или игрока), так как по определению()=n ( K ) max ФK K , ( N \ K ) r ≥ max min ФK ( K , N \ K ) .KKN /KОпределение 5.2. Характеристическая функция обладает следующимисвойствами:1) ν(0) =0;2) ν( N ) =max ФN ( min – для минимизируемых J i );3) cупераддитивность ν( S R ) ≥ ν( S ) + ν( R ) ( ≤ для минимизируемыхJ i ) (существенность игры);4) ν( K ) + ν( N \ K ) = ν( N ) (для игр с постоянной суммой∑ J i = const ).i∈NСледует отметить, что вид характеристической функции, в общем случае игры, может отличаться от данного определением 5.1.
В каждой игрехарактеристическая функция ν ставится в соответствие каждой коалициикак устойчивая оценка получаемого ею выигрыша.Определение 5.3 [199]. Дележом для кооперативного компромисса Nлиц с характеристической функцией ν называется вектор J d , удовлетворяющий условиям:Стабильные эффективные решения и компромиссы. Часть I1741)∑ Jdi∈Ni= ν( N ) (коллективная рациональность);2) J di ≥ ν(i ) (индивидуальная рациональность) для всех i ∈ N .Замечание. Для предпосылки дележа игры условие коллективной рациональности имеет вид(5.4)∑ J di ≤ ν( N ).Понятие дележа существенно отличает кооперативную игру от бескоалиционной.
Бескоалиционные игры являются стратегическими в томсмысле, что исход игры формируется в результате действий тех игроков,которые в исходе получают те или иные выигрыши. Исходом кооперативной игры является делёж, который возникает не как следствие действийигроков, а как результат их соглашений. То есть в кооперативных играхсравниваются по предпочтительности не действия с исходами, а дележи, исравнение это не ограничивается рассмотрением индивидуальных выигрышей, а носит более содержательный характер.Условием существования наилучшего дележа является свойствотрансферабельности выигрышей коалиции K , когда совокупный выигрыш коалиции K может быть произвольным образом поделен между членами коалиции. Если данное свойство не выполняется и делёж единственный, то объединение игроков в коалиции не приведёт к увеличению выигрышей всех игроков и, в этом смысле, игра несущественна.Определение 5.4 [42]. Несущественной игрой называется кооперативная игра с аддитивной характеристической функцией, когдаν( K R ) = ν( K ) + ν( R ).(5.5)Утверждение 5.1 [199].
Всякая кооперативная игра двух игроков с постоянной суммой несущественна.До к аз ат е льс тво . По свойству 5.4 характеристической функции(определение 5.2) ν(1) + ν(2) = ν(1, 2) , а это означает аддитивность функции при N = 2 .Утверждение 5.2. Для того чтобы характеристическая функция ν( K )была аддитивной, необходимо и достаточно, чтобы выполнялось равенство(5.6)ν( N ) .∑ ν(i ) =i∈NУтверждение 5.3. В несущественной игре имеется только один делёж( ν(1),..., ν( N )) . Во всякой существенной игре множество дележей бесконечно.Несущественность игры может быть следствием нетрансферабельностивыигрышей и преодолена изменениями в постановке задачи или модификацией метода исследования.Так, в работе [199] показана нетрансферабельность типичного терминального показателяГлава 5.
Оценка эффективности кооперативного компромиссаJ i ( x(T )) =ρ( x(T ), M i ), i ∈ N ,175(5.7)где M i , i = 1,..., N − некоторая заданная система точек в пространстве E N ,которому принадлежит вектор состояния x(T ) , который в свою очередьоценивает расстояние ρ от положения игроков в момент окончания игрыдо точек M i , являющихся для них известными. Потери J ( x(T )) не являются трансферабельными, так как не могут делиться и передаваться другим участникам игры.
По существу это означает, что каждой точке x(T )соответствует единственный делёж, игра несущественна и образование коалиций не имеет смысла.В работе [199] предложена модификация понятия дележа, котораяприводит к формированию характеристических множеств взамен характеристических функций и к решению задачи определения оптимальногодележа.Возможным представляется и способ, когда вводится понятие взвешенного вектора потерь коалиции K(5.8)ФK= ∑ αi J iи в зависимости от αi «делятся» степени близости к M , т.е. в зависимости от α формируется множество дележей внутри коалиции K .5.2. МЕТОДЫ ОПТИМИЗАЦИИ ДЕЛЕЖЕЙПринципы оптимальности классической теории кооперативных игр, заданных в форме характеристических функций, условно можно разделитьна два типа [32]:1) оптимальность на основе принципов устойчивого поведения каждогоигрока (оптимальность по Парето, С-ядро, Н–М-решение);2) оптимальность на основе «здравых» гипотез о свойствах, которымидолжно обладать решение, исходящее от явно или неявно существующего арбитра (вектор Шепли, арбитражные схемы, среднеквадратическое решение).Рассмотрим в сравнении оптимизационные подходы на основе понятийПарето, С-ядра, Н–М-решений и определения вектора дележа Шепли вклассе дифференциальных игр [32, 199], но при условии, что целью каждого игрока системы является выбор параметров q ∈ Q своей полной математической модели, в частности, выбор параметров ПКЗУ с оптимизациейсвоего показателя – функционала общего вида.Из свойства коллективной рациональности дележа следует, что предпосылки дележа оптимальны по Парето, но из свойства индивидуальнойрациональности следует, что не все решения по Парето являются предпосылками дележа.176Стабильные эффективные решения и компромиссы.