Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 42
Текст из файла (страница 42)
ПНОК содержит подмножество УКУ-оптимальныхрешений, а при выравнивании ресурсов коалиций – объектов в ММС числорешений возрастает и их множество существенно пересекается с ПНОК,причём Парето-граница ПНОК содержит УКУ-решения (см. утв. 4.8 в гл. 4).Замечание 6.3. Из последней части утверждения следует, что точкиПарето-границы ПНОК могут выбираться как начальные приближениякомпромиссных УКУ-решений.Взаимосвязь ПНОК и множества дележей (СТЭК-6). Метод получения дележей по Шепли детально обсуждается в главе 5. В условиях необязательных соглашений делёж по Шепли обосновывает выбор такого коалиционного равновесия, которое является наиболее подходящим для возможного объединения в кооперацию при переходе к строго договорнымкомпромиссам с обязательным выполнением соглашения.Поэтому полезно исследовать взаимосвязь ПНОК и множества дележей.Утверждение 6.11.
Парето-граница ПНОК для однотипных ММС удовлетворяет свойствам коллективной и индивидуальной рациональностидележей.Данное утверждение является вариацией утверждения 5.4. Как известно, в общем случае ПНОК принадлежит прямоугольному многогранномуСтабильные эффективные решения и компромиссы. Часть I218конусу с вершиной в J ir (i = 1,…,N), который ограничен Парето-границейJ iП (i = 1,…,N), и следовательно,J iП ≥ J i ≥ J ir1 , (i = 1,…,N).Тогда характеристическая функция, характеризующая индивидуальнуюэффективность, имеет видv (i) = J ir1 из ( J ir1 , ФNr1/ j ).При этомr1= ∑ J j . j∈N / i В утверждении 5.4 показано, чтоJ iП ≥ J ir ≥ J ir1 = v(i), i = (1,…,N),что является условием индивидуальной рациональности дележа на Паретоточках ПНОК.
Условие коллективной рациональности Парето-точкиПНОК выполняется тождественно, так как по определению дележа∑ J iП ≡ v( N ) .ФNr1/ ii∈NТаким образом, Парето-граница ПНОК обладает свойством коллективной и индивидуальной рациональности.Собственно, СТЭК-6 имеет смысл либо ПСТЭК, либо УКУ-равновесия,которые оказались на Парето-границе ПНОК в окрестности найденнойточки дележа по Шепли.J2J2ПНОКТ. УКУ-СТЭКППт.
НJ (uСТЭК)J1Рис. 6.1. Парето–Нэш-областькомпромиссов для двухобъектной ММСсо скалярными показателямиJ1Рис. 6.2. Частный случай СТЭК-5:точка УКУ единственнаяи попадает на ПНОКВыбор наиболее эффективного УКУ-решения на основе ПНОК иточки дележа Шепли (СТЭК-7). Рассмотренный СТЭК-6 является част-Глава 6. Методы комбинирования решений219ным случаем более общего СТЭК, когда множество УКУ-равновесий имеет общий характер положения в ПНОК, например так, как показано дляN = 2 на рис. 6.3.J2УКУ-СТЭКПНУКУJ1Рис. 6.3. Общий характер положения УКУ-равновесия на ПНОКТогда СТЭК-5 и СТЭК-6 обобщаются в виде СТЭК-7, который имеетнаиболее общий вид в условиях необязательных соглашений и содержитпредыдущие СТЭК-1 – СТЭК-6 как частные случаи или компоненты.Определение 6.5.
Общий стабильно-эффективный компромисс в условиях необязательных соглашений формируется как устойчивое решение спредостережением, обладающее максимальной степенью близости к оценке наилучшего результата, который может быть достигнут при кооперативном объединении на основе обязательных соглашений. Таким свойством обладает УКУ-равновесие на ПНОК, которое является наиболееблизким к точке дележа по Шепли или к ее максимальной реализуемойпредпосылке.Общая схема метода определения данного СТЭК заключается в последовательном поэтапном решении следующих задач.Эт а п 1.
Определение множества Нэш-равновесий.Эт а п 2. Определение наилучшего Нэш-решения на основе СТЭК-1,СТЭК-2, СТЭК-3.Эт а п 3. Определение множества УКУ-равновесных решений.Эт а п 4. Формирование подмножества УКУ-решений, удовлетворяющих условиям (6.32) на основе СТЭК-4, СТЭК-5.Эт а п 5. Определение предпосылки дележа по Шепли на ПНОК(СТЭК-6).Эт а п 6.
Определение УКУ-решения, принадлежащего ПНОК инаиболее близкого к точке дележа по Шепли.Собственно, СТЭК-7 формируется на этапе 6 метода и заключается врешении задачи перебора следующего вида:min || J УКУi − J ДЕЛ || ,i220Стабильные эффективные решения и компромиссы. Часть Iгде J УКУi = J(ui УКУ ) – значение вектора показателей i-го УКУ-решенияui УКУ на ПНОК; J ДЕЛ – значение вектора показателей точки дележа поШепли.Вопросы существования и методы определения данного решения поэтапам рассмотрены в главах 2 – 5 и пункте 6.2.2 данной главы на основематериалов [54], причём в каждом конкретном применении (см.
гл. 3 – 5,10 – 12) представляют собой достаточно сложную задачу. Элементы приближений при формировании управляющих функций, базовые модули иинтерактивные процедуры в рамках специализированной программной системы «МОМДИС» и универсальной ПС «MATLAB», а также параллельные алгоритмы реализации позволяют сформировать процесс автоматизированного проектирования управления конкретной ММС на основе СТЭКкомбинации Парето–Нэш–УКУ–Шепли-решений.6.2.3.Комбинированные методы в условиях ε-равновесияпо Нэшу с минимизацией угроз и неполной информациейо партнёрах [54, 213, 229]Рассматривается комбинирование вычислительных процедур параметрической оптимизации (см.
гл. 3), объединяющих алгоритмическиемодули Ω-оптимизации (модуль 1), векторной Нэш-оптимизации (модуль2а), скалярной Нэш-оптимизации (модуль 2б), и получения начальногоприближения по Парето Ω-оптимизации на основе глобального зондирования параметров с помощью равномерных сетевых последовательностей (модуль 3).Модули 1, 2б, 3 реализованы как модули ПС «МОМДИС». Модуль 2ареализован как модуль «MATLAB» (см. гл. 9).Следует отметить, что модуль 3 формирует начальные приближения наглобальном уровне: для точного решения задачи Парето Ω-оптимизациина локальной окрестности, для неявного поиска недоминируемогоНэш-решения в окрестности Парето-границы и, в самом общем смысле,для преодоления зацикливания на локальных экстремумах при формировании различных процедур векторной оптимизации, для которой, как правило, свойственно формирование наилучших решений в Паретоокрестности.Формирование комбинаций определяются следующими факторами:• информационным состоянием коалиций [42, 84, 137], когда наразличных этапах развития конфликтной ситуации коалиция можетполучать или терять информацию и принимать частичные решения взависимости от информации на данном этапе;• видом системы отношений предпочтения {R i }, i∈M K, где M K –множество коалиций структуры Р, входящей в модули 1, 2, 3 иопределяющей приоритетность локальных показателей внутрикоалиций;Глава 6.
Методы комбинирования решений221• свойством компонент векторного показателя J = [J i , …, J m ] .В указанных работах рассматриваются три основных типа СТЭК, которые можно сформировать в рамках предлагаемой методики. На рис. 6.4изображена укрупнённая схема соотношений СТЭК-8–10.TПолнаяинформацияо партнереСТЭК-8{Rj} = {Bj}M \jq ( K ) = фикс.Взаимнаянеопределенностьпараметрови приоритетовСТЭК-9{Ri}={λi}j∈MKСТЭК-10{Ri}={Bi}j∈MKРис. 6.4. Виды СТЭКВыбор эффективного решения с допустимыми техническими требованиями и степенью неравновесности с оценкой и минимизациейугроз (полная информация о коалициях-партнёрах) (СТЭК-8). Рассмотрим метод получения данного СТЭКа, структурная схема которогоизображена на рис. 6.5.Применяется, когда известны параметры коалиций-партнёров.
Решается задача многокритериальной оптимизации внутри коалиции K j при фиксированных параметрах контркоалиции K M \ j : q ( M K \ j ) = const. При этомKна основе комбинирования принципов оптимальности по Парето и равновесия по Нэшу на множестве Парето в критериальном подпространствеE mj ищется решение, удовлетворяющее, с одной стороны, техническимтребованиям, с другой стороны, обладающее максимальной степенью равновесности (ε-равновесие относительно коалиции K j и контркоалицииK M K \ j [54, 229, 355]).Эт а п 1. Построение дискретной аппроксимации множества Парето впространстве показателя J j при варьировании вектора параметров qj. Тоесть решается задача (модуль 3) в виде:mопределить {J j ( Q ( j ) | K , E j },(6.33)Пq∈Q ( j )где Q(j) = {q∈Q⊂Er | qj ∈ Q j , q ( M K \ j ) = фикс}.j≤Стабильные эффективные решения и компромиссы.
Часть I222mjрешается задача минимизации.E mj≤ означает, что на любом EjQПI – дискретная аппроксимация множества Парето относительно Jв пространстве параметров.Модуль 3. Построение дискретнойаппроксимации множества Паретов пространстве J j (6.33)при варьировании qjВыбор начального приближения.Решение последовательности задачΩ-оптимизации (модуль 1) (6.34).Вычисление степени неравновесностиM \jε относительно J K и Jоснове модуля 2анетjнаε<ε0даПроверка угрозы со стороныконтркоалиции{M K \ j}модуль 3 (6.35)Уточнение параметров «угрозы»(6.34) и окончательный выборэффективного режима защитыс максимальной степеньюравновесностиРис. 6.5. Алгоритм СТЭК-8jГлава 6. Методы комбинирования решений223Эт а п 2.
Полагаем k = 0.Шаг 1. Из множества J П j(k) (Q(j)) выбираем наиболее подходящее решениеj=J j ( k ) J j (q ( k ) ), q ( k ) ∈ QПj ,удовлетворяющее априорным техническим требованиям.Шаг 2. Решение задачи Ω j (k)-оптимизации (модуль 1) из начальногоприближения q(k): определить(6.34)min {J j (q ) | K j , Ω(jk ) } .q∈Q ( j )Если k = 0, то матрица конуса доминирования Ω j (k)B j (k) = E = [m j ×m j ].И в результате находим решение J j ( k +1) , более предпочтительное, чемJ j ( k ) : J j ( k +1) ≤ J j ( k ) .Переход к шагу 4, иначе к шагу 3.Шаг 3.
Формирование матрицы В j (k) допустимых взаимных локальныхизменений компонент вектора J j(k) (см. гл. 3). Решается задача в постановке вида (6.34) (модуль 1) и находится решение=J j ( k +1) J j ( k ) , q ( k +1) ∈ QПj ,оптимальное по конусу доминирования, определяемому матрицей В j (k).Шаг 4. Вычисляется степень неравновесности ε(k+1) решения (см. гл. 3)J ( M K \ j ) (k+1) = J ( M K \ j ) (q(k+1))относительно контркоалиции K M K \ j . Для этого решается оптимизационjная задача (модуль 2а), в которой определяется степень несовместностинеобходимых условий векторного равновесия относительно векторногопоказателя J ( M K \ j ) и вектора параметров q ( M K \ j ) .