Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 44
Текст из файла (страница 44)
3.5.4) с введением последовательной системыпредпосылок видаJУКУ≤ J1≤ J2≤ Jш.6.3.3.Модификации арбитражных схемПри всём разнообразии структурных вариантов арбитражных схем(АС), рассмотренном в обзоре данной главы, выделяются четыре АС: АСГлава 6. Методы комбинирования решений229Нэша, АС Райфы, пропорциональная АС [39] и АС Нэша–Харшаньи–Селтена при неполной информации (АСНХС) [245, стр. 225]. Если АСНимеет исходной точкой гарантированное решение, а результат, как правило, даёт одну из точек Парето-границы, то АСР ориентируется на то Парето-решение, которое является пересечением Парето-границы с линией, соединяющей исходную точку с идеальной точкой.
Пропорциональная АС(ПАС) обеспечивает последовательные переходы от исходной точки в точки-предпосылки с последовательным пропорциональным нарастанием эффективности объектов, задействованных данной АС. Структура ПАС частично пересекается со структурой последовательного СТЭК-11, даёт решения на множестве предпосылок, не достигая Парето-границы. Кромеоригинальной конструкции кооперативного компромисса на основеАСНХС, интересна возможность дополнительного выигрыша тому, ктопривносит дополнительную информацию в одностороннем порядке.В данном разделе рассмотрены две модификации АС с использованиемНэш- и УКУ-исходов (СТЭК-3, 6), а также модифицированная АС на основе «узкого» конуса доминирования и ПНОК.О модификации арбитражных схем Нэша и Райфы с использованием Нэш- и УКУ-решений (СТЭК-12).
По определению арбитражнойсхемы Нэша арбитражное решение удовлетворяет условию(6.41)max ∏ ( J i ( u) − J i∗ ) → u a ,uJ i∗гдеi∈N– компоненты вектора показателей J* в начальной точке, uа – Па-рето-решение. В классической АСН в качестве J i∗ выбирается гарантированное значение показателя i-го объекта (коалиции)(6.42)J i* = maxminJ i ( ui , u / ui ) .iiiiu ∈Uu / u ∈U / UКратко приведем известные свойства арбитражного решения, подробно проанализированные во введении к главе и, например, в рефератеработы [32] 1.1) Арбитражные решения оптимальны по Парето.2) Решение независимо от альтернатив: при расширении множества допустимых решений арбитражное решение не изменяется.3) Решение не зависит от линейного преобразования показателей.∗∗∗J=4) Имеет место симметрия решения: если J=12 2 J N , то и( )( )( )J1 u a = J 2 u a = ...= J N u aпри условии, что арбитраж проводитсямежду одинаковыми (однотипными) игроками.
К данным свойствамможно добавить свойство-следствие.1См. сноску в п. 1.2.230Стабильные эффективные решения и компромиссы. Часть I5) Свойства 1 – 4 арбитражного решения сохраняются, если J* являетсяодним из устойчивых решений, принадлежащих множеству допустимых значений показателей.Утверждение 6.12. Существует единственное арбитражное решениеНэша, удовлетворяющее свойствам 1 – 5. Доказательство в работе [39, стр.191] базируется на первых четырех свойствах.При анализе стабильно-эффективных компромиссов ориентировка альтернативы обязательного соглашения в виде АСН при отказе от арбитражана наихудший информационно-тактический вариант необязательных соглашений (6.42) является слишком грубым вариантом. Кроме того, приглобальной оптимизации на основе АСН усилена проблема локальныхэкстремумов.Предлагается в качестве J* использовать значения СТЭК-3 или СТЭК-7,как наилучших Нэш- и УКУ-решений соответственно, которые «продвинуты» к Парето-границе по сравнению с (6.42) и поэтому имеют большую эффективность, чем (6.42).
Кроме того, АС меньше подвержена влиянию локальных экстремумов.Таким образом, вместо (6.42) имеемУКУ(6.43)=J i∗ J=, ( J i∗ J ir ) .iПри условии параметризации управляющих сил далее решается задачачисленной оптимизации (6.41) – (6.43).По определенно арбитражной схемы Райфы [39] арбитражное решениеудовлетворяет условиюmax minu∈U i∈NJ i (u ) − J i∗→ ua ,J iид(6.44)где J i∗ – значения показателей в начальной точке; J iид – значения показателей в «идеальной точке».Значение Ji ( u a ) находится в точке Парето-границы.Теперь свойство 2 принимает вид 2', 2'' [39].2'. Если при заданном J, J (ua)∈L’⊂L, J ид на L' и на L совпадает, то u aна L' совпадает с u a на L.2''. Если J1ид = J iид =...= J nид и J1∗ = … = J N∗ , то J 1 ( u a ) = … = J N ( u a ).Можно показать, что свойства 1, 2', 3, 4, 5 имеет АСН и АСР, но свойством 2′′ обладает лишь АСР.Утверждение 6.13.
Существует единственное арбитражное решениеРайфы удовлетворяющее свойствам 1, 2', 2'', 3, 4, 5.Доказательство приводится в работе [39, стр 195 – 196] на основесвойств 1, 2', 2'', 3, 4. Можно также показать, что свойство 5 не вносит вдоказательство дополнительных ограничений.Глава 6. Методы комбинирования решений231Таким образом, модифицированная задача определения, например арбитражного решения по схеме Райфы, решается в постановке (6.43), (6.44).Общая схема алгоритма содержит, по крайней мере, три этапа.Эт а п 1.
Определение идеальной точки.Эт а п 2. Определение СТЭК-7 (СТЭК-3) для получения J*.Эт а п 3. Формирование итерационного процесса максимизациинаименьшей компоненты текущего приближения (6.44).Модифицированная арбитражная схема на основе узкого конусадоминирования и ПНОК [49, 54, 213] (СТЭК-13). В данном пункте обсуждается алгоритм построения конуса доминирования, обеспечивающегов отличии от АСН равномерное улучшение компонент векторного показателя Ф ∈ E mK (m K – число коалиций) от точки Ф(qr), где qr – равновесноепараметризованное решениеФK j ∑ J l , K j ∈ M K .=i∈K jАлгоритм состоит из трёх шагов.Ша г 1.
Назначение величины ε, характеризующей минимально допустимый разброс при изменении компонент векторного показателя Ф внутри конуса доминирования Ω, иначе требуется, чтобы для любого d ∈ Ωвыполнялось соотношение(6.45)1 − ε ≤ di / d j ≤ 1 + εпри любых i, j∈M K .Ша г 2. Вычисление величины δ по формулеε.0<δ≤( mK − 1)2 + ε( mK − 1)(6.46)Ша г 3. Построение матрицы В конуса доминирования Ω в виде1 s s s s 1 s s,(6.47)B=s s 1 s s s s 11где s = −+ δ . mK − 1Конус Ω, построенный по формулам 6.46, 6.47, удовлетворяет требованию (6.45).Утверждение 6.14 [213].
Конус доминирования Ω с матрицей В, сформированной в виде (6.47), где параметр δ выбирается из диапазона (6.46)для любого d ∈ Ω, обеспечивает выполнение условия (6.45).Заданием конуса доминирования Ω = BJ и его вершин в виде СТЭК-7(или СТЭК-3) формируются начальные условия для реализации алгоритмаСтабильные эффективные решения и компромиссы. Часть I232Ω-оптимизации в рамках ПС «MOMДИС». Данный алгоритм подобно арбитражной схеме, но с равномерным улучшением вектора показателей,позволяет получить обязательный компромисс в виде единственного Парето-решения или его малой окрестности.Алгоритм СТЭК-13 имеет следующий вид:1) Формирование СТЭК-7 (СТЭК-1–3).2) Формирование «узкого» конуса доминирования Ω с равномернымулучшением вектора показателей и вершиной в СТЭК-7 (СТЭК-1–3).3) Процедура оптимизации по конусу Ω.6.3.4.Среднеквадратическое решение (СКР) относительноидеальной точки и значения дележа по Шепли (СТЭК-14)Обязательный компромисс в виде среднеквадратического решения относительно идеальной точки широко известен [32, 108, 203, 226] и имеетсмысл Парето-решения, наиболее близкого к идеальной точке (минимальная групповая неудовлетворённость).
При неравнозначности объектов СКРявляется решением задачиN2min ∑ λ i J i ( u) − J i* → u c ,u∈U(6.48)i =1где=J i* max=J i ( u), i 1, N ,(6.49)uгде веса λ i удовлетворяют условию0 ≤ λ i ≤ 1,N∑ λi =1 .(6.50)i=1Важным свойством решения является независимость от неизвестныхальтернатив: если U ⊂ U ,=max J i ( u) max J i ( u), =u c ∈ U , i 1, N ,u∈Uu∈Uто u является решением и для суженного множества допустимых решений U .В данном разделе рассматривается модифицированное СКР как задача(6.48) – (6.50) с дополнительным условием||J – Jш || ≤ c.(6.51)cКак известно, задача (6.48 – 6.51) на условный экстремум может бытьрешена методом Лагранжа при условии задания (6.51) в виде равенства, впостановкеNN(6.52)max ∑ λ i [ J i ( u) − J *]2 + ρ∑ γ i [ J i ( u) − J iШ ]2 ,u∈U i 1 =i 1=Глава 6.
Методы комбинирования решений233шгде J i – компоненты вектора дележа по Шепли; γ i – весовые коэффициенты, удовлетворяющие, так же как и λ i , условию (6.50); ρ – множитель Лагранжа, который после получения решения как функции u (⋅, ρ) определяется из условия (6.51).При параметризации управления u = u(q, ρ, x), q∈Q, компактностимножества Q и квазивыпуклости функционалов J i (u) данная задача имеетрешение в численной форме.В результате получаем СКР с дополнительными свойствами близости кзначению средней эффективности, которая может быть достигнута каждым объектом при образовании им всевозможных коалиций в рамках данного множества объектов.Очевидно, что общий алгоритм решения полученной задачи имеет триэтапа.Эт а п 1.
Решение N задач вида (6.49) для получения идеальной точкиJ* (см. СТЭК-3, СТЭК-9).Эт а п 2. Решение задачи получения значения дележа по Шепли JШ(глава 5) (см. СТЭК-6).Эт а п 3. Получение СКР на основе решения задачи (6.50) – (6.52).6.4. ОБ ИНТЕЛЛЕКТУАЛЬНЫХ СТЭК НА ОСНОВЕ ОБОБЩЁННОГОГОМЕОСТАЗА В ФОРМЕ ПРЕДЕЛЬНОГО ЦЕЛЕВОГО КАЧЕСТВАИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ (ИС) С ДИНАМИЧЕСКОЙЭКСПЕРТНОЙ ПОДДЕРЖКОЙ [46, 179, 215]Интеллектуализация СТЭК, т.е.
внедрение интеллектуальных подходов всложный механизм формирования СТЭК на основе экспертных систем является важным технологическим фактором. С другой стороны, подходы на основе ёмких структур информационно-тактических компромиссов, учитывающих факторы многообъектности и многокритериальности сложных системи задач, позволяют сформировать оценки предельного целевого качестваИС, в которой в соответствии с её структурой [215] существенными являются вопросы взаимодействия с внешней и внутренней средой.Современное состояние управления сложными техническими системами порождает потребность к формированию положений кибернетики, которые равноправно объединяют технические и биологические аспектыуправления [46, 179, 215].В данной работе применяются обобщенные свойства формальногопредставления гомеостаза [179] на основе учёта целевых признаков и стабильно-эффективных компромиссов при компенсаторном взаимодействииИС с активной средой [55].