Методическое пособие по ОУММС (1033914), страница 4
Текст из файла (страница 4)
Известны также определенные результаты по комбинированию стабильных и эффективных решений (некоторые условия их совпадения, методы доминирования, некоторые методы комбинирования Парето-решений, максиминных решений, Нэш-решений, предостережений типа «угроз-контругроз», работы по анализу условий вступления в коалицию и др.).
Обзор существующих подходов и методов приведен в [1, гл. 1] и разделен по главам [1, гл. 2 – гл. 8].
Можно выделить ряд свойств задач управления ММС, которые свидетельствуют о необходимости формирования компромиссов и создают определенную основу для этого:
-
наличие в целевой эффективности ММС индивидуальных и общих интересов;
-
изменение информационных условий в ММС (неполнота информации и информационное «перемирие» с добровольным обменом (при наличии искажений – «блефа») и «добыванием» информации, связь субъективной и объективной информационных ситуаций);
-
возможности и условия образования коалиций и различных коалиционных структур в ММС для повышения индивидуальной и общей эффективности в ММС на основе предостережения (наказания и поощрения);
-
комбинации стабильных и эффективных решений на основе необязательных соглашений или обязательной договорной основе (например, выбор наиболее эффективного стабильного решения, стабильного среди эффективных и др.);
-
стремление ММС к предельному целевому качеству с обеспечением минимальной межуровневой конфликтности (между «арбитром» и «линейкой» равнозначных объектов – коалиций ММС) на основе обобщенного гомеостаза и т.д.
Усложняемые виды стабильно-эффективных компромиссов и другие вопросы рассмотрены в пунктах 2, 3 данного учебного пособия и в [1, гл. 6].
1.5. Основные определения эффективности и стабильности. Методы и алгоритмы стабильно-эффективного управления
Целью данной работы является изучение методов и алгоритмов стабильного и эффективного управления, способов формирования стабильно-эффективных компромиссов ММС (СТЭК ММС) с последующим применением средств автоматизированного проектирования и реализацией методов в прикладных задачах.
Определения стабильности и эффективности, используемые в работе, без ограничения общности, сформулируем в рамках параметризованных управлений и/или процедур принятия решения, причем на общий вектор параметров наложены ограничения
, где
Понятия эффективного управления базируется на Парето-оптимальном решении, -оптимальном решении и дележе Шепли.
Определение 1.11. Пусть множество индексов коалиции
. Вектор
оптимален по Парето, если из условия
следует либо
, либо система неравенств несовместна и хотя бы одно из неравенств противоположного смысла.
Определение 1.12. Пусть – многогранный конус, определенный матрицей
.
Пусть – новый векторный показатель вида
. Тогда оптимальное по Парето множество для
совпадает с
-оптимальным множеством для
.
Рис. 1.3. Парето- и -оптимальность
На рис. 1.3 для приведены два конуса
и
.
Из рис. 1.3 видно, что прямоугольный конус типа конуса с вершиной в точке С1 удовлетворяет всей области П-Парето-решений, а «узкий» конус с вершиной С2 выделяет на Парето-области подобласть -оптимальных решений.
Определение 1.13. Набор параметров называется оптимальным по Шепли, если обеспечивает
, где
– функция Шепли, которая, например, при
имеет вид
где – характеристическая функция, как точка равновесия по Нэшу (см. определение 1.14). Например,
означает:
,
,
.
Стабильные решения формируются в виде гарантирующих решений, скалярного равновесия по Нэшу, векторных равновесий (векторное равновесие по Нэшу, -равновесие) и коалиционного равновесия на основе V-решений в форме угроз-контругроз (УКУ) Вайсборда–Жуковского.
Определение 1.14. Набор решений является равновесным по Нэшу относительно скалярного показателя
, который является функцией эффективности коалиции
, если для любого
Определение 1.15. (частный случай определения 1.14).
Если и цели антагонистические, т.е.
, то равновесие по Нэшу превращается в седловую точку
Определение 1.16. Набор параметров называется гарантирующим решением для показателя
коалиции
, если
.
Определение 1.17. Набор векторов параметров , где
называется коалиционным равновесием (V-решением в форме угроз-контругроз (УКУ)) при показателе коалиции
, если при попытке коалиции
улучшить свой показатель (угроза –
)
на множестве P допустимых коалиционных структур существует возможность создания контркоалиции , для которой реализуется контругроза
Определение 1.18. Набор параметров является равновесным по Нэш относительно векторного показателя
, где
(фиксированная коалиционная структура), если набор
является V-решением без угроз и если для любых
и
из условия
следует лишь
(т.е. на векторе
имеет место Парето-оптимальность).
Определение 1.19. Набор векторов параметров называется -равновесным относительно векторного показателя
, где
, если
есть V-решение без угроз и если для любых
и
из условия
, где
, следует либо
, либо его несовместность (т.е. на векторе
в соответствии с определением 1.12 имеет место -оптимальность).
Определения стабильных и эффективных решений позволили далее описать методы поиска этих решений на основе математического и алгоритмического обеспечения (см. пункты 2 и 3 данного учебного пособия и работу [1]). На рис. 1.4а представлены восемь основных методов и алгоритмов. Данные методы и алгоритмы были реализованы в рамках разработанных программных систем:
-
ПС «МОМДИС» (многокритериальной оптимизации многообъектных динамических систем с разработкой методов и алгоритмов определения Нэш, Парето, УКУ, Шепли и др. решений);
-
ПС «ГАРАНТИЯ-М» (программная реализация программно-корректируемого закона управления на основе экстремального прицеливания);
-
ПС «FILTR» (оптимизация стохастических антагонистических моделей в интегро-дифференциальной форме) на основе фильтрации и управления);
-
ПС «ОКПЛА» (оптимизация коалиционного перехвата ЛА на основе векторного равновесия по Нэшу);
-
ПС «АСН» (арбитражная схема Нэша на основе СТЭК-1 (2, 3) и СТЭК-7);
-
ПС «Алгоритм ЦР-ПДК на основе СТЭК»;
-
ПС «Алгоритм оптимизации антагонистического стохастического конфликта на основе интегро-дифференциальной модели».
На рис. 1.4а справа указана степень проработки каждого алгоритма в соответствии с рис. 1.4б.
Рис. 1.4а. Применяемые методы и алгоритмы взаимодействия объектов и коалиций
Рис. 1.4б. Схема, иллюстрирующая уровень проработки алгоритма
Рис. 1.4в. Классификация СТЭК
На рис. 1.4в дана классификация стабильно-эффективных компромиссов (СТЭК) ММС на основе необязательных соглашений Мулена и строгой договорной основе.
Рис. 1.5 иллюстрирует смысл компромиссов на основе комбинации Парето–Нэш–УКУ–Шепли-подходов.
Рис. 1.5. Компромиссы на основе комбинации ПаретоНэшУКУШепли-подходов:
П – Парето-граница АВ; Н – Нэш-равновесие; УКУ – область угроз-контругроз;
ИТ – идеальная точка; УК – -оптимальная часть П-границы на основе узкого конуса ;
Ш – точка Шепли; СНД – Парето–Нэш-область компромиссов (ПНОК)
СТЭКи заключаются в выборе недоминируемого наиболее эффективного Нэш-решения (точка Н), формировании Парето–Нэш-области компромиссов (ПНОК) на основе прямоугольного конуса СНД, границей которой является Парето-граница. В области ПНОК выбираются УКУ-решения в той или иной степени близости к точке Шепли либо к «идеальной» точке. Результирующим на основе остальных является СТЭК-7. В [1, гл. 6] приведены обобщения СТЭК-7 в форме СТЭК-8–10.
Участникам игры имеет смысл выполнять необязательные соглашения в связи с устойчивостью ситуации в точке УКУ-решения.
В рамках обязательных соглашений рассматриваются комбинации арбитражных схем с УКУ–Нэш-равновесием, среднеквадратических решений с точкой Шепли и др.
Игровые подходы имеют большую значимость в развитии интеллектуальных систем управления (ИСУ, в состав которых входят, по меньшей мере, два присущих лишь ИСУ блока: динамическая экспертная система (ДЭС) и подсистема предельного целевого качества (ППЦК). Кроме необходимости пополнения базы знаний ДЭС разрабатываемыми игровыми алгоритмами, с одной стороны, и интеллектуализации компромиссов с учетом возможностей ИСУ, с другой стороны, в настоящее время разрабатывается концепция формирования ППЦК на основе игровых компромиссов в ММС и обобщенного гомеостаза, а также на основе игровых компромиссов в иерархических системах.
1.6. О применении методов и алгоритмов стабильно-эффективного управления в практических задачах
В данной курсовой работе исследуются практически важные модели конфликтных ситуаций в технических, экономических и биотехнических приложениях.
Рис. 1.6. Фрагменты трехуровневой конфликтной ситуации ЛС СВН – ЛС ПВО
Так, в рамках технических задач рассмотрены методы оптимизации решений в поуровневых фрагментах трехуровневой конфликтной ситуации ЛС СВН – ЛС ПВО (локальной подсистемы системы воздушного нападения и локальной подсистемы ПВО) (см. рис. 1.6).
На рис. 1.6 КС – конфигурации систем, ЦР – целераспределение, ИТК – имитация такта конфликта, ПДК – прогноз динамики конфликта на основе игровых подходов и т.д. (см. список обозначений).