Лекции по дисциплине Оптимальное управление многоуровневыми ММС. Глава 2 (2016) (1245051), страница 4
Текст из файла (страница 4)
2.2. Частная классификация дифференциальных игр(с выделением учитываемых признаков)Cтабильно-эффективный компромисс в ММС (СТЭК ММС) – это объединениестабильности и эффективности в рамках множества решений – от полного совпадения данныхсвойств в одной точке пространства показателкй J (или управлений U) до обеспечения возможнойстепени сближения в условиях информационно-тактических расширений соглашений.СТЭК ММС дополняются их координацией в иерархических системах (КСТЭК ИС), гдереализуется право первого хода на основе субъективной информации, что составляет темуотдельного исследования.
Частная классификация дифференциальных игр с выделениемучитываемых в работе свойств, которая обобщает модель конфликтной ситуации, дана на рис. 2.2,где АДИ, БДИ и т.д. – вид взаимодействия в дифференцированной игре (ДИ). Стохастическиеусловия учтены в одном из классов АДИ (гл. 8).2.4. АНАЛИЗ ОСНОВНЫХ ПРИНЦИПОВ ОПТИМАЛЬНОСТИ, ФОРМ КОМПРОМИССОВ И МЕТОДОВРЕШЕНИЯ НА ОСНОВЕ ПОНЯТИЙ СТАБИЛЬНОСТИ И ЭФФЕКТИВНОСТИВ соответствии с понятиями стабильности и эффективности многие из существующихпринципов оптимальности связаны с тремя базовыми: оптимальность на основе гарантирующихподходов, коалиционного равновесия и кооперативных соглашений.Принцип оптимальности на основе гарантированных решений базируется на исследованиимаксиминных и минимаксных задач и равновесных (седловых) решений.Принцип оптимальности на основе коалиционного равновесия связан с игровыми подходами ввиде скалярного Нэш-равновесия, векторных равновесий (в частности, «сильного» равновесия,векторного Нэш-равновесия, -равновесия и др.), коалиционного равновесия на основеV-решений («угроз и контругроз») и др.Принцип оптимальности на основе кооперативных соглашений содержит два основныхвзаимосвязанных направления: векторная оптимизация для определения множества Парето11решений (без структурных свойств ММС) (скаляризация, лексикографическая оптимизация,пороговая оптимизация и принцип сложности, оптимизация на основе конусов доминирования,среднеквадратическая оптимизация и др.) и исследование кооперативной игры в формехарактеристической функции (с элементами учета структуры ММС: коллективной ииндивидуальной рациональности и т.д.) (С-ядро, Н-ядро, решение Нэймана–Моргенштерна (Н-Мрешение), решение на основе вектора дележа Шепли, с учетом и без учета платежей и др.).Причем решаются задачи получения множества Парето и выбора кооперативного(эффективного)компромисса(принципсложности, -оптимизация, дележ по Шепли, среднеквадратическая стратегия, арбитражная схема и др.).Известны также определенные результаты по комбинированию стабильных и эффективныхрешений (некоторые условия их совпадения, методы доминирования, некоторые методыкомбинирования Парето-решений, максиминных решений, Нэш-решений, предостереженийтипа «угроз-контругроз», работы по анализу условий вступления в коалицию и др.).Обзор существующих подходов и методов приведен в [54] и разделен по главам.
Кроме того,рекомендуются авторские рефераты некоторых фундаментальных и обзорных работ понеантагонистическим играм с анализом и дополнениями: Э.М. Вайсборда–В.Н. Жуковского [32],Э.Й. Вилкаса [39], Ю.Б. Гермейера [84], Н.С. Кукушкина–В.В. Морозова [137], Э. Мулена [158]. Вчастности, в работе [84] для игр в нормальной форме на основе субъективного и объективногоописания обстановки игры (см. стр. 2–3 реферата [84] и сноску в п.2.2) и понятия стратегий синформационным, смешанным расширением с использованием побочных платежей и с учетомспособов обмена информацией (см. стр.
3–6 реферата [84]) приводится детальный анализ принциповоптимальности (принципов выбора рациональных стратегий). При этом учитываютсяинформационные условия, степень коллективности действий и потребности практики (см. стр. 8–14 реферата работы [84]): оптимизация критерия коалиции-кооперации; оптимизация сосреднением; принцип максимина с позиции оперирующей стороны; принцип максимина всочетании с коалиционной оптимизацией и оптимизацией с осреднением; получение абсолютнооптимальной стратегии; получение стратегии наказания и поощрения; принцип гарантированногорезультата при обмене информацией в многошаговых играх с фиксированнойпоследовательностью принимаемых решений; строгое и нестрогое (не единственность) равновесиеи его связь с максимином, абсолютно-оптимальными стратегиями.
Сделаны выводы о болееобщих свойствах равновесия, чем решения в БДИ. Приведен подробный анализ преимуществ инедостатков коалиций и методов их организации (см. стр. 15–22 реферата [84]).Далее приводится краткий библиографический перечень некоторых классических исовременных направлений.В рамках методов исследования гарантированных решений (максиминных и минимаксныхзадач) наиболее известны следующие конструктивные направления (полностью см.
[54]: обзорыглав 7, 8 по антагонистическим играм).Это направления: Н.Н. Красовского–А.И. Субботина–А.Г. Ченцова–В.Д. Батухтина, В.М. Кейна, атакже Е.А. Ивановой–Е.М. Воронова–А.В. Савина, например [15, 76, 111, 118, 129, 130, 245] [см. обзоргл. 7], на основе принципа экстремального направления областей достижимости; Р. Айзекса–Р.
Беллмана–Ж.М. Андерсона, Д. Блекуэлла [см. обзор гл. 7] на основе динамическогопрограммирования и анализа сингулярностей нелинейных задач управления; В.Ф. Демьянова–В.Н. Малоземова–В.В. Федорова [94, 250], связанного с н/д условиями минимакса и максимина саналитическими и численными методами определения решений; Л.С. Понтрягина–А.М. Летова–А.М. Баткова–Д.С. Иргера–В.М. Александрова–А.Д.
Шараборова,атакжеЕ.М. Воронова–В.А. Карабанова–А.П. Карпенко–А.П. Маслова [209, 210] [см. также обзор главы 8] и [3, 26, 27, 61–66]на основе детерминированного и стохастического принципа максимума или комбинации принципамаксимума и фильтрации; А.Б. Куржанского [140] на основе методов наблюдения и управленияансамблем траекторий; Л.А. Петросяна–О.А.
Малафеева–Г.В. Томского [см. обзор главы 7] и [199] наоснове непрерывно-дискретных динамических игр; Ф.П. Черноусько, А.А. Меликяна [257],посвященное исследованию задач управления и поиска с перерывом поступления информации,эллипсоидными оценками и применением областей достижимости и неопределенности; А.Н. Лысенко,например [98], на основе аналитического конструирования и линейного наблюдения; Ю.Б. Гермейера[83] с глубоким анализом информационно-тактических свойств гарантирующих решений висследовании операций; А. Брайсона, М.
Берковица, У. Флеминга [278] на основе вариационныхподходов; В. Явина – стохастическое преследование и уклонение [420] и др.12В [54] проведен подробный анализ неантагонистических игр. В рамках подходов на основекоалиционного равновесия: обзор по Нэш-оптимизации дан в главе 2, обзор по векторнымравновесиям, коалиционному равновесию и V-решениям дан в главах 3,4. Обзор по методамвекторной оптимизации дан в главе 3, анализ кооперативной игры на основе характеристическойфункции дан в главе 5. Развернутый обзор по существующим подходам на основе СТЭК дан вглаве 6.Кроме ряда фундаментальных и обзорных работ по неантагонистическим играм, например,Э.М. Вайсборда–В.Н.
Жуковского [32], Э.Й. Вилкаса [39], Ю.Б. Гермейера [84], Н.С. Кукушкина–В.В. Морозова [137], Э. Мулена [168], следует отметить следующих авторов, чьи результаты внесливклад в развитие неантагонистических игр и анализ работ которых дан в обзорах [54]:В.Ф. Бирюков, В.И. Борисов, Н.Н.
Воробьев, В.М. Гаврилов, Ю.Б. Гермейер, В.В. Гороховик,А.Н. Джафаров, В.В. Дружинин, Г.И. Дюбин, В.Ю. Зверев, Ю.М. Ермольев, А.П. Карпенко,А.Ф. Кононенко, В.Ф. Крапивин, В.В. Кротов, А.Б. Куржанский, О.И. Ларичев, Ц.Г. Литовченко,Р. Льюс, Л.Н. Лысенко, Н.Н. Моисеев, А.А. Меликян, О. Моргенштерн, Д. Нейман, В.Д. Ногин,В.Н. Опойцев, Г. Оуэн, Р.А. Поляк, В.П.
Пацюков, Л.А. Петросян, В.В. Подиновский, М.Е. Примак,Л.С. Понтрягин, Х. Райфа, Л.А. Растригин, Т. Саати, М.Е. Салуквадзе, В.А. Серов, Э.Р. Смольяков,Е.В.Смирнова, И.М. Соболь, Р.Б. Статников, В.Г. Суздаль, Г.В. Томский, А.Л. Топчишвили,Н.Т. Тынянский, М.М. Хрусталев, Ф.Л. Черноусько, S.L. Anderson, T.Basar, L.D.
Berkovitz,I.H. Case, E.L. Dockher, I.V. Friedman, D. Ghose, I.C. Harsanyi, A. Haurie, S. Jorgensen, G. Leitman,M. Margiacco, H. Mukai, J. Nash, V. Pareto, L.F. Pau, B. Petrovic, V.R. Prasad, A. Ray, J.K. Sengupta,L.S. Shapley, R.Selten, H.L. Stalford, A.W. Starr, D. Yeung, J. Yong, P. Yu, L.S. Zazemba и др.Следует отметить, что распределение принципов оптимальности по элементу классификацииигр на игры с противоположными и непротивоположными интересами (неантагонистическиеигры) является условным, так как, к примеру, минимаксные (или максиминные) подходы могутбыть применены и в играх с непротивоположными интересами при недостатке информации опартнерах, при формировании характеристической функции и арбитражной схемы. Более того, вцитированной работе [84] ряд постановок и условий для игр с непротивоположными интересамисформированы на основе обобщенного автором принципа гарантированного результата.
Вкачестве второго примера «перемешивания» принципов конфликтного взаимодействия являетсяусловность их отношения к стратегическим и нестратегическим (кооперативным) играм. Так, изопределения 2.9 следует, что единая коалиция действия кооперации порождает единую стратегию,которая совпадает с ситуацией, в отличие от определения 2.3. Понятие стратегии теряет смысл[190, стр. 17], и принятие решения в кооперативной игре принимает вид нормативногодоговорного акта (обязательного соглашения [168]). Результатом соглашения становитсясовместное получение «справедливого» дележа. Но подобный результат может быть полученпосле создания коалиции-кооперации, а в процессе ее организации решаются задачистратегического характера. Во-первых, необходимо создать механизм обеспечения устойчивостикоалиции-кооперации при неудовлетворенности участников кооперации результатами дележа и,во-вторых, обеспечить наилучшие для всех объектов условия дележа введением «арбитражной»[84] характеристической функции объекта (определение 2.8).