Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 38
Текст из файла (страница 38)
Рассмотрен вопрос о способах обмена информацией и расширении в связи с этим понятия стратегии.Автор исследует формализованное отношение трех уровней возможного компромисса при образовании коалиции (обмен информацией об игре иобстановке, частичный совместный выбор на основе совместной информации, полное объединение ресурсов и совместный способ действий) и,1См.
сноску в п. 1. 2.200Стабильные эффективные решения и компромиссы. Часть Iсоответственно, три формы объединения в коалицию с повышением степени коллективизма (с уменьшением степени конфликтности).Так, основная, первая, форма включает свёрткуJ K = min[ρi ( J i − J i0 )] ,i∈Kгде Ji° – нижняя грань результата, на которую ещё может согласиться игрок, не выходя из коалиции; ρi – весовые коэффициенты,и ограничения коалицииX K = ∏ Xi ,i∈Kгде для Xi, имеющих вид γi(x, β) > 0 (x – решения, β – неопределённыефакторы), ограничения принимают видmin ρi γ i ( x, β) ≥ 0 .i∈KЗдесь векторы ρ и J° – элементы формализации принципа компромиссамежду интересами игроков.Если игроки не приходят к соглашению относительно ρi, они могут обратиться к арбитру и на основе, например АСН, оптимизировать=J K ∏ ( J i − J i0 ) .i∈KЧтобы подчеркнуть выгоду коллективных действий, автор приводитпример игры с противоположными интересами, в которой вводятся побочные платежи, что приводит к большей эффективности для каждого игрока.При таком перестроении допустимое множество имеет кроме Паретограницы и внутренние точки в отличие от исходной задачи, где Пареторешения составляли всю допустимую область.Анализируя принципы выбора рациональных стратегий [84] с учётоминформационных условий, степени конфликтности (коллективизма) и потребностей практики (оптимизация с осреднением, максимин, абсолютнооптимальные стратегии и стратегии наказания, равновесие и т.д.), авторпредсказывает важность и актуальность исследований для СТЭК.При этом «прообразом» СТЭК-4 является предложенная при рассмотрении принципа максимина область компромиссов, которой соответствуют все решения с результатами лучшими, чем максиминные.
Выводы 1 и 2второй главы [84] о коллективном обмене информацией при выборе неединственного равновесного решения и коллективности принципа равновесия являются обоснованием для СТЭК-1, 2 (см. стр. 14 реферата [84]).Вывод 3 обосновывает СТЭК-5, а вывод 4 указывает на оригинальный вариант возможного компромисса при образовании коалиции.Подробно анализируя преимущества и недостатки коалиций и рассматривая девять условий образования коалиции, «шесть трудностей» органи-Глава 6. Методы комбинирования решений201зации коалиций и три условия невозможности коалиций, автор указываетна базовую область возможных коалиций со значениями между минимальными и неулучшаемыми (см.
СТЭК-4), а кооперативная игра с характеристической функцией трактуется как вариант договорного арбитража.Определённая ценность в смысле устойчивого компромисса заключается в реализации дополнительных мероприятий, которые способствуютуменьшению опасности сепаратных действий. Среди них следует выделить: одновременность принятия решения, ограничение выбора, переход кколлективным действиям с некоторой устойчивостью к индивидуальнымустремлениям (кроме равновесия, УКУ, применяется повторение игры, тогда «обман» вскрывается и может быть предусмотрена процедура наказания), создание органа, следящего за выполнением условий коалиции (переход от СТЭК ММС к СТЭК ИС) и т.д.Для этого в работе рассмотрены подходы и методы решения игр с повторением и иерархические игры.
Таким образом, потребное для практикикомбинирование классов игр и детальный учёт информационных условийигры в фундаментальной работе [84] является мощным источником дляформирования и развития методов исследования на основе СТЭК.Эпиграфом работы Э. Мулена [168] может быть предложена следующая фраза на стр. 12: «противоречие между стабильностью и эффективностью мы считаем главным побудительным мотивом к кооперации…», которая не только выделяет две основные грани игрового результата, но иуказывает основную тенденцию развития конфликтной ситуации – кооперативный компромисс. В работе, как отмечалось ранее (гл. 1), впервыевводятся понятия необязательного и обязательного соглашения, которыемогут быть важной классификационной основой компромиссов.Напомним, что необязательное соглашение заключается в том, что либо игроки сообща обсуждают, какой исход выбрать, пока не договариваются, либо при достаточной взаимной информации без обсуждения выбирают единственно доминирующее решение, выгодное каждому из них.
Этисоглашения не лишают игроков прав отклонения от договорённости и потенциально сохраняют свойства конфликтности. Поэтому после принятиятаких соглашений требуется определённая ограниченность обмена информацией между игроками. Если дальнейший обмен и «добывание» информации невозможны, то необязательные соглашения на основе равновесныхконцепций порождают стабильные компромиссы. Если самостоятельноедобывание информации или частичный обмен допустим, то необязательное соглашение может быть сохранено при учёте в процедуре компромисса различных предостережений.
(Всё это может служить основой дляформирования ряда указанных ранее СТЭК ММС (СТЭК-1, 2, 5 и др.)).Обязательным соглашением является такая договорённость сторон, врезультате которой игроки теряют контроль над решениями. После согла-202Стабильные эффективные решения и компромиссы. Часть Iшения все проблемы кооперации снимаются, но все они имеют место досоглашения. Теперь значимость стабильности уменьшается, так как нарушения невозможны, можно говорить только о «справедливости», поэтомуподход к кооперации при обязательных соглашениях из описательного(какие соглашения являются стабильными при той или иной информационной структуре) становится нормативным (какие соглашения считатьсправедливыми при заданных соотношениях сил отдельных игроков и коалиций).Потребности практики и тенденция игры позволяют утверждать обопределённой взаимосвязи данных видов соглашений и определённой динамике перехода от необязательных соглашений к обязательным, как степени развития игры, что может служить основой формирования СТЭК-4,СТЭК-11, СТЭК-12 и т.д.В работе отмечается, что область между индивидуальными решениями и Парето-границей является минимальной областью переговоров окооперации (к СТЭК-4), а основой концепции равновесия при предостережениях является α-ядро (прообраз СТЭК-5): множество таких переходов, которые при соответствующих угрозах становятся стабильными относительно отклонений любых коалиций.
Рассматриваются α-решенияПарето-области, тогда любое α-решение является дележом, в частномслучае решения, оптимальные по Парето–Нэш, являются дележом (основа ПСТЭК). Следовательно, α-ядро включает стабильные решения сбольшей степенью эффективности, чем те, которые обеспечивают необязательные соглашения. Рассмотрены и β- и γ-ядра, как α-ядра с дополнительными ограничениями. Установлена прямая связь между осуществимостью стабильности предупреждений и борьбой за лидерство, т.е.
переход от СТЭК ММС к СТЭК ИС.Фундаментальная работа Э.М. Вайсборда и В.И. Жуковского [32] систематически раскрывает и формирует новые результаты в четырех основных классах игр (БДИ, КДИ, КОДИ, ИДИ) по трем направлениям: понятие, существование и методы отыскания решений. Определенные идеи иметоды касаются проблемы компромиссов.Так, в разделе БДИ рассматриваются вопросы выбора равновесных решений при их неединственности. В разделе КДИ анализируется компромиссная модификация Скеруса решения по Харшаньи на множестве коалиционных структур, когда сформированное множество недоминируемыхравновесных решений и значений игры на множестве коалиционныхструктур используется для формирования характеристической функцииν (K) кооперативной надстройки над множеством коалиционных структур.При этомNν(0) = 0, ν( N ) = max ∑ J i ( u) ,u∈Ui =1Глава 6. Методы комбинирования решений203n( K ) =min ∑ J i ( u r ) для всех K∈P⊂P.K∈Pi∈KВ последнем равенстве минимум берется по всем разбиениям Р, (P⊂P),содержащим коалицию K, а ur – набор равновесных стратегий, выбранныйпо методу доминирования Харшаньи из множества всех равновесныхстратегий игры Г(P), причем предполагается единственность такого набора в Г(P).
Далее, после исследований условий существенности полученнойкооперативной игры может быть получен кооперативный дележ.Можно предположить, что подобная комбинация КДИ- и КОДИподходов имеет определенную связь с одним из наиболее общих понятийкомпромиссов – коалиционным равновесием.В том же разделе [32] в рамках предложенного авторами метода поискаУКУ-решений рассматриваются условия получения УКУ–Паретокомпромиссов, а в случае отсутствия угрозы (равновесные решения) – получения ПСТЭК.
Следует отметить, что эти условия, основанные на подходах Сталфорда–Кротова, достаточно сложны, но позволяют найти решения «в обратных связях».Обсуждаются более простые частные случаи УКУ–Паретокомпромисса, когда угроза реализуется среднеквадратической стратегией,а ПСТЭК исследуется для игры с постоянной суммой.В разделе, посвященном КОДИ, отмечается, что применение среднеквадратических решений (СКР), арбитражной схемы Нэша (АСН), С-ядра,Н–М-решения, вектора Шепли и других дележей позволяет сузить множество решений, чтобы все игроки имели результат лучший, чем самостоятельный.Свойствами договорного компромисса обладают принципы, применяемые в КОДИ: договорная устойчивость по Парето, С-ядро, Н–М-решениеи оптимальность, явно или неявно предполагающая наличие арбитра(АСН, вектор Шепли).При совместном выборе стратегий формируется показатель оптимальности ϕ (J 1 ,..., J N ), который сужает выбор решений на Парето-множестве.В случае СКР, АСН-скаляризации эта функция задается явно, в остальныхслучаях (вектор Шепли, С-ядро, Н–М-ядро) – неявно.Подробно обсуждаются определения и свойства СКР и АСН.
Поставлена задача поиска дележа на введенном множестве предпосылок, которыеопределяются как ПНОК и ПГОК и поэтому подкрепляют важность обсуждаемых в данной главе схем СТЭК.В разделе, посвященном ИДИ, формируется понятие СТЭК ИС и рассматриваются необходимые и достаточные условия его получения как координации центра в виде решения по Штакельбергу.204Стабильные эффективные решения и компромиссы. Часть IВ работе Э.Й. Вилкаса [39] сформировано обобщение основных принципов оптимальности в БДИ, КДИ, КОДИ с позиций введенного авторомпонятия V-решения и его модификаций, что проектируется на проблемукомпромиссов.
Одним из центральных результатов является формулировка коалиционного равновесия на основе V-решения. Из формулировкиследует, что ситуация является коалиционным равновесием, если она принадлежит V-решениям (для которых отсутствуют эффективные угрозы, т.е.угрозы без контругроз) и максимизирует по Парето вектор показателей коалиции. Данная формулировка дополняет трактовку Харшаньи–Скеруса[32], так как при фиксированной коалиционной структуре реализуетсялишь Нэш-равновесие, а договорное начало на множестве разбиений достигается на основе кооперативного подхода с использованием характеристических функций.В рамках КОДИ появляется дополнительное качество договорногокомпромисса в виде устойчивости конфигурации (P, х), где P – разбиение,а х – дележ, и справедливого дележа на основе баланса взаимных требований коалиции. В связи с последним появляется понятие K-ядра, когда конфигурация (P, х) считается устойчивой, если дележ в каждой коалицииK ∈ P произведен согласно возможностям игроков в других коалициях.Анализ классических решений кооперативной игры в соотношении сV-решениями позволяет автору сделать вывод, что получение новых договорных решений связано с дополнительными ограничениями наконтругрозы.