Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 13
Текст из файла (страница 13)
Одна относится к микросоциальным процессам [337]. Здесь Нэш-подход применендля «игр» голосования, имеющих несколько этапов процедуры голосования. Другая иллюстрирует макросоциальные процессы [306]. Рассматривается дифференциальная игра с социальными модельно-династическимициклами. Получено Нэш-решение – устойчивый цикл социального развития (деспотизм-анархия) в игре их представителей – правителей и олигархий при наличии общего ресурса – крестьянской массы (или основногонаселения), который по-разному используется обеими силами.В заключение данного раздела обзора рассмотрим применение Нэшподхода как элемента собственно математической «технологии». Так, в[389] задача стохастического программирования рассмотрена как игра сненулевой суммой. В [289] вычисляется вариация в форме пары интегральных форм с использованием регулярного равновесия по Нэшу.В [302] рассматривается мультиобъектное программирование с анализомСтабильные эффективные решения и компромиссы.
Часть I60равновесия, Парето-решения и их зквивалентности. В [374] рассмотренметод приближения Нэш-решений (изменение множества решений и показателей) в игре и мультиобъектном программировании.В заключение следует отметить, что в [54 п. 2.1.5] дан комментарий попроблеме равновесия рефератов ряда монографий. В приложении работы 1приведены рефераты монографий. В разделе 2.1.5 рефераты комментируются по всем направлениям обзора (определения, существование, алгоритмы) с некоторыми дополнениями.2.2. ОБОБЩЕННОЕ НЕОБХОДИМОЕ УСЛОВИЕ РАВНОВЕСИЯ ПО НЭШУВ ФОРМЕ ДВУХУРОВНЕВОЙ СТРУКТУРЫ ПАО2.2.1.Необходимое условие равновесия по Нэшу в формедвухуровневой структуры Пао [376]Рассматривается конфликтное взаимодействие N коалиций со скаляризованными показателями J i на фиксированном интервале времени [0,T ] ,как бескоалиционная игра с ненулевой суммой.Модель конфликтной ситуации дана следующими соотношениями:x (t ) f ( x, u(⋅), t ),=x 0=(t ) g ( u(⋅), z(0), t ),z(t ) ( x(t ), x 0 (t )) ∈ E n + N ,=(2.1)x (t ) ∈ X (t ) ⊂ E n ,ui (⋅) ∈ U i ⊂ Fi , i= 1, N , F = F1 × × FN ,u ∈ F,где E − евклидово пространство размерности k; Fi − рефлексивное банахово (полное, линейное, нормированное) пространство действительныхфункций, определенных на интервале [0,T ] с предгильбертовым скалярнымkпроизведением < ⋅, ⋅ > : Fi × Fi → E1; X (t ) − заданное компактное множество в E n при любых t ∈ [0, T ] и такое, что дополнительное к X (t ) множество в E n − связанное; x(t ) − вектор состояния в E n , для которого определены ограниченияX (t )для всехt ∈ [0, T ] ; начальное состояниеx(0) ∈ X (0) − задано; конечное состояние принадлежит X (T ) ; U i (⋅) − за-данное замкнутое ограниченное компактное подмножество из Fi такое, что1См.
сноску в п. 1.2.Глава 2. Модифицированный метод скалярной Нэш-оптимизации61дополнительное к U i (⋅) подмножество в Fi связанное; ui (⋅) − управляющийфункционал i-й коалиции кусочно-непрерывный на [0,T ] , ui (•) ∈ U i ; f k −для всех k ∈ (1, n ) непрерывно дифференцируемые функции, удовлетворяющие условиям Липшица, а также непрерывно дифференцируемые по u; gi− для всех i ∈ 1, N непрерывные и дифференцируемые функции для всехu(⋅) , x(0) ∈ X (0) , дважды непрерывно дифференцируемые по u(⋅) в смыслеФреше [121]; кроме того, обычно gi явно зависит от состояния x(t ) , а таккак состояние единственно для заданных x(0) и u(⋅) , то применяется соgi gi ( u(⋅), z(0), t ) .кращенное обозначение для=Показатели коалиций сведены к минимизируемому относительно u(⋅)терминальному видуJi =xoi (T ) =⋅xoi ( u( ), z(0), T ), i =1, N ;txoi ( u(⋅), z(0),=t ) xoi (0) + ∫ gi ( u(⋅), z(0), t)d t t ∈ [0, T ].(2.2)0Терминальные платы xoi дважды непрерывно дифференцируемы поФреше [121] относительно u(⋅) .Замечание 2.1.
В частности, если показатель коалиции имеет видT=Ji∫ foi (x, u, t )dt + ϕi (x(T ), T ),0=gi f oi ( x(⋅), u(⋅), t ) + ϕ i ( x(t ), t ),(2.3)xoi (0) = ϕi ( x(0)).Определение 2.1. Управление u(⋅) ∈ F является допустимым для данного x(0) , если u(⋅) ∈ U1 (⋅) × × U N (⋅) и если x(t ) удовлетворяет условиюx(t ) ∈ X (t ) для всех t ∈ [0, T ] .Определение 2.2. Управление u* (⋅) ∈ Fявляется оптимальным поНэшу для данного x(0) , если u (⋅) является допустимым для x(0) и удо*влетворяет условиям равновесия по Нэшу для терминальных плат∀ui (⋅) ∈ U i (⋅),*****(2.4)=∀i ∈ (1, N ) uoi (u=1 , , ui −1 , ui , ui +1 , , u N ) u || ui ,*oi xoi ( u (⋅), z(0), T ) ≤ xoi ( u (⋅), z(0), T ).То есть уход любой подсистемы от ситуации равновесия в первую очередь невыгоден ей самой, так как увеличивает ее собственную плату.62Стабильные эффективные решения и компромиссы.
Часть IНеобходимое условие Пао формируется с учетом конструктивной идеипоиска решения, которая заключается в том, что бескоалиционное конфликтное взаимодействие систем с неполной информацией может бытьсведено к двухуровневой иерархической системе (рис. 2.1), которая включает в себя:1) N элементарных подсистем − коалиций, имеющих целью минимизациюсвоих локальных показателей xoi ( u(⋅), z(0), T ), i =1, N ;2) Одну сверхсистему − фиктивного или реального арбитра (i = 0) , глобальный показатель которой g при его минимизации формирует локальное необходимое условие равновесия по Нэшу.νoi , i = 1, NOpt g (u(⋅), u* (⋅), x(0), T ))u(⋅) ∈ D (u* (⋅))α( ⋅ )Min x01.
. . .Min x0i. . . .Min x 0 NРис. 2.1. Необходимое условие Нэш–ПаоКоординация подсистем осуществляется таким образом, что вначалеобеспечиваются интересы арбитра, а потом − остальных подсистем.Координация выполняется итеративно координирующей функциейa(⋅=) ( a1 (⋅), , a N (⋅)) ∈ F ,составляющей наилучшую текущую аппроксимацию a(⋅)= u* (⋅) , котораяиспользуется i-й элементарной подсистемой в качестве фиксированнойкомпоненты ai в векторе управленияu || ai = (u1 , , ui −1 , ai , ui +1 , , u N )при минимизации показателей подсистем.Оптимизация управления u(⋅) в каждой элементарной подсистеменижнего уровня осуществляется по компонентам партнеров.
Таким образом, каждая элементарная i-я подсистема откликается на функцию координации a(⋅) тем, что «сообщает» арбитру локальную информацию νoi отом, каково должно быть управление остальных (N – 1) подсистем, чтобыоно минимизировало плату i-й подсистемы.Арбитр осуществляет следующий итеративный шаг по определениюкоординаций, учитывая информацию, полученную от подсистем.Подобная двухуровневая структура имеет универсальный характер иможет быть использована для того, чтобы найти другие типы равновесныхуправлений (например, [316] или на основе «угроз и контругроз» и т.д.)при конфликтном взаимодействии.Глава 2. Модифицированный метод скалярной Нэш-оптимизации63Смысл оптимизационной конфликтной задачи «заложен» в структурефункции качества g ( u(⋅), u* (⋅), x(0), T ) , а «предельно неконфликтные» (похожие с учётом координации на аппроксимацию «утопической точки»)итерационные оценки на нижнем уровне формируют максимально возможные начальные отклонения для каждой итерации на верхнем уровне.Данная двухуровневая структура учитывает определенный характер информации, которая может иметь место при конфликтном взаимодействии.Действительно, во-первых, структура формирует направленную координацию, поэтому элементарным подсистемам не обязательно знать видпоказателей других подсистем, во-вторых, подсистемы должны «знать»структуру ограничений на управление u(⋅) и состояние x(⋅) всей системы;кроме того, должны быть известны уравнения, соответствующие векторуx(⋅) , и начальное состояние x(0) ; в-третьих, предполагается, что каждаяподсистема способна формировать управляющие функции других подсистем в своем показателе; в-четвертых, арбитр − это единственная система,которой требуется полная информация о системе в целом, включая всетерминальные платы; кроме того, арбитр может быть фиктивным, можетбыть представлен одной из элементарных подсистем или реальной системой более высокого уровня.Оптимальное по Нэшу управление должно, естественно, отвечать необходимым условиям оптимальности.
Для формирования этих условийПао использовал идею агрегирования плат подсистем для формированияфункции качества. Используя терминологию Месаровича [159], необходимо найти управление u* (⋅) для всей системы (рис. 2.1) в целом такое, чтобы оно удовлетворяло необходимым условиям равновесия по Нэшу, когдафункция g минимальна.Обычно вид управления u* (⋅) неизвестен и подсистемы «знают» лишьитеративные оценки v(⋅) = a(⋅) и находят νoi .Определение 2.3.
Пусть v (⋅) и u(⋅) – допустимые управления, определенные на F при x (0) . Функция качества Пао определяется выражением=g ( u(⋅), v(⋅), x(0), t )∏i =1, N∂xoi ( v oi (⋅), z(0), t ), ui (⋅) − vi (⋅) ,∂ui (⋅)i(2.5)=v (=vv1 , , v N ),( vi ,1 , , vi ,i −1 , ui , vi ,i +1 , , vi , N ),oiгде частные производные определены в смысле Фреше [121], < ⋅, ⋅ >i −предгильбертово скалярное произведение.
Под знаком скалярного произведения находится частный дифференциал xoi∂xoi (⋅)∂x=∆ui .oi∂uiСтабильные эффективные решения и компромиссы. Часть I64Как известно,=∆xoiТогда∂xoi (⋅)∆ui + Ω∆ui , где Ω → 0 при ∆u → 0.∂ui∆xoi − ∂xoi = Ω∆ui ,где Ω∆ui − бесконечно малая более высокого порядка малости, чем ∆ui .То есть, по определению, ∂xoi есть главная линейная по ∆ui часть приращения функционала xoi .Таким образом, функционал g при малых ∆ui есть произведение при-ращений функционалов систем i = 1, N в окрестности итерационной оценки Нэш-решения v(⋅) в форме скалярных произведений.Естественной является минимизация функции g на итерации для получения текущей координации.В работе Пао [376] показано, что координация, равновесная по Нэшу,приводит с необходимостью к локальному экстремуму функции g .Определение 2.4.