Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 30
Текст из файла (страница 30)
Локальной угрозой и контругрозой для коалиции Kназывается набор управлений=u(t ) {u K (t ), =u N / K } ∈UN∏ Ui , для котоi =1Стабильные эффективные решения и компромиссы. Часть I150рого существует постоянная ε > 0 такая, что на любую локальную угрозукоалиции K у контркоалиции N/K имеется локальная контругроза.Определение 4.6.
Если один и тот же набор управлений является локальной угрозой и контругрозой для любой допустимой коалиции K, тоu(t) называется локальной угрозой и контругрозой коалиционной игры.Стабильные свойства ЛУКУ обобщают известные свойства равновесияпо Нэшу, при которых контругроза реализуется уже для соотношения(4.21) с изменением знака.Для получения достаточных условий класс допустимых вариаций u K (t)и u N / K (t ) ограничивается допустимыми управлениями видаv=K (t ) u K (t ) + γ K ⋅ u K (t );v=N / K (t ) u N / K (t ) + γ N / K ⋅ u N / K (t ),где u K ∈ U K , u N / K ∈ U N / K , а γ K , γ N/K – постоянные.Постоянные γ K , γ N/K можно выбрать настолько малыми по абсолютнойвеличине, что при ограниченных u K , u N / K имеет место:T∫ u K (t ) − v K ( t )t022+ u N / K (t ) − v N / K (t ) ⋅ dt < ε .Вводятся системы видаξ j (t ) = A (t ) ⋅ ξ j (t ) + B j (t ) ⋅ u j (t ), ξ (t0 ) = 0,где=A (t )(4.23)(4.24)∂f∂f(j = K, N/K) – матрицы Якоби, Y(t) – матрица=; B( t )∂x∂u jфундаментальных решений.
Далее для удобства будем обозначать УКУ-{решение, как u0 = u0K , u0NK}.Теорема 4.1 [32]. Для того=чтобы u0 (t ){u0K (t ),}u0N / K ∈ U было ло-кальной угрозой и контругрозой для коалиции K, достаточно, чтобыа) векторы g 1 (K) = g K,N/K (t) и g 2 (K) = g N/K,N/K (t) были линейно независимы(равенство α 1 ⋅g 1 (t)+α 2 ⋅g 2 (t) = 0 возможно лишь при α 1 = α 2 = 0),б) для любых допустимых u K = u K (t ) имело место неравенствоT∫ ( g K ,K (t ), u K (t ) ) dt ≠ 0 , где (⋅, ⋅)t0– скалярное произведение,Глава 4. Стабильные коалиционные решения в ММС на основе УКУ151Tg k , j (t ) =BTj (t ) ⋅ Y −1 (t ) ×()∂F k T , x 0 ( T ) T T∂F ( t, x 0 ( t), u0 ( t)) T× Y (T ) ⋅+ ∫ Y ( t) ⋅ k⋅ d t +∂x∂xt+∂Fk (t , x 0 (t ), u0 (t )), k, j =K , N / K.∂u jКак и в общем случае, данные достаточные условия локальных УКУ такжеявляются сложными для практических применений.Действительно, для выполнения условия а) существует, в свою очередь,необходимое условие: если g 1 и g 2 линейно независимы, то определительГрамма [32][g1 , g1 ] [g1 , g 2 ]=∆>0,[g 2 , g1 ] [g 2 , g 2 ]Tгде g i , g j = ∫ ( g i , g j ) dt , (⋅, ⋅) – скалярное произведение.t0Во-первых, если это условие выполняется, то функции могут и не бытьлинейно-независимы, во-вторых, это условие трудно проверяется.Для проверки условия б) необходимо решить интегральное уравнениеT∫ ( g K ,K (t ), u K (t ) ) dt = 0t0и убедиться, что кроме тривиального решения u K (t ) ≡ 0 , которое недолжно входить в U K , для всех u K (t ) ∈ U K решения нет, при этом ядроуравнения g K,K (t) имеет сложный вид.И, наконец, необходимо во всех случаях применения иметь точное описание функции перехода =X ( t , t)( Y(t ), Y T ( t)) системы (4.24).Три данных фактора делают трудноприменимым данный вид достаточных условий и требуют их модификации.4.4.2.
Модифицированные достаточные условия ЛУКУ{Теорема 4.2. Для того чтобы набор u0 (t ) = u0K (t ), u0N / K} был локаль-ной угрозой и контругрозой для коалиции K, достаточно, чтобы для любыхдопустимых=u(t ) {u K (t ), u N / K }∈ U выполнялась система неравенств:Стабильные эффективные решения и компромиссы. Часть I152 ∂f K (0, 0)∂f (0, 0)∂f N / K≠ 0; K> 0;<0,∂ γN / K∂ γN / K ∂ γK(4.25)где∂ f k ∂ F k (T , x 0 (T )=, ξ j (T ) +∂γj ∂x ∂ F (t , x 0 (t ), u0 ) ∂F+ ∫ k, ξ j (t ) + k0 , u j ⋅ dt ,∂x ∂ u jt0 (4.26)k , j = [ K , N / K ], ξ j (t ) = A (t ) ⋅ ξ j (t ) + B j (t ) ⋅ u j (t ),(4.27)Tгде∂f ξ==A ,=Bjj (t0 ) 0,∂ x 0x=(t ) f ( x, u0K , u0N / K ), x=(t0 ) x 0 ; ∂ f ; ∂ u j (4.28)v j ≡ u0j + γ j ⋅ u j(4.29)– реализация угроз и контругроз, v j , u0j , u j принадлежат U j , вектор малыхвеличин γ j выбираем из условияT∫∑ uj −vj02⋅ dt < ε , где ε > 0 – малая величина.(4.30)t0Если показатели имеют смысл показателей эффективности, то знакивторого и третьего неравенств в (4.25) меняются на противоположные.Доказательство приведено в работе [54].
Показано, что если задана постоянная ε > 0 и для управлений u0K (t ) ∈ U K и u0N / K (t ) ∈ U N / K условиятеоремы выполняются, то, введя допустимые вариации управлений,v K (t , γ K =) u0K (t ) + γ K ⋅ u K (t );v N / K (t , γ N / K =) u0N / K (t ) + γ N / K ⋅ u N / K (t ),где u K (t ) ∈ U K и u N / K (t ) ∈ U N / K , из первого условия (4.25) следует, чтоуправление v K (t , γ K ) реализует локальную угрозу коалиции K(4.31)J K ( v K , u0N / K=) J K ( u0K + γ K ⋅ u K , u0N / K ) < J K ( u0K , u0N / K ) ,а из второго и третьего условия (4.25) следует, что управлениеv N / K ( t=) u0N / K (t ) + γ N / K ⋅ u N / K (t ) реализует контругрозуJ K ( v K , v N / K ) > J K ( u0K , u0N / K ), J N / K ( v K , v N / K ) < J N / K ( v K , u0N / K ) .
(4.32)Глава 4. Стабильные коалиционные решения в ММС на основе УКУ4.4.3.153Метод оптимизацииУсловия теоремы 4.2 предполагают, что неравенства (4.25) выполняются на множестве допустимых управлений u j коалиции j ∈ ( K , N/K ) . Следовательно, каждое из трех скалярных произведений выражения (4.26)представляет собой произведение вектора, зависящего от оптимальногоуправления и траектории, на любой вектор из допустимого множества.Если в первом слагаемом множество ξ j (T ) имеет смысл множествадостижимости при t = T [129], то в интегральном члене (4.26) имеет местоансамбль траекторий ξ j (t ) и множество управлений u j (t ) .Один из вариантов методического упрощения структуры алгоритмана втором этапе заключается в сведении исходной задачи к такому виду,когда для получения u 0 достаточно использовать лишь области достижимости.Для этого вводятся дополнительные координаты=x 0K FK (t , x, u), x==x 0N / K FN / K (t , x, u), x 0=( t0 ) 0, (4.33)0 K ( t0 ) 0;N /Kи исходная задача сводится к задаче с терминальным показателемJK =Φ K ( x(T ), T ) + x0 K (T ) =Φ K ( x (T ), T ); J N / K =Φ N / K ( x (T ), T ) , (4.34)()где x (T ) = x0K ( T ) , x0N / K (T ) , x(T ) – расширенный вектор.Тогда()0∂f K ∂Φ k x (T ), T==, ξ j (T ) , k , j ( K , N / K ) ;∂γ j ∂xξ (t ) = A (t ) ⋅ ξ (t ) + B (t ) ⋅ u (t ), ξ (t ) = 0, u ∈ U ;jjjjj 0jj(4.35)(4.36)(4.37)=x 0 (t ) f=( x 0 , u0K , u0N / K ), x (t0 ) x0 ,где последняя система имеет вид0 00 x 00 (t ) F==x 0K (t0 ) 0;K (t , x , u K , u N / K ), K00 00(4.38)=x 0N / K (t0 ) 0; x 0N / K (t ) F=N / K (t , x , u K , u N / K ), 0=( x 0 , u0K , u0N / K ), x(t0 ) x 0 . x (t ) f=В данной трактовке достаточные условия принимают вид системы154Стабильные эффективные решения и компромиссы.
Часть I() ∂ Φ K T , x 0 (T ) ∂f K , ξK (T ) ≠ 0;= ∂γ K ∂x0 ∂ Φ K T , x (T ) ∂f K(4.39), ξ N / K (T ) > 0;=∂x ∂γ N / K 0 ∂ Φ N / K T , x (T ) ∂f N /K , ξ N / K (T ) < 0=∂x ∂γ N / K при наличии связей (4.36) – (4.38).Здесь и далее рассматриваются кусочно-непрерывные скалярные (иливекторные u K ) управления u j (t ) вида (4.16) или()()uj=tn T , =r 1, n ,( t ) u j (t, x(tr −1 )), tr −1 ≤ t ≤=(4.40)а также параметризованные стратегии u j (t ) = ( q j , x(t ) ) .Таким образом, необходимо найти пару ( u0K , u0N / K ) , которая на множествах допустимых управлений u K ∈ U K и u N / K ∈ U N / K и, как следствие,на множествах ξK (t ), ξ N / K (t ) обеспечивает систему неравенств (4.39).Общую алгоритмическую структуру этапа 2 теперь можно базироватьна основе следующей геометрической трактовки.Примем для рассуждений без ограничения общности результата, чторазмерность систем (4.36) и (4.37)=dim ξ j 2,=dim x 2 .Тогда система (4.39) является системой скалярных неравенств следующего вида (прочерки над переменными опускаем): ∂f K = ( a, ξ K (T ) )= a1 ⋅ ξK ,1 (T ) + a2 ⋅ ξK ,2 (T ) ≠ 0; ∂γ K ∂f K(4.41)= ( a, ξ N / K (T ) )= a1 ⋅ ξ N / K ,1 (T ) + a2 ⋅ ξ N / K ,2 (T ) > 0; ∂γ N / K ∂f N / K= ( b, ξ N / K (T ) )= b1 ⋅ ξ N / K ,1 (T ) + b2 ⋅ ξ N / K ,2 (T ) < 0. ∂γ N / KВектора a, b являются векторами, однозначно зависящими от u0.
Вектора ξ K (T ), ξ N / K (T ) заполняют соответствующие области достижимости(ОД) (рис. 4.2).Глава 4. Стабильные коалиционные решения в ММС на основе УКУ155ξ j2IОД ξN / K II III− IV− III− III0− IIIОД ξKξ j1 IVРис. 4.2. Топология алгоритма на основе ОДУтверждение 4.4. Для того чтобы третье неравенство системы (4.41)выполнялось на всей ОД ξN / K , достаточно, чтобы вектор нормали b гиперплоскости, проходящей через начало координат, находился «внутри» конуса (ℓI0ℓII), где ℓI и ℓII – вектора внешней нормали касательных гиперплоскостей к ОД ξN / K .До к аз ат е льс тво . Достаточно учесть знак скалярного произведенияпри всех возможных положениях векторов ξ N / K (T ) в( b, ξ N / K (T ) )ОД ξN / K .Утверждение 4.5. Для того чтобы второе неравенство системы (4.41)выполнялось на всей ОД ξN / K , достаточно, чтобы вектор нормали a гиперплоскости находился «внутри» конуса (–ℓI 0 – ℓII).Доказательство базируется на учете знака скалярного произведения( a, ξ N / K (T ) ) при всех ξ N / K (T ) ∈ ОД ξN / K .156Стабильные эффективные решения и компромиссы.
Часть IУтверждение 4.6. Первое неравенство системы (4.41) ограничивает область допустимых значений нормали a гиперплоскости второго неравенства системы пересечением конусов (–ℓI 0 – ℓII) и (–ℓIV0 – ℓIII), где ℓIII и ℓIV –нормали к гиперплоскостям, касающимся ОД ξK и конуса (–ℓII 0 ℓIII).До к аз ат е льс тво . Рассмотрим от обратного нормаль a в зачерченномсекторе (–ℓIII0 – ℓIV). Тогда всегда найдется вектор ξ K (T ) ∈ ОД ξK , которыйобеспечит равенство ( a, ξ N / K (T ) ) =0 , т.е.
ξ K (T ) ⊥ a .Полученная система конусов (ℓI0ℓII) по b и (–ℓIV0 – ℓI), (–ℓII 0 ℓIII) по а(выделены ярко на рис. 4.2) при данном расположении ОД j является алгоритмической основой для получения u0 (t ) из достаточных условий теоремы 4.2.Область ОД ξN / K ( ОД ξK ) может деформироваться в двух основныхнаправлениях:1. «Приближаться» к началу координат, разворачивая касательные гиперплоскости.2. «Вырождаться» в фигуру с малым конусом при вершине при уменьшении угла между касательными гиперплоскостями или увеличении пространственного угла конуса (ℓI 0 ℓII).Утверждение 4.7.
При касании ОД ξN / K начала координат или привключении начала координат во внутреннююОД ξN / K ( ОД ξK ) задача решения не имеет.точкуобластиДо к аз ат е льс тво . Действительно, при «приближении» границыОД ξN / K к началу координат касательные гиперплоскости «расходятся»,конический угол (ℓI 0 ℓII) уменьшается и в «момент» касания направлениеℓI и ℓII совпадает и внутренних точек не имеется, а следовательно, решениянет.