Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 16
Текст из файла (страница 16)
Необходимые и достаточные условия локального равновесия поНэшу (на основе подхода Э.М. Вайсборда, В.Н. Жуковского [32, 50]).Определение 2.9 [32]. Локальным равновесием по Нэшу называется вобщем случае подвектор управления u∗i , i = 1, N , при замене которого науправление=v i u∗i (t ) + γ i ui (t ), ui , v i ∈ U iприСтабильные эффективные решения и компромиссы.
Часть I76T∫2u∗i (t ) − v i (t ) dt < ε,(2.30)0где ui − любое допустимое управление, γ i − малый численный параметр,удовлетворяющий неравенству (2.30),имеет место неравенствоJ i ( u*) ≤ J i ( u * v i ), i =1, N ,Tгде J i =Фi (T , x (T )) + ∫ f 0i ( x, u )dt - показатель потерь i -й системы.0Переобозначим f i (0, ,0) = J i ( u∗ ) , тогда f i (0, , γ i , ,0) =J i ( u* v i ).Утверждение 2.7. Для верификации или определения управления u∗i ,локально оптимального по Нэшу, необходимо и достаточно выполнениясоотношений ∂f (0,2 ,0) ∂Ф (T , x ∗ (T )) T i = ii 1, N ,ξ i (T ) 0,==∂γ i∂x( 2.31)T22∗∗ ∂ f i (0,2 ,0) ∂Фi (T , x (T )) ∂ Фi (T , x (T ))T=ξ i (T ) > 0, χ i (T ) + ξ i (T )2∂x∂γ i∂x 2где∂f∂fξ i (t ) =Aξ i (t ) + Bi ui ; ξ i (t0 ) =0, A =, Bi =,∂x∂v i2∂2 fT ∂ fξ+uui = Aχ i (t ) + u′′i (t ) + u′′′ i (t ); χ (t0 ) = 0.t()ii∂x 2∂u 2Показатель потерьχ i (t ) = Aχ i (t ) + ξ iT (t )Ji =Фi (T , x(T )) =Фi (T , x(T )) + x0i (T ); f i (0, ,0) =J i ( u*), i =1, N ,=x ( x=, x 0 ), x f ( x , u), u ∈ U .До к аз ат е льс тво :f i (0,222, γ i , ,0) − f i (0, ,0) ==∂f i (0,2222∂ 2 f i (0, , γ i , ,0), γ i , ,0)γi +γ i2 +2∂γ i∂γiγ =0γ =0ii∂f i (0,22∂ 2 f i (0, ,0) 2,0)=+o( γ i )γi +γ i +=o( γ i ), i 1, N .∂γ i∂γ i2Глава 2.
Модифицированный метод скалярной Нэш-оптимизации77Необходимоеусловиеравновесиясоответствуетравенству∂f i (0, , 0)= 0,=i 1, N . Достаточное условие равновесия (для показателей∂γ iпотерь) соответствует неравенству∂ 2 f i (0,2 ,0)>0.∂γ i2Для показателей эффективности знак неравенства меняется на противоположный. Раскрывая выражения, получим искомые соотношения.Следствие из утверждения 2.7.
Для верификации ( ui *, x*) необходимо произвести сравнение векторной∂Фi (T , x *(T ))∂xи матричной∂ 2 Фi (T , x *(T ))«точек» с областями достижимости ξ i (T ) , χ i (T ) , причем∂x 2последняя является «зависимой» и определяется на основе функцийξ i (t ), ui (t ) .Следует отметить, что для проверки полученного решения ( u* , x* ) наоптимальность достаточно выполнения знака неравенства, так как можнопоказать, что первое равенство обеспечено необходимым условием Пао.Алгоритм верификации решения может быть реализован на приближенной сетевой основе.Обоснование двухуровневой структуры Пао.
Необходимое условие равновесия Пао является достаточно «прозрачным» для формирования метода оптимизации (N + 1) задачи. В его иерархической структуре (см. рис. 2.1) совместно с условиями леммы 2.1 заложены свойствасходимости.Рассмотрим кратко назначение каждого уровня на итерации.На верхнем уровне на основе структуры функции g как произведениялинейных частей приращения функционалов и свойств сжатия в соответствии с леммой 1 на итерации происходит сдвиг к точке равновесия Нэша.На нижнем уровне на основе координаций, полученных на верхнемуровне, формируются алгоритмы N минимизационных задач. В процессеминимизации каждая элементарная система оценивает значение показателя при условии, что собственное управление является рекомендованнойкоординацией, которая является текущим приближением равновесногоуправления и при показателях-потерях обладает минимизирующим свойством, управления «партнеров» выбираются напрямую из условия минимизации показателя данной элементарной системы.Стабильные эффективные решения и компромиссы.
Часть I78Поэтому можно сделать вывод, что элементарные системы нижнегоуровня на данной итерации «оценивают» возможность приближения к«утопической» точке ( J i → min, i =1, N ).При достаточной степени конфликтности данная оценка имеет смысл«максимального возможного отклонения» от равновесия на данной итерации. Информация об оптимальных управлениях партнеров данного смыслаиспользуется при формировании координаций на верхнем уровне на следующей итерации. Таким образом, задача арбитра на итерации – на основесвойства сжатия «продвигать» управление к равновесному решению, совместный смысл задач оптимизации систем нижнего уровня – сформировать возможное отклонение от цели арбитра.
От итерации к итерации впроцессе сходимости это возможное отклонение постепенно уменьшаетсяи, взаимодействуя со свойством сжатия алгоритма арбитра, обеспечиваетгарантированные свойства процесса сходимости.Данные особенности необходимого условия Пао можно обосноватьстрого математически или обнаружить в процессе итерационной оптимизации.2.3. ИЕРАРХИЧЕСКИЙ МЕТОД НЭШ-ОПТИМИЗАЦИИПАРАМЕТРИЗОВАННОГО ПКЗУ2.3.1.Пао–Нэш-оптимизация управления на основе системыЭйлера–Лагранжа [376]В работе [376] предложен иерархический метод оптимизации управления u(t ) , когда задача арбитра приводится к форме Лагранжаa)L(=dx* jdg (a(⋅), u* (⋅), x(0))( −1) q + ∑ ψ kj ( k − f k ( x j (t ), u(⋅), t )) +dtdtk =1,nj =1, N+∑j =1, N(2.32)(λ j ( a j (t ) − u*j (t )) + ri rj ( a j (t ), t )),где ψ kj , λ i , ρ − множители Лагранжа, a − координация, определяемая наитерации, u* − оценка Нэш-равновесия на итерации и собственно Нэшравновесие.Далее, при наличии непрерывной дифференцируемости L по Фрешеили Гато [121] на уровне арбитра формируются и применяются необходимые условия оптимальности L(a) по a в форме системы Эйлера–Лагранжа, которые совместно с решением N задач на нижнем уровне формируют шестишаговую итерационную процедуру [376].Глава 2.
Модифицированный метод скалярной Нэш-оптимизации79Данная итерационная процедура реализует иерархический метод оптимизации управления, который, как известно из вариационного исчисления,является работоспособным при отсутствии существенных ограничений науправление.Пао применил данный подход при наличии существенных ограниченийна управления. Недостатками данного подхода являются следующие факты:а) управление a(⋅) и, наконец, u* не должны находиться на границах допустимых множеств U1 × × U N , т.е. оптимальные решения должныбыть внутренними точками множеств, но при наличии существенныхограничений, как известно, оптимальные управления, как правило,определяются на границах допустимых множеств;б) для решения используются градиентные методы, причем градиенты наоснове условий Эйлера–Лагранжа имеют сложную структуру;в) в процессе решения используются сложные условия трансверсальностидля t = 0 , t = T , и сложные условия Сталфорда, если управление является сингулярной дугой на пересечении (U1 (⋅) × × U N (⋅)) 1 D ( u* (⋅)) ;г) алгоритм не сходится часто из-за ограничений или когда «сингулярныедуги» не охватываются введенной процедурой минимизации нормы вL2 [376], или, наконец, когда управление u* (⋅) имеет большое числоскачков.2.3.2.Формирование метода Пао–Нэш-оптимизации управленияна основе принципа максимумаОдним из принципиальных подходов оптимизации управления приналичии ограничений является принцип максимума [158], на основе которого в данном пункте сформирован метод Пао-оптимизации.
Каждаяm -итерация состоит из следующих шагов:Ша г 1 . Вводится ε > 0 , m ≥ 2 − номер итерации, получаем a ∈ U .При m = 1 задаем a и a1 ∈ U такие, что sign g (a, a1 , x(0),=T ) sign( −1) q иg – малая величина и переходим к шагу 4.Ша г 2. Решение задачи-арбитраN nn da ← max H= max ψ0 g (t ) + ∑∑ ψik f k ( xim , νoim , t ) + ∑ ψ k f k ( x, u, t ) , (2.33)u∈Uu∈Udt=i 1 ==k 1k 180Стабильные эффективные решения и компромиссы. Часть Iгде x f=( x, u, t ), x(0) x 0 ,immmmmi x =( nnnn1, N ,f ( x im , νoim , t ), νoim =xi 0 , i =i ,1 ,…, i ,i −1 , ui , i ,i +1 ,…, i , N ), x (0) =∂f k =−( x , u , t ) ⋅ ψ,k =1, n,ψ∂x k i∂f k =− i ( x i , νoim , t ) ⋅ ψ,k =1, n,i =1, N ,ψ∂xkψ =−1,t ∈ [0, T ]. 0Получили aопт = a .
Переходим к шагу 3.Ша г 3. Если g (a, am , x, T ) > ε , обозначаем a = am+1 и переходим кшагу 4. Если g (a, am , x, T ) < ε , то переходим к шагу 5.Ша г 4. Решение N задач минимизации элементарных подсистем нижнего уровня, i -я из которых имеет видnmax H= max ψ0i gi + ∑ ψ k f k ( x, u, t ) ,(2.34)u∈Uu∈Uk =1xoi (0) x0i 0 ,= xoi g=i (u, z (0), t ), x f=( x, u, t ),=x (0) x0 ,∂g oi =− i ψ0i =0, ψoi =−1,ψ∂x∂f k =−( x, u, t ) ψ, k =1, n;ψ∂xku = (u1 , , ui −1 , ai , ui +1 , , uN ).Получим u = νoi ( m+1) и траекторию x i ( m+1) , переходим к шагу 1 следующей итерации.Ша г 5. Принимаем u∗ = a . Задача Пао-оптимизации решена.Данный метод на каждом шаге итерации требует решения N + 1 задачоптимизации с использованием принципа максимума.