Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)), страница 14
Описание файла
PDF-файл из архива "Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)", который расположен в категории "". Всё это находится в предмете "оптимальное управление многообъектными многокритериальными системами (оуммс)" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 14 страницы из PDF
Дана функция c( s ) такая, что при s ≥ 0 имеемc( s ) ∈ E . Величина c( s ) является бесконечно малой порядка p > 0 относительно s , если∃M > 0,∃η > 0 : ∀s, 0 ≤ s ≤ η,c( s ) ≤ M ⋅ s p , c( s ) =lim c( s ) 0,=lim p 0.s →0+s →0+ s*Лемма 2.1 [417]. Пусть u (⋅) ∈ F является Нэш-оптимальным управле-нием для заданного x(0) . Пусть N ≥ 2 и пусть при всех i = 1, N∃bi ( εi ) > 0 ∀u(⋅) таких, что uoi (⋅) − u* (⋅) < εi имеет место∀εi > 0( xoi ( u(⋅), z(0), T ) − xoi ( u* (⋅), z(0), T )) ≥ bi ( εi ) Ω1i ≥ 0,где а) uoi(2.6)дано в определении 2.2; б) Ω1i =Ω1i ( u(⋅) − u (⋅) ) − бесконечно*малая, порядок которойu(⋅) − u* (⋅) и Ω1i ≥ 0 .строгоменьшедвухТогда существует окрестность D ( u* (⋅)) для u* (⋅) ,относительноD ( u* (⋅)) ⊂ F ,D ( u* (⋅)) ⊂ U1 (⋅) × × U N (⋅) такая, что g ( u(⋅), u* (⋅), x(0), T ) имеет экстремумпри u* (⋅) :а ) ∀u(⋅) ∈ D ( u* (⋅)) : g ( u(⋅), u* (⋅), x(0), T ) ≥ 0;б ) g ( u *(⋅), u* (⋅), x(0), T ) =0;в ) ∀i ∈ (1, N ), ∂g ( u (⋅), u (⋅), x(0), T ) ∂ui (⋅) =0.***(2.7)Глава 2.
Модифицированный метод скалярной Нэш-оптимизации65Замечание 2.2. Может так случиться, что предположения (2.6) леммы2.1 не выполняются для некоторых индексов i ∈ (1, N ) . Если существуетскаляр bi ( εi ) < 0 такой, чтоbi ( εi )Ω1i ≥ ( x0i ( u(⋅), z(0), T ) − x0i ( u* (⋅), z(0), T )),(2.8)bi ( εi ) < 0, Ω1i ≥ 0,то лемма 2.1 по-прежнему справедлива, но со следующими изменениями:∀u(⋅) ∈ D ( u* (⋅)) : sign g ( u(⋅), u* (⋅), x(0), T )совпадает с sign( − 1) q , где q − число индексов, для которых выполняется(2.8).Замечание 2.3. Условия леммы 2.1 непротиворечиво дополняют определение равновесия по Нэшу.Как известно, при отклонении лишь i-й системы от равновесия ui* потери её возрастают.
В дополнение к этому основному свойству 1 Нэшравновесия Пао вводит следующее свойство 2: если остальные системытакже будут локально отклоняться от Нэш-равновесия, то i-я система может иметь незначительное возрастание (2.6) или уменьшение потерь (замечание 2.2) по сравнению с равновесными, при этом потери устойчивостремятся к равновесным при || u − u* ||→ 0 .Это обеспечивается свойством сжатия оператора перехода от || ∆ui || к∆xoi (свойство 3).
Эти свойства выполняются для всех i = 1, N .Таким образом, по свойству 3 условием существования экстремума gв точке u* являются разные порядки отклонения управления и изменениятерминальной платы, причем порядок изменения терминальных плат пропорционален бесконечно малой первого порядка по отношению к маломуотклонению управления. Очевидно, в свою очередь, существенными условиями для этого являются непрерывность показателей по u(⋅) и компактность множества управлений U (⋅) . Полезным условием является компактность введенного ограничения X (t ) , так как компактность X (t ) приопределенных свойствах дифференциальных операторов позволяет ослабить требования на U (⋅) .Следствие 2.1. Пусть условия леммы 2.1 выполняются и пусть платыxo являются квазивыпуклыми функциями u(⋅) в окрестности D ( u* (⋅)) ,определяемой леммой 2.1.
Тогда утверждения леммы могут быть дополнены следующим образом:∀i ∈ (1, N ), ∀u(⋅) ∈ D ( u* (⋅)),∂g ( u(⋅), u* (⋅), x(0), T ), ui (⋅) − ui* (⋅)∂ui (⋅)≥ 0.i(2.9)66Стабильные эффективные решения и компромиссы. Часть IЗамечание 2.4. Введенная функция g ( u(⋅), v(⋅), x(0), T ) сепарабельнаотносительно функции ui (⋅), i =1, N . Введение в выражении g знакасуммы вместо произведения приведет к тому, что лемма 2.1 не выполняется, так как не имеет место (2.7в). В то же время введенная функция gявляется бесконечно малой величиной порядка не выше N относительнобесконечно малых величин ui (⋅) − ui* (⋅) , практическое значение этогофакта заключается в ускорении сходимости в рамках двухуровневойструктуры Пао.Замечание 2.5. Экстремальность функции g , как заявлено в лемме 2.1,в действительности является только локально необходимым условием длятого, чтобы u* (⋅) было оптимально по Нэшу, так как используются частные производные терминальных плат.Замечание 2.6.
В лемме 2.1 не рассмотрены вариации функцииg ( u(⋅), v(⋅), x(0), T ) относительно v(⋅) . Однако они очень важны, так как витерационной процедуре v(⋅) являются наилучшими текущими аппроксимациями u* . Итерационный процесс использует равномерную непрерывность g по v(⋅) , когда g оптимизируется по u(⋅) . Это требует обычно,чтобы u(⋅) было только некоторым изменением v(⋅) в его окрестности.Замечание 2.7. В итерационном процессе оптимизации g будут снижаться численные значения тех скаляров∂xoi ( v oi (⋅), z(0), T ) ∂ui (⋅), ui (⋅) − vi (⋅)i,которые наибольшие по абсолютной величине либо потому, что скоростьтерминальной платы является слишком большой по норме, либо потому,что u(⋅) слишком отходит от лучшего направления аппроксимации v(⋅) ,даже если оно минимизирует xoi , i = 1, N .Определение 2.5.
Пусть предположения леммы 2.1 выполняются, u* (⋅)– оптимальное по Нэшу управление и D ( u* (⋅)) – соответствующая окрестность. Управление a(⋅) называется координирующим, еслиa(⋅=) ( a1 (⋅), , a N (⋅)) ∈ F1 × × FN ;a(⋅) : (0, T ) → Fi i =1, N .В каждый момент времени ai (⋅) − управление, предписанное арбитромдля использования элементарной системой i, i ∈ (1, N ) : ui (⋅)= ai (⋅) .Определение 2.6. Задача оптимального управления для элементарнойсистемы i, i = 1, N в иерархической системе с координирующей стратегией a(⋅) формулируется так:Глава 2.
Модифицированный метод скалярной Нэш-оптимизации67xoi ( νoi (⋅), z(0), T ) = min xoi ( u(⋅), z(0), T ),u ( ⋅)=xoi gi ( u(⋅), z(0), T ),x f ( x(t ), u(⋅)t ),=(2.10)u(⋅=) (u1 (⋅), , uN (⋅)) ∈ U1 (⋅) × × U N (⋅) ∩ D( u (⋅)),*∀t ∈ (o, T ] : x(t ) ∈ X (t ); x(0), xoi (0) заданы,u=ai (⋅),iгде u=ai (⋅) − ограничение, порожденное процессом координирования.iПусть при заданном a(⋅) оптимальное управление νoi (⋅) существует.Вводятся следующие обозначения: νoi (⋅) = ( νi1 (⋅), , νiN (⋅)) , x i (⋅) − оптимальная траектория, порожденная оптимальным управлением νoi (⋅) и z (0)(2.11)x i (⋅)= ( xi1 (⋅), , xiN (⋅)), νii (⋅)= ai (⋅).Определение 2.7. Задача оптимального управления для арбитра виерархической структуре для определения итерации координирующегоуправления a(⋅) по предыдущей ν(⋅) = a(⋅) формулируется следующим образом:( −1) q g (a(⋅), ν(⋅), x(0), T )= min ( −1) q g ( u(⋅), ν(⋅), x(0), T ) ,u=x f ( x(t ), u(⋅), t ),x i= f ( x i (t ), νoi (⋅), t ), nii= ui (⋅), ∀i ∈ (1, N ).u(⋅) ∈ U1 (⋅) × × U N (⋅) ∩ D ( u* (⋅)),(2.12)sign ( g ( u(⋅), ν(⋅), x(0), T ))= sign ( −1) ,x(0), xoi (0) заданы.Используя принципы интерактивного баланса M.
Месаровича [159],решаются задачи управления элементарными подсистемами (определение2.6) для меняющихся координаций a . Эти координации изменяются итеративно в процессе решения задачи управления арбитром (определение2.7), и каждая новая a(⋅) является более «близкой» оценкой u* (⋅) .Определение 2.8. Иерархическая структура является скоординированной оптимально по Нэшу (или сбалансированной), если существует некоторое координирующее управление a(⋅) ∈ (U1 (⋅) × × U N (⋅)) 1 D( u* (⋅)) , которое является оптимальным по Нэшу при x(0) для N подсистем.qТеорема Пао. Пусть u* (⋅) – оптимальное по Нэшу управление в двухуровневой структуре.
Если предположения леммы 2.1 и замечания 2.3 выполнены, то u* (⋅) с необходимостью является решением задачи оптималь-Стабильные эффективные решения и компромиссы. Часть I68ного управления для арбитра, aˆ(⋅)= u* (⋅) . Более того, двухуровневаяструктура оказывается сбалансированной по Нэшу.2.2.2.Обобщение необходимых условий Пао равновесия по НэшуСнятие постановочного требования компактности множества Х(x∈Х). В необходимых условиях Пао [376] в явном виде содержится требование компактности множества состояний ММС. Цель данного исследования заключается в том, чтобы показать, что для широкого класса динамических моделей ММС условие ограниченности или компактности множества управлений U ММС является достаточным для обеспечениясвойств компактности множества состояний X ММС и в постановочномтребовании компактности X нет необходимости.Рассмотрим эти не совсем очевидные свойства на моделях ММС сусложнением операторных свойств моделей.
Для доказательства будемиспользовать некоторые положения работ [36, 114, 138].Утверждение 2.1 [138]. Каждый ограниченный линейный операторпреобразует компактное (ограниченное) множество в другое компактное(ограниченное) множество.Докажем справедливость этого утверждения для линейного описаниясистемы (2.1)_(2.13)x =A (t )x + B(t )u, u ∈ U {u :| ui |≤ u i }; y =C(t )x(t ).Множество U компактно в C [0,T ] (или L p , в типичной ситуацииp = 2 ) [138].
Известно, что решение (2.13) представимо в видеt=y C ( t ) Ф ( t , t0 ) x ( t0 ) + ∫ K ( t , t ) u ( t=) d t y1 ( t ) + y 2 ( t ) , t ≥ t,t0где Ф(t , t0 ) − известная функция перехода, K=(t , t) C(t )Ф(t , t)B( t) − импульсная переходная функция системы (2.13).Тогда y1 (t ) − заданная ограниченная по времени функция, K1* ≤ K1 −зависит от управления u является линейным оператором от управления, апри нулевых начальных условиях y (t ) = y 2 (t ) .Ядро K (t , t) оператора – ограниченная непрерывная функция, поэтомуоператор ограничен и непрерывен.
В соответствии с утверждением изкомпактности множества u ∈ U следует компактность множества y 2 ∈ Y2 .Так как функция y1 (t ) есть заданная непрерывная ограниченнаяфункция, не зависящая от управления, то множество Y функцийy = y1 + y 2 ∈ Y при фиксированных начальных условиях также будеткомпактным.
Аналогичный результат имеет место при C = E дляx ∈ X . Следовательно, в условиях линейной модели (2.1) постановоч-Глава 2. Модифицированный метод скалярной Нэш-оптимизации69ное условие компактности X не является необходимым и выполняетсяавтоматически при компактности U .Рассмотрим модель системы (2.1), линейную по управлению:_=x f ( x, u=, t ) f1 ( x, t ) + B(t )u, 0 ≤ t ≤ T , u ∈ U {u : | ui |≤ u i } ,tt00(2.14)x= x 0 + ∫ f ( x, u, t )dt= x 0 + ∫ f1 ( x, t)d t +t(2.15)+ ∫ B( t)u( t)d t= x 0 + y (t ) + z(t ).0Утверждение 2.2 [36, 114, 138]. Оператор (2.14), (2.15) преобразуетограниченное (или компактное) множество U в компактное множествоX.Таким образом, при нелинейном ограничении системы (2.1) с линейными свойствами по управлению и ограниченности (или компактности)множества U множество X компактно и не требует специального заданияэтого свойства в необходимых условиях равновесия.Пусть описание системы (2.1) имеет вид=x f ( x, u=, t ) f1 ( x, t ) + f2 ( u), 0 ≤ t ≤ T ,(2.16)u ∈ U1 ( u : ∑ ui2 ≤ r 2 , i = 1, N ) ⊂ U 2 ( u : | ui |≤ ui ) .(2.17)iТогдаtt00x(t=) x 0 + ∫ f1 ( x, t)d t + ∫ f2 ( u)d =t x 0 + y + z, 0 ≤ t ≤ T .(2.18)По сравнению с предыдущим вариантом изменилось выражение для ztz=(t )∫ f2 (u(t))d t,0 ≤ t ≤ T,(2.19)0которое является частным случаем оператора Урысонаtz(t=)∫ K (t, t, u( t))d t .(2.20)0Утверждение 2.3 [114, 138].