Сотсков А.И., Колесник Г.В. Оптимальное управление в примерах и задачах (2002) (1249284), страница 2
Текст из файла (страница 2)
Задача оптимального управления. Принцип максимума.Пусть имеется некоторая динамическая система, состояние которой вкаждый момент времени t описывается вектор-функцией x(t)∈ Rn. Насостояние системы можно воздействовать, изменяя управляемые параметрыu(t)∈ Ut ⊆ Rr. Будем рассматривать класс куусочно-непрерывных управленийu(t).При заданном управлении u(t) состояние системы изменяется во временисогласно закону:x& (t ) = f (t , x (t ), u(t )) .(2.1)Рассмотрим задачу оптимального управления данной системой:определить управление u*(t), доставляющее экстремум критерию качествавида:t1J(x(⋅), u(⋅)) = ∫ F (t , x (t ), u (t ))dt + Ф0(t0, t1, x(t0), x(t1)) → max.(2.2)t0При этом первое слагаемое (интегральная часть критерия) характеризуеткачество функционирования системы на всем промежутке управления [t0, t1],тогда как второе слагаемое (терминальный член) – только конечныйрезультат воздействия управления, определяемый начальным x(t0) иконечным x(t1) состояниями и, возможно, моментами начала и окончанияуправления t0 и t1.
В зависимости от физического смысла задачиинтегральная или терминальная часть критерия может быть равна нулю.На процесс функционирования системы могут накладыватьсядополнительные ограничения в форме краевых условий:Фi(t0, t1, x(t0), x(t1)) = 0, i = 1..m.(2.3)задающие множества допустимых начальных и конечных состояний системыи моментов начала и окончания управления.Важным частным случаем (2.3) являются условия вида:x(t0) - x0 = 0; x(t1) - x1= 0,(2.4)соответствующие закрепленному левому или правому концу фазовойтраектории.Моменты времени начала и окончания управления, t0 и t1, могутполагаться как известными, тогда говорят о задаче с фиксированным9временем управления, или неизвестными (задача с нефиксированныммоментом начала или окончания управления).Необходимые условия оптимальности в данной задаче, точнее,необходимые условия сильного локального максимума даются принципоммаксимума Понтрягина.Т е о р е м а .
Пусть (x*(t), u*(t), t0*, t1*) – оптимальный процесс в задаче(2.1) – (2.3). Тогда найдутся одновременно не равные нулю множители λ и ψ: λ = (λ0, …, λm) ∈ Rm+1, λ0 ≥ 0 и ψ(t) = (ψ1(t), …, ψn(t)) ∈ Rn, такие, чтовыполнены следующие условия:а). Функция Понтрягина задачиH(t, x, u, ψ, λ0) = λ0F(t, x, u) + (ψ, f(t, x, u))(2.5)при каждом t∈[t0, t1] достигает максимума по u в т. u*(t), когда x = x*(t),ψ=ψ(t).ψ(t)удовлетворяетсопряженнойсистемеб). Вектор-функциядифференциальных уравнений:ψ& i (t ) = −∂H (t , x * (t ), u * (t ),ψ (t ), λ0 ); i = 1,…, n ,∂x i(2.6)с краевыми условиями (условия трансверсальности)ψi(t0*) = – (λ,ψi(t1*) = (λ,∂Φ (t 0 *, t1 *, x * (t 0 ), x * (t1 )));∂xi (t 0 )∂Φ (t 0 *, t1 *, x * (t 0 ), x * (t1 ))).∂xi (t1 )(2.7)в). Выполнены условия на подвижные концы:H(t, x*(t), u*(t), ψ(t), λ0) | t = t0 = (λ,∂Φ (t 0 *, t1 *, x * (t 0 ), x * (t1 )));∂t 0H(t, x*(t), u*(t), ψ(t), λ0) | t = t1 = – (λ,∂Φ (t 0 *, t1 *, x * (t 0 ), x * (t1 ))).∂t1(2.8)(2.9)Замечания.1.
Множитель Лагранжа λ0 определяет чувствительность оптимальногорешения задачи к виду интегральной части функционала. В вырожденномслучае совокупность ограничений задачи такова, что оптимальноеуправление u*(t) не зависит от вида интегранта F(t, x(t), u(t)). При этом изусловий принципа максимума следует, что λ0 = 0. В невырожденномслучае λ0 > 0, поэтому ее можно положить равной 1 (разделив функцию Нна λ0). При этом условия принципа максимума не изменятся.10Как правило, из физического смысла задачи понятно, допускаются ли вней вырожденные решения. При исследовании таких решений необходимообращать внимание на выполнение условия теоремы о том, что множителиλ и ψ(t) не могут одновременно быть равными 0.2.
Для задачи с закрепленными концами (2.4) сопряженная функция ψ(t)имеет свободные концы, т.е. соответствующие условия трансверсальностиотсутствуют.Обратно, для задачи со свободными концами, не содержащей ограничений(2.3), сопряженная функция имеет закрепленные концы, определяемыесоотношениями:ψi(t0) = –∂Φ 0 (t 0 , t1 , x (t 0 ), x (t1 ));∂x i (t 0 )ψi(t1) =∂Φ 0 (t 0 , t1 , x (t 0 ), x (t1 )).∂x i (t1 )(2.7')Примеры1. Найти оптимальное управление в задаче:42J(u, x) = ∫ ( u + x )dt → min; x& = u; x(0) = 0; | u | ≤ 10Р е ш е н и е . Перепишем данную ее в виде задачи на максимум42– ∫ ( u + x )dt → max0и воспользуемся теоремой о необходимых условиях.Функция Понтрягина (рис.
2.1):H = –λ0(u2 + x) + ψu;Сопряженная система:ψ& = −∂H= λ0;∂xУсловие трансверсальности:ψ(4) =∂Φ 0=0∂x (1)(т.к.правыйконецфазовойтраектории свободен).Исследуем вырожденный случай:положим λ0 = 0.Тогда ψ& ≡ 0, откуда следует, чтоH(t1)H(t2)–10H(t3)1uψ = const. Но из условия трансверРис. 2.111сальности следует, что ψ ≡ 0. Таким образом получили, что множители λ0 и ψодновременно равны 0, что противоречит условию теоремы. Следовательно,вырожденных решений задача не имеет.Положим λ0 = 1.
Тогда:H = ψu – u2 – x → max ;uψ& = 1; ψ(4) = 0.H является квадратичной отрицательно определенной функцией u.Вершина параболы отыскивается из условия экстремума I порядка:∂H= ψ – 2u = 0∂uЕсли она лежит внутри отрезка изменения управления [–1, 1], то она иявляется точкой максимума. В противном случае максимум Н достигается направой либо левой границе отрезка (см.
рис. 2.1).Таким образом, получаем:⎧sgn ψ ( t ), | ψ (t ) |> 2⎪u*(t) = ⎨ ψ (t )| ψ ( t ) |≤ 2⎪⎩2Оптимальное управление зависит от величины ψ(t). Решая сопряженнуюсистему, получаем ψ(t) = t – 4. Видно, что – 4 ≤ ψ(t) ≤ – 2 при 0 ≤ t ≤ 2 и– 2 ≤ ψ(t) ≤ 0 при 2 ≤ t ≤ 4. Тогда⎧⎪ − 1, 0 ≤ t ≤ 2u*(t) = ⎨ t − 4.2≤t ≤4⎪⎩ 2Определим теперь фазовуюоптимальному управлению:⎧⎪ − 1, 0 ≤ t ≤ 2x& = u*(t) = ⎨ t − 42≤t ≤4⎪⎩ 2траекторию⇒x*(t),соответствующую0≤t ≤2⎧ − t + c1 ,⎪ 2x*(t) = ⎨ t.⎪⎩ 4 − 2t + c2 , 2 ≤ t ≤ 4Для участка траектории при t ∈ [0, 2], постоянная интегрирования с1находится из начального условия x(0) = 0 ⇒ с1 = 0.
Для участка при t ∈ [2, 4]воспользуемся условием непрерывности фазовой траектории x(t) в точкеt = 2:lim x(t) = lim x(t).t →2 −t →2 +Из этого условия получаем с2 = 1. Итак, окончательно:12⎧⎪ − 1, 0 ≤ t ≤ 2u*(t) = ⎨ t − 4 2 ≤ t ≤ 4 ,⎪⎩ 20≤t ≤2⎧ − t,⎪ 2x*(t) = ⎨ t.⎪⎩ 4 − 2t + 1, 2 ≤ t ≤ 42. Найти траекторию x(t), доставляющую минимум функционалу:2J(u, x) = ∫ | x&& | dt ,0при ограничениях:x&& ≤ 2,x(0) = 0,x(2) = 1,x& (2) = 2.Р е ш е н и е .
Введем обозначения x(t) = x1(t), x& (t) = x2(t), x&& (t)= u(t). Тогдаисходная задача запишется в следующем виде:2J(u, x) = ∫ | u | dt → min, u(t) ≤ 2,0x& 1 = x2, x1(0) = 0,x& 2 = u,x1(2) = 1,x2(2) = 2,Выпишем необходимые условия оптимальности для этой задачи:Н = – λ0| u | + ψ1x2 + ψ2u → max;ψ& 1 = −∂H= 0;∂x 1ψ& 2 = −∂H= –ψ1;∂x 2(2.10)ψ2(0) = 0.Рассмотрим вырожденный случай λ0 = 0. Тогда Н = ψ1x2 + ψ2u и максимумдостигается, когда:⎧ − ∞, ψ 2 (t ) < 0u(t) = ⎪⎨( −∞,2 ], ψ 2 (t ) = 0 .⎪ 2,ψ 2 (t ) > 0⎩Управление u(t) = – ∞ при ψ2(t) < 0 нереализуемо. При ψ2(t) = 0 получаемψ1(t) = 0, что противоречит условиям принципа максимума.
При u(t) = 2траектория движения имеет следующий вид:x& 2 = 2 ⇒ x2(t) = 2t + a,(2.11)x& 1 = x2 ⇒ x1(t) = t2 + at + b.Тогда из краевых условий получаем: а = –2, а = –3/2, b = 0. Таким образом,для u(t) = 2 при ψ2(t) > 0 допустимых экстремалей нет.Рассмотрим теперь невырожденный случай λ0 = 1. Условие оптимальностипо u(t) принимает вид13Н = – | u | + ψ1x2 + ψ2u → max, u ≤ 2.Решением этой задачи максимизации (2.10) в этом случае являетсяуправление⎧0, ψ 2 (t ) < 1.u*(t) = ⎨⎩2, ψ 2 (t ) ≥ 1Из сопряженной системы получаемψ1(t) = c1; ψ2(t) = – c1t + c2.Учитывая условие трансверсальности ψ2(0) = 0, находим с2 = 0, откудаψ2(t) = – c1t. Для такой функции ψ2(t) величина (ψ2(t) – 1) может менять знакне более одного раза, поэтому оптимальное управление будет иметь вид:⎧0, 0 ≤ t ≤ τ.u*(t) = ⎨⎩2, τ ≤ t ≤ 2Определим момент переключения управления τ. На отрезке [0, τ]траектория подчиняется системе уравнений:x& 2 = 0 ⇒ x2(t) = a,x& 1 = x2 ⇒ x1(t) = at + b.Из начального условия x1(0) = 0 находим b = 0, т.е.
x1(t) = at.На отрезке [τ, 2] основная система уравнений имеет вид (2.11), при это изкраевых условий получаем a = –2, b = 1.Из условия непрерывности фазовой траектории в точке τ получаемсистему уравнений для определения параметров τ и а:x1(τ –) = at = τ2 – 2τ + 1 = x1(τ +);x2(τ –) = a = 2τ – 2 = x2(τ +).Отсюда τ = 1, а = 0.Итак, оптимальный процесс в данной задаче имеет вид:0,0 ≤ t ≤1⎧.x*(t) = x1*(t) = ⎨ 2⎩t − 2t + 1, 1 ≤ t ≤ 23. П р о с т е й ш а я з а д а ч а о п т и м а л ь н о г о у п р а в л е н и я д л япотребителя.Рассматривается модель потребителя:Tmax ∫ ce-β t dt014W& = rW – c, t ∈ [0, T].Граничные условия имеют вид: W(0) = W0 , W(T) = WT и ограничение наобъем мгновенного потребления с: 0 ≤ c ≤ 1.