Лекции по ОУ (1050564), страница 9
Текст из файла (страница 9)
Если исходная ЗОУ имеет решение, то полученная краевая задача такжеимеет решение. Найдя это решение, подставим его в (3.2.12) и получим управление u (t ) = u ( x(t ), ψ(t ), t , λ 0 ) , которое может быть оптимальным. Однако этопроисходит не всегда, так как теорема 3.2.1 дает лишь необходимые условияоптимальности. В том же случае, когда краевая задача принципа максимумаоднозначно разрешима, найденное управление будет оптимальным.Существуют классы задач, для которых найденное управление заведомобудет оптимальным. К таким задачам относятся те, для которых принцип максимума является не только необходимым, но и достаточным условием оптимальности.
Приведем без доказательства теорему о достаточности принципамаксимума для следующей ЗОУ [10]:dx= A(t ) x(t ) + B(t )u (t ),dtt ∈ [0, T ],x(0) = x0,u (t ) ∈ U ,TI ( x, u ) = ∫ ( f ( x, t ) + g (u , t ))dt → min,0где x(t ) ∈ E n , u (t ) ∈ E m , A(t ) , B(t ) – матрицы соответствующих размерностей,f , g – заданные функции, причем предполагается, что f ( x, t ) выпукла по xпри каждом t ∈ [0, T ] .Теорема 3.2.2. Пусть ( x, u ) – допустимая пара для рассматриваемой задачи и пусть для нее выполняются условия теоремы 3.2.1. Тогда пара ( x, u ) является оптимальной.433.3. Условия трансверсальности при различных режимахна концах оптимальной траекторииРассмотрим равенстваg j ( x(t0 ), x(t1 )) = 0, j = 1,K , s ,которые присутствуют в формулировке задачи (3.2.1) – (3.2.4).
При соответствующем выборе функций g j эти равенства могут означать, что концы траекторий закреплены, свободны, или один из концов закреплен, а другой свободен.Рассмотрим каждый из этих режимов и выпишем соответствующие условиятрансверсальности, которые будут меняться.1) Задача со свободными концами:dx= f ( x(t ), u (t ), t ) ,dtu (t ) ∈ U ,J ( x, u ) =t1∫ f (x(t ), u(t ), t )dt + g (x(t000(3.3.1)(3.3.2)), x(t1 )) → min .(3.3.3)t0Здесь отсутствуют ограничения типа (3.2.2), и поэтому в формулировке теоремы будут отсутствовать параметры λ1 , λ 2 , K, λ s , .
Значит λ 0 ≠ 0 , т.е. λ 0 = 1.Краевая задача принципа максимума будет состоять из уравнений (3.2.15) –(3.2.21) и условий:∂g 0 ( x(t0 ), x(t1 )),∂x∂g ( x(t0 ), x(t1 ))ψ(t1 ) = − 0;∂yλ 0 = 1.ψ(t 0 ) =2) Задача с закрепленными концами:dx= f ( x(t ), u (t ), t ) ,dtx(t0 ) = a, x(t1 ) = b ,(3.3.4)u (t ) ∈ U ,J ( x, u ) =t1∫ f (x(t ), u(t ), t )dt + g (x(t000), x(t1 )) → min .t0Запишем условие (3.3.4) в виде (3.2.2). Для этого определим функции44g j ( x, y ) = x j − a j , j = 1,K , n,g j ( x, y ) = y j −n − b j −n , j = n + 1,K ,2n.Легко видеть, что равенства (3.3.4) эквивалентны условиямg j ( x(t0 ), x(t1 )) = 0, j = 1,K ,2n .Для того чтобы выписать условия трансверсальности, подсчитаем производныефункций g j .Для j = 1,K, n имеем∂g j⎧0, i ≠ j=⎨, (i = 1,K, n);∂xi ⎩1, i = jДля j = n + 1,K,2n имеем∂g j∂x= 0;∂g j∂y= 0.∂g j⎧0, i ≠ j − n=⎨, (i = 1,K, n).∂yi ⎩1, i = j − nУчитывая это, получим формулы для условий трансверсальности в координатах:ψ i (t0 ) = λ 0∂g 0 ( x(t0 ), x(t1 ))+ λ i , i = 1,K , n ,∂xiψ i (t1 ) = −λ 0∂g 0 ( x(t0 ), x(t1 ))− λ n + i , i = 1,K , n .∂yi(3.3.5)(3.3.6)Покажем, что для рассматриваемой задачи при всех t ∈ [t0 ,t1 ] выполняетсянеравенствоλ 0 + ψ (t ) ≠ 0 .Предположим, что существует t ∈ [t0 ,t1 ], при котором λ 0 + ψ (t ) = 0 .
Тогда λ 0 = 0, ψ(t ) = 0 , и для сопряженных переменных мы получим однороднуюсистему дифференциальных уравнений с нулевым начальным условием, а этозначит, что ψ(t ) ≡ 0 . Следовательно, λ1 = λ2 = K = λ2 n = 0 , что противоречитусловиям теоремы.Рассмотрим доказанное неравенство в конкретной точке t ∈ [t0 ,t1 ], например в точке t1 : λ 0 + ψ(t1 ) ≠ 0 . Получим еще одно условие на вспомогательныепеременные. Так как они определены с точностью до постоянного множителя,то можно считать:λ 0 + ψ(t1 ) = 1 .(3.3.7)Этим условием можно заменить условие нормировки.
Уравнения (3.2.15),(3.2.16) в краевой задаче принципа максимума содержат 2n + 1 неизвестных(вместе с параметром λ 0 ). Для их определения мы имеем 2n + 1 условий – это2n равенств (3.3.4) и условие (3.3.7). Отсюда следует, что условия трансверсальности можно не рассматривать при решении задачи. Таким образом, крае45вая задача принципа максимума в данном случае будет состоять из уравнений(3.2.15), (3.2.16) и условий:x(t 0 ) = a, x(t1 ) = b ,λ 0 + ψ (t1 ) = 1,λ 0 ≥ 0.3) Задача с закрепленным левым и свободным правым концом:dx= f ( x(t ), u (t ), t ) ,dtx(t0 ) = a ,u (t ) ∈ U ,J ( x, u ) =(3.3.8)t1∫ f (x(t ), u(t ), t )dt + g (x(t ), x(t )) → min .0001t0Определим функцииg j ( x, y ) = x j − a j , j = 1, K , n .Как и в предыдущем случае, получим, что равенство (3.3.8) эквивалентно условиямg j ( x(t0 ), x(t1 )) = 0, j = 1, K, n .Запишем условия трансверсальности:∂g 0 ( x(t0 ), x(t1 ))+ λ i , i = 1, K , n ,∂xi∂g ( x(t 0 ), x(t1 ))ψ i (t1 ) = − λ 0 0, i = 1,K, n .∂yiψ i (t0 ) = λ 0(3.3.9)(3.3.10)Покажем, что для рассматриваемой задачи λ 0 ≠ 0 .
В самом деле, предположим, что λ 0 = 0 . Тогда из (3.3.10) следует, что ψ (t1 ) = 0 , а это означает, чтосопряженная система имеет только тривиальное решение ψ (t ) ≡ 0 , так как приλ 0 = 0 она становится однородной. Учитывая это, из (3.3.9) получим:λ1 = λ 2 = K = λ n = 0 , а это противоречит условиям теоремы 3.2.1.
Таким образом, λ 0 ≠ 0 , и условием нормировки будет λ 0 = 1 . Аналогично предыдущемуслучаю условие трансверсальности (3.3.9) можно не учитывать при решениизадачи, так как параметры λ1 , λ 2 , K, λ n никуда больше не входят. Итак, краеваязадача принципа максимума для рассматриваемой задачи состоит из уравнений(3.2.15), (3.2.16) и условий:x(t 0 ) = a ,46(3.3.11)ψ(t1 ) = −λ 0∂g 0 ( x(t0 ), x(t1 )),∂yλ 0 = 1.(3.3.12)(3.3.13)4) Задача со свободным левым концом и закрепленным правым:dx= f ( x(t ), u (t ), t ) ,dtx(t1 ) = b ,u (t ) ∈ U ,J ( x, u ) =t1∫ f (x(t ), u(t ), t )dt + g (x(t ), x(t )) → min .0001t0Эта задача полностью аналогична предыдущей. Для нее краевая задачапринципа максимума будет состоять из уравнений (3.2.15), (3.2.16) и условий:x(t1 ) = b ,∂g ( x(t0 ), x(t1 ))ψ (t0 ) = λ 0 0,∂xλ 0 = 1.3.4.
Задача с квадратичным функционаломВажным частным случаем рассмотренной в п.3.2 задачи (3.2.1) – (3.2.4)является задача оптимального управления для линейной системы с квадратичным функционалом без ограничений на управление, т.е. когда U = E m :dx= Ax(t ) + Bu (t ), t ∈ [t 0 , t1 ] ,dtx(t0 ) = x0 ,J ( x, u ) =t1∫ [(Cx(t ), x(t ) ) + (Du (t ), u )(t )]dt → min .(3.4.1)(3.4.2)(3.4.3)t0Здесь C – симметричная матрица размерности n × n , D – положительноопределенная матрица размерности m × m . Остальные параметры те же, что и вп.3.1. Подобные задачи являются моделями многих систем управления. Минимизация квадратичного функционала может означать минимизацию среднейошибки управления, или, например, минимизацию энергии, расходуемой науправление. Для сформулированной задачи выполняется теорема 3.4.1, причемв данном случае можно решить задачу нахождения максимума функции Гамильтона.
Тем самым мы найдем явную зависимость оптимального управленияот сопряженных переменных. Далее выпишем уравнения принципа максимума.47Поскольку левый конец закреплен, а правый свободен, то λ 0 = 1 . Составим гамильтониан:H ( x, u, ψ ) = (ψ, Ax + Bu ) − (Cx, x ) − (Du, u ) .(3.4.4)Ограничений на управление нет, поэтому переменную u, на которой достигается максимум функции H , можно найти из условия равенства нулю вектора∂Hградиента. Подсчитаем сначала частную производную по uk от скалярного∂uпроизведения (ψ, Bu ). Обозначим: BT ψ = R – m -вектор. Тогда∂(ψ, Bu ) = ∂ (R, u ) = ∂∂uk∂u k∂ukm∑Rui i= Rk .i =1Следовательно,∂(ψ, Bu ) = (R1 ,K, Rm )T = R = BT ψ .∂u(3.4.5)Подсчитаем частную производную по uk от скалярного произведения(Du, u ).
Для этого запишем его в координатах:m(Du, u ) = ∑ d ij uiu j .i , j =1Учитывая, что d ij = d ji , будем иметь′′′m⎛ mm⎛ m⎞⎞⎞⎛ m∂(Du, u ) = ∑ ⎜⎜ ∑ d ij ui u j ⎟⎟ u k = ∑ ⎜⎜ ∑ d ij ui u j ⎟⎟ u k + ⎜⎜ ∑ d kj u k u j ⎟⎟ u k =∂u ki ≠ k ⎝ j =1i =1⎝ j =1⎠⎠⎠⎝ j =1′⎞⎛= ∑ d ik ui + ⎜ ∑ d kj u k u j ⎟ u k + (d kk u k u k )′u k = ∑ d jk u j + ∑ d kj u j + 2d kk u k =⎟⎜ j≠ki≠kj≠kj≠k⎠⎝m= 2 ∑ d kj u j + 2d kk u k = 2 ∑ d kj u j .j≠kj =1Таким образом,⎡ m⎤⎡ d11⎢ d1 j u j ⎥⎢d⎢ j =1⎥∂(Du, u ) = 2⎢ L ⎥ = 2⎢ 21⎢K∂u⎢m⎥⎢⎢ d mj u j ⎥⎣ d n1j=1⎢⎣⎥⎦∑K∑K48KKd1n ⎤ ⎡ u1 ⎤d 2 n ⎥ ⎢u 2 ⎥⎥ ⋅ ⎢ ⎥ = 2 Du .K ⎥ ⎢K⎥⎥ ⎢ ⎥d nn ⎦ ⎣u n ⎦(3.4.6)Из представления гамильтониана (3.4.4) и полученных формул (3.4.5), (3.4.6)следует:∂H ( x, u , ψ )= B T ψ − 2 Du .(3.4.7)∂uЕсли û (t ) – оптимальное управление, то оно доставляет максимум функции Гамильтона и, следовательно, удовлетворяет равенствуBT ψ (t ) − 2 Duˆ (t ) = 0 ,откуда1uˆ (t ) = D −1 B T ψ(t ) .2Это действительно точка максимума, так как матрица вторых производныхфункции H отрицательно определенна.
Действительно, из (3.4.7) следует:⎛ ∂2H⎜⎜ ∂u ∂u⎝ i jn⎞⎟= −2 D ,⎟⎠ i , j =1а так как по условию D – положительно определенная матрица, то − 2 D – отрицательно определенная матрица.∂H∂Hаналогичен подсчету, поэтомуПодсчет вектора-градиента∂x∂u∂H ( x, u , ψ )= AT ψ − 2Cx .∂xСледовательно, сопряженная система имеет видdψ= − AT ψ (t ) + 2Cx(t ) .dtУсловие трансверсальности для задачи со свободным правым и закрепленнымлевым концом с учетом вида критерия качества (3.4.3) имеет видψ(t1 ) = 0 .Теперь сформулируем полученный результат в виде теоремы (принципмаксимума для линейной системы с квадратичным функционалом).Теорема 3.4.1. Если ( xˆ (t ), uˆ (t )) – решение задачи (3.4.1) – (3.4.3), то суще-ствует вектор-функция ψ(t ) = (ψ1 (t ), ψ 2 (t ),K , ψ n (t )) , которая удовлетворяетсопряженной системеTdψ= − AT ψ(t ) + 2Cxˆ (t ), t ∈ [t 0 , t1 ] ,dtкраевому условиюψ(t1 ) = 0 ,49и при этом оптимальное управление определяется формулой1uˆ (t ) = D −1 B T ψ(t ) .2Таким образом, в рассматриваемой задаче для оптимального управлениянайдена формула, выражающая в явном виде зависимость его от сопряженныхпеременных.
Выпишем краевую задачу принципа максимума:dx1= Ax(t ) + BD − 1 B Tψ (t ),dt2dψ= − ATψ (t ) + 2Cx(t ),dtx(t0 ) = x0 ,ψ (t1 ) = 0.Эта краевая задача достаточно хорошо изучена. Ее решение сводится крешению задачи Коши для уравнения Риккати, для решения которого разработаны численные методы.3.5. Принцип максимума для дискретных задачПринцип максимума Понтрягина впервые был получен для непрерывныхсистем. Позже было доказано, что в общем случае для дискретных задач принцип максимума Понтрягина не имеет места. Это значит, можно привести примеры, в которых дискретное оптимальное управление не удовлетворяет условию максимума, т.е.