Методы оптимизации. Конспект лекций (Буряков) (2003) (1125388), страница 3
Текст из файла (страница 3)
Показать, что из того, что J(u0 +h) = J(u0 )+ah+ 21 bh2 +o(khk2 ),не следует существование J 00 (u0 ) (рассмотреть случай H = R1 ).Теорема (о производной сложной функции). [КФ, гл.X]Пусть X, Y, Z — нормированные пространства, F : X → Y, G: Y → Z, существует производная функции F в точке x0 , существует производная функции G в точкеy0 = F (x0 ). Тогда существует производная сложной функции GF : X → Z в точке x0 ,причём(GF )0 (x0 ) = G0 (y0 )F 0 (x0 )(без доказательства).Формулы конечных приращенийВведём ряд обозначений:C(U) — класс непрерывных на U функций;Lip(U) — класс Липшиц-непрерывных на U функций (т.е.
функций, для которыхвыполняется условие |f (u) − f (v)| 6 L·ku − vkH , где L — константа Липшица);C1 (U) — класс непрерывно дифференцируемых функций;12C2 (U) — класс дважды непрерывно дифференцируемых функций.Утверждение. Для функции J(u) ∈ C1 (U) и ∀u, v ∈ U выполняется следующееравенство:Z1J(u) − J(v) = hJ 0 (v + t(u − v)), u − viH dt =00= hJ (v + θ(u − v)), u − viH , где θ ∈ [0, 1].Доказательство.
Введём вспомогательное отображениеF : R1 → H, F (t) = v + t(u − v), F 0 (t) = u − v.Тогда будем иметь:J(u) − J(v) = JF (1) − JF (0) = {формула Ньютона-Лейбница} =Z1=(JF )0 (t) dt = {теорема о производной сложной функции} =0Z1=0J 0 (F (t)) F 0 (t) dt = {теорема Рисса} =| {z } | {z }∈H∗ =Hu−vZ1hJ 0 (v + t(u − v)), u − viH dt =00= {теорема о среднем (матан)} = hJ (v + θ(u − v)), u − viH , θ ∈ [0, 1] Упражнение 6 (3). Пусть J(u) ∈ C2 (H).
Доказать, что0Z10hJ (u + h) − J (u), giH =hJ 00 (u + th)h, giH dt = hJ 00 (u + θh)h, giH , где θ ∈ [0, 1].0Приведём примеры вычисления производной.1) J(u) = hc, uiH ⇒ J 0 (u) ≡ C ∈ H, J 00 (u) = Θ, (Θ — нуль-оператор).2) J(u) = kAu − f k2F , A ∈ L(H → F), f ∈ H:J(u + h) − J(u) = k(Au − f ) + Ahk2F − kAu − f k2F = 2 hAu − f, AhiF + kAhk2FЗаметим, что kAhk2F = o(khkH ), так как kAhk2F 6 kAk2L ·khk2H . Отсюда, сделав элементарные преобразования скалярного произведения в последнем равенстве, получаем, что J 0 (u) = 2A∗ (Au − f ).
Аналогично можно получить, что J 00 (u) = 2A∗ A(J 00 (u) ∈ L(H → H)).Упражнение 7 (3). Найти первую и вторую производные для функционала1J(u) = hAu, uiH − hf, uiH , где A ∈ L(H → H), f ∈ H.2Упражнение 8 (4). Найти первую и вторую производные для функционалаJ(u) = g(kukH ), g: R1 → R1 , g ∈ C2 (R1 ).Что будет, если g(t) ≡ t ?133Задачи управления линейной динамической системойЗдесь мы рассмотрим простейшую задачу оптимального управления при следующихусловиях:x0 (t) = A(t)x(t) + B(t)u(t) + f (t),t0 < t < T,x(t0 ) = x0 ,u(t) ∈ U ⊆ L2r (t0 , T ), (1)здесь A(t) = {aij (t)} — матрица (оператор)порядка n×n, B(t) = {bij (t)} — матрица порядка n×r, f (t) = {fi (t)} — матрица порядка n×1, то есть n-мерный вектор столбец;моменты времени t0 , T, а также точка x0 заданы; U — заданное множество из L2r (t0 , T );x(t, u) = x(t) = (x1 (t), .
. . , xn (t)) — решение (траектория), соответствующая управлению u = u(t) = (u1 (t), . . . , ur (t)) ∈ L2r (t0 , T ). Также мы считаем известной траекторию,разницу с которой мы минимизируем — y(t).Критериями качества управления могут выступать различные функционалы, например:J1 (u) = |x(T, u) − y|2Rn → inf — терминальный квадратичный функционал(2)илиZTJ2 (u) =|x(t, u) − y(t)|2Rn dt → inf — интегральный квадратичный функционал(3)t0Минимизация терминального квадратичного функционала позволят добиться точности в достижении конечной точки. Интегрального — близости траектории к заданной.Определение. При u(t) ∈ L2 (t0 , T ) под решением задачи Коши (1) понимается непрерывная на отрезке [t0 , T ] функция x(t), удовлетворяющая интегральному уравнениюZtx(t) = x0 +(A(τ )x(τ ) + B(τ )u(τ ) + f (τ )) dτ,t ∈ [t0 , T ]t0При этом функционалы A(t), B(t), F (t) должны принадлежать классу измеримыхпо Лебегу и ограниченных функций L∞ (t0 , T ).! p1RTНапомним, что kukL∞ (t0 ,T ) =infC = lim|u(t)|p dtp→∞C>0:|u(t)|6C п.в.t0Редуцируем исходную задачу к линейной, положив x = x1 + x2 , где 0 0x1 = Ax1 + Bux2 = Ax2 + fx1 (t0 ) = 0,x2 (t0 ) = x0 .Заметим, что во второй системе нет неизвестного управления, а значит можно найти x2 .
При такой редукции критериальные функционалы можно представить какJ1 (u) = | x1 (T, u) − (y − x2 (T )) |2 = kA1 u − f k2Rn ,| {z } |{z}=A1 u=f ∈Rn14ZTJ2 (u) =t0| x1 (t, u) − (y − x2 (t)) |2 dt = kA2 u − f kL2 (t0 ,T ) .| {z } | {z }=A2 u=f ∈L2 (t0 ,T )Таким образом, для решения задачи (1), (2) или задачи (1), (3) необходимо минимизировать нормы kA1 u−yk2 и kA2 u−yk2 соответственно, где операторы A1 и A2 задаютсяследующим образомA1 u = x(T, u): L2 (t0 , T ) → Rn ,A2 u = x(t, u): L2 (t0 , T ) → L2 (t0 , T ).Для дальнейших рассуждений докажем, что операторы A1 и A2 ограничены, то естьдля соответствующих норм kAuk 6 c·kuk.
Из (1) и определения решения задачи Кошиимеем t ZtZ|x(t)| = (A(τ )x(τ ) + B(τ )u(τ )) dτ 6 (|A(τ )||x(τ )| + |B(τ )||u(τ )|) dτ.t0t0Так как A(t), B(t) ∈ L∞ , то модули под знаком интеграла можно оценить сверхуконстантами, тогда получим, что |x(t)| не превосходитZtZt|u(τ )| dτ + CACBt0|x(τ )| dτ.t0Можно загрубить оценку, заменив момент времени на максимальный, тогда в силунеравенства Коши-Буняковского полученное выражение меньше или равноCBpZtT − t0 kukL2 + CA|x(τ )| dτ.t0Эта оценка верна для всех t ∈ [t0 , T ].
Далее нам понадобится лемма ГронуоллаБеллмана. Напомним её формулировку без доказательства.Лемма (Гронуолл-Беллман). [В2, стр. 30–31, лемма 2], [АТФ, стр. 189]Пусть функция ω(t) удовлетворяет условиюZt0 6 ω(t) 6 b + aω(τ ) dτ(b > 0, a > 0).t0Тогда верно неравенство ω(t) 6 b·ea(t−t0 ) .√Применяя лемму к функции x(t), получаем оценку |x(t)| 6 CB T − t0 kukeCA (t−t0 ) , тоесть |x(t)| 6 Ckuk. Таким образом, мы доказали, что оператор A1 ограничен.Для доказательства ограниченности оператора A2 заметим, чтоvuZTupukA2 ukL2 = kxkL2 = t |x(t)|2 dt 6 CkukL2 T − t0 .t015Из приведённых рассуждений можно сделать вывод, что функционалы J1 (u) и J2 (u)слабо полунепрерывны снизу на L2 , откуда следует следующаяТеорема 3 (о существовании оптимального управления задач (1), (2) и (1), (3)).Пусть A(t), B(t), f (t) ∈ L∞ (t0 , T ); y(t) ∈ L2 (t0 , T ), x0 ∈ Rn , y ∈ Rn .
Тогда у обеих задач(1), (2) и (1), (3) при выборе управления из слабо компактного множества U ⊂ L2 (t0 , T )существует оптимальное управление.Доказательство.По сути, достаточно сослаться на Теорему 2.Теперь обратимся к вопросу о дифференцируемости функционалов J1 и J2 . Для любого дифференцируемого по Фреше квадратичного функционала J(u) = kAu−f k2 справедливы формулы J 0 (u) = 2A∗ (Au − f ) и J 00 (u) = 2A∗ A. Вычислим сопряжённые операторыв нашем случае. Для оператора A1 для любого v имеемhA1 u, viRn = hu, A∗1 viL2Если расписать это равенство, то получимZThx(T, u), viRn =hu(t), .
. .iRr dt,t0где вместо многоточия стоит необходимый нам множитель.Введём функцию ψ(t) как решение сопряжённой задачи Коши:ψ(T ) = v,ψ 0 (t) = −AT (t)ψ(t).(5)Тогда скалярное произведение можно расписать какhx(T ), viRn = hx(T ), ψ(T )i − h0, ψ(t0 )i = {ф-ла Ньютона-Лейбница, x(t0 ) = 0} =ZTZT0= hx(t), ψ(t)it dt = (hx0 (t), ψ(t)i + hx(t), ψ 0 (t)i) dt = {x0 (t) = Ax + Bu} =t0t0ZTZThBu, ψ(t)iRn dt +=t0ZT=t0(hAx, ψ(t)iRn + hx(t), ψ 0 (t)iRn ) dt =t0u(t), B T ψ(t) Rr dt +ZTx(t), ψ 0 (t) + AT (t)ψ(t) Rn dtt0Последний интеграл в силу (5) обнуляется, а из первого мы получаем, чтоA∗1 v = B T ψ(t).16Аналогичные рассуждения можно провести для оператора A2 :hA2 u, viL2 = hu, A∗2 viL2ZTZThu(t), .
. .iRr dthx(t, u), viRn =t0t0Прибавим к левой части этого равенства интегралZThBu + Ax − x0 (t), ψ(t)iRn dt = 0,t0где ψ(t) — решение системыψ(T ) = 0,ψ 0 (t) = −AT (t)ψ(t) − v(t).(6)Получаем:ZTZThx(t, u), viRn =t0u(t), B T ψ(t) Rr dt +t0ZThx(t), v(t)i + x(t), AT ψ − hx0 (t), ψi dt.t0Последний интеграл обращается в нуль в силу (6) и того, что по формуле НьютонаЛейбницаZT−Thx (t), ψi dt = − hx(t), ψ(t)i 0ZTZThx(t), ψ (t)i dt =+t=t0t00t0hx(t), ψ 0 (t)i dt.t0Отсюда A∗2 v = B T ψ(t).Теорема 4 (о дифференцируемости функционалов J1 и J2 ).
Пусть A(t), B(t) ∈L∞ (t0 , T ); y(t) ∈ L2 (t0 , T ), y ∈ Rn . Тогда оба функционала J1 и J2 бесконечно дифференцируемы по u на L2 (t0 , T ), причёмJ10 (u) = 2B T ψ(t), где ψ(t) — решение (5),J20 (u) = 2B T ψ(t), где ψ(t) — решение (6).Доказательство.Фактически мы провели доказательство этой теоремы выше при вычислении операторов A∗1 и A∗2 .17Упражнение 9 (5). Вычислить J 0 (u) дляZlJ(u) =|y(x, u) − z(x)|2 dx,0где y — решение системы0 (k(x)y 0 (x)) − q(x)y(x) = u(x), 0 < x < ly(0) = 0y(l) = 0k(x) > k0 > 0, q(x) > 0, u(x) ∈ L2 (0, l).4Элементы выпуклого анализаНапомним определение выпуклой функции.Определение.
Функция J(u) называется выпуклой на выпуклом множестве U, еслиJ(αu + (1 − α)v) 6 αJ(u) + (1 − α)J(v) ∀u, v ∈ U, ∀α ∈ [0, 1].И введём несколько новых понятий:Определение. Функция J(u) называется строго выпуклой, еслиJ(αu + (1 − α)v) < αJ(u) + (1 − α)J(v) ∀u, v ∈ U, u 6= v, ∀α ∈ (0, 1).Определение.
Функция J(u) называется сильно выпуклой с коэффициентом κ > 0,еслиκJ(αu + (1 − α)v) 6 αJ(u) + (1 − α)J(v) − α(1 − α)ku − vk2 ∀u, v ∈ U, ∀α ∈ [0, 1].2Теорема 5 (о локальном минимуме выпуклой функции). Пусть множество Uвыпуклое, функция J(u) выпукла на U, J∗ > −∞, тогда:1) любая точка локального минимума J(u) на U является точкой глобального минимума;2) если U∗ 6= ∅, то U∗ выпукло;3) если U∗ 6= ∅, а J(u) строго выпукла, то U∗ = {u∗ } (состоит из одного элемента).Доказательство.Пусть точка u∗ ∈ U — точка локального минимума, т.е.∃ε > 0 : ∀u ∈ U ∩ {ku − u∗ k 6 ε} ⇒ J(u) > J(u∗ ).Фиксируем любую точку v ∈ U, тогда существует такое α0 , 0 < α0 < 1, что для любогоα из отрезка [0, α0 ] выполнено условиеu∗ + α(v − u∗ ) ∈ U ∩ {ku − u∗ k 6 ε}.1866--нестрого выпуклаяфункцияневыпуклая функция66exx2--строго, но не сильновыпуклая функциясильно выпуклаяфункция с κ = 1Рис.