Теормин (extended) (2003) (1125525), страница 5
Текст из файла (страница 5)
[АТФ, стр. 171-174]Пусть X, Y — банаховы пространства, отображение F : X → Y дифференцируемопо Фреше, M = {x ∈ X | F (x) = 0}, x0 ∈ M, im F 0 (x0 ) = Y. Тогда Tx0 M = ker F 0 (x0 ).Теорема 24. Пусть u∗ — точка локального минимума в задаче (1); J(u), gi (u) ∈ C1 (Uε )для некоторого положительного ε. Тогда существует ненулевой набор множителейЛагранжа λ∗ = (λ∗0 , . . . , λ∗m+s ), обладающий следующими свойствами:m+sX0∗∗0i) Lu (u∗ , λ ) = λ0 J (u∗ ) +λ∗i gi0 (u∗ ) = 0i=1— условие стационарности функции Лагранжа ;ii)λ∗i > 0 ∀i = 0, m — условия неотрицательности множителей Лагранжа;iii)λ∗i gi (u∗ ) = 0 ∀i = 1, m — условия, дополняющие нежёсткости.Двойственные экстремальные задачиВ этом пункте рассмотрим задачу минимизацииJ(u) → inf,u ∈ U = {u ∈ U0 ⊆ L | g1 (u) 6 0, .
. . , gm (u) 6 0, gm+1 (u) = 0, . . . , gm+s (u) = 0} .(1)Для решения подобных задач иногда легче перейти к решению так называемых двойственных задач. Опишем этот процесс. Строим функцию Лагранжа для задачи (1):L(u, λ) = 1·J(u) +m+sXλi gi (u), u ∈ U0 , λ ∈ Λ0 = λ ∈ Rm+s | λi > 0, i = 1, m .(2)i=1Рассмотрим функциюϕ(u) = sup L(u, λ) =λ∈Λ0J(u), если u ∈ U,.+∞, если u ∈ U0 \U(3)Задача (1) равносильна задаче минимизации на расширенном множестве:ϕ(u) → inf,u ∈ U0 .(4)Вводим функциюψ(λ) = inf L(u, λ).u∈U0(5)Определение.
Задачаψ(λ) → sup,λ ∈ Λ0(6)называется двойственной к исходной задаче (1).Теорема 25. Всегда верны неравенства:ψ(λ) 6 ψ ∗ 6 ϕ∗ = J∗ 6 ϕ(u),∀λ ∈ Λ0 , ∀u ∈ U0 .(7)Для того, чтобыψ ∗ = ϕ∗ , U∗ 6= ∅, Λ∗ 6= ∅,(8)необходимо и достаточно, чтобы L(u, λ) имела седловую точку на U0 × Λ0 ; U∗ × Λ∗ —множество всех седловых точек.23Вторая двойственная задачаВведём понятие второй двойственной задачи. Для этого рассмотрим одинПример.Рассмотрим минимизацию функции J(u) = u2 на множествеU = {g(u) = u2 − 1 6 0} = [−1, 1].Имеем:J∗ = ϕ∗ = 0, U∗ = {0} =6 ∅,L(u, λ) = u2 + λ(u2 − 1)Получаем ψ(λ) = −λ, если λ > −1 (в нашем случае λ > 0).Теперь поставим двойственную задачу к ψ(λ):ψ(λ) = −λ → sup, ψ ∗ = 0 = ψ(0), Λ∗ = {0} =6 ∅.λ>0Перейдём к задаче на минимум (J(v) = −ψ(v)):J(v) = v → inf, v > 0,(v := λ)v ∈ V = {v ∈ R1 = V0 | g(v) = −v 6 0}Отсюда получаем функцию Лагранжа:L(v, µ) = 1·v + µ(−v), µ > 00, если µ = 1,ψ(µ) =.−∞, если µ 6= 1.
второйОпределение. Задача максимизации функции ψ(µ) при µ > 0 называетсядвойственной задачей.Приведённый пример показывает, что вторая двойственная задача не всегда совпадает с исходной.7Простейшая задача оптимального управления.Принцип максимума ПонтрягинаВ этой главе мы коснёмся задачи оптимизации, которую принято называть задачей оптимального управления. Более подробно этот вопрос освещается в соответствующемкурсе, мы же рассмотрим его, исходя из наших потребностей.В общем виде рассматриваемая задача выглядит следующим образом:ZTJ(u) = f 0 (x(t), u(t), t) dt + ϕ(x(T )) → inft00x (t) = f (x(t), u(t), t) почти всюду для t0 < t < T, x(t0 ) = x0 ,(1)u ∈ U = {u(t) — измерима по Лебегу | u(t) ∈ V ⊆ Rr для почти всех t}Функционал f 0 принято называть интегрантом, а функционал ϕ — терминантом.Заметим, что в такой постановке отсутствуют фазовые ограничения на x(t)(x(t) ∈ G ⊆ Rn ), что облегчает нам исследование задачи.Предположим существование f, fx , f 0 , fx0 , ϕ, ϕx их непрерывность по t, и Липшицнепрерывность по x и u на Rn × V × [t0 ; T ].
(В принципе можно обойтись без Липшицнепрерывности, но при этом многие выкладки значительно усложняются.) В дальнейшембудем ссылаться на подобное существование отметкой (2).24Функция Гамильтона-Понтрягина. Принцип максимумаВ этом пункте рассмотрим функцию следующего вида:H(x, u, t, ψ) = f 0 (x, u, t) + hψ, f (x, u, t)iRn ,называемой функцией Гамильтона-Понтрягина.Введём ряд обозначений:∆J = J(u + h) − J(u),∆x = x(t, u + h) − x(t, h),∆f 0 = f 0 (x(t, u + h), u(t) + h(t), t) − f 0 (x(t, u), u(t), t) .Преобразуем ∆J(u) так, чтобы получить принцип максимума.ZT∆J =∆f 0 dt + ∆ϕ.(3)t0Применяя формулу конечных приращений, имеем∆ϕ = hϕx (x(T ) + θ∆x(T )) ± ϕx (x(T )), ∆x(T )iRn = hϕx (x(T )) , ∆x(T )iRn + Rϕ ,где θ ∈ [0, 1], Rϕ — некоторый остаток.Таким образом, получаемZT∆J = ∆f 0 dt + hϕx (x(T )) , ∆x(T )iRn + Rϕ .(4)t0Введём обозначение(5)ψ(T ) = ϕx (x(T )) .Тогдаhϕx (x(T )) , ∆x(T )i = hψ(T ), ∆x(T )i = {∆x(t0 ) = 0} = hψ(T ), ∆x(T )i − hψ(t0 ), ∆x(t0 )i =ZTZTZTd0=hψ(t), ∆x(t)i dt = hψ (t), ∆x(t)i dt + hψ(t), ∆x0 (t)i dt.dtt0t0t0ZTZTТаким образом, имеем∆H dt +∆J =t0hψ 0 (t), ∆x(t)i dt + Rϕ .(6)t0Теперь, используя формулу конечных приращений и элементарные преобразования,представим ∆H в несколько ином виде:∆H = (H (x(t, u + h), u + h, t, ψ) − H (x(t, u), u + h, t, ψ)) ++ (H (x(t, u), u + h, t, ψ) − H (x(t, u), u, t, ψ)) == hHx (x(t) + θ(t)∆x(t), u + t, t, ψ) , ∆x(t)i + ∆u H,где θ ∈ [0; 1], а через ∆u H обозначено второе слагаемое.25Продолжая цепочку равенств, получаем∆H = hHx (x, u, t, ψ), ∆x(t)i + ∆u H + RH (t),где RH (t) — некий остаток, связанный с H(.
. .). Имеем:ZTZT(7)t0t0t0RH (t) dt + Rϕ .hψ + Hx , ∆xi dt +∆u H dt +∆J =ZT0Потребуем, чтобы выполнялось равенствоψ 0 (t) = −Hx (x(t), u(t), t, ψ(t)).(8)При выполнении этого условия выражение (7) преобразуется вZTZTRH (t) dt + Rϕ .∆u H dt +∆J =(9)t0t0Оценим остатки в этом выражении. Для этого рассмотрим сначала производную приращения x:∆x0 (t) = ∆f (t), t0 < t < T ;∆x(t0 ) = 0.Перейдём к эквивалентной интегральной форме:Zt∆f (τ ) dτ.∆x(t) =t0Тогда из условия Липшица получим:ZtZtk∆x(τ )kRn dτ + Lk∆x(t)kRn 6 Lt0t0Zt=∆u(τ )ZTk∆x(τ )kRn dτ + L6Lk h(τ ) kRr dτ 6|{z}t0kh(τ )kRr dτ.t0По лемме Гронуола-Бэллмана имеем:k∆x(t)kRn 6 LkhkL1 (t0 ;T ) exp {L(t − t0 )} .Возьмём максимум по t от обоих частей этого неравенства:k∆x(t)kC[t0 ;T ] 6 constkhkL1 (t0 ;T ) = O (khkL1 ) .26Тогда для остатка Rϕ , используя условия Липшица и применяя неравенство КошиБуняковского, получаем следующую оценку:|Rϕ | = |hϕx (x(T ) + θ∆x(T )) − ϕx (x(T )) , ∆x(T )iRn | 66 {θ ∈ [0; 1]} 6 Lk∆x(T )k2Rn = O khk2L1Оценим остаток RH (t).RH (t) = hHx (x(t) + θ(t)∆x(t), u(t) + h(t), t, ψ(t)) − Hx (x(t), u(t) + h(t), t, ψ(t)) , ∆x(t)iRnВ силу неравенства Коши-Буняковского и условий (2) получаем TZZT RH (t) dt 6 L kθ(t)∆x(t)kRn (1 + kψkC ) k∆x(t)kRn dt.t0t0И так как ψ непрерывна и промежуток ограничен, то TZ RH (t) dt = O khk2 1 .Lt0Из оценок остатков получаем формулуZT∆J =2∆u H dt + O khkL1 (t0 ;T ) .(10)t0Теперь сформулируем основную теорему пункта.Теорема 26 (принцип максимума Понтрягина).
Пусть для задачи (1) выполняются условия (2), u(t) — оптимальное управление, x(t) — соответствующая оптимальнаятраектория, ψ(t) — решение сопряжённой задачи (5), (8). ТогдаH (x(t), u(t), t, ψ(t)) = min n H (x(t), v, t, ψ(t))v∈V ⊆Rдля почти всех t.27(11)Об использовании принципа максимумаЗаметим, что используя принцип максимума, мы, по сути, переходим от бесконечномерной задачи к континууму конечномерных задач.
(Параметр t можно считать при этом“номером” задачи.) Иногда это позволяет упростить решение, иногда нет. Принцип максимума даёт нам лишь необходимые условия на оптимальность, то есть управления, емуудовлетворяющие, на самом деле есть лишь “подозрительные” на оптимальность управления.Предположим, что u(t, x, ψ) — оптимальное управление, на котором достигается (11).Тогда, подставляя его в наши условия, имеем систему: 0x (t) = f (x(t), u (t, x(t), ψ(t)) , t)x(t0 ) = x0ψ 0 (t) = −Hx (x(t), u (t, x(t), ψ(t)) , t) , t, ψ(t))ψ(T ) = −ϕ (x(T ))Получаем краевую задачу принципа максимума, в которой 2n дифференциальныхуравнений и 2n краевых условий. К сожалению, это именно краевая задача, с условиямине в t0 , а в T, к тому же она нелинейно зависит от траектории x(t).Предположим, что x(t),ψ(t) — решение этой системы.
Тогда управление u(t, x(t), ψ(t))будет являться “подозрительным” на оптимальность.Линеаризованный принцип максимума. Градиент функционалаДобавим в задаче (1) к условиям (2) условия на гладкость: fu , fu0 — Липшиц-непрерывныпо u и непрерывны по совокупности переменных (x, u, t). Обозначим эти условия (2u).Тогда аналогично предыдущим выкладкам можно показать, что∆u H(t) = H (x(t), u(t) + h(t), t, ψ(t)) − H (x(t), u(t), t, ψ(t)) == hHu (x(t), u(t), t, ψ(t)) , h(t)iRr + Ru .Для Ru в силу наших предположений справедлива оценка:|Ru | 6 L |h(t)|2 .И для (10) мы получаем выражение:ZTZT2J(u + h) − J(u) = hHu (x(t), u(t), t, ψ(t)) , h(t)iRr dt + O khkL1 + L |h(t)|2 dt.t0t02Последнее слагаемое в этой сумме есть норма h в пространстве L в квадрате, умно2женная на константу L, то есть O khkL2 .Второе слагаемое также можно считать O khk2L2 , так как T2 T TZZZkhk2L1 = 1· |h(t)| dt 6 1 dt · |h(t)|2 dtt0t0t0|{z=const} |{z=khk2 2}LИ по определению J 0 (u) = Hu (x(t), u(t), t, ψ(t)) (отождествление по Риссу).28Теорема 27.Пусть выполнены условия Теоремы 26 и условия (2u).