Теормин (extended) (2003) (1125525), страница 2
Текст из файла (страница 2)
Тогда у обеих задач(1), (2) и (1), (3) при выборе управления из слабо компактного множества U ⊂ L2 (t0 , T )существует оптимальное управление.Теперь обратимся к вопросу о дифференцируемости функционалов J1 и J2 . Для любого дифференцируемого по Фреше квадратичного функционала J(u) = kAu−f k2 справедливы формулы J 0 (u) = 2A∗ (Au − f ) и J 00 (u) = 2A∗ A. Вычислим сопряжённые операторыв нашем случае. Для оператора A1 для любого v имеемhA1 u, viRn = hu, A∗1 viL2Если расписать это равенство, то получимZThu(t), . . .iRr dt,hx(T, u), viRn =t0где вместо многоточия стоит необходимый нам множитель.Введём функцию ψ(t) как решение сопряжённой задачи Коши:ψ(T ) = v,ψ 0 (t) = −AT (t)ψ(t).(5)Тогда скалярное произведение можно расписать какhx(T ), viRn = hx(T ), ψ(T )i − h0, ψ(t0 )i = {ф-ла Ньютона-Лейбница, x(t0 ) = 0} =ZTZT0= hx(t), ψ(t)it dt = (hx0 (t), ψ(t)i + hx(t), ψ 0 (t)i) dt = {x0 (t) = Ax + Bu} =t0t0ZTZThBu, ψ(t)iRn dt +=t0ZT=t0(hAx, ψ(t)iRn + hx(t), ψ 0 (t)iRn ) dt =t0u(t), B T ψ(t) Rr dt +ZTx(t), ψ 0 (t) + AT (t)ψ(t) Rn dtt0Последний интеграл в силу (5) обнуляется, а из первого мы получаем, чтоA∗1 v = B T ψ(t).7Аналогичные рассуждения можно провести для оператора A2 :hA2 u, viL2 = hu, A∗2 viL2ZTZThu(t), .
. .iRr dthx(t, u), viRn =t0t0Прибавим к левой части этого равенства интегралZThBu + Ax − x0 (t), ψ(t)iRn dt = 0,t0где ψ(t) — решение системыψ(T ) = 0,ψ 0 (t) = −AT (t)ψ(t) − v(t).(6)Получаем:ZTZThx(t, u), viRn =u(t), B T ψ(t) Rr dt +t0t0ZThx(t), v(t)i + x(t), AT ψ − hx0 (t), ψi dt.t0Последний интеграл обращается в нуль в силу (6) и того, что по формуле НьютонаЛейбницаZT−Thx (t), ψi dt = − hx(t), ψ(t)i 0ZTZThx(t), ψ (t)i dt =+t=t0t00t0hx(t), ψ 0 (t)i dt.t0Отсюда A∗2 v = B T ψ(t).Теорема 4 (о дифференцируемости функционалов J1 и J2 ).
Пусть A(t), B(t) ∈L∞ (t0 , T ); y(t) ∈ L2 (t0 , T ), y ∈ Rn . Тогда оба функционала J1 и J2 бесконечно дифференцируемы по u на L2 (t0 , T ), причёмJ10 (u) = 2B T ψ(t), где ψ(t) — решение (5),J20 (u) = 2B T ψ(t), где ψ(t) — решение (6).7Определение. Функция J(u) называется выпуклой на выпуклом множестве U, еслиJ(αu + (1 − α)v) 6 αJ(u) + (1 − α)J(v) ∀u, v ∈ U, ∀α ∈ [0, 1].И введём несколько новых понятий:Определение. Функция J(u) называется строго выпуклой, еслиJ(αu + (1 − α)v) < αJ(u) + (1 − α)J(v) ∀u, v ∈ U, u 6= v, ∀α ∈ (0, 1).Определение. Функция J(u) называется сильно выпуклой с коэффициентом κ > 0,еслиκJ(αu + (1 − α)v) 6 αJ(u) + (1 − α)J(v) − α(1 − α)ku − vk2 ∀u, v ∈ U, ∀α ∈ [0, 1].2Теорема 5 (о локальном минимуме выпуклой функции).
Пусть множество Uвыпуклое, функция J(u) выпукла на U, J∗ > −∞, тогда:1) любая точка локального минимума J(u) на U является точкой глобального минимума;2) если U∗ 6= ∅, то U∗ выпукло;3) если U∗ 6= ∅, а J(u) строго выпукла, то U∗ = {u∗ } (состоит из одного элемента).Теорема 6 (сильно выпуклый вариант теоремы Вейерштрасса). Пусть H —гильбертово пространство, множество U ⊂ H выпукло и замкнуто (не обязательноограничено!), функция J(u) сильно выпукла с коэффициентом κ и полунепрерывна снизуна U (т.е.
и слабо полунепрерывна снизу) тогда:1) J∗ > −∞;2) U∗ = {u∗ } =6 ∅;κ3) ∀u ∈ U 2 ku − u∗ k2H 6 J(u) − J(u∗ ).Теорема 7 (критерий выпуклости для дифференцируемых функций). ПустьH — гильбертово пространство, множество U ⊂ H выпукло, J(u) ∈ C1 (U). Тогдаследующие утверждения эквивалентны:(a) J(u) выпукла;(b) J(u) > J(v) + hJ 0 (v), u − viH∀u, v ∈ U;(c) hJ 0 (u) − J 0 (v), u − viH > 0 ∀u, v ∈ U.Если, кроме того, J(u) ∈ C2 (U) и intU 6= ∅, то эквивалентны утверждения (a)−(c)и утверждение(d) hJ 00 (u)·h, hiH > 0 ∀u ∈ U, ∀h ∈ H.8Теорема 8 (критерий сильной выпуклости для дифференцируемых функций).Пусть H — гильбертово пространство, множество U ⊂ H выпукло, J(u) ∈ C1 (U).Тогда следующие утверждения эквивалентны:(a0 ) J(u) сильно выпукла с коэффициентом κ > 0;(b0 ) J(u) > J(v) + hJ 0 (v), u − viH + κ2 ku − vk2H(c0 ) hJ 0 (u) − J 0 (v), u − viH > κku − vk2H∀u, v ∈ U;∀u, v ∈ U.Если, кроме того, J(u) ∈ C2 (U) и intU 6= ∅, то эквивалентны утверждения (a0 ) −(c ) и утверждение0(d0 ) hJ 00 (u)·h, hiH > κkhk2H∀u ∈ U, ∀h ∈ H.Теорема 9 (условия оптимальности в форме вариационного неравенства).Пусть множество U — выпукло, J(u) ∈ C1 (U).
Тогда1) если u∗ = argmin J(u), то hJ 0 (u∗ ), u − u∗ i > 0 ∀u ∈ U (1);u∈U2) если u∗ ∈ intU, то J 0 (u∗ ) = 0;3) если выполняется (1), а J(u) выпукла, то u∗ = argmin J(u).u∈UМетрическая проекцияВ этом пункте M — метрическое пространство, ρ(x, y) — метрика, U ⊂ M.Определение. Проекцией prU (v) точки v на множество U называется argmin ρ(u, v)u∈U(в некоторых случаях выгоднее рассматривать проекцию как argmin ρ2 (u, v)).u∈UЗаметим, что в случае, когда U не выпукло, проекция точки, вообще говоря, можетбыть не единственной (см. рис.
8).Для некоторых множеств проекции точки на них вообще не существует. Например,если рассмотреть открытый шар U = {kuk < 1} и точку вне этого шара, то она не будетиметь проекцию на это множество (см. рис. 9).Теорема 10 (существование и единственность проекции и её свойства).Пусть H — гильбертово пространство, U — выпуклое замкнутое множество, тогда1) для любого элемента h из H существует единственная prU (h);p ∈ U,2) p = prU (h) ⇔(см. рис.
10);hp − h, u − piH > 0 ∀u ∈ U3) k prU (f ) − prU (g)kH 6 kf − gkH ∀f, g ∈ H. Это свойство называют нестрогойсжимаемостью оператора проектирования (см. рис. 11).Теорема 11 (проекционная форма критерия оптимальности). Пусть H — гильбертово пространство, U — выпуклое замкнутое множество, J(u) ∈ C1 (U), J(u) выпукла. Тогдаu∗ = argmin J(u) ⇔ ∀α > 0 u∗ = prU (u∗ − αJ 0 (u∗ )).u∈U9Метод скорейшего спускаРассмотрим достаточно общую задачу минимизации:J(u) → inf,u ∈ H.(1)Для её решения в данном методе строится следующая итерационная последовательность:uk+1 = uk − αk J 0 (uk ), k = 0, 1, 2, . . .
; α > 0(2)Для начала процесса итерирования необходимо задать u0 ∈ H. Способов, для выбораu0 в общем случае не существует и в основном здесь исходят из каких-либо эмпирическихданных и полагаются на опыт.Критерии остановки процесса приближенного нахождения минимума могут бытьоснованы на различных соображениях. Приведём некоторые из них:1) kuk+1 − uk k 6 ε1 ;2) kJ(uk+1 ) − J(uk )k 6 ε2 ;3) kJ 0 (uk )k 6 ε3 .(εi выбираются, исходя из требований к решению). Обычно на практике применяюткомбинации этих оценок.Выбор шага спуска αk в общем случае также не единственен (причём на каждом шагеон может быть взят по-разному). Иногда αk берут не зависящим от k: αk = α ≡ const > 0.В методе скорейшего спуска αk определяется конкретным образом:αk = argmin J(uk − αJ 0 (uk )).(3)α>0Обозначим через fk (α) выражение J(uk − αJ 0 (uk )).Заметим, что в при таком выборе αk , если uk+1 = uk , то либо αk = 0, либо J 0 (uk ) = 0.Случай J 0 (uk ) = 0 является необходимым условием минимума и процесс итерированияможно остановить.
А в случае, когда αk = 0 из (3) имеем(fk0 (0) > 0fk0 (0) = hJ 0 (uk ), J 0 (uk )i 6 0.Откуда fk0 (0) = 0 и мы опять получили необходимое условие минимума.Теорема 12. Пусть H — гильбертово пространство, J(u) ∈ C1 (H), J(u) сильно выпукла с коэффициентом κ > 0, J 0 (u) ∈ Lip(H) с константой L > 0. Тогда при любомвыборе начальной точки u0 из H метод (2)–(3) сходится к точке минимума u∗ задачи(1), причём для скорости сходимости справедлива оценка:κκkuk − u∗ k2 6 J(uk ) − J(u∗ ) 6 q k (J(u0 ) − J(u∗ )), где q = 1 − ∈ [0, 1)2L10(4)Непрерывный аналог метода скорейшего спускаКак и в предыдущем методе, здесь мы рассматриваем задачу минимизации функцииJ(u) на множестве без ограничений U = H:J(u) → inf, u ∈ H(1)Приведём некоторые формальные рассуждения, которые позволят нам получитьнепрерывный аналог метода скорейшего спуска.
Рассмотрим шаг процесса для этогометода:uk+1 = uk − αJ 0 (uk ).Если рассматривать ∆tk как некий временной шаг, то разделив это равенство на ∆tkполучим:αk 0uk+1 − uk=−J (uk ).∆tk∆tkЕсли теперь задать значение u(t) в начальный момент времени t = 0, то мы придём(исходя из здравого смысла) к системе 0u (t) = −β(t)J 0 [u(t)], t > 0(2)u(0) = u0Теорема 13. Пусть J(u) сильно выпукла на H с коэффициентом κ > 0, J 0 (u) ∈ Lip(H),β(t) > β0 > 0 непрерывна по t. Тогда для любого начального приближения u0 ∈ H метод(2) сходится к u∗ и для скорости сходимости справедлива оценка:ku(t) − u∗ kH 6 ku0 − u∗ kH ·e−κβ0 t , t > 0(3)Метод проекции градиентаВ этом пункте рассмотрим задачу минимизации функции J(u) на множестве, уже несовпадающем со всем пространством H (задачу на условный минимум):J(u) → inf,u∈U⊂H(1).В данном методе рассматривается итерационная последовательностьuk+1 = prU (uk − αk J 0 (uk )),k = 0, 1, 2, .