Методы оптимизации. Конспект лекций (Буряков) (2003) (1125388), страница 12
Текст из файла (страница 12)
Пусть для задачи (1) выполняются условия (2), u(t) — оптимальное управление, x(t) — соответствующая оптимальнаятраектория, ψ(t) — решение сопряжённой задачи (5), (8). ТогдаH (x(t), u(t), t, ψ(t)) = min n H (x(t), v, t, ψ(t))v∈V ⊆R(11)для почти всех t.Доказательство.Из того, что u(t) — оптимальное управление, следует, что для всех допустимых h∆J = J(u + h) − J(u) > 0,отсюдаZT∆u H(t) dt + O khk2L1 > 0,t068∀h ∈ L1 : u + h ∈ Uu6u(s)qVq-v∈V(t0εεзаменаконстантой)-TtsПрименим метод игольчатых вариаций, заменив оптимальное управление на некотором отрезке [t − ε; t + ε] постоянной v (см.
рис.)v, если s ∈ [t − ε; t + ε],u(s) + h(s) = uε (s) =u(s) для остальных s.Тогда разность ∆u H(s) будет ненулевой только на этом отрезке:Zt+ε∆u H(s) ds + O khk2L1 > 0t−εМы можем сказать, что O khk2L1 = O(ε2 ), так какkhkL1Zt+ε=|u(s) − v| ds = O(ε).t−εРазделив полученное выражение на ε и устремив ε к нулю, в пределе для почти всехt из интервала (t0 , T ) получаем (11).Об использовании принципа максимумаЗаметим, что используя принцип максимума, мы, по сути, переходим от бесконечномерной задачи к континууму конечномерных задач.
(Параметр t можно считать при этом“номером” задачи.) Иногда это позволяет упростить решение, иногда нет. Принцип максимума даёт нам лишь необходимые условия на оптимальность, то есть управления, емуудовлетворяющие, на самом деле есть лишь “подозрительные” на оптимальность управления.Предположим, что u(t, x, ψ) — оптимальное управление, на котором достигается (11).Тогда, подставляя его в наши условия, имеем систему: 0x (t) = f (x(t), u (t, x(t), ψ(t)) , t)x(t0 ) = x00ψ(t) = −Hx (x(t), u (t, x(t), ψ(t)) , t) , t, ψ(t))ψ(T ) = −ϕ (x(T ))69Получаем краевую задачу принципа максимума, в которой 2n дифференциальныхуравнений и 2n краевых условий. К сожалению, это именно краевая задача, с условиямине в t0 , а в T, к тому же она нелинейно зависит от траектории x(t).Предположим, что x(t),ψ(t) — решение этой системы.
Тогда управление u(t, x(t), ψ(t))будет являться “подозрительным” на оптимальность.Пример. (на применение принципа максимума)Этот пример уже приводился нами как комментарий к Теореме 9, теперь мы воспользуемся другим способом решения. Рассмотрим задачу минимизацииZ4J(u) =x(t) + u2 (t) dt → min,0V = [−1, 1],x0 (t) = u(t),x(0) = 0.0 < t < 4,Для этой задачи в наших обозначенияхf 0 = x + u2 , f = u, ϕ = 0, H = (x + u2 ) + ψu,где ψ(t) удовлетворяет следующему дифференциальному уравнению 0ψ (t) = 1,ψ(4) = 0.Решая это уравнение, получаем ψ(t) = 4 − t.
Отсюда из (11) следует, что “подозрительным” управлением является−1, если t ∈ [0, 2),2u = u(t, x, ψ) = argmin(x + v + ψv) =t− 2, если t ∈ [2, 4].−16v612На самом деле можно доказать, что полученное управление является оптимальным(из теоремы Вейерштрасса).Линеаризованный принцип максимума. Градиент функционалаДобавим в задаче (1) к условиям (2) условия на гладкость: fu , fu0 — Липшиц-непрерывныпо u и непрерывны по совокупности переменных (x, u, t).
Обозначим эти условия (2u).Тогда аналогично предыдущим выкладкам можно показать, что∆u H(t) = H (x(t), u(t) + h(t), t, ψ(t)) − H (x(t), u(t), t, ψ(t)) == hHu (x(t), u(t), t, ψ(t)) , h(t)iRr + Ru .Для Ru в силу наших предположений справедлива оценка:|Ru | 6 L |h(t)|2 .70И для (10) мы получаем выражение:ZThHu (x(t), u(t), t, ψ(t)) , h(t)iRr dt + OJ(u + h) − J(u) =khk2L1ZT+L|h(t)|2 dt.t0t0Последнее слагаемое в этой сумме естьнорма h в пространстве L2 в квадрате, умноженная на константу L, то есть O khk2L2 .Второе слагаемое также можно считать O khk2L2 , так какkhk2L1 = 2ZTZT1· |h(t)| dt 6 TZ1 dt · |h(t)|2 dtt0t0|t0{z=const} |{z=khk2 2}LИ по определению J 0 (u) = Hu (x(t), u(t), t, ψ(t)) (отождествление по Риссу).Теорема 27.Пусть выполнены условия Теоремы 26 и условия (2u).
Тогда J(u) дифференцируемапо Фреше в L2 и её производная имеет видJ 0 (u) = Hu (x(t), u(t), t, ψ(t)) .Если, кроме того, u(t) — оптимальное управление в задаче (1), то необходимо выполняется линеаризованный принцип максимума:hHu (x(t), u(t), t, ψ(t)) , u(t)iRr = min hHu (x(t), u(t), t, ψ(t)) , viRr .v∈V(15)Упражнение 21 (4). Доказать линеаризованный принцип максимума (15).8Регуляризация некорректно поставленныхэкстремальных задач по ТихоновуНапомним, что экстремальная задача минимизации функционала J(u) называется корректно поставленной в случае, когда1) J∗ существует (конечно);2) множество оптимальных решений U∗ не пусто;3) из того, что последовательность J(uk ) (uk допустимы) сходится к J∗ следует, чтосоответствующая последовательность uk сходится к u∗ .В зависимости от типа сходимости uk → u∗ корректность задачи может быть, соответственно, сильной и слабой. Следующий пример показывает, что эти типы корректностине эквивалентны.71Пример.
(слабо корректная задача, не являющаяся сильно корректной)Рассмотрим следующую задачу минимизации:ZTJ(u) =x2 (t) dt → inf,x0 (t) = u(t), 0 < t < T,x(0) = 0,0u ∈ U = {u ∈ L2 (0, T ) | u(t) ∈ [−1; 1] почти всюду}Ранее было доказано, что множество U (“параллелепипед” в L2 ) — слабый компакт,а функционал J(u) слабо полунепрерывен снизу.
Можно также показать, что J∗ > −∞(J∗ = 0), оптимальной является точка u∗ = 0 и, более того, U состоит из одной этойточки: U = {0} 6= ∅. Таким образом, пункты 1) и 2) в определении корректности выполняются. По Теореме 2 получаем, что задача является слабо корректно поставленной.Докажем, что она не сильно корректно поставлена.Берём последовательностьπktuk (t) = sin∈ C∞ [0, T ] ⊂ L2 (0, T ) ⇒ uk ∈ U.TТогда соответствующие xk сходятся к 0:Tπkt k→∞xk (t) =1 − cos⇒ 0.πkT|{z}62То есть, J(uk ) → 0 = J∗ , но в тоже время сходимости по uk нет:kuk − u∗ k2L2 = kuk − 0k2L2 =T k→∞9 0.2И задача не является сильно корректно поставленной.Перейдём к теме пункта.
Пусть, как обычно, требуется решить задачу минимизацииJ(u) → inf,u ∈ U ⊆ H,(1)но при этом мы будем считать, что известно лишь приближенное значение функции J(u)(U задано точно). Положим, что отличие известного значения функции от истинногоудовлетворяет неравенству˜ − J(u)| 6 δ 1 + kuk2 , δ > 0, ∀u ∈ U.|J(u)2HЭто означает, что ошибка может быть довольно большой на “периферии”, но достаточна мала, если u близко к 0.Выбор такого рода ограничения обусловлен следующими рассуждениями. Рассмотрим функционал J(u) = kAu−f k2F (A ∈ L(H → F), f ∈ F). Если порождающий оператор˜задан неточно с некоторой ошибкой kà − Ak 6 h, J(u)= kÃu − f k2F , то для соответствующих квадратичных функционалов ошибка принимает вид˜ − J(u)| 6 h· max kf k2F , 1 + h + 2kAk · 1 + kuk2H 6 δ 1 + kuk2H ,|J(u)72то есть получаем (2) (эту оценку можно получить из того, что kAu−ÃukF 6 kA−Ãk·kuk).А.
H. Тихонов в 1960-х годах предложил метод, позволяющий решать подобного родазадачи. Суть метода в том, что от исходной задачи мы переходим к экстремальной задачеследующего вида:˜ + α·kuk2 → inf,Tα (u) = J(u)α > 0,u ∈ U.(3)Функционал Tα называют функционалом Тихонова. α — некий стабилизирующийфункционал.При переходе к такой задаче нам достаточно найти такое ũ ∈ U, чтоTα (ũ) 6 inf Tα (u) + ε,u∈Uε > 0.(4)Теорема 28. Пусть в задаче (1) J∗ > −∞, U 6= ∅, множество U выпукло и замкнутов гильбертовом пространстве H, функционал J(u) выпукл и полунепрерывен снизу, выполняется условие (2), ũ выбирается по правилу (4), параметры δ, α, ε стремятся к 0,→ 0. Тогдапричём δ+εα˜J(ũ)→ J∗ , kũ − u∗ kH → 0,где u∗ = argmin kukH — нормальное решение задачи (1).u∈U∗Доказательство.Из условий теоремы следует, что множество U∗ выпукло и замкнуто в H, отсюда поТеореме 10 получаем, что u∗ существует и единственна (u∗ = prU∗ (0)).Докажем, что у задачи (4) существует решение ũ, то есть inf Tα (u) > −∞:u∈U˜ + αkuk2 = J(u)˜ + αkuk2 ± J(u) > {(2)} >Tα (u) = J(u)> −δ 1 + kuk2 + J(u) + αkuk2 > J∗ − δ + (α − δ)kuk2 > J∗ − δ > −∞,что и требовалось.Для доказательства сходимости по функции запишем цепочку неравенств:J∗ = J(u∗ ) 6 J(ũ) 6 J(ũ) + αkũk2 6 {(2)} 6 T (ũ) + δ 1 + kũk2 6 {(4)} 66 inf Tα (u) + ε + δ 1 + kũk2 .u∈UПо отношению к Tα точка u∗ является “рядовой”, поэтому inf Tα (u) 6 Tα (u∗ ).
Отсюдаu∈Uполученное выражение не превосходитJ(u∗ ) + δ 1 + ku∗ k2 + αku∗ k2 + ε + δ 1 + kũk2 = J∗ + (2δ + ε) + (δ + α)ku∗ k2 + δkũk2 .Из этой цепочки неравенств имеем(α − δ)kũk2 6 J∗ − J(ũ) + (2δ + ε) + (δ + α)ku∗ k2 .Тогда, взяв верхний предел от обеих частей неравенства и принимая во внимание,→ 0, получаемчто δ+εαlim kũk2 6 1·ku∗ k2 .(5)73Переходя к пределу в вышеприведённой цепочке и учитывая (5) (в последнем равенстве), получаем сходимость по функции:˜lim J(ũ) = lim J(ũ)= J∗ .(6)Докажем теперь сходимость по аргументу.
Из (5) следует, что существует подпоследовательность ũ, которая слабо сходится к некой точке u0 в H. Из условия теоремы видно, что функционал J слабо полунепрерывен снизу, откуда получаем, чтоJ(u0 ) 6 lim J(ũ) = {(6)} = J∗ . Множество U выпукло и замкнуто, следовательно, онослабо замкнуто. Из этого получаем, что u0 ∈ U, но тогда u0 ∈ U∗ , то есть u0 — оптимальное решение.Функция kuk2 слабо полунепрерывна снизу, значит ku0 k2 6 lim kũk2 6 {(5)} 6 ku∗ k2 ,отсюда u0 = u∗ (так как u∗ единственна).Из приведённых рассуждений делаем вывод, что всё семейство ũ слабо сходится кu∗ . Для доказательства сильной сходимости перейдём в равенствеkũ − u∗ k2 = kũk2 − 2 hũ, u∗ i + ku∗ k2к верхнему пределу. Тогда, учитывая слабую сходимость ũ → u∗ и то, чтоlim kũk2 6 ku∗ k2 , получаем существование предела lim kũ − u∗ k2 = 0, что и требовалось.Теорема полностью доказана.74AПрограмма курса 2002/2003 учебного года1. Метрический вариант теоремы Вейерштрасса о сильной корректности задачи минимизации полунепрерывного снизу функционала на компактном множестве.Недостаточность условий ограниченности и замкнутости.2.