14-16 лекции (Лекции А.В. Дмитрука)
Описание файла
Файл "14-16 лекции" внутри архива находится в папке "Лекции А.В. Дмитрука". PDF-файл из архива "Лекции А.В. Дмитрука", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Курс лекций А.В. Дмитрука"Вариационное исчисление и оптимальное управление"Мехмат, 4 курс 2 поток, осень 2008 годаЛекции 14–16Условия "второго порядка" в задачах на экстремумВспомним сначала обычную задачу минимизации функции многих переменных:f (x) → min, где f : IRn → IR − дважды дифференцируемая функция в окрестности точки x0 . Пусть в точке x0 выполнено необходимое условие первого порядкадля локального минимума: f 0 (x0 ) = 0. Из курса анализа известно, что необходимоеусловие второго порядка есть неравенство f 00 (x0 ) ≥ 0 (неотрицательная определенность матрицы вторых производных), а достаточное условие второго порядка естьнеравенство f 00 (x0 ) > 0 (положительная определенность этой матрицы).Оба этих неравенства могут быть записаны также в виде оценки снизу второгодифференциала f :d2 f (x0 ) = ((f 00 (x0 ) x̄, x̄) ≥ c ||x̄||2∀ x̄ ∈ IRn ,(1)где c = 0 соответствует необходимому условию, а c > 0 достаточному (последнеевытекает из компактности единичной сферы в IRn .
)Проверка указанной знакоопределенности квадратичной формы d2 f (x0 ) или соответствующей матрицы f 00 (x0 ) может быть проведена с помощью критерия Сильвестра или путем вычисления ее собственных значений.Каков аналог этих условий для задач в бесконечномерном пространстве?Пусть x есть элемент банахова пространства X, а функция f по-прежнему дважды дифференцируема в окрестности x0 . Нетрудно показать (повторяя стандартноедоказательство для конечномерного случая), что здесь по-прежнему неравенство (1)при c = 0 будет необходимым условием, а при c > 0 достаточным условием локального минимума. В случае выполнения последнего неравенства мы говорим, что квадратичная форма ((f 00 (x0 ) x̄, x̄) положительно определена. (Покажите, что простаяположительность этой формы на всех x̄ 6= 0 может еще не обеспечивать локальныйминимум!)Полученное достаточное условие, однако, имеет существенный дефект: оно можетвыполняться только в случае, когда пространство X изоморфно гильбертову пространству (т.е.
в нем можно ввести эквивалентную норму, порожденную скалярнымпроизведением. Докажите это простое утверждение!). Это нас не устраивает, поскольку в большинстве задач на экстремум естественное пространство не гильбертово (например, практически во всех задачах оптимального управления, которые ставятся впространстве L∞ ). Для банахова пространства квадрат нормы – слишком грубаявеличина, чтобы оценивать ею снизу d2 f (x0 ).Из этих соображений возникает идея о замене квадрата нормы ||x̄||2 некоторымболее слабым квадратичным функционалом γ(x̄) так, чтобы тем не менее оценка1d2 f (x0 ) ≥ c γ(x̄) при c > 0 обеспечивала бы наличие локального минимума.
Оказывается, что в некоторых случаях выбор такого функционала γ(x̄) возможен, итогда более правильно говорить не об условиях второго порядка, а (более точно) обусловиях квадратичного порядка γ. Именно эта идея и будет сейчас реализована.Задача с ограничениями равенства в банаховом пространстве приналичии разложений с квадратичными членами порядка γРассмотрим задачуJ = f (x) → min,g(x) = 0,(2)где X, Y − банаховы пространства, функционал f : X → IR и отображениеg : X → Y определены в окрестности O(x0 ) и строго дифференцируемы в x0 ,причем g 0 (x0 ) действует "на", т.е.
выполнено условие Люстерника.Предположим далее, что в пространстве X задана еще одна норма ||x||0 , болееслабая, чем исходная (т.е. выполнена оценка ||x||0 ≤ const ||x|| для всех x ∈ X ), аотображения f и g имеют следующие разложения в точке x0 (мы здесь выпишемего только для одного отображения, а второе аналогично):g(x0 + x̄) = g(x0 ) + g 0 (x0 )x̄ +1Qg (x̄, x̄) + rg (x̄),2(3)где билинейное отображение Qg : X × X → Y ограничено сверху относительно новойнормы, т.е. удовлетворяет оценке||Qg (x1 , x2 )|| ≤ Cg ||x1 ||0 ||x2 ||0(4)с некоторой константой Cg , а остаточный член удовлетворяет оценке||rg (x̄)|| = o (||x̄||0 )2приx̄ → 0.(5)Функционал γ(x̄) = (||x̄||0 )2 назовем квадратичным порядком задачи (2).Таким образом, у обоих отображений f, g квадратичные части разложений = O(γ(x̄)),а остаток = o(γ(x̄)).Пусть для точки x0 выполнено необходимое условие первого порядка — правиломножителей Лагранжа, т.е.
существует элемент y ∗ ∈ Y ∗ такой, что функция Лагранжа L(x) = f (x) + y ∗ g(x) стационарна в точке x0 : L0 (x0 ) = f 0 (x0 ) + y ∗ g 0 (x0 ) = 0.(Коэффициент при функционале α0 = 1 в силу невырожденности g .)Отсюда и из разложений (3) для f, g вытекает, что функция Лагранжа имеетразложение1L(x0 + x̄) = L(x0 ) + Ω(x̄) + rL (x̄),(6)2где квадратичный функционал Ω(x̄) = Qf (x̄, x̄) + y ∗ Qg (x̄, x̄) играет роль d2 L(x0 ), аостаток имеет оценку |rL (x̄)| = o (γ(x̄)) при x̄ → 0.2Теорема 1 (необходимое и достаточное условия порядка γ) .а) Пусть x0 − точка локального минимума в задаче (2).
Тогда∀ x̄ ∈ ker g 0 (x0 ).Ω(x̄) ≥ 0(7)б) Пусть для некоторого c > 0∀ x̄ ∈ ker g 0 (x0 ).Ω(x̄) ≥ c γ(x̄)(8)Тогда x0 − точка строгого локального минимума в задаче (2).Доказательство. Считаем f (x0 ) = 0. Обозначим K = ker g 0 (x0 ).а) Возьмем любой x̄ ∈ K. В силу (3)–(5) g(x0 + εx̄) = O(ε2 ) при ε → 0 + .Отсюда по теореме Люстерника об оценке расстояния найдется поправка x̃ε с оценкой ||x̃ε || = O(ε2 ), такая что точка xε = x0 + εx̄ + x̃ε удовлетворяет ограничениюравенства g(xε ) = 0.Из локального минимума в точке x0 следует, что при малых ε > 0L(xε ) = (f + y ∗ g)(xε ) = f (xε ) ≥ f (x0 ) = L(x0 ).Согласно (6) L(xε ) − L(x0 ) =12ε2 Ω(x̄) + o(ε2 ) ≥ 0, откуда Ω(x̄) ≥ 0, ч.т.д.б) Допустим, что строгого минимума в точке x0 нет, т.е. существует последовательность δxn → 0, δxn 6= 0, такая чтоf (x0 + δxn ) ≤ 0,g(x0 + δxn ) = 0.(9)Покажем, что в этом случае оценка (8) нарушается.
Обозначим γn = γ(δxn ).Из (9) и разложения (3) получаемg 0 (x0 )δxn +1Qg (δxn , δxn ) + rg (δxn ) = 0,2откуда с учетом (4), (5) следует, что g 0 (x0 )δxn = O(γn ). По теореме Банаха об открытом отображении существует последовательность x̃n с оценкой ||x̃n || = O(γn ),такая что g 0 (x0 )x̃n = −g 0 (x0 )δxn . Тогда для x̄n = δxn + x̃n выполнено равенствоg 0 (x0 )x̄n = 0, т.е.
x̄n ∈ K.Нетрудно показать, что при этом γ(x̄n ) = γn + o(γn ) ∼ γn . (Покажите!)Из (9) следует, что L(x0 + δxn ) = f (x0 + δxn ) + y ∗ g(x0 + δxn ) ≤ 0.Отсюда в силу (6) L(x0 + δxn ) =12Ω(δxn ) + o(γn ) ≤ 0, и поэтому Ω(δxn ) ≤ o(γn ).Тогда для x̄n = δxn + x̃n с учетом (4) имеемΩ(x̄n ) = Ω(δxn ) + 2QL (δxn , x̃n ) + Ω(x̃n ) ≤ o(γn ).При больших n получаем, что для x̄n ∈ K выполнено Ω(x̄n ) ≤воречит оценке (8).c2γ(x̄n ), что проти2Изложенная здесь схема получения квадратичных условий локального минимумадля задачи (2) в банаховом пространстве называется методом двух норм ("two-normapproach" в зарубежной литературе).3Задача Лагранжа с концевыми ограничениями равенстваПрименим теперь изложенную выше абстрактную схему к задаче Лагранжа КВИ:J = ϕ(p) → min,η(p) = 0,ẋ = f (t, x, u).(10)Здесь, как и раньше, x ∈ IRn , u ∈ IRr , p = (x(0), x(T )) ∈ IR2n , функции ϕ, ηразмерностей 1, m определены на открытом множестве P ⊂ IR2n и дважды гладкие на нем, функция f определена на открытом множестве Q ⊂ IR1+n+r и имеетна нем производные fx , fu , fxx , fxu , fuu , непрерывные по совокупности переменных (t, x, u).
Отрезок времени ∆ = [0, T ] фиксирован. (Ограничения неравенстваϕi (p) ≤ 0 для упрощения изложения мы здесь не рассматриваем.)Как и раньше, допустимый процесс — это пара функций w = (x, u) ∈ W =AC(∆) × L∞ (∆), такая что ее график (t, x(t), u(t)) лежит "строго внутри" Q, вектор концов p = (x(0), x(T )) ∈ P, и при этом выполнены оба ограничения равенствазадачи.Пусть дан некоторый допустимый процесс w0 = (x0 , u0 ). Будем считать, что длянего выполнено условие Люстерника, т.е. ограничения равенства в точке w0 невырождены.
Оператор g, задающий равенства, имеет здесь вид g : W → L1 (∆) × IRm ,g(x, u) = ( ẋ − f (t, x, u),η(x(0), x(T )) ).Необходимое условие первого порядка слабого минимума для процесса w0 (уравнение Эйлера–Лагранжа) состоит в том, что существует липшицева n− мерная функция ψ(t) и вектор β ∈ IRm , такие что−ψ̇ = Hx (t, x0 (t), u0 (t)),Hu (t, x0 (t), u0 (t)) = 0,ψ(T ) = −lxT (p0 ),ψ(0) = lx0 (p0 ),где H = ψ f (t, x, u),l(p) = ϕ(p) + βη(p). Считаем, что эти условия выполнены.Нас интересует, доставляет ли процесс w0 слабый минимум.
(Как мы знаем, взадаче (10) он эквивалентен локальному минимуму относительно нормы в W. )В качестве квадратичного порядка для задачи (10) возьмем функционалZ T22γ(w̄) = |x̄(0)| + |x̄(T )| +(|x̄|2 + |ū|2 ) dt0pи соответственно положим ||w̄||0 =γ(w̄). Ясно, что эта норма слабее исходнойнормы ||w̄|| = |x̄(0)| + ||x̄˙ ||1 + ||ū||∞ пространства W.При сделанных предположениях о гладкости f, ϕ, η функционал J и операторg, очевидно, имеют требуемые разложения с точностью до квадратичных членов порядка γ на процессе w0 (как и вообще на любом допустимом процессе).
Для Jи второй компоненты g это очевидно, так как это просто дважды гладкие функции конечномерного аргумента p = (x(0), x(T )), а для первой компоненты g эторазложение имеет вид (3), в котором и квадратичная часть, и остаток возникают отразложения функции f в точке (t, x0 (t), u0 (t)) :00Q(w̄, w̄)(t) = −(fww(t, w0 (t)) w̄(t), w̄(t)) =4000000= −(fxxx̄(t), x̄(t)) − 2(fuxx̄(t), ū(t)) − (fuuū(t), ū(t))(все производные берутся в точке (t, x0 (t), u0 (t)) ), а для остатка справедлива оценка|r(t, w̄(t))| ≤ µ(|w̄(t)|) |w̄(t)|2 ,00где µ есть модуль непрерывности функции fwwв некоторой трубке вокруг процесса0w . Ясно, чтоZ TZ T|Q(w̄, w̄)(t)| dt ≤ const(|x̄|2 + |ū|2 ) dt ≤ const · γ(w̄),00и соответствующая билинейная форма удовлетворяет оценке (4), а норма остаткав L1 имеет оценкуZ T|r(t, w̄(t))| ≤ µ(||x̄||C + ||ū||∞ ) γ(w̄) = o (γ(w̄)).0Таким образом, предположения нашей абстрактной схемы выполнены.Функция Лагранжа здесь имеет видZ TL(w) = l(p) +ψ (ẋ − f (t, x, u)) dt,0где l = ϕ + βη, и тогда квадратичная часть ее разложения (второй дифференциалили вторая вариация) естьZ T¡ 00¢000000(Hxx x̄(t), x̄(t)) + 2(Huxx̄(t), ū(t)) + (Huuū(t), ū(t)) dt.