А.В. Фурсиков - Курс лекций по вариационному исчислению (1156151), страница 4
Текст из файла (страница 4)
Заметим, что x(t + λ) − x(t) = λ∆x.Рассмотрим Φ(t) := y ∗ , f x(t) . Дифференцируемость f по Гато влечет дифференцируемость Φ на [0, 1],откуда по одномерной теореме Лагранжа получаемkf (x2 ) − f (x1 )k = Φ(1) − Φ(0) = Φ′ (ξ)(62)для некоторого ξ ∈ [0, 1]. Вычислим производную Φ в точке ξ: Φ(ξ + λ) − Φ(ξ) D ∗ f x(ξ + λ) − f x(ξ) E D ∗ fΓ′ x(ξ) ∆xλ + o(λ) E= y ,= y ,→ y ∗ , fΓ′ x(ξ) ∆xλλλ(63)при λ → 0. Отсюда kf (x2 ) − f (x1 )k = Φ′ (ξ) = y ∗ , fΓ′ x(ξ) ∆x 6 ky ∗ k · fΓ′ x(ξ) ∆x 66 fΓ′ x(ξ) · k∆xk 6 sup fΓ′ x(t) · k∆xk , (64)t∈[0,1]что и требовалось доказать.
Очевидно, линейный непрерывный оператор A : X → Y строго дифференцируем и A′ = A.Следствие 1.1. В условиях предыдущей теоремы для всякого линейного непрерывного оператора Λ : X → Yвыполнено неравенствоkf (x2 ) − f (x1 ) − Λ(x2 − x1 )k 6supx∈[x1 ,x2 ]kfΓ′ (x) − Λk · kx2 − x1 k .(65)Пусть X, Y — нормированные пространства, U ⊂ X открыто. Пусть f : U → Y дифференцируема по Гатово всех точках x ∈ U .
Обозначим через L(X, Y ) пространство линейных непрерывных операторов X → Y ,снабженное операторной нормой.Определение. Отображение f называется непрерывно дифференцируемым по Гато в U , если отображениеU → L(X, Y ), x 7→ fΓ′ (x), непрерывно.Теорема 1.15. Пусть f непрерывно дифференцируемо по Гато в U . Тогда f строго дифференцируемо в любой точке x ∈ U .
Фиксируем x0 ∈ U и докажем строгую дифференцируемость f в точке x0 . Пусть kfΓ′ (x) − fΓ′ (x0 )k < εпри kx − x0 k < δ. Тогда при kx1 − x0 k < δ и kx2 − x0 k < δ, пользуясь предыдущим следствием, получимkf (x2 ) − f (x1 ) − fΓ′ (x0 )(x2 − x1 )k 6supx∈[x1 ,x2 ]kfΓ′ (x) − fΓ′ (x0 )k · kx2 − x1 k 6 ε kx2 − x1 k ,(66)а это и означает строгую дифференцируемость.
1.2.5. Оператор Немыцкогоm1Пусть f : U → R и f ∈ C (U ), где U — область в Rt × Rnx .Рассмотрим множествоW := x(t) ∈ C(T ; Rm ) : t, x(t) ∈ U при всех t .(67)Определим оператор Немыцкого равенством N (x) := f t, x(t) .mТеорема 1.16. Пусть xb∈W . Тогда оператор Немыцкого N : W → C(T ; R ) строго дифференцируем в точ′′ке xb, причём N (bx) = fx t, xb(t) . Найдём производную N по Гато и докажем её непрерывность. Выберем малое δ > 0 и рассмотримкомпакт K := {(t, x) ∈ T × Rn : |x − xb(t)| 6 δ}. Заметим, что fx′ (t, x) равномерно непрерывна на K. Возьмёмh ∈ W .
При фиксированном t по теореме Лагранжа имеем (промежуточную точку обозначим θt ∈ (0, 1)):|f (t, xb + λh) − f (t, xb) − fx′ (t, xb)λh| 6 |fx′ (t, xb + θt λh) − fx′ (t, xb)| · |λ| · |h(t)| .12(68)Ясно, что при λ → 0 величина fx′ t, xb + θt λh − fx′ (t, xb) стремится к нулю. Но поскольку fx′ равномерно непрерывна на K, то все рассуждения равномерны по t, так чтоsup f t, xb(t) + λh(t) − f t, xb(t) − fx′ t, xb(t) λh(t) = o(λ).(69)t∈TИтак, мы нашли производную по Гато.
Осталось показать, что она непрерывна в xb (отсюда последует строгаядифференцируемость в xb). Действительно,kN ′ (bx) − N ′ (x)k = sup sup fx′ t, xb(t) − fx′ t, x(t) h(t) 6 sup fx′ t, xb(t) − fx′ t, x(t) → 0(70)khk=1 t∈Tпри kx − xbk → 0. t∈T1.2.6. Теорема ЛюстерникаТеорема 1.17 (Люстерник). Пусть X, Y — банаховы пространства, U ⊂ X открыто, F : U → Y , xb ∈ U,F строго дифференцируема в xb, F ′ (bx) — эпиморфизм.ТогдасуществуетокрестностьOточкиxb,отображение ϕ : O → X и число K > 0, такие что F ϕ(x) = F (bx) для всех x ∈ O иkϕ(x) − xk 6 K kF (x) − F (bx)k .(71) Не ограничивая общности, считаем xb = 0 и F (0) = 0.
По лемме о правом обратном, найдётся M : Y → X,такое что F ′ (bx)M = idY , kM (y)k 6 C kyk. В силу строгой дифференцируемости, найдется ε > 0, такое что приkxi k < 2ε (i = 1, 2) выполнено неравенство1kx2 − x1 k .(72)2CИз этого неравенства видно, что функция F непрерывна в шаре {x : kxk < 2ε}.
Выберем δ так, чтоεkxk + C kF (x)k <(73)2при kxk < δ. Положим O := {x : kxk < δ}. Рассмотрим произвольную точку x ∈ O. Будем искать ϕ(x) с помощьюитераций (это, как несложно убедиться, аналог метода Ньютона):kF (x2 ) − F (x1 ) − F ′ (0)(x2 − x1 )k 6ξ0 := x,ξn+1 := ξn − M F (ξn ).(74)Докажем по индукции, что kξn k < ε. При n = 0: x ∈ O, kxk < 2ε . При n = 1 имеемε(75)2в силу выбора δ.
Пусть мы доказали это для ξn , докажем для ξn+1 . Заметим, что ξn − ξn−1 + M F (ξn−1 ) = 0.Применим к этому равенству оператор F ′ (0):0 = F ′ (0) ξn − ξn−1 + M F (ξn−1 ) = F ′ (0)(ξn − ξn−1 ) + F (ξn−1 ).(76)kξ1 k 6 kxk + kM F (x)k 6 kxk + C kF (x)k <Далее, !1kξn − ξn−1 k =kξn+1 − ξn k 6 C kF (ξn )k = C F (ξn ) −F ′ (0)(ξn − ξn−1 ) − F (ξn−1 ) 6 C ·|{z}2C01111ε= kξn − ξn−1 k 6 kξn−1 − ξn−2 k 6 . . .
6 n kξ1 − xk = n kM F (x)k 6 n+1 . (77)24222Здесь переход «!» следует из (72). Отсюда111εkξn+1 k 6 kξn+1 − ξn k + kξn − ξn−1 k + . . . + kξ1 k 6++...+ε + < ε.(78)2n+12n42Аналогичным образом получается неравенство kξn+m − ξn k < 2εn , из которого следует, что последовательность ξn фундаментальна. Положим ϕ(x) := lim ξn . Проверим, что ϕ удовлетворяет требуемым условиям. Поскольку kϕ(x)k 6 ε и F непрерывна в шаре {x : kxk < 2ε}, то F ϕ(x) = F (lim ξn ) = lim F (ξn ).
Нопоскольку ξn − ξn−1F (ξn−1 ) = −F ′ (0)(ξn − ξn−1 ) → 0,→ 0. Мы доказали, что F ϕ(x) = 0. Наконец,kξn − xk 6 kξn − ξn−1 k + . . . + kξ1 − xk 6 2 kξ1 − xk 6 2C kF (x)k .Переходя к пределу в этом неравенстве, получим kϕ(x) − xk 6 2C kF (x)k. 13(79)(80)1.2.7. Теорема о касательном пространствеПусть X — нормированное пространство, M ⊂ X, xb ∈ M.Определение. Вектор h ∈ X называется касательным вектором к M в точке xb, если существует ε > 0 иотображение r : (−ε, ε) → X, такое что r = o(λ), и при всех λ ∈ (−ε, ε) выполнено xb + λh + r(λ) ∈ M .Определение. Совокупность касательных векторов к M в точке xb обозначается TxbM . Если TxbM являетсялинейным пространством, то TxbM называется касательным пространством.Пусть X и Y — банаховы пространства, U ⊂ X — открыто, xb ∈ U, F : U → Y .Теорема 1.18 (О касательном пространстве).
Пусть F строго дифференцируема в xb и F ′ (bx) является′эпиморфизмом. Обозначим M = {x ∈ U : F (x) = F (bx)}. Тогда TxbM = Ker F (bx). Докажем «⊂». Пусть h ∈ TxbM . Возьмём r(λ) из определения касательного вектора.F (bx) = F xb + λh + r(λ) = F (bx) + F ′ (bx) λh + r(λ) + o λh + r(λ) ,(81)откудаo λh + r(λ) + F ′ (bx)r(λ)→ 0 при λ → 0,F (bx)h = −λоткуда F ′ (bx)h = 0, h ∈ Ker F ′ (bx).Докажем обратное включение. Пусть h ∈ Ker F ′ (bx). Воспользуемся теоремой Люстерника. Возьмём′ϕ : O(bx) → X,такое что F (bx) = F ϕ(x) и kϕ(x) − xk 6 K kF (bx) − F (x)k. Положимr(λ) := ϕ(bx + λh) − (bx + λh).Тогдаи при этомF (bx) = F ϕ(bx + λh) = F xb + λh + r(λ) ,kr(λ)k = kϕ(bx + λh) − (bx + λh)k 6 K kF (bx + λh) − F (bx)k = o(λ).(82)(83)(84)(85)(86)Из вышесказанного следует, что h является касательным вектором с функцией близости r(λ).
1.2.8. Принцип Лагранжа для гладких задач с ограничениями типа равенстваПусть X, Y — банаховы пространства, U ⊂ X открыто, f : U → R, F : U → Y .Определение. Гладкими задачами с ограничениями типа равенства называются задачи вида(f (x) → inf (sup),F (x) = 0.(87)Множество A := {x ∈ X : F (x) = 0} является множеством допустимых элементов для нашей задачи.Определение. Точка xb ∈ A называется локальным минимумом (мы будем писать xb ∈ locmin), если найдётсяε > 0, такое что для всех x ∈ A, для которых kbx − xk < ε, выполнено f (bx) 6 f (x).Определение локального максимума (bx ∈ locmax) аналогично.Определение. Локальный экстремум (locextr) — это локальный минимум или локальный максимум.На самом деле правильнее считать, что локальный экстремум — это «место, где изменение функции мало по сравнению сизменением аргумента». Например, для гладких функций на прямой — это те x, в которых f ′ (x) = 0.
Так, 0 будет локальнымэкстремумом для x3 , но не локальным минимум или максимумом. Мы всё же будем считать, что locextr = locmin ∪ locmax.Определение. Функцией Лагранжа для абстрактной задачи называется функцияL(x, λ, y ∗ ) := λf (x) + hF (x), y ∗ i .(88)Теорема 1.19 (Лагранж). Пусть xb ∈ locextr для задачи (87), f и F строго дифференцируемы в xb, Im F ′ (bx)замкнут в Y . Тогда:а) Существует ненулевой функционал (λ, y ∗ ) ∈ (R × Y )∗ такой, что L′x (bx, λ, y ∗ ) = 0.б) Если Im F ′ (bx) = Y , то λ 6= 0.Как понимать L′x ? Так же, как и обычно: нужно зафиксировать λ и y ∗ , получится отображение U → Y . Остается показать,что оно строго дифференцируемо в xb (если таковы f и F ) и что его производная равна λf ′ (bx)(·) + hF ′ (bx)(·), y ∗ i. Это делаетсянепосредственно по определению.14 Рассмотрим функцию G(x) = f (x), F (x) : U → R × Y .
Ясно2 , что G′ (bx) = f ′ (bx), F ′ (bx) . По лемме озамкнутом образе, Im G′ (bx) замкнут в R × Y . Рассмотрим два случая.1◦ Пусть Im G′ (bx) 6= R × Y . В силу леммы о нетривиальности аннулятора существует ненулевой функционалΛ ∈ (R × Y )∗ такой, что hΛ, G′ (bx)hi = 0 для всех h ∈ X. Имеем hΛ, (c, y)i = λc + hy ∗ , yi. Тогда для любого h ∈ X0 = hΛ, G′ (bx)hi = λf ′ (bx)h + hy ∗ , F ′ (bx)hi = L′x (bx, λ, y ∗ )h.(89)Мы доказали пункт а) теоремы.Докажем б).
Предположим, λ = 0. Тогда hy ∗ , F ′ (bx)hi = 0, откуда в силу сюръективности F ′ (bx) имеем y ∗ = 0.Противоречие с условием Λ 6= 0.2◦ Im G′ (bx) = R × Y . В частности, Im F ′ (bx) = Y . Обозначим M := {x ∈ U : F (x) = 0}. Пусть h ∈ TxbM . Тогдадля некоторой функции r(λ) = o(λ) выполнено равенство F xb + λh + r(λ) = 0, потому что xb + λh + r(λ) ∈ M .Пусть, для определенности, xb ∈ locmin.