А.В. Фурсиков - Курс лекций по вариационному исчислению (1156151), страница 7
Текст из файла (страница 7)
Поэтому для xbиub выполнены уравнения (6), (7), (8).Мы закрываем глаза на то, что xb может быть кусочно-гладкой, а не гладкой, как в задаче Лагранжа. . .Всё же уравнение (8) слишком слабое, так как использует лишь локальную минимальность по u. Вместоэтого уравнения имеется более сильное, которое носит название принципа максимума Понтрягина:f (t, xb, ub) − p(t)ϕ(t, xb, ub) = min f (t, xb, v) − p(t)ϕ(t, xb, v) .(25)v∈UЭто уравнение соответствует тому, что функция Лагранжа не просто стационарна по u при фиксированном x,а достигает минимума!2.3. Доказательство принципа максимумаПроведем доказательство для более простой задачи.Zt1J(x, u) = f (t, x, u) dt → inf,t0ẋ = ϕ(t, x, u), x(t0 ) = x0 ,u(t) ∈ U при всех t.(26)Предполагается, что f ∈ C1 (T ; R2 ), ϕ ∈ C1 (T × R2 ), U ⊂ R — замкнутое множество.
Решение x ищется в классекусочно-гладких функций, u — в классе кусочно-непрерывных: x ∈ KC1 (T ), u ∈ KC(T ).Равенство ẋ = ϕ(t, x, u) в задаче (26) должно выполняться не во всех точках t, а только в тех, в которых функция u непрерывна.Заметим также, что из этого равенства следует, что x будет C1 -гладкой на тех отрезках, на которых u непрерывна.Теорема 2.2. Пусть (bx, ub) — решение задачи (26).
Тогда найдётся функция p ∈ KC1 (T ), такая что выполнены условия стационарности по x и трансверсальности(ṗ(t) + ϕ′x t, xb(t), ub(t) p(t) = fx′ t, xb(t), ub(t) ,(27)p(t1 ) = 0,и выполнен принцип максимума Понтрягинаf t, xb(t), ub(t) − ϕ t, xb(t), ub(t) p(t) = min f t, xb(t), v − ϕ t, xb(t), v p(t)v∈U(28)(равенства справедливы для любой точки t, в которой ub непрерывна).
По сути дела, условия стационарности и трансверсальности были получены ранее в общем случае.Действительно, из принципа Лагранжа следует, что(ṗ(t) + ϕ′x t, xb(t), ub(t) p(t) = λ0 fx′ t, xb(t), ub(t) ,(29)p(t1 ) = 0,Покажем, что в нашем случае λ0 6= 0. Действительно, если λ0 = 0, то задача Коши для функции p(t) имеет(единственное по теореме существования и единственности для ОДУ) решение p(t) ≡ 0. Но это противоречиттому, что хотя бы один из множителей Лагранжа не равен нулю. Итак, можно считать, что λ0 = 1, и мыприходим к уравнению (27).Перейдем к доказательству принципа максимума. Возьмем τ ∈ Int T — точку непрерывности для ub (ясно, чтоможно считать ub непрерывной на концах отрезка).
Зафиксируем произвольное v ∈ U . Возьмем малое λ > 0 так,чтобы на отрезке [τ − λ, τ ] функция ub была непрерывна. Игольчатой вариацией называется пара (xλ (t), uλ (t)),определяемая из равенств(v,t ∈ [τ − λ, τ ),uλ (t) =(30)ub(t), t ∈/ [τ − λ, τ ),(ẋλ (t) = ϕ t, xλ (t), uλ (t) ,(31)xλ (t) = x0 .21Почему существует и единственно решение выписанной задачи Коши на xλ (t)? Пусть σ1 < σ2 < . .
. < σk — точкиразрыва функции uλ . На отрезке [t0 , σ1 ] мы получаем обычную задачу Коши, решая ее, находим xλ (σ1 −0). Далеерешаем на отрезке [σ1 , σ2 ] задачу ẋλ = ϕ(t, xλ , uλ ) с начальным условием xλ (σ1 + 0) := xλ (σ1 − 0). И так далеемы пройдем весь отрезок.Обозначим для краткостиϕ(t)b := ϕ t, xb(t), ub(t) , ϕb′x (t) := ϕ′x t, xb(t), ub(t) ,(32)′′fb(t) := f t, xb(t), ub(t) , fb (t) := f t, xb(t), ub(t) .(33)xxЛемма 2.3.1◦ xλ (t) ⇒ xb(t) на отрезке T при λ → +0.x(t)◦ xλ (t)−b⇒ y(t) на отрезке [τ, t1 ] при λ → +0, где y(t) — некоторая кусочно-гладкая функция, удовле2λтворяющая условиям(ẏ(t) = ϕb′x (t)y(t),(34)y(τ ) = ϕ τ, xb(τ ), v − ϕ(τb ).
Предположим сначала, что функция ub непрерывна на T . Утверждения о сходимости выведем из теоремо непрерывной и гладкой зависимости решения от параметров.1◦ На отрезке [t0 , τ − λ] функция xλ (t) совпадает с xb(t), поэтому доказывать нечего.Рассмотрим отрезок [τ − λ, τ ]. Определим функцию Y (t, s, ξ) как решение задачи∂ Y (t, s, ξ) = ϕ t, Y (t, s, ξ), v ,∂t(35)= ξ.Yt=sПо теореме о непрерывной зависимости решения от начальных условий функция Y непрерывна (на самом деледаже непрерывно дифференцируема!).|xλ (t) − xb(t)| 6 |xλ (t) − xb(τ − λ)| + |bx(τ − λ) − xb(t)| == Y t, τ − λ, xb(τ − λ) − Y τ − λ, τ − λ, xb(τ − λ) + |bx(τ − λ) − xb(t)| . (36)В силу непрерывности Y и xb это выражение стремится к нулю равномерно на [τ − λ, τ ].Рассмотрим отрезок [τ, t1 ].
Определим функцию X(t, ξ) как решение задачи∂ X(t, ξ) = ϕ t, X(t, ξ), ub ,∂t= ξ.X(37)t=τПо теореме о гладкой зависимости решения от начальных условий функция X(t, ξ) непрерывно дифференцируема по совокупности переменныхb(τ ). Поскольку (t, ξ). Обозначим ξλ := xλ (τ ). Как мы показали, ξλ → xxλ (t) = X(t, ξλ ) и xb(t) = X t, xb(τ ) , то xλ (t) ⇒ xb(t).2◦ Поскольку ξλ = Y (τ, τ − λ, xb(τ − λ)), то ξλ непрерывно дифференцируема по λ. Значит, xλ (t) = X(t, ξλ )будет непрерывно дифференцируемой по совокупности переменных (t, λ). Отсюдаxλ (t) − xb(t)d⇒xλ (t)на [τ, t1 ].λdλλ=0(38)Теперь получим (34), преобразовав y(t):xλ (t) − xb(t)y(t) = lim= limλ→+0λ→+0λZtt0ẋλ (s) − x(s)ḃds = limλ→+0λ1= limλ→+0 λZττ −λZtt0ϕ s, xλ (s), uλ (s) − ϕ(s)bds =λϕ s, xλ (s), uλ (s) − ϕ(s)b ds + limλ→+0Ztτϕ s, xλ (s), ub(s) − ϕ(s)bds.
(39)λИз обычной теоремы о среднем следует, что первый предел равен ϕ(τ, xb(τ ), v) − ϕ(τb ). Вычислим второй предел.ϕ s, xλ (s), ub(s) − ϕ(s)b = ϕ′x s, θλ (s), ub(s) xλ (s) − xb(s) ,(40)22где θλ (s) между xλ (s) и xb(s). Поскольку xλ (s) ⇒ xb(s), то ϕ′x s, θλ (s), ub(s) ⇒ ϕb′x (s). Отсюдаlimλ→+0ZtτМы доказали, чтоZtZt xλ (s) − xϕ s, xλ (s), ub(s) − ϕ(s)bb(s)′ds = limϕx s, θλ (s), ub(s)= ϕb′x (s)y(s) ds.λ→+0λλτ(41)τy(t) = ϕ(τ, xb(τ ), v) − ϕ(τb )+Ztτϕb′x (s)y(s) ds.(42)Дифференцируя полученное выражение, получаем (34). Лемма доказана в случае непрерывной ub.
Если жеимеются точки разрыва, нужно провести то же рассуждение на первом отрезке непрерывности, потом на втором(правда, начальное условие уже может меняться по λ, но гладко, так что это не страшно), и так далее пройтивесь отрезок. Рассмотрим выражениеZt1Φ(λ) := f t, xλ (t), uλ (t) − f t, xb(t), ub(t) dt.(43)t0Вычислим производную Φ(λ) в нуле (заодно доказав, что она существует):Φ(λ) − Φ(0)1= limλ→+0 λλZττ −λf t, xλ (t), v − fb(t) dt + limλ→+0Zt1τf t, xλ (t), ub(t) − fb(t)dt.λ(44)Так же как и в лемме (и используя лемму!), мы находим, что первый предел равен f τ, xb(τ ), v − fb(τ ), а второйRt1предел равен fbx′ (t)y(t) dt.
Выражая fbx′ из уравнения стационарности по x, получаемτZt1τfbx′ (t)y(t)dt =Zt1Zt1′(ṗ + pϕbx ) dt = (ṗy + pẏ)dt = p(t1 )y(t1 ) − p(τ )y(τ ).τ(45)τОкончательно, используя равенство p(t1 ) = 0 и (34), получаемΦ′ (0) = f (τ, xb(τ ), v) − fb(τ ) − p(τ ) ϕ τ, xb(τ ), v − ϕ(τb ) .(46)Вспомним, что (bx, ub) является решением нашей задачи (оптимальным процессом), поэтому при малых λбудет Φ(λ) > Φ(0) = 0, откуда Φ′ (0) > 0, то естьf τ, xb(τ ), v − p(τ )ϕ τ, xb(τ ), v > fb(τ ) − p(τ )ϕ(τb ).(47)Так как v и τ были произвольными, теорема доказана. 3.
Теоремы существованияЯсно, что не всякие экстремальные задачи имеют решение. Например, функция не обязана достигать минимального значения, если она рассматривается на некомпактном множестве. Или уравнение Эйлера может неиметь решений, как в следующей задаче: 1Zt2 ẋ2 dt → inf,0x(0) = 0, x(1) = 1.23(1)3.1. ПолунепрерывностьКлассическая теорема существования заключается в том, что непрерывная на компакте функция достигаетминимума и максимума. Обобщим эту теорему, введя понятие полунепрерывности.Пусть X — топологическое пространство.
Будем рассматривать только собственные функции f : X → R(то есть только функции f > −∞ и f 6≡ +∞).Определение. Лебеговым множеством функции f уровня λ называется множество(2)Lλ f = {x ∈ X : f (x) 6 λ} .Определение. Функция f называется полунепрерывной снизу, если выполнено одно из следующих эквивалентных условий:(i) для любого λ ∈ R множество Lλ f замкнуто в X,(ii) epi f := {(λ, x) ∈ R × X : f (x) 6 λ} замкнут в R × X.Лемма 3.1. Условия (i) и (ii) эквивалентны. Пусть выполнено (i).
Покажем, что множество R × X r epi f = {(λ, x) : f (x) > λ} открыто. Возьмем(λ0 , x0 ), для которых f (x0 ) > λ0 . Тогда найдется ε > 0, такой что f (x0 ) > λ0 + ε. Поскольку X r Lλ0 +ε f открыто,то найдется окрестность U точки x0 , в которой выполнено неравенство f (x) > λ0 + ε. Тогда (λ0 − ε, λ0 + ε) × Uбудет окрестностью точки (λ0 , x0 ), целиком лежащей в R × X r epi f .Обратно: фиксируем λ0 .
Множество {(λ0 , x) : f (x) 6 λ0 } замкнуто как пересечение замкнутых множеств epi fи {(λ0 , x) : x ∈ X}. Значит, замкнуто и Lλ0 f . Удобно говорить о полунепрерывных функциях в терминах последовательностей. Пусть X обладает такимсвойством: A ⊂ X замкнуто ⇔ предел любой фундаментальной последовательности элементов A лежит в A.Легко проверить, что тогда свойства (i) и (ii) эквивалентны третьему:(iii) для всех xb ∈ X и для всякой последовательности {xn } → xb выполнено f (bx) 6 lim f (xn ).n→∞Указанное свойство пространства X выполнено автоматически, если X метризуемо (то есть топология задается некоторойметрикой).
Можно ослабить это требование до требования первой аксиомы счетности: у любой точки x ∈ X найдется не более чемсчетная система окрестностей V1 , V2 , . . ., такая что любая окрестность x содержит какую-то из Vj . Если формулировать определениеполунепрерывности в терминах последовательностей, то от X надо требовать не компактности, а секвенциальной компактности(то есть каждая последовательность должна иметь сходящуюся подпоследовательность).
Тогда мы сможем доказать аналог теоремыВейерштрасса – Лебега (см. ниже). Действительно, пусть xn : f (xn ) → β = inf f (x). Выделим xnk → x. Тогда f (x) 6 β, откудаx∈Xf (x) = β.Теорема 3.2 (Вейерштрасс – Лебег). Пусть X — компактное топологическое пространство, f : X →→ R — собственная, полунепрерывная снизу функция. Тогда f ограничена снизу и достигает наименьшегозначения: найдётся xb, для которого f (bx) = inf f (x).x∈XS Обозначим Uλ := X r Lλ f .
Эти множества открыты ввиду полунепрерывности функции f . Ясно, чтоUn = X. Выделим конечное подпокрытие Un1 , . . . , Unk . Тогда f ограничена снизу числом min nj . Возьмемn∈Zβ := inf f (x). Если f (x) > β для всех x ∈ X, тоx∈X∞Sn=1Uβ+ n1 = X. Снова выделим конечное подпокрытиеUβ+ n1 , . . . , Uβ+ n1 . Но тогда при всех x будет f (x) > β + min n1j — противоречие. 1s3.1.1. Принцип компактностиПусть X — нормированное пространство.Определение. Скажем, что xn слабо сходится к x, если для всех x∗ ∈ X ∗ имеем hx∗ , xn i → hx∗ , xi (обознаwчение: xn −→ x).Определение.