Диссертация (1155108), страница 10
Текст из файла (страница 10)
Пусть утверждение уже доказано при всех k2 < k. Покажем его при k2 = k. Для этого воспользуемся теми же рассуждениями, что ивыше при k2 = 1 и также тем фактом, что если |J(t)| < k2 , то по индуктивномупредположению µ2 липшицева в окрестности t с константой c.Теорема доказана.В Теореме 6 нет априорных предположений о структуре множества точеквыхода на границу в отличии от Теоремы 4.2.2Уравнение кратчайшей для сложной областиРассмотрим сложную областьM := {x ∈ Rn : g1 (x) = 0, g2 (x) ≤ 0},и пусть A, B – две фиксированные точки из M , A 6= B. Рассмотрим гладкуюкривую x(t) : [0, 1] → M , целиком лежащую в M и соединяющую A и B, т.е.x(0) = A и x(1) = B. (Область M будем полагать связной и тогда, в силуналоженных выше условий регулярности, такая кривая всегда существует.)Кратчайшей на M будем называть непрерывно дифференцируемую, регулярную кривую x∗ (t) с естественной параметризацией, имеющую наименьшуюдлину среди всех гладких кривых x(t), которые лежат на M и соединяют A иB.7Рассмотрим задачу управления Z 11|u(t)|2 dt → min,2 0ẋ = u,g1 (x) = 0, g2 (x) ≤ 0, u ∈ Rn , x(0) = A, x(1) = B.7(56)Регулярность кривой означает, что ẋ∗ (t) 6= 0 ∀ t, естественная параметризация – что функция |ẋ(t)|постоянна.61Лемма 5 Кратчайшая кривая x∗ (t), соединяющая точки A и B, существует.Любая кратчайшая является решением задачи (56).
Верно и обратное, любоерешение (56) будет кратчайшей.Доказательство. В силу связности и регулярности M , в задаче (56) существует допустимая траектория. Тогда, в силу вида функционала задачи ислабой секвенциальной компактности единичного шара в L2 ([0, 1]) в задаче (56)существует решение в классе траекторий из W1,2 ([0, 1]). Обозначим это решениечерез x∗ (t). Покажем, что x∗ (t) удовлетворяет данному определению кратчайшей.Заметим, что для любой допустимой траектории имеет место неравенствоsZ 1Z 1|ẋ(t)|dt ≤|ẋ(t)|2 dt00(неравенство Коши-Буняковского).
Причем равенство достигается тогда и тольR1ко тогда, когда функция |ẋ(t)| постоянна. Однако интеграл 0 |ẋ(t)|dt и естьдлина кривой. Отсюда несложно выводится, чтоа) |ẋ∗ (t)| = const для п.в. t ∈ [0, 1];б) кривая x∗ (t) доставляет минимум функционала длины.(Для строгого обоснования этих фактов достаточно использовать указанное неравенство и аппроксимацию гладкими регулярными кривыми, для которых осуществима нормальная репараметризация).Покажем, что x∗ (t) кривая класса C1 . Оптимальное управление в задаче(56) обозначим u∗ (t). из а) следует, что функция u∗ (t) ограничена, а из регулярности области M следует, что траектория x∗ (t) регулярна в смысле Определения 9. Применим Теорему 5.Имеемλ0 |u|2H̄(x, u, ψ, µ, λ) = ψ, u −− µgx0 (x)u.2Условие (11) принимает вид00ψ(t) − µ2 (t)g2x(t) = µ1 (t)g1x(t) + λ0 u∗ (t) п.в.
t.62Если λ0 = 0, то оно противоречит (54). Поэтому ниже λ0 = 1.Условие максимума принимает вид2max0u∈ker g1x (t)! |u|0ψ(t), u −− µ2 (t)g2x(t)u2= H̄(t).Решим задачу на условный экстремум|u|2 /2 − u, a → min, Bu = 0,00где B = g1x(t), a = ψ(t) − µ2 (t)g2x(t). Матрица B имеет полный ранг. Применяяклассическое правило множителей Лагранжа, получаемu − a + ωB = 0,где ω – множитель Лагранжа. (Здесь u полагается строкой.) Значит, u = a−ωB.Но uB ∗ = 0, и отсюда ω = aB ∗ [BB ∗ ]−1 ⇒u = a(E − B ∗ [BB ∗ ]−1 B).Таким образом, находим формулу для оптимального управления, рассматриваяего как вектор-строку:!u∗ (t) =0ψ(t) − µ2 (t)g2x(t)!·0∗00∗0E − g1x(t)[g1x(t)g1x(t)]−1 g1x(t) .(57)Однако, функция µ2 (t) непрерывна на (0, 1), и что также важно, у неев силу монотонности существуют пределы µ2 (0+) и µ2 (1−). Значит, и u∗ (t)непрерывна, у нее также существуют соответствующие правый и левый пределы в концевых точках, и следовательно x∗ (t) непрерывно дифференцируема на[0, 1].
Итак, мы показали, что кривая x∗ (t) удовлетворяет данному определениюкратчайшей.В силу проведенных рассуждений также ясно, что любая кратчайшая будет являться решением задачи (56).Лемма 6 Кратчайшая кривая x∗ (t) является функцией класса W2,∞ ([0, 1]). Вотсутствие ограничений типа неравенств она класса C2 ([0, 1]).63Выше в Лемме 5 была выведена формула (57), из которой следует непрерывность производной кратчайшей, т.е. u∗ (t). Отсюда, учитывая, что для (x∗ , u∗ )выполняется условие Лежандра, применяя Теорему 6, заключаем, что µ2 (t) липшицева, и следовательно в силу (57) липшицевой оказывается и u∗ (t).
Такимобразом, x∗ ∈ W2,∞ ([0, 1]).Пусть неравенственные фазовые ограничения отсутствуют. Из (57) и условия стационарности Эйлера-Лагранжа (11) имеем0∗00∗0u∗ (t) = ψ(t)(E − g1x(t)[g1x(t)g1x(t)]−1 g1x(t)),0∗00∗µ1 (t) = (ψ(t) − u∗ (t))g1x(t)[g1x(t)g1x(t)]−1 ,и кроме того00ψ̇(t) = µ1 (t)g1xx(t)u∗ (t).Отсюда, последовательно: u∗ (t) непрерывно ⇒ µ1 (t) непрерывно ⇒ ψ(t) класса C1 . Повторяя цикл: ψ(t) класса C1 ⇒ u∗ (t) класса C1 ⇒ µ1 (t) класса C1 .Теперь, если g1 класса C3 , то ψ(t) будет класса C2 .
Снова повторяя цикл: ψ(t)класса C2 ⇒ u∗ (t), µ1 (t) класса C2 . И так далее. Итак, доказано, что степеньгладкости кратчайшей равна степени гладкости g1 . Напомним, что изначально,для принципа максимума, предполагалось, что g1 класса C2 . Таким образом,x∗ ∈ C2 ([0, 1]).Пусть P (x) означает матрицу размерности (k1 + k2 ) × (k1 + |J(x)|), которая вектор y = (y1 , y2 , ..., yk1 , yk1 +1 , yk1 +2 , ..., yk1 +k2 ) переводит в вектор ỹ =(y1 , y2 , ..., yk1 , yk1 +j1 , yk1 +j2 , ..., yk1 +jk ), где j1 , j2 , ..., jk – это индексы, образующиемножество J(x).
(Например, если все фазовые ограничения активны в x, тоP (x) – это единичная матрица.) В случае, когда k1 = 0 и J(x) = ∅, будем считать, что P (x) = O, где O – это нулевая квадратная матрица размера k2 × k2 .Условимся, что [O]−1 = O.Лемма 7 Кратчайшая кривая x∗ (t) почти всюду на [0, 1] удовлетворяет уравнению00ẍ = −gx0∗ (x)P ∗ (x)[P (x)gx0 (x)gx0∗ (x)P ∗ (x)]−1 P (x)gxx[ẋ, ẋ].(58)64Доказательство. В силу условий принципа максимума (6) и (11) имеем(зависимость от переменной t для простоты опущена)0000ψ̇ = µ1 g1xxẋ + µ2 g2xxẋ,00ψ = ẋ + µ1 g1x+ µ2 g2x.Выше учтено, что λ0 = 1. Поскольку µ2 , ψ, ẋ – это все липшицевые функции, тов силу регулярности, липшицевой будет и µ1 .
Поэтому производная функцииµ = (µ1 , µ2 ) существует почти всюду. Из указанных двух равенств, дифференцируя последнее, очевидно, имеем (п.в.)0000ψ̇ = ẍ + µ̇gx0 + µgxxẋ = µgxxẋ ⇒ ẍ = −µ̇gx0 .Заметим, что для j ∈/ J(t) функция µj2 постоянна в окрестности t, и значит, ее производная равна нулю. Поэтому, из последнего равенства, переходяот строк к столбцам, по определению матрицы P (x) имеемẍ = −gx0∗ P ∗ P µ̇.(59)Отсюда ввиду регулярности получаемP µ̇ = −[P gx0 gx0∗ P ∗ ]−1 P gx0 ẍ.(60)Пусть J ⊆ {1, 2, ..., k2 } – некоторый набор индексов. Пусть D = {t ∈(0, 1) : J(t) = J} – отвечающее ему подмножество отрезка [0, 1]. Покажемравенство (58) для почти всех точек из D.
Тогда, поскольку индексы J выбирались произвольным образом, лемма будет доказана. Ясно, что интересен лишьслучай, когда `(D) > 0.Заметим, что при j ∈ J, t∗ ∈ D, функция g2j (x(t)) достигает своего локального максимума в точке t = t∗ , и поскольку она непрерывно дифференцируема,то ее производная в точке t∗ равна нулю. Отсюда на множестве D справедливосоотношениеP gx0 ẋ = 0.65Пусть t∗ ∈ D – это точка плотности D такая, что в ней существует производнаяµ, и верно (59).
Тогда в силу (59) в t∗ существует и производная функции ϕ =P∗ gx0 ẋ, где P∗ = P (t∗ ). Однако, P (t) = P∗ ∀ t ∈ D ⇒ ϕ = 0 на D и тогда в силувыбора t∗ , очевидно, что производная ϕ в t∗ равна нулю. Почти все точки Dявляются точками плотности равно как и почти всюду существует производнаяµ и справедливо (59).
Поэтому, отсюда для п.в. t ∈ D, получаем00P gxx[ẋ, ẋ] = −P gx0 ẍ.Здесь мы учли, что P (t) = P∗ ∀ t ∈ D. Учитывая (60), приходим к выражению00P µ̇ = [P gx0 gx0∗ P ∗ ]−1 P gxx[ẋ, ẋ].Подставляя в (59) приходим к уравнению кратчайшей.Положим00a(x, y) := P ∗ (x)[P (x)gx0 (x)gx0∗ (x)P ∗ (x)]−1 P (x)gxx[y, y].Замечание 4 Из приведенных рассуждений вытекает, чтоak1 +j (x∗ (t), ẋ∗ (t)) ≤ 0 ∀ j ∈ J(t) п.в. t ∈ [0, 1].(61)Здесь ak1 +j – это компонента вектора a ∈ Rk1 +k2 .
Действительно, условие(61) есть следствие монотонности функции µ2 (t). (Условие (61) будет вернои при всех t ∈ [0, 1], но этот факт требует отдельного доказательства.)Замечание 5 Наряду с (58), имеет место уравнение кратчайшей в более простой, геометрической форме:ẍ ∈ NM (x).Это есть следствие (58), (61).Соберем полученные факты в одну теорему.Теорема 7 Кратчайшая кривая x∗ (t) существует.