Диссертация (1155108), страница 9
Текст из файла (страница 9)
Вычислим матрицу якоби в этой точке.lji∂Γ2∂r1Обозначим через B матрицу, состоящую из строк ∂Γ∂u (u∗ , t∗ ), ∂u (u∗ , t∗ ), ∂u (u∗ , t∗ ),с l ∈ L, j ∈ Q, i ∈ I. Принимая во внимание c), d) и e), получаем,∗AB∂F (u∗ , µ1 (t∗ ), µ̃2 (t∗ ), ν̃∗ , t∗ ) =.∂(u, µ1 , µ̃2 , ν̃)B 0 53Ввиду a) матрица A отрицательно определенная. Таким образом, в силуПредложения 11 Якобиан не равен нулю. Применяя теорему о неявной функции (см. [2]), учитывая способ построения последовательности {ti }, получаем,что существует окрестность O точки t∗ и, однозначно определенные на O функции α(t), β(t), ω(t), ρ(t) такие, что F (α(t), β(t), ω(t), ρ(t), t) = 0 and α(t∗ ) = u∗ ,β(t∗ ) = µ∗1 , ω(t∗ ) = µ̃2 (t∗ ), ρ(t∗ ) = ν̃∗ , α(ti ) = u∗ (ti ), β(ti ) = µ1 (ti ), ω(ti ) = µ̃2 (ti ),ρ(ti ) = ν̃(ti ).Траектория x∗ (t) есть липшицевая функция.
Таким образом, по теоремео неявной функции, все функции α, β, ω, ρ липшицевы. Но из липщшицевостиω, монотонности µ2 и (52) следует линейный рост µ2 справа от t∗ .Линейный рост слева от t∗ ∈ (t∗1 , t∗2 ] доказывается аналогично. Проведенные рассуждения справедливы для любой точки t∗ ∈ T , откуда следует липшицевость µ2 на всем интервале времени T .Теорема доказана.Замечание 3 Автору не удалось построить пример экстремали, для которой выполнены условия регулярности, нарушено усиленное условие Лежандра,и функция µ2 является гельдеровой, но не липшицевой. Вопрос о существовании такой экстремали остается открытым.542О некоторых свойствах кратчайшей кривой в сложнойобластиРассматривается замкнутая фазовая область, которая задается ограниче-ниями вида:g1 (x) = 0, g2 (x) ≤ 0,где x ∈ Rn , а g1 , g2 – заданные вектор-функции, принимающие значения в Rk1и Rk2 соответственно. Именно такую фазовую область будем ниже называтьсложной.
При этом всюду ниже будем полагать, что векторы∂g2j∂x (x),∂g1i∂x (x),i = 1, .., k1 ,j ∈ J(x) линейно независимы при любом x. Здесь J(x) := {j : g2j (x) = 0}.Изучены некоторые свойства кратчайшей кривой в сложной области. Получено уравнение кратчайшей кривой. Важно отметить следующее. Казалосьбы, из принципа оптимальности уравнение кратчайшей при наличии неравенстввыводится тривиально. Действительно, любой кусок кратчайшей является снова кратчайшей, и тогда путем рассмотрения отдельных ее частей, лежащих награнице области x : g2 (x) ≤ 0 и внутри нее (предположим, что k2 = 1), придемк искомому результату. Такой метод применим, если эти части целиком лежатна границе или внутри области.
Но такой части кратчайшей, которая бы целиком лежала на границе области может и не найтись, в то время как множествоточек выхода кратчайшей на границу может являться, например, канторовыммножеством положительной меры. Приведем соответствующий пример.Пусть C ⊂ [0, 1] – канторово множество положительной меры. ПосколькуC замкнуто, то по теореме Уитни существует гладкая неположительная функция ϕ : [0, 1] → R такая, что ϕ−1 ({0}) = C. Возьмем n = 2, g2 (x) = ϕ(x1 ) − x2 ,и пусть ограничения типа равенств отсутствуют. Кратчайшая, соединяющаядве точки (0, 0) и (1, 0) есть, очевидно, x1 (t) = t, x2 (t) = 0, t ∈ [0, 1].
Легко видеть, что множество C × {0} лежит на границе указанной области, а множество([0, 1] \ C) × {0} лежит в ее внутренности.Заметим, что здесь также возникает и вопрос о том классе функций, к55которому принадлежит кратчайшая кривая. Ясно, что при наличии неравенствона уже не класса C2 ([0, 1]), как в случае с геодезической. Соответствующийконтрпример несложно построить.В этой главе показано, что кратчайшая кривая для сложной области принадлежит пространству W2,∞ ([0, 1]). При этом не делается никаких дополнительных предположений относительно множества точек выхода кратчайшей награницу области.
(Если часть кратчайшей целиком лежит на границе или внутри, то там она, конечно, класса C2 .) Используя этот результат, получено уравнение кратчайшей кривой для сложной области в общем случае.Если фазовые ограничения типа равенств отсутствуют, то задачу о кратчайшей для сложной области еще называют задачей об обходе препятствия,[3]. На возможность вывода уравнения кратчайшей через ПМП впервые указалР.В. Гамкрелидзе в [17, 49].2.1Вспомогательный материалРассмотрим задачу оптимального управленияZ 1ϕ0 (x, u)dt → min,0 ẋ = ϕ(x, u), t ∈ [0, 1],g1 (x) = 0, g2 (x) ≤ 0,r(x, u) ≤ 0, e (p) = 0, e (p) ≤ 0, p = (x(0), x(1)).12(53)Здесь заданные вектор-функции g1 , g2 , r принимают значения в арифметических пространствах размерностей k1 , k2 и k3 соответственно, функция ϕ0 скалярная, ẋ =dxdt ,t ∈ [0, 1] – время, x – фазовая переменная, принимающая зна-чения в n-мерном арифметическом пространстве Rn , а u ∈ Rm – управляющийпараметр. Вектор p ∈ Rn × Rn называется концевым.
В качестве класса допустимых управлений рассматриваются измеримые существенно ограниченныефункции u(·).56Далее будем предполагать, что все функции, участвующие в постановкезадачи, непрерывно дифференцируемы, а функция g = (g1 , g2 ) дважды непрерывно дифференцируема.Задача (53) является частным случаем задачи (1), необходимые определения для которой были рассмотрены в Главе 1.Основными инструментами для дальнейшего исследования станут следующие две теоремы.Теорема 5 Пусть допустимый процесс (x∗ , u∗ ) регулярен, концевые ограничения регулярны, фазовые ограничения согласованы с концевыми, и допустимыйпроцесс является оптимальным в задаче (53).Тогда процесс (x∗ , u∗ ) удовлетворяет принципу максимума, в которомвыполнено усиленное условие нетривиальности∂g2∂g1∗Если λ = 0, то ψ(t) − µ2 (t)(t) ∈/ im(t) ∀ t ∈ [0, 1],∂x∂x0(54)а функция µ2 (t) непрерывна на (0, 1).Теорема 6 Пусть имеют место предположения Теоремы 5.
Предположимдополнительно, что1) выполнено усиленное условие Лежандра;2) оптимальное управление u∗ (t) кусочно-непрерывно.4Тогда процесс (x∗ , u∗ ) удовлетворяет принципу максимума, в котором функция µ2 оказывается даже липшицевой на (0, 1), т.е. существует число c > 0:|µ2 (t) − µ2 (s)| ≤ c · |t − s| ∀ t, s ∈ (0, 1).Доказательство Теоремы 5.
То, что оптимальный процесс удовлетворяет принципу максимума следует из Теоремы 1. Условие (54) и непрерывностьµ2 на (0, 1) была доказана в Теореме 2.Доказательство Теоремы 6. ПоложимD(t) := {s : Γj2 (s) = 0 ∀ j ∈ J(t)}.4То есть функция u∗ (t) всюду непрерывна за исключением лишь конечного числа точек.57Рассмотрим произвольную точку t∗ ∈ (0, 1), в которой оптимальное управлениенепрерывно. Покажем, что существует число c > 0, которое можно выбратьнезависящим от t∗ , и число δ > 0 такие, что|µ2 (t) − µ2 (t∗ )| ≤ c · |t − t∗ | ∀ t ∈ D(t∗ ) ∩ (t∗ − δ, t∗ + δ).(55)Можно считать, что |J(t∗ )| = k2 , |I(t∗ )| = k3 .
Также будем сейчас полагать, что отображение I(t) постоянно в окрестности точки t∗ . (Позже будетпоказано, как избавиться от этого требования.) Тогда, используя регулярность,из (11) в окрестности t∗ для п.в. t имеем(µ1 (t), ν(t)) =hi−1∂φ∗∂φ∂u (t) ∂u (t)∂φ∗∂H∂u (t) ∂u (t)2− µ2 (t) ∂Γ(t),∂uгде φ := (Γ1 , r).5Однако u∗ (t) и µ2 (t) непрерывны в окрестности t∗ (функция u∗ (t) по условию, а µ2 (t) по Теореме 5). Значит, непрерывными будут и µ1 (t), ν(t).6 Крометого, в силу непрерывности управления, условие j ∈ J(t∗ ) влечет Γj2 (t∗ ) = 0.Поэтому, учитывая усиленное условие Лежандра (50), справедливы соотношения:a) A :=b)∂ 2 H̄∂u2 (µ1∗ , t∗ )∂ H̄∂u (µ1∗ , t∗ )−DE∂2rν∗ , ∂u2 (t∗ )< 0;∂r− ν∗ ∂u(t∗ ) = 0.c) Γ(t∗ ) = 0, r(t∗ ) = 0.Выше µ1∗ = µ1 (t∗ ), ν∗ = ν(t∗ ).Рассмотрим отображение F (u, µ, ν, t):F : Rm+k1 +k2 +k3 +1 → Rm+k1 +k2 +k3 ,∗∂ϕВвиду регулярности, матрица ∂ϕ∂u (t) ∂u (t) обратима.6Точнее, их замыкание по мере однозначны, и, следовательно, непрерывны.558компонентами которого являются функции∂r∂ H̄(u, µ, t) − ν(u, t), k = 1, ..., m;∂uk∂ukΓj1 (u, t), j = 1, ..., k1 ;Γj2 (u, t), j = 1, ..., k2 ;ri (u, t), i = 1, .., k3 .ясно, что в силу b), c)F (u∗ , µ∗ , ν∗ , t∗ ) = 0,где u∗ = u∗ (t∗ ), µ∗ = µ(t∗ ).Решим уравнение F (u, µ, ν, t) = 0 относительно переменных u, µ, ν в окрестности (u∗ , µ∗ , ν∗ , t∗ ).
Вычислим матрицу якоби для F в этой точке. Обозначимчерез B матрицу, составленную из строк∂Γj2∂Γi1∂rk(u,t),∗ ∗∂u∂u (u∗ , t∗ ), ∂u (u∗ , t∗ ),гдеi = 1, ..., k1 , j = 1, ..., k2 , k = 1, ..., k3 . Үогда∗AB∂F (u∗ , µ∗ , ν∗ , t∗ ) =.∂(u, µ, ν)B 0 Из условия a) матрица A отрицательно определена. Но матрица B имеетполный ранг в силу условия регулярности траектории.
Поэтому Якобиан (детерминант матрицы якоби) не обращается в ноль. Применяя теорему о неявнойфункции можно утверждать, что существуют окрестность O точки (u∗ , µ∗ , ν∗ )и число δ > 0, такие, что для любого t ∈ Oδ (t∗ ) := (t∗ − δ, t∗ + δ) в окрестностиO существует единственное решение уравнения F (u, µ, ν, t) = 0. Обозначим эторешение через ū(t), µ̄(t), ν̄(t). Таким образом, ū(t∗ ) = u∗ , µ̄(t∗ ) = µ∗ , ν̄(t∗ ) = ν∗ ,и при всех t ∈ Oδ (t∗ ) имеет место (ū(t), µ̄(t), ν̄(t)) ∈ O иF (ū(t), µ̄(t), ν̄(t), t) = 0.Кроме того, поскольку F и ее производные по u, µ, ν липшицевы по t, то можноутверждать, что и все функции ū(t), µ̄(t), ν̄(t) являются липшицевыми с некоторой константой Липшица c > 0.
Однако, по построениюF (u∗ (t), µ(t), ν(t), t) = 0 ∀ t ∈ D(t∗ ).59Поэтому, в силу сказанного выше,ū(t) = u∗ (t), µ̄(t) = µ(t), ν̄(t) = ν(t) ∀ t ∈ D(t∗ ) ∩ Oδ (t∗ ).Отсюда, поскольку t∗ ∈ D(t∗ ), и µ̄ липшицева с константой c следует (55).ясно, что условия регулярности, как и усиленное условие Лежандра, имеютравномерный по времени характер. Поэтому константа c выше не зависит от t∗ .В случае, когда отображение I(t) не является постоянным, функция ν(t),и, как следствие, µ1 (t), уже, вообще говоря, измеримы и могут иметь довольно сложное поведение в окрестности t∗ . В этом случае будем действовать следующим образом.
Разобьем множество D(t∗ ) на конечное число подмножествпостоянства I(t). Используя замыкание по мере функций µ1 , ν, повторяя описанную выше процедуру на каждом участке постоянства I(t), и для каждойпредельной точки функций µ1 , ν в t∗ , используя компактность и покрывая ихзамыкание по мере в t∗ конечным числом шаров, в итоге докажем оценку (55).Теперь липшицевость µ2 на (0, 1) докажем индукцией по k2 . Вначале установим липшицевость при k2 = 1. Пусть [a, b] ⊂ (0, 1) – некоторый отрезок времени, целиком лежащий в области непрерывности оптимального управления.
Длякаждой точки t ∈ [a, b] существует окрестность Oδ (t), в которой справедливаоценка (55). Используя компактность отрезка [a, b] и выделяя конечное подпокрытие, получим набор точек a = t1 < t2 < ... < tN = b и чисел δ1 , δ2 , ..., δNтаких, что ∪Ni=1 Oδi (ti ) ⊃ [a, b] и|µ2 (t) − µ2 (ti )| ≤ c · |t − ti | ∀ t ∈ Oδi (ti ) ∩ D(ti ), i = 1, ..., N.Отсюда, учитывая монотонность µ2 , условие а) ПМП, а также условие Γ2 (t) 6= 0⇒ J(t) = ∅ (сейчас k2 = 1), вытекает оценка|µ2 (a) − µ2 (b)| ≤ c · |a − b|.Отсюда, учитывая кусочную непрерывность оптимального управления инепрерывность µ2 на (0, 1), следует липшицевость µ2 на (0, 1).60Шаг индукции.