Диссертация (1155108), страница 3
Текст из файла (страница 3)
Будем считать, что U − (t∗1 ) = U + (t∗1 ), U + (t∗2 ) =U − (t∗2 ).Предложение 1 Справедливы следующие свойства:a) U − (t) 6= ∅, U + (t) 6= ∅ ∀ t ∈ T ;b) U(t) ⊆ U (t) ∀ t ∈ T ;c) отображение U(t) полунепрерывно сверху;d) u∗ (t) ∈ U(t) для п.в. t ∈ T .Доказательство. Свойства a), b) и c) легко вывести из определения. Свойство d) следует из теоремы Данжуа2 и следующего утверждения.Предложение 2 Пусть τ ∈ (t∗1 , t∗2 ).
Вектор u∗ ∈ Rm принадлежит множеству U + (τ ) тогда и только тогда, когда существует измеримое множествоE + : E + ∩ [t∗1 , τ ] = ∅, такое чтоi) `(E + ∩ [τ, τ + ε]) > 0 ∀ ε > 0;ii) lim u∗ (t) = u∗ .3E+t−→τАналогично, u∗ ∈ U − (τ ) ⇔ ∃ E − : E − ∩ [τ, t∗2 ] = ∅, `(E − ∩ [τ − ε, τ ]) > 0∀ ε > 0, и lim u∗ (t) = u∗ .E−t−→τ1Термин “замыкание по мере” был впервые введен А. Я. Дубовицким и А. А.
Милютиным в [34].Измеримая конечная функция аппроксимативно непрерывна почти всюду, [47].3Символ lim означает, что предел берется только по точкам из S.2St−→τ16Доказательство. Ясно, что из i) и ii) следует, что u∗ ∈ U + (τ ) в силу определения замыкания по мере. В обратную сторону: пусть u∗ ∈ U + (τ ), докажемi) и ii). ОбозначимEn+=t∈[τ, t∗2 ]1: |u (t) − u∗ | ≤.n∗Выберем строго монотонно убывающую и стремящуюся к нулю последовательность положительных чисел αn , такую что`(En+ ∩ [αn+1 , αn ]) > 0 ∀ n.Такой выбор осуществим в силу замыкания по мере и того факта, что Ek+ ⊆ En+∀ k > n.Рассмотрим множество+E =∞[En+ ∩ [τ + αn+1 , τ + αn ] .n=1Множество E + , очевидно, измеримо и удовлетворяет i) и ii) по построению.Аналогичные рассуждения могут быть проведены и слева от точки τ .Будем использовать эти свойства ниже.Введем определение регулярного процесса.Определение 9 Допустимый процесс (p∗ , x∗ , u∗ ) называется регулярным, если для любых t ∈ T , u ∈ U(t), векторы∂Γj1∗∂u (x (t), u, t),j = 1, ..., d(g1 ),∂ri∗∂u (x (t),u, t), i ∈ I(x∗ (t), u, t) линейно независимы, и существует вектор d = d(u, t) ∈i∂Γ1∗∗∗Rm такой, что d ∈ ker ∂r∂u (x (t), u, t) ∀ i ∈ I(x (t), u, t), d ∈ ker ∂u (x (t), u, t),*+j∂Γ2 ∗(x (t), u, t), d > 0 ∀ j ∈ J(x∗ (t), t).(3)∂uНаряду с определением регулярного процесса ниже нам также понадобится понятие регулярной точки множества U (x, t).
В отличие от регулярностипроцесса это понятие никак не связано с фазовыми ограничениями типа неравенств.171Определение 10 Назовем точку u ∈ U (x, t) регулярной, если rank ∂Γ∂u (x, u, t) =1d(g1 ) и существует вектор q ∈ ker ∂Γ∂u (x, u, t) такой, что∂ri(x, u, t), q∂u> 0 ∀ i ∈ I(x, u, t).(4)Подмножество всех регулярных точек множества U (x, t) обозначим черезUR (x, t).
Положим Ω(x, t) := cl UR (x, t). Отметим, что если процесс регулярен, то U(t) ⊆ UR (x∗ (t), t) ∀ t ∈ T , и значит все близкие точки из некоторойего окрестности регулярны. В частности смешанные ограничения будут регулярными в некоторой окрестности регулярного процесса. Отсюда, посколькуU(t) 6= ∅ ∀ t ∈ T , также следует, что Ω(x∗ (t), t) 6= ∅ ∀ t ∈ T . Будем неявно (т.е.не ссылаясь на них каждый раз) использовать эти факты ниже.Рассмотрим расширенную функцию Гамильтона-Понтрягина H̄(x, u, ψ, µ, λ0 , t) = ψ, ϕ(x, u, t) − µ, Γ(x, u, t) − λ0 ϕ0 (x, u, t),где µ = (µ1 , µ2 ), и малый Лагранжиан l(p, λ) = λ0 e0 (p) + λ1 , e1 (p) + λ2 , e2 (p) ,λ = (λ0 , λ1 , λ2 ).Определение 11 Будем говорить, что допустимый процесс (p∗ , x∗ , u∗ ) в задаче (1) удовлетворяет принципу максимума Понтрягина, если существуетвектор λ = (λ0 , λ1 , λ2 ) : λ0 ∈ R, λ1 ∈ Rd(e1 ) , λ2 ∈ Rd(e2 ) , λ0 ≥ 0, λ2 ≥ 0, 2λ , e2 (p∗ ) = 0, абсолютно непрерывная функция ψ : T → Rn , функция µ =(µ1 , µ2 ) : T → Rd(g) и измеримая ограниченная функция ν: T → Rd(r) такие,18что0либо λ +|µ2 (t∗1 )|> 0, либо∂g1∗(t) ∀t ∈ T,ψ(t) ∈/ im∂x∂ H̄∂r(t) + ν(t) (t) п.в.
t,∂x∂x∂l ∗∂g2 ∗ψ(t∗s ) = (−1)s+1(p , λ) + µ2 (t∗s )(t ), s = 1, 2,∂xs∂xs smax H̄(u, t) = H̄(t) п.в. t,ψ̇ = −(5)(6)(7)(8)u∈Ω(t)∂ H̄∂r(t) − ν(t) (t) п.в. t,∂t∂t∂g2 ∗∂l(t ), s = 1, 2,h(t∗s ) = (−1)s (p∗ , λ) − µ2 (t∗s )∂ts∂t s∂ H̄∂r(t) = ν(t) (t) п.в. t,∂u∂uhν(t), r(t)i = 0, ν(t) ≥ 0 п.в. t,ḣ =(9)(10)(11)(12)где h(t) := maxu∈Ω(t) H̄(u, t).Более того, функция h(t) абсолютно непрерывна на T , а вектор-функцияµ = (µ1 , µ2 ) удовлетворяет следующим свойствам:a) каждая из функций µj2 постоянна на каждом отрезке времени [a, b], накотором траектория x∗ (t) целиком лежит во внутренности фазовогомножества, задаваемого j-ым фазовым ограничением-неравенством, т.е.когда g2j (t) < 0 ∀ t ∈ [a, b];б) вектор-функция µ2 непрерывна слева на интервале (t∗1 , t∗2 ), и µ2 (t∗2 ) = 0;в) каждая из функций µj2 (нестрого) убывает;г) вектор-функция µ1 измерима и ограничена на T .Процесс (p∗ , x∗ , u∗ ), удовлетворяющий принципу максимума называетсяэкстремалью, а набор (λ, ψ, µ, ν) – множителями Лагранжа, отвечающимипроцессу (p∗ , x∗ , u∗ ) в силу принципа максимума.Здесь и везде далее в работе приняты следующие соглашения относительно обозначений.
Во-первых, если у отображений H̄, g, r, ϕ, Ω, и т.п., или их про-19изводных какие-нибудь из аргументов опущены, то вместо них подставлены значения x∗ (t), u∗ (t) или множители Лагранжа ψ(t), µ(t), λ. Во-вторых, все множители Лагранжа или элементы сопряженных пространств рассматриваются каквектор-строки, в то время как вектор-функции или векторы, такие как ϕ, x, u,рассматриваются как вектор-столбцы.
Градиенты функций считаются элементами сопряженных пространств. Элементы матрицы Якоби F (x) : Rn → Rkимеют вид∂F i∂xj (x),и ее строками являются градиенты координатных функцийF i.В работе [55] была получена следующая теорема.Теорема 1 Пусть процесс (p∗ , x∗ , u∗ ) оптимален в задаче (1). Предположим,что U(t) ⊆ UR (x∗ (t), t) ∀ t ∈ T , концевые ограничения регулярны, фазовыеограничения регулярны и согласованы с концевыми в точке p∗ .
Тогда процесс(p∗ , x∗ , u∗ ) удовлетворяет принципу максимума.1.2Гельдеровость µ2 (t)В этом разделе будут рассмотрены различные условия, гарантирующиенепрерывность меры-множителя Лагранжа µ2 (t) из принципа максимума.Пусть t∗ ∈ (t∗1 , t∗2 ). Обозначим через D+ (t∗ ) множество всевозможных пределов справа траектории x∗ в точке t∗ :x∗ (t∗ + ∆t) − x∗ (t∗ )D (t∗ ) = Limsup.∆t∆t→0++Таким образом, множество D+ (t∗ ) – это, в определенном смысле, обобщеннаяпроизводная справа x∗ (t) в точке t∗ .
Если производная справа существует вклассическом смысле, то это множество состоит только из одного элемента –значения производной.Аналогично, множествоx∗ (t∗ + ∆t) − x∗ (t∗ )D (t∗ ) = Limsup∆t∆t→0−−20является обобщенной производной траектории слева.Введем следующие понятия. Будем говорить, что траектория выходитгладким образом на границу j-ого фазового ограничения в точке t∗ , j ∈ J(t∗ ),еслиD ∂g j2E∂g2j(t∗ ), v +(t∗ ) = 0 ∀ v ∈ D− (t∗ ).∂x∂tВ противном случае будем говорить, что траектория выходит на границу неглад-Аналогично, когдаD ∂g jEко.∂g2j(t∗ ), v +(t∗ ) = 0 ∀ v ∈ D+ (t∗ ),∂x∂t2будем говорить, что траектория гладко сходит с границы.Заметим, что справедливы неравенстваD ∂g jE ∂g j2(t∗ ), v + 2 (t∗ ) ≥ 0 ∀ v ∈ D− (t∗ ) ∀ j ∈ J(t∗ ),∂x∂tE ∂g jD ∂g j2(t∗ ), v + 2 (t∗ ) ≤ 0 ∀ v ∈ D+ (t∗ ) ∀ j ∈ J(t∗ ),∂x∂tкоторые следуют из допустимости траектории.Таким образом, выход на границу j-ого фазового ограничения будет неглад j ∂gj2ким, если существует вектор v ∈ D− (t∗ ) такой, что ∂g(t),v+ ∂t2 (t∗ ) > 0.∗∂xТочно также негладкий сход с границы j-ого фазового ограничения эквивален j ∂gj2тен существованию вектора v ∈ D+ (t∗ ) такого, что ∂g(t),v+ ∂t2 (t∗ ) < 0.∗∂xБудем использовать это ниже.Следующее утверждение раскрывает важную связь между обобщеннымипроизводными (справа и слева) и замыканием по мере.Предложение 3 Справедливы следующие условия:D+ (t∗ ) ⊆ conv ϕ(U + (t∗ ), t∗ ), D− (t∗ ) ⊆ conv ϕ(U − (t∗ ), t∗ ).Доказательство.
См. Предложение 2 в [10].В случае, когда управление кусочно-непрерывная функция, проверка условий регулярности сводится к проверке условия (3) для всех u∗ (t) в точках непрерывности, и для u∗ (t− ), u∗ (t+ ) в точках разрыва управления. Действительно,21U + (t) = {u∗ (t+ )}, U − (t) = {u∗ (t− )}, U(t) = {u∗ (t)} в точках непрерывностиu∗ (t), и U(t) = {u∗ (t− ), u∗ (t+ )} в точках разрыва.Будем говорить, что функция θ : T → Rk имеет корневой рост слева вpточке t∗ ∈ T , если существует число c > 0 такое, что |θ(t) − θ(t∗ )| ≤ c |t − t∗ |∀ t ∈ [t∗1 , t∗ ] и корневой рост справа, если это неравенство выполняется дляpлюбого t ∈ [t∗ , t∗2 ].