Диссертация (1155108), страница 4
Текст из файла (страница 4)
Рост называется линейным справа/слева, если |t − t∗ | воценке выше заменить на |t − t∗ |.Теорема 2 Предположим, что допустимый процесс (p∗ , x∗ , u∗ ) является экстремальным. Пусть концевые ограничения регулярны в точке p∗ , фазовыеограничения согласованы с концевыми в p∗ , и процесс (p∗ , x∗ , u∗ ) регулярен.Тогда для любых множителей Лагранжа λ, ψ, µ, ν, отвечающих (p∗ , x∗ , u∗ ) всилу принципа максимума, выполняется:i) условие нетривиальностилибо0λ > 0,либо∂g2∂g1∗(t) ∈/ im(t) ∀ t ∈ T ;ψ(t) − µ2 (t)∂x∂x(13)ii) в каждой точке t∗ ∈ (t∗1 , t∗2 ) функция µ2 (t) непрерывна и более тогоимеет корневой рост справа и слева; если оптимальная траектория выходитнегладко на границу j-ого фазового ограничения в точке t∗ , j ∈ J(t∗ ), тогдарост µj2 линеен справа; в случае негладкого схода с границы j-ого фазовогоограничения, рост µj2 линеен слева;iii) существует вектор λm = (λ0 , λ1m , λ2m ) и функция ψm (t) такие что,набор λm , ψm , µ1 , µ̄2 , ν, где∗ ∗µ2 (t) − µ2 (t∗−2 ), t ∈ (t1 , t2 ),∗−∗µ̄2 (t) =µ2 (t∗+1 ) − µ2 (t2 ), t = t1 , 0, t = t∗ .2удовлетворяет принципу максимума и условию (13); иiv) при дополнительном предположении, что d(g2 ) = 1, функция µ̄2 (t)22является гельдеровой с показателем α = 12 , т.е.|µ̄2 (t) − µ̄2 (s)| ≤ constp|t − s| ∀ t, s ∈ T.(14)Таким образом, в условиях регулярности, Теорема 2 гарантирует существование непрерывной меры-множителя Лагранжа µ2 (t), удовлетворяющей условию корневого роста всюду на (t∗1 , t∗2 ).
Теорема 2 является развитием результатов из [56] на случай, когда также присутствуют фазовые ограничения типаравенств.Введенное условие регулярности является существенным, что показываетследующий пример из [37].Пример 1 Пусть n = m = 2. Рассмотрим следующую задачу оптимальногоуправления:t2 − t1 → min,ẋ1 = x2 + u1 ,ẋ = u2 , 2(u1 , u2 ) ∈ [0, 1] × [0, 1],2x2 − x1 ≤ 0,t1 = −1, x(t ) = (− 1 , −1), x(t ) = ( 9 , 2).1222Опишем экстремальный процесс (он также будет оптимальным). В [37]было показано, что t∗1 = −1, t∗2 = 2 ln 2 + 1,• при t ∈ [−1, 0] – выход на границу:(u∗1 (t), u∗2 (t)) = (1, 1),2(x∗1 (t), x∗2 (t)) = (t + t2 , t);• при t ∈ (0, 2 ln 2] – движение по границе:t(u∗1 (t), u∗2 (t)) = (1, e 2 /2),tt(x∗1 (t), x∗2 (t)) = (2(e 2 − 1), e 2 − 1);23• при t ∈ (2 ln 2, t∗2 ] – сход (сход в t = 2 ln 2) с границы фазового ограничения:(u∗1 (t), u∗2 (t)) = (1, 1),(x∗1 (t), x∗2 (t)) = (2 + 2(t − 2 ln 2) +(t−2 ln 2)2,12+ (t − 2 ln 2)).Оказывается, что в точке t = 2 ln 2, для любых множителей Лагранжа(λ, ψ, µ, ν), удовлетворяющих ПМ, функция µ2 (t) претерпевает разрыв (см.[37]).
Это является следствием того, что нарушается регулярность оптимального процесса в этой точке. Отметим, что аналогичный пример былпервоначально предложен в книге [12] (при других концевых ограничениях).Приведем несколько вспомогательных утверждений.Лемма 1 Пусть допустимый процесс (p∗ , x∗ , u∗ ) регулярен. Тогда выполненыусловия управляемости.Доказательство. Предположим, что J(t∗1 ) 6= ∅. (В противном случае утверждение леммы выполняется автоматически.)Покажем, что для любого вектора α = (α1 , .., αd(g2 ) ) 6= 0 такого, что αj ≥/ J(t∗1 ) существует вектор ϕ1 ∈ ϕ(U (x∗1 , t∗1 ), t∗1 )0, ∀ j ∈ J(t∗1 ), и αj = 0, ∀ j ∈(зависящий от α) такой, что∂g2 ∗∂g2 ∗α(t1 ), ϕ1 + α(t ) < 0.∂x∂t 1(15)Для заданного α рассмотрим функциюG(x, t) = hα, g2 (x, t)i .Очевидно, что G(t) ≤ 0, ∀ t ∈ T и G2 (t∗1 ) = 0.Покажем, что ∃ u1 ∈ U (x∗1 , t∗1 ), z1 ∈ Rm такой, что∂G ∗∂G ∗∗(t1 ), ϕ(u1 , t1 ) +(t ) ≤ 0,∂x∂t 1∂Γ2α(u1 , t∗1 ), z1 > 0,∂u j∂r(u1 , t∗1 ), z1 > 0, ∀ j : rj (u1 , t∗1 ) = 0,∂u∂Γ1z1 ∈ ker(u1 , t∗1 ).∂u(16)24Действительно, рассмотрим измеримое множествоnD ∂GE ∂GoE := t ∈ T :(t), ϕ(t) +(t) ≤ 0 .∂x∂tЗаметим, что в каждой окрестности O точки t∗1 имеем `(E ∩ O) > 0 потому что,∂Gв противном случае для некоторой окрестности O выполняется h(t), ϕ(t)i +∂xZ t∂G∂G∂G(h(t) > 0 для почти всех O ∩ T , и тогда G(t) =(θ), ϕ(θ)i +(θ))dθ >∂t∂x∂tt∗10, ∀ t ∈ (O ∩ T ) \ {t∗1 }, а это противоречит свойствам функции G(t), о которыхбыло указано выше.Отсюда, используя определение множества E, из Определения 9 и свойствзамыкания по мере, несложно вытекает существование вектора z1 , удовлетворяющего (16).∂G ∗∂G ∗(t1 ), ϕ(u1 , t∗1 )i +(t ) < 0, тогда (15)∂x∂t 1∂G ∗выполняется для ϕ1 = ϕ(u1 , t∗1 ).
Во втором случае, когда h(t1 ), ϕ(u1 , t∗1 )i +∂x∂G ∗∂G ∗∂G(t1 ) = 0, обозначим φ(u) = h(t1 ), ϕ(u, t∗1 )i +(t∗1 ). Тогда φ(u1 ) = 0, и в∂t∂x∂tсилу очевидного тождества∂G∂G(x, t), ϕ(x, u, t) +(x, t),hα, Γ2 (x, u, t)i ≡∂x∂tРассмотрим 2 случая. Если h∂φ(u1 ), z1 i ≥ 0. Таким образом, используя∂uнеравенство (16), Определение 9 и свойства касательного конуса к U (u1 , t∗1 ),и второго неравенства (16) имеем hимеем, что для достаточно малых δ > 0, выполняется Γ1 (u1 − δz1 + o(δ), t∗1 ) = 0,r(u1 − δz1 + o(δ), t∗1 ) < 0, φ(u1 − δz1 + o(δ)) < 0 и, следовательно, ϕ1 = ϕ(u1 −δz1 + o(δ), t∗1 ) удовлетворяет (15).
Отсюда (15) доказано. Выше o(δ) – векторнаяфункция такая, что |o(δ)|/δ → 0 при δ → 0+.Теперь докажем управляемость траектории относительно фазового ограничения в левом конце. В пространстве Rn+1 рассмотрим выпуклый конус K,∂g2jкоторый является выпуклой оболочкой конечного числа векторов(t∗1 ), j ∈∂(x, t)∗J(t1 ). Конус K острый (то есть не содержит нулевых подпространств), так какрегулярность процесса предполагает положительную линейную независимость25векторов, порождающих конус K.
Таким образом, int K ◦ 6= ∅, где K ◦ – полярный конус к K.В пространстве Rn+1 рассмотрим множество F = (ϕ(U (x∗1 , t∗1 ), t∗1 ), 1). Оче∂g2j◦видно, что K = {ξ : hξ,(t∗1 )i ≤ 0 ∀ j ∈ J(t∗1 )}. Следовательно, для того,∂(x, t)чтобы получить условия управляемости на левом конце, достаточно доказать,чтоconv F ∩ int K ◦ 6= ∅.(17)Предположим противное. Применим теорему отделимости к двум непересекающимся множествам conv F и int K ◦ и получим, что существует ненулевойвектор h ∈ Rn+1 , для которого выполняется hh, di ≥ 0, ∀ d ∈ conv F и h ∈ K ◦◦ .Многогранный конус K замкнутый и выпуклый, и, следовательно, K ◦◦ = K,а это означает, что h ∈ K.
Поэтому в определении конуса K существует век∂g2 ∗тор α такой, что h = α/ J(t∗1 ).(t ) и αj ≥ 0, ∀ j ∈ J(t∗1 ), αj = 0, ∀ j ∈∂(x, t) 1Следовательно, в силу (15) ∃ d = (ϕ1 , 1) ∈ F такой, что hh, di < 0. Это противоречие доказывает (17). Применяя аналогичные рассуждения к точке t∗2 ,получим управляемость в правом конце траектории.Лемма доказана.Предложение 4 Существует число C > 0 такое, что для любых t∗ ∈ (t∗1 , t∗2 ),u∗ ∈ U(t∗ ), и ∆t > 0 справедливы следующие оценки.Если u∗ ∈ U − (t∗ ), тогдаd(g2 )XΓj2 (u∗ , t∗ ) · |µj2 (t∗ + ∆t) − µj2 (t−∗ )| ≤ C · ∆t.(18)j=1Если u∗ ∈ U + (t∗ ), тогдаd(g2 )XΓj2 (u∗ , t∗ ) · |µj2 (t∗ − ∆t) − µj2 (t+∗ )| ≥ −C · ∆t.(19)j=1Доказательство. Предположим, что ограничения типа равенств g1 (x, t) =0 отсутствуют.
Докажем оценку (18). Выберем t∗ , u∗ ∈ U − (t∗ ). Рассмотрим мно-26жество E − , которое соответствует (u∗ , t∗ ) из Предложения 2. Таким образом,`(E − ∩ [t∗ − ε, t∗ ]) > 0 для всех ε > 0 и u∗ (ti ) → u∗ как только ti ∈ E − , ti → t−∗.Для каждого εi = i−1 выберем точку ti ∈ E − ∩ [t∗ − εi , t∗ ) такую, чтобы вточке ti , условие оптимальности (8) выполнялось. Далее, так как функция h(t)непрерывна, и µ2 (t) непрерывна слева в t∗ , при i → ∞, имеем:h(ti ) = H̄(u∗ (ti ), ti ) → H̄(u∗ , t∗ ) = h(t∗ ).(20)Существуют числа δ, α0 > 0 такие, что для всех (t, u) ∈ Gr U найдется единичный вектор q = q(u, t), удовлетворяющий условию регулярности смешанныхограничений (т.е. условию (2)), где x = x∗ (t), такой, чтоu − ∆t · α0 q ∈ U (t + ∆t)∀ ∆t ∈ (0, δ) : t + ∆t ∈ T.Это вытекает из компактности, полунепрерывности сверху многозначного отображения I, регулярности смешанных ограничений и разложения:D jE∂rjjr (u∗ − ∆t · αq, t + ∆t) = r (u, t) − ∆t · ∂u (u, t), αq ++ ∆t ·∂rj∂t (u, t)+ V (∆t) + o(∆t),где α ∈ R, V (∆t) = rj (u − ∆t · αq, t + ∆t) − rj (x∗ (t), u − ∆t · αq, t + ∆t).
Причем|V (∆t)| ≤ const ·∆t для всех ∆t, α : α∆t ≤ 1, q, u ∈ U(t), t ∈ T , и ∆t ∈ (0, 1).Обозначим через q∗ = q(u∗ , t∗ ), H(x, u, ψ, λ0 , t) = hψ, ϕ(x, u, t)i−λ0 ϕ0 (x, u, t).Таким образом, из определения h(t), принимая во внимание (9), и то, что функция h(t) липшицева, используя условие (20), для ∀∆t ∈ (0, δ) : t∗ + ∆t ∈ T ,имеем:H̄(u∗ − ∆t · α0 q∗ , t∗ + ∆t) ≤ h(t∗ + ∆t) = h(t∗ ) + O(∆t) = H̄(u∗ , t∗ ) + O(∆t) ⇒H(u∗ − ∆t · α0 q∗ , t∗ + ∆t) − µ2 (t∗ + ∆t), Γ2 (u∗ − ∆t · α0 q∗ , t∗ + ∆t) −− (H(u∗ , t∗ ) − µ2 (t∗ ), Γ2 (u∗ , t∗ ) ) ≤ O(∆t) ⇒d(g2 )XΓj2 (u∗ , t∗ ) · |µj2 (t∗ + ∆t) − µj2 (t∗ )| ≤ O(∆t) = const ·∆t.j=1Учитывая, что µ2 (t∗ ) = µ2 (t−∗ ), оценка (18) доказана. Доказательство оценки(19) аналогично, только вместо µ2 (t∗ ) следует рассмотреть µ2 (t+∗ ), и соответственно, H̄(u∗ , µ2 (t+∗ ), t∗ ) = h(t∗ ) в (20).27Случай d(g1 ) > 0 (то есть когда присутствуют также и ограничения типаравенств) легко сводится к рассмотренному выше с помощью замены переменной.