Диссертация (1155108), страница 6
Текст из файла (страница 6)
Однако последнее являетсяследствием неравенства Гронуолла, (6) и неравенств (31) и (32).Ясно, что (32) и (33) влечет µ̃1 = 0, ν = 0.Из условий трансверсальности (7), (10), и определения H̄, получаем:∂l∂lmax∗ (−1)s+1(p∗ , λ), ϕ(u, t∗s ) = (−1)s (p∗ , λ), s = 1, 2.(34)∂xs∂tsu∈Ω(ts )Из условий трансверсальности (7), получаем(−1)s∂l ∗∂g2 ∗(p , λ) = µ̃2 (t∗s )(t ), s = 1, 2.∂xs∂xs sАналогично, из (10)(−1)s∂l ∗∂g2 ∗(p , λ) = µ̃2 (t∗s )(t ), s = 1, 2.∂ts∂ts sВ итоге, µ̃2 (t∗1 ) ≥ 0 и µ̃2 (t∗2 ) ≤ 0 в силу условия в) ПМ и того факта, что µ̃2 (t) = 0∀ t ∈ (t∗1 , t∗2 ).
Поэтому, подставляя полученные формулы в (34), используя условия управляемости в p∗ (которые выполняются благодаря Лемме 1), получаемµ̃2 (t∗1 ) = µ̃2 (t∗2 ) = 0. Следовательно, µ̃2 = 0 и тогда µ2 (t) = µ2 (t0 ) ∀ t ∈ T ⇒∗1µ2 = 0 в силу условия б). Поэтому ψ(t0 ) ∈ im ∂g∂x (t0 ). А это противоречит (5) иТеореме 1.
Значит, (13) доказано.Случай, когда t0 = t∗1 или t0 = t∗2 рассматривается аналогично, но в опреде∗−лении µ̃2 из µ2 вычитаем µ2 (t∗+1 ) или µ2 (t2 ) соответственно, а не µ2 (t0 ). Утвер-ждение i) доказано.Докажем iii). Пусть набор λ, ψ, µ1 , µ2 , ν удовлетворяет принципу максимума.
Покажем, что существует вектор λm и функция ψm такие, что наборλm , ψm , µ1 , µ̄2 , ν, где функция µ̄2 (t) вводится выше в формулировке теоремы(это непрерывное продолжение µ2 c (t∗1 , t∗2 ) на весь интервал T минус скачок µ2в правом конце µ2 (t∗−2 )), тоже удовлетворяет принципу максимума.Рассмотрим набор множителейλ, ψm (t) = ψ(t) − µ2 (t∗−2 )∂g2(t), µ1 (t), µm (t) = µ2 (t) − µ2 (t∗−2 ), ν(t).∂x35Заметим, что он отвечает всем условиям принципа максимума за исключением,возможно, б).Благодаря условию согласованности фазовых и концевых ограничений длякаждого индекса j в задаче условного экстремума ∆j · g j (x , t ) + ∆j · g j (x , t ) → max,12 1 122 2 2 e (p) = 0, e (p) ≤ 0,12jj∗∗где ∆j1 = µjm (t∗1 ) − µjm (t∗+1 ), ∆2 = −µm (t2 ), точка p = p есть точка локальногоминимума.
Применяя классическое правило множителей Лагранжа, учитываярегулярность концевых ограничений, получаем следующее соотношение:∗∗∂g2j (x∗1 , t∗1 )1j ∂e1 (p )2j ∂e2 (p )·=λ+λ,∂(x, t)∂(x1 , t1 )∂(x1 , t1 )j ∗ ∗∗∗j ∂g2 (x2 , t2 )1j ∂e1 (p )2j ∂e2 (p )=λ+λ,∆2 ·∂(x, t)∂(x2 , t2 )∂(x2 , t2 )такие векторы, что λ2j ≥ 0, λ2j , e2 (p∗ ) = 0 для всех j. Теперь с∆j1где λ1j , λ2jучетом этого и условий трансверсальности (7), (10) легко получить, что приλm = (λ0 , λ1m , λ2m ), гдеd(g2 )λimi=λ +Xλij ,i = 1, 2,j=1набор λm , ψm , µ1 , µ̄2 , ν, который, очевидно, в силу (13) нетривиален, удовлетворяет принципу максимума. Более того, этот набор снова удовлетворяет (13) (см.рассуждения выше).Докажем iv).
Возьмем t∗ ∈ (t∗1 , t∗2 ). Если J(t∗ ) = ∅, то µ̄2 (t) постояннавблизи t∗ . Если J(t∗ ) 6= ∅, тогда из Леммы 3 следует существование C, δ, независящих от t∗ , таких, что для функции µ̄2 (t) справедливы оценки корневогороста справа и слева (считаем, что ε(t∗ ) = +∞, d(g2 ) = 1). Тогда очевидно, что функция µ̄2 (t) удовлетворяет этим оценкам (с теми же самыми C, δ вкаждой точке t∗ ∈ T ). Следовательно, для любой точки s ∈ T имеемp|µ̄2 (t) − µ̄2 (s)| ≤ C |t − s| ∀ t ∈ (s − δ, s + δ).36Интервалы (s − δ, s + δ) образуют покрытие T .
Таким образом, после выбораконечного подпокрытия для a < b и t ∈ [a, b] (где a и b принадлежат двумсоседним замкнутым полуинтервалам вида [s − δ, s] или [s, s + δ], а t берется изих пересечения) справедливо следующее неравенство|µ̄2 (a) − µ̄2 (b)| = |µ̄2 (a) − µ̄2 (t) + µ̄2 (t) − µ̄2 (b)| ≤ |µ̄2 (a) − µ̄2 (t)| + |µ̄2 (t) − µ̄2 (b)|pp√ p√ p≤ C |a − t| + C |t − b| ≤ 2C |a − t| + |t − b| ≤ 2C |a − b|.Таким образом, благодаря тому, что δ не зависит от s, получаем (14).
Теоремадоказана.1.3Ослабление условий регулярностиВ этом разделе ослабим условия регулярности, предложенные в предыдущемразделе, но таким образом, чтобы по-прежнему гарантировать гельдеровостьфункции µ2 . Такое ослабление условий регулярности (и тем самым усилениеТеоремы 2) предполагает, что фазовое ограничение g2 скалярно. В случае векторной функции g2 ниже потребуются дополнительные предположения.Предположение (А) Существует целое число N > 0 и точки ti ∈ (t∗1 , t∗2 ),i = 1, ..., N такие, что t1 < t2 < ...
< tN , отображение J(t) постоянно длякаждого интервала (t∗1 , t1 ), (ti , ti+1 ), i = 1, ..., N − 1 и (tN , t∗2 ). Точка ti или t∗1 , t∗2называется точкой стыка, если отображение J(t) не является постоянным влюбой из ее окрестностей.ПустьG + (t) := {u ∈ U (t) : Γj2 (u, t) ≥ 0 ∀ j ∈ J(t)},G − (t) := {u ∈ U (t) : Γj2 (u, t) ≤ 0 ∀ j ∈ J(t)}.Далее будем считать, что априори справедливы следующие условия:U + (t) ∩ G − (t) 6= ∅, U − (t) ∩ G + (t) 6= ∅ ∀ t ∈ T.Следующее утверждение указывает на два важных класса задач.(35)37Предложение 6 Пусть выполняется хотя бы одно из следующих двух условий.a) |J(t)| ≤ 1 ∀ t;b) управление u∗ (t) кусочно-непрерывно, и выполняется Предположение(A).Тогда справедливо (35).Доказательство очевидно.
Оно следует из допустимости траектории x∗ (t).Следующее определение является ослаблением условий регулярности посравнению с Oпределением 9.Определение 12 Допустимый процесс (p∗ , x∗ , u∗ ) называется слабо регулярным, если для любых t ∈ T , и u ∈ U(t), векторы∂ri∗∂u (x (t), u, t),∂Γj1∗∂u (x (t), u, t),j = 1, ..., d(g1 ),i ∈ I(x∗ (t), u, t) линейно независимы, и существует векторi∗∗d = d(u, t) ∈ Rm такой, что d ∈ ker ∂r∂u (x (t), u, t) ∀ i ∈ I(x (t), u, t), d ∈∗1ker ∂Γ∂u (x (t), u, t),*+∂Γj2 ∗(x (t), u, t), d > 0 ∀ j ∈ J(x∗ (t), t) : Γj2 (x∗ (t), u, t) = 0.∂u(36)В общем случае, когда множество U(t) трудно вычислимо, достаточно проверить условие (36) для всех u ∈ U (x∗ (t), t). Кроме того, очевидно следующеепростое утверждение.Замечание 1 Любой допустимый процесс задачи (1) является слабо регулярным, если для любых x, t и любого u ∈ U (x, t), векторы1, ..., d(g1 ),∂ri∂u (x, u, t),∂Γj1∂u (x, u, t),j =i ∈ I(x, u, t) линейно независимы, и существует векiтор d = d(x, u, t) ∈ Rm такой, что d ∈ ker ∂r∂u (x, u, t) ∀ i ∈ I(x, u, t), d ∈1ker ∂Γ∂u (x, u, t), и*∂Γj2∂u+(x, u, t), d> 0 ∀ j ∈ J(x, t) : Γj2 (x, u, t) = 0.38Предложение 7 Предположим, что выполнены условия (35), и процесс (p∗ ,x∗ , u∗ ) слабо регулярен.Тогда траектория x∗ (t) управляема в концевых точках.Доказательство очевидно и следует непосредственно из определений.Если выполнены условия слабой регулярности для экстремального процесса, то имеет место следующий результат.Теорема 3 Предположим, что допустимый процесс (p∗ , x∗ , u∗ ) экстремален.Пусть концевые ограничения регулярны в точке p∗ , фазовые ограничения согласованы с концевыми ограничениями в точке p∗ , процесс (p∗ , x∗ , u∗ ) слаборегулярен, выполнено условие (35), и имеет место хотя бы одно из следующих условий:1) выполняется Предположение (А);2) |J(t)| ≤ 1 ∀ t.Тогда, для любых множителей Лагранжа λ, ψ, µ, v, отвечающих (p∗ , x∗ , u∗ )в силу принципа максимума, выполнено утверждение Теоремы 2.Замечание 2 В силу Предложения 6 в случае, когда d(g2 ) = 1, Теорема 3не содержит никаких дополнительных предположений по сравнению с Теоремой 2.
Условия слабой регулярности экстремального процесса используютсявместо условий сильной регулярности в смысле Oпределения 9, что делаетпредположения Теоремы 3 слабее, чем отвечающие ей из Теоремы 2. Значит,в скалярном случае утверждение Теоремы 3 содержит в себе утверждениеТеоремы 2.Теорема 3 является развитием результатов из [56] на случай, когда также присутствуют фазовые ограничения типа равенств.
Заметим, что благодаряТеореме 1 и Замечанию 1 можно априори (то есть не вычисляя экстремальныйпроцесс) гарантировать непрерывность µ2 (t). Приведем несколько примеров.39Пример 2 Пусть n = m, r1 , r2 – заданные положительные числа, φ : R2n →R1 , θ : Rn → Rn – заданные гладкие функции. Рассмотрим задачу:Z 1φ(x, u)dt → min,0ẋ = θ(x) + u,|u|2 ≤ r1 , |x|2 ≤ r2 ,x(0) = xA , x(1) = xB .(37)√| θ(x), x | < r1 r2 ∀ x : |x|2 = r2 .(38)Предположим, чтоТогда любой допустимый процесс задачи 37 слабо регулярен.Покажем, что в примере выполнены все предположения, сформулированные в Замечании 1.
Тогда в его силу любой допустимый процесс будет слаборегулярным. Действительно, имеем:g2 (x) = |x|2 − r2 , r(u) = |u|2 − r1 , Γ2 (x, u) = 2x, θ(x) + u .Покажем, что векторы∂r∂u (u)и∂Γ2∂u (x, u)линейно независимы на множестве(x, u) : r(u) = 0, Γ2 (x, u) = 0, g2 (x) = 0.Действительно, имеем, что∂r∂Γ2(u) = 2u,(x, u) = 2x.∂u∂uПоскольку Γ2 (x, u) = 0, то x, u = − θ(x), x . Из (38) имеем, что | x, u | <√√√r1 r2 . Но |x| = r2 , |u| = r1 , и поэтому последнее неравенство влечетлинейную независимость векторов∂r∂u (u)и∂Γ2∂u (x, u).Легко видеть, что выполнены все предположения, сформулированные вЗамечании 1. Поэтому любой допустимый процесс является слабо регулярным.Таким образом, в силу Теоремы 3, для любого экстремального процессанайдется гельдерова функция-множитель Лагранжа µ2 (t).40Пример 3 Пусть n = m, r1 – заданное положительное число, w – заданныйединичный вектор, φ : R2n → R1 , θ : Rn → Rn – заданные гладкие функции.Рассмотрим задачу:Z 1φ(x, u)dt → min,0ẋ = θ(x) + u,2|u|≤r,w,x≤ 0,1x(0) = xA , x(1) = xB .(39)Предположим, что√| θ(x), w | < r1 ∀ x : w, x = 0.(40)Тогда любой допустимый процесс задачи 39 слабо регулярен.Доказательство.
Покажем, что в примере выполнены все предположения, сформулированные в Замечании 1. Тогда в его силу любой допустимыйпроцесс будет слабо регулярен. Действительно, имеем:g2 (x) = w, x , r(u) = |u|2 − r1 , Γ2 (x, u) = w, θ(x) + u .Покажем, что векторы∂r∂u (u)и∂Γ2∂u (x, u)линейно независимы на множестве(x, u) : r(u) = 0, Γ2 (x, u) = 0, g2 (x) = 0.∂r2(u) = 2u, ∂Γ(x,u)=w.ПосколькуΓ(x,u)=0,тоw,u=Действительно, ∂u2∂u√√− θ(x), w . Из (40) имеем, что | w, u | < r1 , a поскольку |w| = 1 и |u| = r1 ,то векторы∂r∂u (u)и∂Γ2∂u (x, u)не коллинеарны.Легко видеть, что выполнены все предположения, сформулированные вЗамечании 1. Поэтому любой допустимый процесс является слабо регулярным.Таким образом, в силу Теоремы 3, для любого экстремального процессанайдется гельдерова функция-множитель Лагранжа µ2 (t).41Пример 4 Пусть n = m, k < m, a – заданное положительное число, w –заданный единичный вектор, φ : R2n → R1 , θ : Rn → Rn – заданные гладкиефункции.