Диссертация (1155108), страница 2
Текст из файла (страница 2)
Скорость в таких задачах рассматриваетсякак фазовая переменная. Если модуль скорости ограничен сверху какой-то константой (что вполне естественно для задач кинематического управления), то это8приводит к фазовым ограничениям и к мере-множителю Лагранжа в необходимых условиях оптимальности. Методы, которые обычно используются длярешения таких задач, как правило, подразумевают абсолютную непрерывностьили даже гладкость этой меры. Поэтому предлагаемое направление исследования может представлять интерес не только с чисто теоретической точки зрения,но и оказаться полезным для инженерных приложений.Положения, выносимые на защиту.• Получены достаточные условия непрерывности функции распределениямеры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенстви неравенств.• Получены достаточные условия липшицевости функции распределения мерымножителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств.• Изучены свойства кратчайшей кривой в сложной области, и в частностидоказано, что кратчайшая кривая в сложной области является функциейкласса W2,∞ .
Получено уравнение кратчайшей кривой для сложной области в общем случае.• Доказан модифицированный вариационный принцип Экланда, и исследованы его применения к изучению свойств метрической регулярности отображения банахова пространства в евклидово пространство относительнозамкнутого подмножества евклидового пространства. Изучены приложения к теории задач оптимального управления с ограничениями.Степень достоверности.Достоверность обусловлена строгостью математических доказательств ииспользованием апробированных научных методов.9Апробация работы.Основные результаты диссертации докладывались автором на следующихсеминарах и конференциях:• научный семинар “Численные методы в оптимизации и теории управления”отдела методов нелинейного анализа ФИЦ ИУ РАН под руководствомВ.
А. Березнева,• научный семинар “Методы оптимизации” кафедры оптимального управления ВМК МГУ под руководством профессора Ф. П. Васильева,• научный семинар “Экстремальные задачи и нелинейный анализ” кафедрынелинейного анализа и оптимизации факультета физико-математическихнаук РУДН под руководством профессора А. В. Арутюнова,• международная конференция “Воронежская зимняя школа С.Г. Крейна –2016” (г. Воронеж, 2016),• международная научная конференция “Ломоносов – 2016” (г.
Москва, 2016),• научная конференция “Ломоносовские чтения” (г. Москва, 2016).Публикации.Основные результаты, полученные в диссертации, опубликованы в 9 печатных работах (см. [20] – [28]), 5 из которых изданы в журналах, рекомендованных ВАК (см. [21] – [24], [26]). Все результаты, выносимые на защиту,получены автором самостоятельно.Структура и объем диссертации.Диссертация, изложена на 85 страницах, состоит из введения, трех глав,разбитых на параграфы, списка условных обозначений и списка литературы,содержащего 78 наименований.10Благодарность.Автор выражает искреннюю благодарность профессору Российского университета дружбы народов Араму Владимировичу Арутюнову и старшему научному сотруднику ФИЦ ИУ РАН Дмитрию Юрьевичу Карамзину за постановку задачи, постоянное внимание к работе, ценные замечания и поддержку.111Исследование регулярных экстремалей в задачахоптимального управления с фазовыми ограничениямиВ главе исследуется свойства непрерывности и абсолютной непрерывности мерымножителя Лагранжа, возникающей в принципе максимума Понтрягина длязадачи с фазовыми ограничениями типа равенств и неравенств.
Ниже показано, что при определенных условиях регулярности функция распределения этоймеры является гельдеровой, а если же вдобавок выполняется усиленное условие Лежандра, то даже липшицевой. Также рассматриваются примеры задачуправления с фазовыми ограничениями, для которых можно гарантировать apriori (то есть без вычисления экстремального процесса), что соответствующаямера непрерывна.Результаты этой главы развивают некоторые результаты работы [56] наболее общий, чем рассмотренный в [56], случай задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств.
В главе активноиспользуется аппарат теории функций действительного переменного и в частности такое понятие, как замыкание функции по мере.Вопросом непрерывности меры-множителя интересовались многие исследователи как у нас в стране, так и за рубежом. Отметим работы [9], [10], [12],[58], [63], [64], [67]. Свойства непрерывности меры-множителя имеют важноезначение для приложений и методов численного решения задач оптимальногоуправления с фазовыми ограничениями (см., например, [59], [60]).
Эти свойстванеобходимо учитывать при построении новых оптимизационных методов решения таких задач. Численным методам решения задач оптимального управленияв целом посвящено большое число работ (см., например, [13] – [16] и библиографию там).121.1Постановка задачи и основные определенияРассмотрим следующую задачу оптимального управленияZ t2Φ(x1 , t1 , t2 , u(·)) := e0 (p) +ϕ0 (x, u, t)dt → min,t1ẋ = ϕ(x, u, t), t ∈ [t1 , t2 ], t1 < t2 ,g (x, t) = 0, g (x, t) ≤ 0,12r(x, u, t) ≤ 0,e1 (p) = 0, e2 (p) ≤ 0,p = (x1 , x2 , t1 , t2 ).(1)Будем считать, что вектор-функции r, ei , gi принимают значения в евклидовых пространствах размерности d(r), d(ei ), d(gi ) соответственно, функцииe0 , ϕ0 , ϕ являются скалярными, ẋ =dxdt ,t ∈ [t1 , t2 ] – время (концы времениt1 и t2 не предполагаются фиксированными), x есть фазовая переменная изn-мерного евклидового пространства Rn , и u ∈ Rm – переменная управления.Вектор p ∈ Rn × Rn × R1 × R1 называется концевым.
Управляющая функция,или просто управление, есть измеримая существенно ограниченная функцияu(·), т.е. элемент пространства L∞ ([t1 , t2 ]).Предположим, что функции e0 , ei , ϕ0 , ϕ непрерывно дифференцируемы,функции gi дважды непрерывно дифференцируемы, а функции ϕ, ϕ0 , r дваждынепрерывно дифференцируемы по u для всех x, t.Определение 1 Пусть u(t), t ∈ [t1 , t2 ] – управление, а x(t), t ∈ [t1 , t2 ] – соответствующая этому управлению траектория, то есть ẋ = ϕ(x(t), u(t), t),и p – соответствующий концевой вектор. Допустимым процессом будем называть тройку (p, x, u), если она удовлетворяет концевым ограничениям: e1 (p) = 0, e2 (p) ≤ 0, смешанным ограничениям: r(x(t), u(t), t) ≤ 0 для п.в.
t ∈ [t1 , t2 ], и фазовым ограничениям: g1 (x(t), t) = 0, g2 (x(t), t) ≤ 0 ∀ t ∈ [t1 , t2 ].13Как видно, фазовые ограничения накладываются лишь на фазовую переменную x, а смешанные ограничения и на фазовую переменную x, и на переменную управления u. Оказывается, что естественные предположения регулярности (см. ниже Определение 4) уже заведомо гарантируют абсолютнуюнепрерывность соответствующей меры-множителя Лагранжа, отвечающей смешанному ограничению в силу принципа максимума. Более того, ее функцияраспределения принадлежит классу W1,∞ . Эти предположения регулярности,к сожалению, не выполнены для фазовых ограничений, что влечет определенные сложности при исследовании свойств соответствующей меры-множителяЛагранжа.
Поэтому, несмотря на то, что смешанные ограничения формальнопредставляют собой более широкий класс ограничений по сравнению с фазовыми ограничениями, они тем не менее, благодаря условию регулярности, классифицируются в другой тип ограничений. Именно исследованию свойств мерымножителя Лагранжа, отвечающей фазовым ограничениям, и посвящена этаглава.Определение 2 Будем говорить, что допустимый процесс оптимален, еслизначение функционала Φ является наименьшим на множестве всех допустимых процессов.Определение 3 Концевые ограничения называются регулярными в точке p =(x1 , x2 , t1 , t2 ): e1 (p) = 0, e2 (p) ≤ 0, еслиD ∂ejE∂e1∂e12rank(p) = d(e1 ), ∃ d ∈ ker(p) :(p), d > 0 ∀ j : ej2 (p) = 0.∂p∂p∂p(Верхние индексы означают координаты вектора или вектор-функции).Определение 4 Смешанные ограничения называются регулярными, если длялюбых (x, u, t): r(x, u, t) ≤ 0 существует вектор q = q(x, u, t) такой, что j∂r(x, u, t), q > 0 ∀ j : rj (x, u, t) = 0.(2)∂u14Определение 5 Фазовые ограничения называются регулярными, если для любых (x, t): g1 (x, t) = 0, g2 (x, t) ≤ 0, имеет местоrank∂g1∂g1(x, t) = d(g1 ), ∃ z = z(x, t) ∈ ker(x, t) :∂x∂x ∂g2j(x, t), z > 0 ∀j : g2j (x, t) = 0.∂xОпределение 6 Фазовые ограничения называются согласованными с концевыми ограничениями в точке p∗ , если существует число ε > 0 такое, что{p ∈ R2n+2 : |p∗ − p| ≤ ε, e1 (p) = 0, e2 (p) ≤ 0} ⊆{p : g1 (x1 , t1 ) = 0, g2 (x1 , t1 ) ≤ 0, g1 (x2 , t2 ) = 0, g2 (x2 , t2 ) ≤ 0}.Определение 7 Будем говорить, что в концевых точках выполнены условияуправляемости относительно фазовых ограничений, если для s = 1, 2∃ ϕs ∈ conv ϕ(x∗s , U (x∗s , t∗s ), t∗s ) :+#"*jj∂g∂g2 ∗ ∗(−1)s(xs , ts ), ϕs + 2 (x∗s , t∗s ) > 0 ∀ j ∈ J(x∗s , t∗s ).∂x∂tПусть (p∗ , x∗ , u∗ ) допустимый процесс в задаче (1).
Здесь p∗ = (x∗1 , x∗2 , t∗1 , t∗2 ).Введем необходимые обозначения:J(x, t) = {j : g2j (x, t) = 0}, I(x, u, t) = {i : ri (x, u, t) = 0},Γi (x, u, t) =∂gi∂gi(x, t)ϕ(x, u, t) +(x, t), i = 1, 2,∂x∂tU (x, t) = {u ∈ Rm : r(x, u, t) ≤ 0, Γ1 (x, u, t) = 0},T = [t∗1 , t∗2 ], Γ = (Γ1 , Γ2 ), g = (g1 , g2 ).Пусть ξ(t) : R → Rm заданная измеримая ограниченная функция.Определение 8 Замыканием справа по мере функции ξ(t) в точке τ называется множество Ξ+ (τ ) таких векторов u ∈ Rm что` {t ∈ [τ, τ + ε] : ξ(t) ∈ Bε (u)} > 0 ∀ ε > 0.15Здесь, Bε (u) = {v ∈ Rm : |v − u| ≤ ε}, и ` – мера Лебега на R. Соответственно, замыкание слева – это множество Ξ− (τ ) таких векторов u ∈ Rmчто` {t ∈ [τ − ε, τ ] : ξ(t) ∈ Bε (u)} > 0 ∀ ε > 0.Многозначное отображение Ξ(t) := Ξ− (t) ∪ Ξ+ (t), где t ∈ R, называется замыканием ξ(t) по мере Лебега.1Рассмотрим некоторые свойства замыкания по мере. Обозначим через U(t)замыкание по мере функции u∗ (t).