В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 52
Текст из файла (страница 52)
1.4.3). Следовательно, значение задачи оптимального управления не больше значения задачи Лагранжа (!пру, < !п! З,). Впрочем, при достаточно естественных предположениях относительно функций ~о ф, и ~р обе эти величины совпадают (в тривиальном случае, когда х=и, мы доказали это в лемме «о округлении углов» в п. 1.4.3). Если !и! 7«< !п1З„то, как легко видеть, решения обеих задач могут существовать или нет независимо друг от друга.
Если же значения задач равны, то возможно одно из трех: а) Задача Лагранжа имеет решение: !п(З,=З,(х( ), и( ), 1„(«). Тогда та же четверка является н решением ЗП задачи оптимального управления, поскольку 7,(х( ), и( ), 1 (д~йч(х( ), и( ), 1„К,)= = 1п1 З, = Ы 3,. б) Задача Лагранжа не имеет решения, а задача оптимального управления имеет: !п1 3, достигается на кусочно-гладкой кривой х( ). Такую ситуацию мы наблюдали в примере (6) п. 1.4.3 (при я=и переход от класса С~ к классу КС' как раз и соответствует переходу к задаче оптимального управления).
в) Обе задачи не имеют решения: нижняя грань функционала не достигается и при расширении области его определения. Так обстоит дело в примере Больца (п. 1.4.3). В предыдущих рассуждениях молчаливо предполагалось, что речь идет о минимизации по всему классу допустимых управляемых процессов. Однако обычно при рассмотрении экстремальных задач мы придерживаемся локальной точки зрения, что, кстати сказать, отражено и в наших определениях.
В п. 4.1.1 допустимый управляемый процесс (х( ), й(.), 1,. 1,) был назван оптимальным (в слабом смысле), если он доставляет минимум функционалу З, в некоторой С'-окрестности по х( ) н С-окрестности по и( ). Теперь же определение оптимальности предполагает, что минимум Ю, имеет место в более широкой окрестности, описываемой неравенствами (4).
Фактически это С-окрестность по х( ), а ограничения на управления не накладываются вовсе. Как уже было сказано, в классической ситуации это был бы сильный минимум. Поэтому локальное решение задачи Лагранжа может не быть оптимальным процессом для задачи оптимального управления. Если же в оптимальном процессе (х( ), и(.), 1„, 1,) управление й( ) непрерывно, то при наших обычных предположениях относительно функций, входящих в задачу, этот процесс будет и локальным решением задачи Лагранжа.
Ограничения (3) не являются самыми общими, кото. рые приходится рассматривать в задачах оптимального управления. Мы, например, совсем оставляем в стороне так называемые фазовыг ограничения вида (г, х (1)) Е Р, 1, ( 1 ( 1„ (6) 318 где Р— некоторое подмножество в Кх П". Конечно, если Р открыто, то, заменив в определении управляемого процесса б на 6ПР и уменьшив, если нужно, е в (4), мы автоматически учтем ограничения (6). Поэтому основной интерес представляет случай, когда Р не является открытым множеством и оптимальная фазовая траектория х(() выходит для некоторых (на границу Р (см.
рис. 37; минимизируется длина кривой, заштрихованная часть плоскости не принадлежит Р). Это приводит к существенно новым эффектам, в частности, к необходимости Рис. 37. ввести в уравнение Эйлера — Лагранжа обобщенную функцию — производную не абсолютно непрерывной меры (или заменить это дифференциальное уравнение интегральным с интегралом Стилтьеса по этой мере). 4.2.2.
Формулировка принципа максимума. Принцип Лагранжа в задаче оптимального управления. Рассмотрим снова задачу 2.(.(), (). 1.. 1,)=~Ы, (1) (1))~1+ со +срО(10 х(1 ) 11' х(11)) сп1 (1) х=ср(1, х(1), и(1)), и(1)ЕП, (2) с, 2,(х( ), и( ), 1„1,)= ~1,(с, х(1), и(1)) с(1+ +ф,((„х(1,), Г„х(1с))~~0, с'=1, 2, ..., лс. (3) Как и в п. 4.1.1, функцией Лагранжа этой задачи называется функция .9'(х( ), и( )~ (о (с', Р( ), ) )о)=~ Е,с(1+1, (4) с, 319 где Л,611 Л=(Л. Л )сй"* Е(1, х, х, и)= ~ ЛД (1, х, и)+ р(1)(х — ~у(1, х, и)), (5) с=о 1((о хо~ (мх1)= Х ЛРРк((ы хо (о х1) ° (6) Функция р( ): 11„1,] — 11"' предполагается непрерывной. Там, где это будет нужно, мы будем считать, что р( ) определена на более итироком промежутке, чем 11„1,], продолжая ее за пределы этого отрезка произвольно, но с сохранением непрерывности.
Функция р( ) и числа Л,, Л, называются множителями Лагранжа задачи (1) — (3), функция (5) — лагранжианом, (6) — терминантоМ. Наконец, функцию Н ($, х, и, р) = Ел х — Е = рр ((, х, и) — ~ ЛД (1, х, и) (7) с=о мы будем называть функцией Понтрягина. Как и обычно, будут использоваться обозначения Е„Я=Е„(1, х(1), х(1), й(1)), ~р(1) =~р(1, х(1), й(1)), 1хь =1чь ((ы х ((ь)~ (о х (11)) и т. д. Теорема (принцип максимума Понтрягин а). Пусть 0 — открытое множество в пространстве М Х К", УР— открытое множество в пространстве 11 Х 1(" Х х11 хК", П вЂ” произвольное топологическое пространство; функции 1,: бхП вЂ” й, 1=0, 1, ..., т, и ~р: ОхП вЂ” 11" и их частные производные по х непрерывны в 6хП, а функции ф,: 1(г — й, 1=1, ..., т, непрерывно дифференцируемы в (ч. Если (х( ), й( ), т„, Ъ,) — оптимальный процесс для задачи (1) — (3), то найдутся множители Лагранжа Х,>О, р(), Л=(Л„..., Л), не равные одновременно нулю и такие, что: а) выполнены условия стационарности и принцип ми.
нимума для функции Лагранжа: 320 по х( ) условие стационарности (Я,ь1=0) — — „', Е;(1)+т.„(1) =О, (8) Ез А)=( — 1)ь(... й=о, 1; (9) по и( ) принцип минимума в лагранжевой форме 1. (1) = 1, (1, х (1), х (1), и ( 1) ) = = ш(п Е. (1, х (1), х (1), о), (10) сея или в гамильтоновой (понтрягинской) форме в виде принципа максимума Й(1) =ыН(г', х(1), и Я, р(1)) =— =шахН(1, х(1), о, р(1)); (11) лев при этом функция Й(1) непрерывна на отрезке [1„1,]; по (ь условия стационарности Х~ =О, й=О, 1; (12) б) выполнено условие согласования знаков Х, ==-:0; в) выполнены условия дополняюицей нежесткости (13) Х,.у;(х( ), и( ), У„(,)=0, 1'=1, 2, ..., т (14) (как и в предыдущем параграфе неравенства (13) означают, что Х,. эО, если в условии (3) 7, е=,'О; Х,.~О, если в (3) Ю1) 0 и Х, может иметь любой знак, если У;=0). Утверждение о существовании множителей Лагранжа, удовлетворяющих совокупности условий а) — в), кратко называется нами принципом Лагранжа для задачи оптимального управления (1) — (3) или принципом максимума Понтрягина.
Как и раньше, это утверждение находится в полном соответствии с общим принципом Лагранжа из п. 3.1.5. Поскольку функция Лагранжа .9' является функцией трех аргументов: х( ), и( ) и (1„1,), 11 В, М. Алексеев и ДР. 321 (9) и (12) — как условия трансверсальности р (1,) +1, = О, — р (1,) + 1„, = 0 и (9а) — Й(Е,)+?и=О, Й(1»)+(и=О.
(12а) Соответствующие преобразования проделываются так же, как в и. 4.1.1, и нет нужды их повторять. В точках разрыва управления в уравнении (8а) надо брать правую производную р,'( ) (левая тоже существует). Непрерывность р( ) и Й( ) в точках разрыва управления (т.е. в точках излома х( )) носит название условия Вебера«трасса — Зрд»«ана. Можно проделать и здесь анализ «на полноту» набора необходимых условий, даваемых сформулированной теоремой.
В сущности он не будет отличаться от того, что было сделано для задачи Лагранжа. Вместо того, чтобы определять и( ) как функцию х( ) и р( ) из условия В, =О, теперь это нужно сделать, исходя из соотношения (10). 4.2.3. Игольчатые вариации, Как и в простейшей ситуации, разобранной нами в п. 1.5.4, основной прием в 322 надлежит рассмотреть три задачи: (а) .У(х( ), и( ), У„1,; р( ), Х, Х,) (п1, (р) 2'(х(-), и( ), 1„1,; р( ), Х, Х») — 1п1, (у) .9 (х( ), и( ), 1„1,; р( ), Х, )»») 1п1.
Задачи (а) и (у) здесь те же самые, что и в п. 4.1.1. Поэтому' и соответствующие условия стационарности по х( ) и по 1» должны выглядеть здесь так же, как и в задаче Лагранжа и это действительно так. Что же касается задачи (р), та это элементарная задача оптимального управления из и.
3.1.4, и принцип минимума (10) .вполне соответствует условию (1) этого пункта. Таким образом, приведенная выше формулировка теоремы действительно согласуется с общим принципом Лагранжа. Обычно условия стационарности (8), (9) и (12) записываются в другой форме: (8) — как уравнение Эйлера— Лагранжа (называемое также сопряженным уравнением) с(р ЯФ= — р(1)'р, Я+ Х, "4 ° (1)' ) и((), 1((т, т+а)„(1) '1 о, г Е 1т, т + а). Соответственно игольчатая вариация х(1; а, т, о) фазо- вой траектории х(1) определяется как решение задачи Коши х=ср(1, х, и(1; а, т, о)), х (т) = х (т).
(2) С точностью до несущественного различия (вместо 1т, т+а) был взят полуинтервал (т — Х, т)) мы рассматривали подобную вариацию в и. 1.5.4. Было обнаружено, что функция х(1; а, т, о) дифференцируема по а и при ()т ее производная у(1)=х ((; О, т, о) является решением уравнения в вариациях У=чъ(()у (3) 11е 323 доказательстве принципа максимума, которое будет из. ложено далее, состоит в замене рассматриваемой нами задачи~оптимального управления некоторой конечномерной экстремальной задачей или, точнее говоря, целым набором таких задач.
Для этого мы включим оптимальный процесс (х( ), й ( ), („ (,) в некоторое специальное семейство управляемых процессов †«пакете игольчатых вариаций †рассмотрим ограничение задачи (1) †(3) п. 4.2.2 на это семейство. Нужное нам Семейство процессов зависит от. следующих параметров: начальные данные ((„х,), конечный момент времени 1,; набор а=(а„..., ай), где все а, ~ 11 достаточно малы; для краткости обозначим а=~~~~~а;; набор т=(т,, ..., тл), где 1, <т;<т,<... «=тх<1„ причем среди т; содержатся все точки разрыва оптимального управления й( ); набор з =--(о„..., ох), где о, ~П. В дальнейшем т и о фиксированы, а (Г„(„х„а) меняются, и по ним мы будем дифференцировать различные функции. Пусть сначала У = 1.