Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 51
Текст из файла (страница 51)
Естественно возникают ограничения, при которых П оказывается замкнутым множеством: насколько это существенно, мы видели, решая задачу Ньютона (и. 1.6.2). Уже в простейших задачах оптимального управления встречаются ограничения вида )и(1))(1 (см.
задачу о быстродействии в п. 1.6.3). В этом последнем случае множеством допустимых управлений оказывается замкнутый шар в сложно устрое»(ном пространстве Ь„(Л), и в типичных случаях оптимальное управление лежит на границе этого шара (из сказанного в п. 1.6.3 видно, что при ограничении ) и (г) ~ ( 1 задача не имела бы решения: минимальное время достигается при управлении, где почти всюду )и(1) (= 1), а эта последняя чрезвычайно негладкая и «многогранная», а точнее, «бесконечногранная».
Все это затрудняет применение обычных методов дифференциального исчисления, и условия гладкости по управлению оказываются довольно часто неестественными. В связи с этим мы не будем больше требовать существования производных Г,„, ~р, и т. п. и даже само множество П возможных значений управления будем считать произвольным топологическим пространством, не обладающим, вообще говоря, линейной структурой.
Отсутствие производных по и — второе отличие новой задачи от старой. Желая оггенить это обстоятельство, функционалы, входящие в формулировку задачи, мы обозначаем новой буквой, хотя по виду они совпадают с функционалами Больца. Наконец, последнее отличие — это отказ от непрерывности управления. В основном это связано с тем, что в классе непрерывных управлений задача часто не имеет решения (например, в большинстве задач, где П дискретно или в задаче о быстродействии п. 1.6.3).
Следует, впрочем, отметить, что переход к рассмотрению «ломаных экстремалей» (что соответствует кусочно-непрерывным управлениям) делается и в классическом вариациоином исчислении (см. п. 1.4,3). Сама же возможность свобод- 315 ного выбора управления внутри множества П (а ею ь)ы уже воспользовались, «выпуская» игольчатые вариации при выводе условия Вейерштрасса в п. 1.4.4,и при доказательстве принципа максимума в простейшей ситуации (и. 1.5.4)), порождает скрытую выпуклость по управлениям, с чем связана форма основного условия — принципа максимума (см. (10), (11) в п. 4.2.2), напоминающая соответствующее условие в задачах выпуклого программирования.
Здесь эта связь не будет вскрыта в полном объеме. Мы сделаем это в следукяцем параграфе, правда в частном варианте общей задачи. Итак, рассмотрим экстремальную задачу .7, (х ( ), и ( ), 1„ 1,) = 11 =~~,((, х(1), и(1))с(1+ф,(с„х(1,), 1„х((с)) 1п1, (1) сс х=ср(1, .х(1), и(1)), и(Ф) ЕП, (2) 5с(х( ), и ( ), 1„1,) = ~ Гс (1, х(1), иЯ) с(1+ и +фс((„х(1,), Ф,, х(гс))~~0; 1=1, 2, ..., т. (3) Здесь 11: бХП вЂ” К, фс:Ю вЂ” й, 1=0, 1, ..., т, чс: бхП ' й", где б и М7 — открытые множества в пространствах КХ11" и Й Х Й" Х ЙХЙ" соответственно, П— произвольное топологическое пространство. Знак ~ имеет тот же смысл, что в Я 3.2 и 4.1.
Все фУнкции 11, ф, с1с предполагается по крайней мере непрерывными. четверку (х( ), и( ), („11) будем называть управляемым арос(есоом в задаче (1) — (3), если: а) управление и ( ) [1„(с) — П вЂ” кусочно.непрерывная функция. Ее значения в точках разрыва существенной роли не играют; для определенности будем считать, что и( ) непрерывна справа для 1, ~1 сс и слева в точке 11. б) фазоаая трооктория х( ): [1„1с) — К" непрерывна и ее график лежит в б Г= ((1, х (1))11.
<1< 11) с б. в) для всех (Е [1„1Д, кроме, быть может, точек разрыва управления и( ), функция х( ) удовлетворяет дифференциальному уравнению х(с) =ср(1, х(1), и (1)) 316 (в этом случае мы говорим, что х( ) соответствует управлению и( ); легко видеть, что в точках разрыва управления х( ) имеет производные слева и справа). Управляемый процесс называется допустимым, если удовлетворяются условия (3). Допустимый управляемый процесс (х( ), й( ), 1„1,) называется (локально) оптимальным, если найдется такое е > О, что для всякого допустимого управляемого процесса (х( ), и( ), 1„1,) такого, что /г',— 1 [<а, Й=О, 1 и !хЯ вЂ” хЯ!<а для всех 1 Е [1„1,] П [1„1,] (4) выполняется неравенство Я«(х(.), и(.), 1„1,) Р«(х( ), и(.), („1,).
(5) Заметим, что и здесь произошло измене)«ие по сравнению с задачей Лагранжа: мы не требуем больше близости производных х(1) и х(1). В классическом вариационном исчислении это соответствует переходу от слабого экстремума к сильному (см. п. 1.4.3). Поучительно сравнить задачу Лагранжа и задачу оптимального управления в том случае, когда Ц = К' и в п. 4.1.1 У=бх»1". При этом предположении: Каждый допустимый управляемый процесс (х( ), и( ), 1„1,) задачи Лагранжа является таковым и для задачи, оптимального управления (точнее, превращается в таковой при ограничении и( ) на [1„1,]). Это означает, что произошло расширение задачи (ср, п.
1.4.3). Следовательно, значение задачи оптимального управления не больше значения задачи Лагранжа (!пру, < !п! З,). Впрочем, при достаточно естественных предположениях относительно функций ~о ф, и ~р обе эти величины совпадают (в тривиальном случае, когда х=и, мы доказали это в лемме «о округлении углов» в п. 1.4.3). Если !и! 7«< !п1З„то, как легко видеть, решения обеих задач могут существовать или нет независимо друг от друга.
Если же значения задач равны, то возможно одно из трех: а) Задача Лагранжа имеет решение: !п(З,=З,(х( ), и( ), 1„(«). Тогда та же четверка является н решением ЗП задачи оптимального управления, поскольку 7,(х( ), и( ), 1 (д~йч(х( ), и( ), 1„К,)= = 1п1 З, = Ы 3,.
б) Задача Лагранжа не имеет решения, а задача оптимального управления имеет: !п1 3, достигается на кусочно-гладкой кривой х( ). Такую ситуацию мы наблюдали в примере (6) п. 1.4.3 (при я=и переход от класса С~ к классу КС' как раз и соответствует переходу к задаче оптимального управления). в) Обе задачи не имеют решения: нижняя грань функционала не достигается и при расширении области его определения. Так обстоит дело в примере Больца (п.
1.4.3). В предыдущих рассуждениях молчаливо предполагалось, что речь идет о минимизации по всему классу допустимых управляемых процессов. Однако обычно при рассмотрении экстремальных задач мы придерживаемся локальной точки зрения, что, кстати сказать, отражено и в наших определениях. В п. 4.1.1 допустимый управляемый процесс (х( ), й(.), 1,. 1,) был назван оптимальным (в слабом смысле), если он доставляет минимум функционалу З, в некоторой С'-окрестности по х( ) н С-окрестности по и( ). Теперь же определение оптимальности предполагает, что минимум Ю, имеет место в более широкой окрестности, описываемой неравенствами (4).
Фактически это С-окрестность по х( ), а ограничения на управления не накладываются вовсе. Как уже было сказано, в классической ситуации это был бы сильный минимум. Поэтому локальное решение задачи Лагранжа может не быть оптимальным процессом для задачи оптимального управления. Если же в оптимальном процессе (х( ), и(.), 1„, 1,) управление й( ) непрерывно, то при наших обычных предположениях относительно функций, входящих в задачу, этот процесс будет и локальным решением задачи Лагранжа.
Ограничения (3) не являются самыми общими, кото. рые приходится рассматривать в задачах оптимального управления. Мы, например, совсем оставляем в стороне так называемые фазовыг ограничения вида (г, х (1)) Е Р, 1, ( 1 ( 1„ (6) 318 где Р— некоторое подмножество в Кх П". Конечно, если Р открыто, то, заменив в определении управляемого процесса б на 6 0Р и уменьшив, если нужно, е в (4), мы автоматически учтем ограничения (6).
Поэтому основной интерес представляет случай, когда Р не является открытым множеством и оптимальная фазовая траектория х(() выходит для некоторых (на границу Р (см. рис. 37; минимизируется длина кривой, заштрихованная часть плоскости не принадлежит Р). Это приводит к существенно новым эффектам, в частности, к необходимости Рис. 37. ввести в уравнение Эйлера — Лагранжа обобщенную функцию — производную не абсолютно непрерывной меры (или заменить это дифференциальное уравнение интегральным с интегралом Стилтьеса по этой мере).
4.2.2. Формулировка принципа максимума. Принцип Лагранжа в задаче оптимального управления. Рассмотрим снова задачу 2.(.(), (). 1.. 1,)=~Ы, (1) (1))~1+ со +срО(10 х(1 ) 11' х(11)) сп1 (1) х=ср(1, х(1), и(1)), и(1)ЕП, (2) с, 2,(х( ), и( ), 1„1,)= ~1,(с, х(1), и(1)) с(1+ +ф,((„х(1,), Г„х((с))~~0, с'=1, 2, ..., лс. (3) Как и в п. 4.1.1, функцией Лагранжа этой задачи называется функция .9'(х( ), и( )~ (о (с', Р( ), ) )о)=~ Е,с(1+1, (4) с, 319 где Л,611 Л=(Л.
Л )сй"* Е(1, х, х, и)= ~ ЛД (1, х, и)+ р(1)(х — ~у(1, х, и)), (5) с=о 1((о хо~ (мх1)= Х ЛРРк((ы хо (о х1) ° (6) Функция р( ): 11„1,] — 11"' предполагается непрерывной. Там, где это будет нужно, мы будем считать, что р( ) определена на более итироком промежутке, чем 11„1,], продолжая ее за пределы этого отрезка произвольно, но с сохранением непрерывности. Функция р( ) и числа Л,, Л, называются множителями Лагранжа задачи (1) — (3), функция (5) — лагранжианом, (6) — терминантоМ. Наконец, функцию Н ($, х, и, р) = Ел х — Е = рр ((, х, и) — ~ ЛД (1, х, и) (7) с=о мы будем называть функцией Понтрягина. Как и обычно, будут использоваться обозначения Е„Я=Е„(1, х(1), х(1), й(1)), ~р(1) =~р(1, х(1), й(1)), 1хь =1чь ((ы х ((ь)~ (о х (11)) и т.
д. Теорема (принцип максимума Понтрягин а). Пусть 0 — открытое множество в пространстве М Х К", УР— открытое множество в пространстве 11 Х 1(" Х х11 хК", П вЂ” произвольное топологическое пространство; функции 1,: бхП вЂ” й, 1=0, 1, ..., т, и ~р: ОхП вЂ” 11" и их частные производные по х непрерывны в 6хП, а функции ф,: 1(г — й, 1=1, ..., т, непрерывно дифференцируемы в (ч. Если (х( ), й( ), т„, Ъ,) — оптимальный процесс для задачи (1) — (3), то найдутся множители Лагранжа Х,>О, р(), Л=(Л„..., Л), не равные одновременно нулю и такие, что: а) выполнены условия стационарности и принцип ми.
нимума для функции Лагранжа: 320 по х( ) условие стационарности (Я,ь1=0) — — „', Е;(1)+т.„(1) =О, (8) Ез А)=( — 1)ь(... й=о, 1; (9) по и( ) принцип минимума в лагранжевой форме 1. (1) = 1, (1, х (1), х (1), и ( 1) ) = = ш(п Е. (1, х (1), х (1), о), (10) сея или в гамильтоновой (понтрягинской) форме в виде принципа максимума Й(1) =ыН(г', х(1), и Я, р(1)) =— =шахН(1, х(1), о, р(1)); (11) лев при этом функция Й(1) непрерывна на отрезке [1„1,]; по (ь условия стационарности Х~ =О, й=О, 1; (12) б) выполнено условие согласования знаков Х, ==-:0; в) выполнены условия дополняюицей нежесткости (13) Х,.у;(х( ), и( ), У„(,)=0, 1'=1, 2, ..., т (14) (как и в предыдущем параграфе неравенства (13) означают, что Х,.
эО, если в условии (3) 7, е=,'О; Х,.~О, если в (3) Ю1) 0 и Х, может иметь любой знак, если У;=0). Утверждение о существовании множителей Лагранжа, удовлетворяющих совокупности условий а) — в), кратко называется нами принципом Лагранжа для задачи оптимального управления (1) — (3) или принципом максимума Понтрягина. Как и раньше, это утверждение находится в полном соответствии с общим принципом Лагранжа из п. 3.1.5. Поскольку функция Лагранжа .9' является функцией трех аргументов: х( ), и( ) и (1„1,), 11 В, М. Алексеев и ДР.