В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 51
Текст из файла (страница 51)
31! с функцией Лагранжа .У(х( ), и(.), 1„1,; р( ), Х, Х,)=) Есй+1, (4) где Е(1, х, х, и)= ~~~, 'ХД(1, х, и)+ 1=о о -! + ~ р~(1)(х,— х,оо)+ро(1)(х,— и) (5) 1=1 и 1((о хо хоо о хо' "о т„хм «о ~ х(*")= = ~~.", Л1фс (Ю„х„х„..., х," ", („х„х„..., хи "). (6) о=о Перефразируя на этот случай теорему и, 4.1.2, по- лучаем необходимое условие экстремума. Теорема. Лусть функции ),: У вЂ” К, 1=0, 1, ..., т, и их частные производные по х, ..., х<о> не- прерывны в открьотом множестве Уо=К1с(Кч)о+", а функции ф,: %' — К, 1=0, 1, ..., т, непрерывно диф- ференцируемы в открытом множестве Ф'~ 11 х((чо)о х Хйх(йо)о, и пусть х( )ЕСо(11, 11о), 1„11~(и(о та- ковы, что (т, х(г), ..., х'о'(1))с)', тра; ((о, х((о), х" о(1о), (м х(У,), ..., х" "'(1,)) ~97.
Если $=(х( ), 1„1,) является локальным решением за. дачи (1), (2), то найдутся множители Лагранжа: Х,) О в задаче на минимум и ~~0 в задаче на максимум, р(.)=-(р,(.), ..., р,(.))~С (Л, (1()-),).=().....„)..), не равные нулю одновременно и такие, что: а) выполнены условия стационарности функции Лаг- ранжа: ПО Х( ) (,Ух(1=0, .Уо(.1= 0) р,(1) =1„(1, х(1), ..., х"'(1)), р,(1)=,Р„-, (1, (1), ", У" (1)) — Р,- (1). 1=2,'..., з, (?) 0 = 1',о> (1, х ~1),, хсо (1)) — р, (1) р,(1„)=( — 1)'1„» и, у=О, 1; 312 2з+т неизвестных. Для их определения мы используем 2з краевых условий (для закрепленных концов) и еще т условий получаем нз условий дополняющей ножесткости и неравенств (1) и (10) (проверьте', что всего из них можно извлечь ровно т равенств).
Аналогично можно проверить, что и в общем случае число уравнений, которые дает теорема, совпадает с числом неизвестных. 2 4.2. Принцип максимума Понтрягина 4.2.1. Постановка задачи оптимального управления, Экстремальная задача, которой посвящен этот параграф, по форме почти совпадает с задачей Лагранжа (1) — (3) п. 4.1.1. Здесь мы встретимся с тем же функционалом, той же дифференциальной связью и с теми же ограничениями типа неравенств, что и раньше.
Отличие новой задачи состоит в том, что в ее формулировке явно выделено ограничение на управление вида и (1) Е П, где П вЂ некотор топологическое пространства. На первый взгляд это не прибавляет ничего нового и даже выглядит менее общим. Действительно, в задаче Лагранжа мы имели дело с условием (1, х(1), и(1)) Е 'г', которому должны были удовлетворять допустимые процессы.
В частном случае, беря г'=бхй, мы расщепляем это условие на два: (1, х(1)) Еб и и(1) ~ П. Однако разделение переменных на фазовые и управление, и выделение ограничений на управление оказалось весьма знаменательным. Вместе с ним выделилась и новая ветвь в теории экстремальных задач, быстро завоевавшая популярность среди прикладников своими возможностями применительно к практическим задачам и позволившая по-новому взглянуть и на классическую теорию. Чем же все это было вызвано? В первую очередь необходимостью исследования задач технического содержания. Разделение фазовых переменных и управления и их связь при помощи дифференциального уравнения— обычная модель для процесса, развивающегося по законам природы (дифференциальное уравнение!), но испытывающего воздействие человека, управляющего этим процессом в соответствии со своими целями и стремящегося сделать его в каком-то смысле оптимальным.
Теперь ясно, что ограничения на управления вида и(1) ЕП свя- 314 заны с ограниченными возможностями воздействовать иа процесс (скажем, с ограниченностью диапазона поворота рулей управляемого аппарата). Если принять за П открытое множество в К', то ничего нового мы действительно не получим.
Однако в технических и иных прикладных задачах множество П ие обязано быть открытым. Зачастую управление может быть даже просто дискретным (включено — выключена). Естественно возникают ограничения, при которых П оказывается замкнутым множеством: насколько это существенно, мы видели, решая задачу Ньютона (и. 1.6.2). Уже в простейших задачах оптимального управления встречаются ограничения вида )и(1))(1 (см. задачу о быстродействии в п. 1.6.3). В этом последнем случае множеством допустимых управлений оказывается замкнутый шар в сложно устрое»(ном пространстве Ь„(Л), и в типичных случаях оптимальное управление лежит на границе этого шара (из сказанного в п.
1.6.3 видно, что при ограничении ) и (г) ~ ( 1 задача не имела бы решения: минимальное время достигается при управлении, где почти всюду )и(1) (= 1), а эта последняя чрезвычайно негладкая и «многогранная», а точнее, «бесконечногранная». Все это затрудняет применение обычных методов дифференциального исчисления, и условия гладкости по управлению оказываются довольно часто неестественными.
В связи с этим мы не будем больше требовать существования производных Г,„, ~р, и т. п. и даже само множество П возможных значений управления будем считать произвольным топологическим пространством, не обладающим, вообще говоря, линейной структурой. Отсутствие производных по и — второе отличие новой задачи от старой. Желая оггенить это обстоятельство, функционалы, входящие в формулировку задачи, мы обозначаем новой буквой, хотя по виду они совпадают с функционалами Больца. Наконец, последнее отличие — это отказ от непрерывности управления.
В основном это связано с тем, что в классе непрерывных управлений задача часто не имеет решения (например, в большинстве задач, где П дискретно или в задаче о быстродействии п. 1.6.3). Следует, впрочем, отметить, что переход к рассмотрению «ломаных экстремалей» (что соответствует кусочно-непрерывным управлениям) делается и в классическом вариационном исчислении (см. п.
1.4,3). Сама же возможность свобод- 315 ного выбора управления внутри множества П (а ею ь)ы уже воспользовались, «выпуская» игольчатые вариации при выводе условия Вейерштрасса в п. 1.4.4,и при доказательстве принципа максимума в простейшей ситуации (и. 1.5.4)), порождает скрытую выпуклость по управлениям, с чем связана форма основного условия — принципа максимума (см.
(10), (11) в п. 4.2.2), напоминающая соответствующее условие в задачах выпуклого программирования. Здесь эта связь не будет вскрыта в полном объеме. Мы сделаем это в следукяцем параграфе, правда в частном варианте общей задачи. Итак, рассмотрим экстремальную задачу .7, (х ( ), и ( ), 1„ 1,) = 11 =~~,((, х(1), и(1))с(1+ф,(с„х(1,), 1„х((с)) 1п1, (1) сс х=ср(1, .х(1), и(1)), и(Ф) ЕП, (2) 5с(х( ), и ( ), 1„1,) = ~ Гс (1, х(1), иЯ) с(1+ и +фс((„х(1,), Ф,, х(гс))~~0; 1=1, 2, ..., т. (3) Здесь 11: бХП вЂ” К, фс:Ю вЂ” й, 1=0, 1, ..., т, чс: бхП ' й", где б и М7 — открытые множества в пространствах КХ11" и Й Х Й" Х ЙХЙ" соответственно, П— произвольное топологическое пространство. Знак ~ имеет тот же смысл, что в Я 3.2 и 4.1.
Все фУнкции 11, ф, с1с предполагается по крайней мере непрерывными. четверку (х( ), и( ), („11) будем называть управляемым арос(есоом в задаче (1) — (3), если: а) управление и ( ) [1„(с) — П вЂ” кусочно.непрерывная функция. Ее значения в точках разрыва существенной роли не играют; для определенности будем считать, что и( ) непрерывна справа для 1, ~1 сс и слева в точке 11.
б) фазоаая трооктория х( ): [1„1с) — К" непрерывна и ее график лежит в б Г= ((1, х (1))11. <1< 11) с б. в) для всех (Е [1„1Д, кроме, быть может, точек разрыва управления и( ), функция х( ) удовлетворяет дифференциальному уравнению х(с) =ср(1, х(1), и (1)) 316 (в этом случае мы говорим, что х( ) соответствует управлению и( ); легко видеть, что в точках разрыва управления х( ) имеет производные слева и справа).
Управляемый процесс называется допустимым, если удовлетворяются условия (3). Допустимый управляемый процесс (х( ), й( ), 1„1,) называется (локально) оптимальным, если найдется такое е > О, что для всякого допустимого управляемого процесса (х( ), и( ), 1„1,) такого, что /г',— 1 [<а, Й=О, 1 и !хЯ вЂ” хЯ!<а для всех 1 Е [1„1,] П [1„1,] (4) выполняется неравенство Я«(х(.), и(.), 1„1,) Р«(х( ), и(.), („1,). (5) Заметим, что и здесь произошло измене)«ие по сравнению с задачей Лагранжа: мы не требуем больше близости производных х(1) и х(1).
В классическом вариационном исчислении это соответствует переходу от слабого экстремума к сильному (см. п. 1.4.3). Поучительно сравнить задачу Лагранжа и задачу оптимального управления в том случае, когда Ц = К' и в п. 4.1.1 У=бх»1". При этом предположении: Каждый допустимый управляемый процесс (х( ), и( ), 1„1,) задачи Лагранжа является таковым и для задачи, оптимального управления (точнее, превращается в таковой при ограничении и( ) на [1„1,]). Это означает, что произошло расширение задачи (ср, п.