Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 43
Текст из файла (страница 43)
гл э1 пгопгссы пни огглничвнных коогдинхтлх эзз В этом случае оптимальная задача состоит в выборе такого допустимого управления, для которого соответствующая траектория целиком лежит в области В и удовлетворяет заданным краевым условиям, причем мипимизнруется заданный функционал. Полная система необходимых условий, которым удовлетворяют оптимальные управления и соответствующие им оптимальные траектории этой обобщенной оптимальной задачи, дается теоремой 25 (см. стр.
345), которая и является основным результатом настоящей главы. Если область  — открытое множество фазового пространства Х, то сформулированная здесь оптимальная задача эквивалентна оптимальной задаче гл. 1,2, и ответ дается принципом максимума (так как при доказательстве принципа максимума мы пользовались лишь сколь угодно малой окрестностью оптимальной траектории). Новые трудности возникают в интересном для приложений случае, когда рассматривается з а м к н у т а я область В (т. е.
замыкание открытого в Х множества) и исследуемая оптимальная траектория частично или целиком лежит па границе области В. В дальнейшем мы будем предполагать, что  — замкнутая область пространства Х, а ее граница — гладкая или кусочно-гладкая гиперповерхность пространства Х. Мы будем рассматривать только такие оптимальные траектории, которые можно разбить на конечное число участков, каждый из которых либо целиком лежит на гладком куске границы области В, либо принадлежит (за исключением, быть может, своих концов) открытому ядру области В. Участки оптимальной траектории, целиком лежащие па гладком куске границы области В, удовлетворяют необходимым условиям, указанным в теореме 22, аналогичной принципу максимума.
Формулировке и доказательству этой теоремы, а также некоторым ее обобщениям посвящены Я 32 — 35 настоящей главы, Участки оптимальной траектории, принадлежащие (за исключением, быть может, своих концов) открытому 1о л с пончря~ин н хр. гзо пгоцвссы пэи оггхничанных кооядинлтхх ~гл., ядру области В, удовлетворяют обычному принципу максимума (гл.
1, 2). Наконец, всякая пара примыкающих друг к другу участков оптимальной траектории, один из которых лежит в открытом ядре области В, а другой — на ее границе, или лежащих на двух разных гладких кусках границы области 8, удовлетворяет некоторому условию сопряжения, которое мы называем условием скачка (теорема 24). Доказательству этого условия и некото рым его приложениям посвящен $ Зв $ 3!.
Постановка задачи Основные определения В качестве допустимых управлений и теперь было бы естественнее всего рассматривать кусочио-непрерывные вектор-функции и(1), определенные па некотором отрезке времени 10 ( 1( 6ь Однако имеющиеся доказательства сформулированных в этой главе теорем проходят при дополнительном предположении о к у с о чной гладкости управлений и(1). Кроме того, областью У возможных значений допустимого управления будет теперь служить не произвольное подмножество г-мерного пространства Е,, а множество, которое в окрестности каждой своей граничной точки имеет «регулярное» строение, определенное ниже. Поэтому в настоящей главе мы примем следующее определение класса допустимых управлений (вполнс достаточное для всех технических приложений полученных результатов). В качестве области управления У мы выберем произвольное множество пространства Е„переменной и = (и'.
.., и'), устроенное в окрестности всякой своей граничной точки «регулярным» в следующем смысле образом. Если и~ — произвольная граничная точка множества К прияадлежащая этому множеству, то найдутся такие непрерывно дифференцируемые скалярные функции д;(и), 1=1, ..., з (э) 1), (1) 9 зн пООТАновкА ВАдАчи что множество (/ в окрестности точки и~ задается системой неравенств д, (и) ~( О, ..., о, (и) ( О, а в самой точке и, выполнены равенства д,(и,)= ... =д,(и,)=0, и векторы д ' =агапу,(и,), ' ги =агапу,(и,) (2) линейно независимы.
Таким образом, (г — 1)-мерные грани области У, примыка|ощие к точке иь определяются уравнениями о,(и)=0, ..., д,(и)=0 (3) и являются гладкими гнперповерхностями пространства Е„находящимися, в силу независимости векторов (2), в общем положении в точке иь Сама точка и, лежит на (г — з)-мерном гладком <ребре» границы, определяемом как множество решений системы (3), лежащих вблизи точки иь Хотя функции (1) перечисленными условиями не определяются однозначно, однако, как легко видеть, грани всех размерностей множества (1 вблизи точки и, (в частности, (г — з)-мерное «ребро» (3)„и, следовательно, число з) однозначно определены.
Формулировки основных теорем этой главы, естественно, инвариантны относительно выбора функций (1) для данной граничной точки аь Однако на некоторые конструкции прн доказательстве теорем этот выбор существенно влияет, что значительно усложняет изложение. Поэтому, во избежание такого произвола, мы для каждой граничной точки и~ ен 7l зафиксируем одну из возможных систем функций (1) и будем во Всем дальнейшем изложении, говоря о функциях (1) для точки аь подразумевать именно эту систему. Классом допустимых управлений мы назовем множество всех кусочно-непрерывных, кусочно-гладких вектор-функций и(1) = (и'(1), ..., и'(г)) (с разрывами первого рода), определенных на произвольном отрезке (А ~ 1 = 1~ (своем для каждой функции) и в каж- з9ч пгоцассы пни огглничгнных коогдинлтхк <гл.а дый момент времени принимающих значения из области управления 0 Если в момент 1' управление терпит разрыв, то множеству 0 должны принадлежать обе точки и(Г' — О) и и(г'+ О).
допустимому управлению и(Г), а также его производной мы будем, как и в гл. 1, в момент разрыва приписывать значение, равное пределу сл е в а. Пусть в п-мерном фазовом пространстве Х переменной х = (х', ..., х") дана замкнутая область В с гладкой границей, определяемая вблизи границы неравенством д(х)=д(х', ..., х") (О, где скалярная функпия д(х) определена и имеет непрерывные частные производные второго порядка вблизи границы п(х) =О, и вектор дд (х) Гда да — = пгаб д(х) = ( —, ... дх (дх''' ' дх") нигде на границе в нуль не обращается. Таким образом, гранина области  — гладкая гпперповерхность пространства Х с непрерывно меняющейся кривизной. Важный для приложений случай, когда область В имеет кусочно-гладкую границу, обсуждается ниже (см.
стр. 344). Формулировка задачи Пусть заданы действительные скалярные функции 10(х, П), 1'(х, и)„1= 1,, л, непрерывные и непрерывно дифференцируемые по всем координатам векто- $. ов х, и на прямом произведении В' к', 0*:» В Х (/, где , сР- — открытые множества пространств Х, Ео содержащие соответственно В, К Уравнение движения фазовой точки имеет, как и в главе 1, вид — =1(х, и), (4) где 1(х, и) = (1' (х, и), ..., )" (х, и)). постановка заллчи зон 293 Поставим следующую задачу.
В пространстве Х заданы две точки хо, хь принадлежащие замкнутой области В. Среди всех допустимых управлений, переводящих фазовую точку из положения хо в положение х,, причем так, что соответствующая фазовая траектория х(1) целиком лежит в замкнутой области В, требуется выбрать управление ц(1), 1о ~ 1 = 1ь минимизирующее функционал ~ ~о(,(1) ц(1)) 11 Чтобы дать вторую (эквивалентную) формулировку нашей оптимальной задачи (ср.
стр. 20 — 21), введем (и+!)-мерное пространство Х переменной х=(хо, х', ..., х") =(х', х), где х=(х',..., х") ~ Х. Всякую векторную илн скалярную функцию Г(х), зависящую от аргумента хан Х, можно, очевидно, считать функцией от аргумента х = (хо, х) АХ, полагая Р (х) Р (хо х) Р (х)' этим фактом мы будем в дальнейшем постоянно пользоваться. Как и в главе 1, вводом вектор 1(х, ц) =~(х, и) (1о(х, ц), 7'(х, ц), ..., 1" (х, ц)) (~о(х ц) )(х ц)) Обратим внимание на то обстоятельство, что функция 1(х, и) не зависит от координаты х'.
Через б обозначим прямое произведение замкнутой области В на ось хо. Область б, так же как и В, задается в окрестности своей границы неравенством ц(х) =д(хо, х) =а(х)(~0. Она имеет гладкую и-мерную границу ц(х) =0 Рэ4 НРОцгссы ПРи ОГРАничвнных кООРдинАТАх [гл 4 с непрерывно меняющейся кривизной, и вектор — =цгада(х) =( —, —, ... — )= дя (х) / дд да дс Х дх (.дхо ' дх' ' ' ' дкх) = =~О, —,, „— „„)=(О, дгабд(х)) нигде на границе области 6 в нуль не обращается. Рассмотрим в пространстве Х уравнение — =г(х, и), дх объединяющее уравнение (4) и соотношение дх4 — =~а (» и) дг После введения этих обозначений можно дать следующую эквивалентную формулировку нашей оптимальной задачи.
Требуется выбрать допустимое управление и(Г), (Р ~ (((» таким образом, чтобы конец х(Г1) соответствующей траектории х(() уравнения (5) с начальным значением х(Г,) =(О, х4) лежал на прямой П с: Х, проходящей через точку (О, х,) и параллельной оси х', и чтобы при этом вся траектория х((), (4 ( т ( гь целиком лежала в замкнутой области 6, а координата х'(Й) принимала наименьшее возможное значение. В дальнейшем мы будем пользоваться преимущественно второй формулировкой задачи. Управления и траектории, удовлетворяющие этим условиям, будем называть оптимальными.
Некоторые дополнительные замечания Кусочно-непрерывные управления мы назвали в гл. 1 «безынерционными управлениями», так как в случае надобности такое управление может мгновенно перескакивать с одного значения на другое. Однако в ряде случаев «рули» обладают определенной инерцией, и, 296 постлновкл зхдАчи % зя следовательно, некоторые из функций и'(1), ..., и'(1) (нли даже все) не только сами непрерывны, но и обладают непрерывными производными вплоть до некоторого порядка, Оптимальные задачи с инерционными управлениями легко сводятся к сформулированной выше оптимальной задаче.
Пусть, например, допустимые управления — непрерывные кусочно-гладкие функции, производные которых ограничены по модулю одной и той же константой, например, единицей, и пусть область управления 0 — замкнутая область с кусочно-гладкой границей. Для простоты допустим, что область возможных значений фазовой точки х совпадает со всем пространством Х.