Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 44
Текст из файла (страница 44)
Доказательству этого условия и некоторым его приложениям посвящен 8 36. в 31. Постановка задачи Основные определения В качестве допустимых управлений и теперь было бы естественнее всего рассматривать кусочно-непрерывные вектор-функции и (1), определенные на некотором отрезке времени ~«( г ( г,. Однако имеющиеся доказательства сформулированных в этой главе теорем проходят при дополнительном предположении о к у с о ч н о й г л а дкости управлений п(1).
Кроме того, областью У возможных значений допустимого управления будет теперь служить не произвольное подмножество г-мерного пространства Я„, а множество, которое в окрестности каждой своей™граничной точки имеет «регулярное» строение, определенное ниже. Поэтому в настоящей главе мы примем следующее определение класса допустимых управлений (вполне достаточное для всех технических приложений полученных результатов). В качестве области управления У мы выберем произвольное множество пространства Е„.
переменной и = = (и',..., и"), устроенное в окрестности всякой своей граничной точки «регулярным» в следующем смысле образом. Если и, — произвольная граничная точка множества У, принадлежащая этому множеству, то найдутся такие непрерывно дифференцируемые скалярные функции д«(и), 1=1,..., г (г)1), (1) что мно«кество ~7 в окрестности точки и задается 284 ПРОЦЕССЫ ПРИ ОГРАНИЧЕННЫХ КООРДИНАТАХ ~ГЛ. 6 системой неравенств д,(и)(0,..., д,(и)(0, а в самой точке и, выполнены равенства д,(и,)=...=д,(и,)=0, и векторы ' =йтаод,(и,),... Р'( ' =ягайд,(и,) (2) линейно независимы.
Таким обрааом, (г — 1)-мерные грани области У, примыкающие к точке и„определяются уравнениями (3) д,(и)=0,..., д,(и)=0 и являются гладкими гиперповерхностями пространства К„, находящимися, в силу независимости векторов (2), в общем положении в точке от. Сама точка и, лежит на (г — з)- мерном гладком «ребре» границы, определяемом как множество решений системы (3), лежащих вблизи точки и,. Хотя функции (1) перечисленными условиями не определяются одноаначно, однако, как легко видеть, грани всех размерностей множества У вблизи точки и, (в частности, (à — г)-мерное «ребро» (3), и, следовательно, число г) однозначно определены.
Формулировки основных теорем этой главы, естественно, инвариантны относительно выбора функций (1) для данной граничной точки и,. Однако на некоторые конструкции при доказательстве теорем этот выбор существенно влияет, что аначительно усложняет наложение. Поэтому, во избежание такого произвола,мы для каждой граничной точки и,~У аафиксируем одну иа воаможных систем функций (1) и будем во всем дальнейшем изложении, говоря о функциях (1) для точки о«, подразумевать именно эту систему.
Классом допустимых управлении мы назовем множество всех кусочно-непрерывных, кусочно-гладких вектор- функций и (с) = (и' (с),..., и" (т)) (с разрывами первого рода), определенных на произвольном отрезке с = С ( г, (своем для каждой функции) и в каждый момент вре- ПОСТАНОВКА ЗАДАЧИ а зц монн принимающих значения из области управления Г. Если в момент 1' управление терпит разрыв, то множеству (7 должны принадлежать обе точки и (~' — 0) и и(г'+ 0). Допустимому управлению и (1), а также его производной ми будем, как и в гл.
1, в момент разрыва приписывать значение, равное пределу с л е в а. Пусть в и-мерном фааовом пространстве Х переменной х = (х', ..., х") дана замкнутая область В с гладкой границей, определяемая вблиаи границы неравенством у (х) = д (х', ..., х") ~ О, где скалярная функция я (х) определена и имеет непрерывные частные производные второго порядка вблизи границы д(х) =О, и вектор нигде на границе в нуль не обращается.
Таким обрааом, граница области  — гладкая гиперповерхность пространства Х с непрерывно меняющейся кривизной. Важный для приложений случай, когда область В имеет кусочно-гладкую границу, обсуждается ниже (см. стр. 337). Формулировка аадачи Пусть заданы действительные скалярные функции 7"' (х, и),7' (х, и),1 = 1,..., п, непрерывные и непрерывно дифференцируемые по всем координатам векторов х, и на прямом произведении Вз х (7*~В х П, где В", С7а— открытые множества пространств Х, В„содержащие соответственно В, (7. Уравнение движения фазовой точки имеет, как и в главе 1, вид (4) †„, = 7'(х, и), где 7'(х, и) = (~~ (х, и), ..., ~п (х, и)), 23С ПРОД[ЕССЬД ПРИ ОГРАНИЧВННЫХ КООРДИНАТАХ ~ГЛ.
6 Поставим следующую задачу. В пространстве Х заданы две точки хе, хд, принадлежащие замкнутой области В. Среди всех допустимых управлений, переводящих фазовую точку из положения хз в положение хд, причем так, что соответствующая фазовая траектория х (д) целиком лежит в замкнутой области В, требуется выбрать управление и (д), 8, ( 1 ( 8д1 минимизирующее функционал ~.(з(хИ) и(г)) (г. Чтобы дать вторую (эквивалентную) формулировку нашей оптимальной задачи (ср.
стр. 20), введем (п + д)- мерное пространство Х переменной х=(хэ, х',..., х") =(хз, х), х=(х", ..., х") (- Х. где Всякую векторную или скалярную функцию Р (х), зависящую от аргумента х~Х, можно, очевидно, считать функцией от аргумента х = (х', х)~Х, полагая Р(х) =Р(х', х) =Р(х); этим фактом мы будем в дальнейшем постоянно пользоваться. Как и в главе д, введем вектор д'(х, и) =у(х, и) =(~'(х, и), ~д (х, и), ..., ~" (х, и)) = =(у~ (х, и), /(х, и)).
б (х) = б (ха, х) = Р (х) ( О. Она имеет гладкую н-мерную границу Р (х) = 0 Обратим внимание на то обстоятельство, что функция г'(х, и) не зависит от координаты АА. Через 6 обозначим прямое произведение замкнутой области В на ось хэ. Область 6, так же как н В, задается в окрестности своей границы неравенством 287 постАИОВКА зАдАчи а»ц с непрерывно меняющейся кривизной, и вектор дх (х) (дд дд дх ) дх х 0( ) ~дх»' дх'' '''' дх") =(О, д— ,,,..., д— ,) =(О, дга0)а (х)) нигде на границе области О в нуль не обращается. Рассмотрим в пространстве Х уравнение — =7(х, и), Ых (5) объединяющее уравнение (4) н соотношение дх» — =/'(х, и). После введения этих обозначений можно дать следующую эквивалентную формулировку нашей оптимальной задачи. Требуется выбрать допустимое управление и (1), 20 ( г ( г„таким образом, чтобы конец х (1») соответствующей траектории х (~) уравнения (5) с начальным значением х (10) (О х«) лежал на прямой П~Х, проходящей через точку (О, х,) и параллельной оси х', и чтобы при этом вся траектория х (т), »0 ( г ( Гы целиком лежала в замкнутой области 6, а координата х' (г,) принимала наименьшее возможное значение.
В дальнейшем мы будем пользоваться преимущественно второй формулировкой задачи. Управления н траектории, удовлетворяющие этим условиям, будем называть оишимальхыни. Н е к о т о р ы е д о и о л н и т е л ь н ы е замечания Кусочно-непрерывные управления мы назвали в гл. г «беаынерционными управлениями», так как в случае надобности такое управление может мгновенно перескакивать с одного аначения на другое. Однако в ряде случаев «рули» обладают определенной инерцией, и, следовательно, 288 пРОЦессы пРи ОРРАниченных НООРДинАТАх ~гл, е некоторые из функций и~ (й), ..., и" (С) (или даже все) не только сами непрерывны, но и обладают непрерывными проиэводвыми вплоть до некоторого порядка. Оптимальные задачи с инерционными управлениями легко сводятся к сформулированной выше оптимальной эадаче.
Пусть, например, допустимые управления — непрерывные кусочно-гладкие функции, производные которых ограничены по модулю одной и той же константой, например единицей, и пусть область управления У вЂ” замкнутая область с кусочно-гладкой границей. Для простоты допустим, что область возможных эначений фаэовой точки х совпадает со всем пространством Х. Примем параметр и эа фаэовую переменную, а эа управляющий параметр примем проиэводную от и. Тогда вместо уравнения движения (4) в и-мерном фазовом пространстве Х мы получим систему †„, = 1 (х, и), ни — =Р сИ в (и + г)-мерном фаэовом пространстве Х х Е„, где и = (Р',..., Р") — кусочно-непрерывное (безынерционное) управление, областью возможных значений которого является единичный г-мерный куб )Р'~(1, 1=1, ..., г, а областью возможных значений фааовой точки (х, и) является прямое проиэведение Х х У.
Отметим еще, что принцип максимума справедлив для оптимальных траекторий, которые лежат в н у т р и о тк р ы т о г о я д р а 6, за исключением концов, лежащих на границе этой области. Пусть концы х (1е), х (1~) оптимальной траектории х (1), 1> ~ 1 ( т„лежат на границе я (х) = О. Тогда участок траектории при т„+ т ( т ( 1, — т, т ) О, целиком лежит в открытом ядре области 6, и потому существует функция ф, (т), та + т ( т ( ~т — г, удовлетворяющая требованиям принципа максимума (теорема 1) применительно 5 331 ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ НА ГРАНИЦЕ 289 к участку х (Т), Тз + т ~ Т вЂ” Т, — т. Можно считать, что длина вектора фт (Тз + т) равна единице.
В силу компактности единичной сферы конечномерного векторного пространства можно выбрать такую последовательность положительных чисел т„тю..., ТО..., СхОдящуюся к нулю, что последовательность векторов ~рп (Тз + т;), ( = 1, 2,..., имеет предел ф>.
Очевидно, что функция ф (Т), Т„~ Т ( Тм соответствующая траектории х(т) и удовлетворяющая начальному условию ~р (Т,) = ф„ внутри отрезка Та ( Т ( Т, служит пределом функций фн (Т), ( = $, 2,..., и потому является искомой. з 32. Оптимальные траектории, лежатцие иа границе области В атом параграфе сформулирована теорема 22, дающая полную систему необходимых условий, которым удовлетворяет всякая регулярная оптимальная траектория, целиком лежащая на гладкой границе я (х) = О области 6.