Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 9
Текст из файла (страница 9)
Обозначим через Ь! касательную гнперплоскость к гиперповерхности г! (хт, х', ..., х") = 0 в точке х (! = г, 2, ..., )с). Пересечение гиперплоскостей Ь„Ь„..., Ьд представляет собой (и — й)-мерную плоскость, называемую касательной плоскостью многообразия М в точке х. Вектор, исходящий из точки х, тогда н только тогда лежит в касательной плоскости (т. е. является касательным вектором многообразия М в точке х), когда он ортогонален всем векторам (47). Наконец, отметим еще один простой факт, которым мы будем пользоваться в дальнейшем. Пусть х=[р~($), [=1,...,п, — параметрическая запись некоторой линии в пространстве Х или, в векторной форме, х = [р(6).
Касательный вектор этой линии в точке, соответствующей значению $ = $ю имеет вид Если линия (49) лежит целиком на гладком многообразии М (некоторого числа измерений), то касательный вектор (50) этой линии является также касательным вектором многообразия М в точке [р ($г). Обратно, если аадан касательный вектор многообразия М в точке хг[ — М, то существует на многообразии М линия, проходящая через точку хг и имеющая заданный вектор своим касательным вектором. Иначе говоря, вектор, исходящий из произвольной точки хг(-М, тогда и только тогда является касательным вектором многообразия М, когда он касается некоторой линии, лежащей на М.
Перейдем теперь к формулировке задачи оптимального управления с подвижными концами. Пусть Яг и 8, — гладкие многообразия произвольных (но меньших, чем и) размерностей го, г[, расположенные в пространстве Х. Поставим задачу: найти допустимое управление и (8), которое переводит фазовую точку из некоторого (заранее не заданного) положения хе~до в некоторое положение х! (: Я! и при этом придает функционалу (7) ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ 57 э «1 инимальное значение (рис.
20). Эту задачу мы и будем яааывать оптимальной задачей с подвижными концами. Если оба многообразия 8», Я, вырождаются в точки, то задача с подвижными концами обращается в прежнюю, уже рассмотренную нами аадачу (аадачу с закрепленными концами). Ноно, что если бы точки х„х, были известны, то мы имели бы задачу с аакрепленными концами. Поэтому Ркс. 20. управление и (»), оптимальное в смысле задачи с подвижными концами, оптимально и в прежнем смысле, т. е. принцип максимума (теоремы 1, 2) остается в силе и для задачи со свободными концами.
Однако нужно в атом случае иметь еще соотношеиия, иа которых можно было бы определить положение точек х„х, на многообразиях 8», Ю,. Такими соотношениями и являются формулируемые в этом параграфе условия трансверсальности. Эти условия позволяют написать г, + г, соотношений, включающих координаты концевых точек х» и х.
Так как, с другой стороны, число неизвестных параметров (по сравнению с задачей с закрепленными концами) также увеличилось на с» + г, (ибо положение точки х, на г»-мерном многообразии Ю«характеризуется гр параметрами, а положение точки х, ~ Я, характериауется г, параметрами), то вместе с принципом максимума условия трансверсальности обраауют «достаточную» систему соотношений для решения поставленной оптимальной задачи с подвижными концами. Приведем теперь формулировку условий трансверсальности.
Пусть х«ч-Я», х»~Ю» — некоторые точки, а Т» и Т, — касательные плоскости многообрааий Я«и Ю„ пгинцип млксимтмл ~гл. г проведенные в зтих точках. Плоскости Т, и Т, расположены в пространстве Х и имеют размерности соответственно гю гы Пусть, далее, и (с), х(с), то ( с ( сю — решение оптимальной задачи с закрепленными концами хг и х,. Наконец, пусть ф (с) — вектор, существование которого утверждается в теореме 1. Мы будем говорить, что вектор ф (С) удовлетворяет условию трансверсольности в правом конце траектории х (1) (т.
е. в точке х (С,)), если вектор ф (с1) = (ф, (Е,), фг (с1), ..., ф„(С,)) ортогонален плоскости Т,. Иначе говоря, условие трансверсольности означает, что для любого вектора О = (91, Ог, ..., 9"), принадлежащего (или параллельного) плоскости Т1, выполнено соотношение (ф (с,), 9) =- О. Аналогичный смысл имеет условие трансверсальности в л е в о и конце траектории х (г) (нужно лишь заменить ~, и Тд на со и То соответственно). Ясно, что условие трансверсальности в правом конце траектории х (С) содержит г1 независимых соотношений, ибо в соотношение (ф (с,), 9) = О достаточно подставить гт линейно независимых векторов Од, О„ О„„расположенных в плоскости Ты Условие трансверсальности в левом конце содержит го неаависимых соотношений.
Пользуясь условиями трансверсальности, можно сформулировать теперь решение задачи с подвиокными концами. Т е о р е и а 3. Пусть и (С), Со ( Е ( ܄— допустимое управление, переводящее фазовую точку из некоторого положения х„~дь в положение х„~бы а х (С) — соответствующая траектория (исходящая из точки хо = (О, хг)). Для того чтобы и (с) и х (с) давали решение оптимальной задачи с подвижными концами, необходимо существование ненулевой непрерывной вектор-функции ф (г), удовлетворяющей условиям, указанным в теореме 1, и, кроме того, условию трансверсальности в обоих концах траектории х (г). Разумеется, если одно из многообразий д„8т вырождается в точку, то условие трансверсальности в соответствующем конце траектории х (с) ааменяется условием прохождения траектории х (С) через эту точку. Для случая оптимальности по быстродействию в формулировке теоремы 3 решение х (с) ааменяется на х (с), злдлчл с подвил~вымя концлми зи а ссылка на теорему 1 заменяется ссылкой на теорему 2.
Приведем элементарные примеры решения задач с подвижными концами. Пример 1 Рассмотрим для точки, движущейся по закону (22) (с тем же ограничением ~и)(1), задачу о быстрейшем попадании на ось х' из заданного начального состояния х . В этом случае мы имеем задачу с подвижным пра- х' вым концом: многообразие Ф Яэ вырождается в точку х, а многообразием о1 служит х' = О. Вектор 0 = (0', 0'), касающийся многообразия Я, (в любой его точке), имеет вид 0 = (О, 0'), где 0' ~ О и, следовательно, ус- РЛ7 ловие трансверсальности в правом конце записывается Рис.
21 в форме Олр, (т,) + 0'ф,(1,) = О, откуда фз (т,) = О. Так как по-прежнему функция ~р, (О линейна (см. стр. 29), то из соотношения фт (~,) = О вытекает, что фз (1) сохраняет постоянный знак при Гэ =. т ~ Гм Таким образом (см. (24)), в этом случае каждое оптимальное управление и (г) п о с т о ян н о и равно +1 или — 1, и потому оптимальными могут быть только движения по параболам (25), (26) (без переключений). Предположим сначала, что начальное фазовое состояние хс находится с и р а в а от прямой х' = О.
Согласно сказанному выше', череа точку хэ проходят только две фааовые траектории, которые могут оказаться оптимальными: траектория (25), по которой движение происходит снизу вверх, и траектория (26), по которой движение происходит сверху вниа (рис. 21). Если точка хз расположена выше линии АО (см. рис. 7), то, двигаясь по параболе (25), фазовая точка не попадет на ось х' = О (рис. 22а), и потому оптимальным может быть только движение по параболе (26). Если же точка х, расположена [гл.
1 60 пгинцип млксимгмл на линии АО или ниже нее, то оба движения (25), (26) приводят фазовую точку на ось ха = О (рис. 22б). Итак,. в этом случае имеются д в е траектории, удовлетворяющие принципу максимума. Однако легко видеть, йв) что время двюкеиия по этим траекториям из точки ха до оси х' = О различно. Действительно, проведя касательные к параболам (25) и (26) в точке хс, мы легко найдем (см. рис. 23), ч о ®3, ) <2,Р, = = Я,Р~ ) Яфы а так как при и =-+- 1 время движения по дуге параболы равно разРис.
22а. ности ординат (см. второе уравнение (22)), то движение по дуге хна происходит д о л ь ш е, чем по дуге хД,. Таким образом, и в этом случае оптимальным может быть Рис. 226. только движение по траектории (26). Итак, в правой полу- плоскости оптимальными могут быть только движения по параболам (26), т.
е. движения, совершающиеся при и = — 1. Аналогично, слева от оси х' = О оптимальными могут быть только движения по параболам (25), т, е. шкыцнп млксимтма движения, совершающиеся прн и ==+ 1. Это н дает скн- тез оптимальных управлений: положив +1 прн х'(О, — 1 прн х')О, мы получим совокупность всех оптимальных траекторий из системы Ие — =х ш — „, г а(Х', Х') (51) (ср. (27)). Фазовая картина оптимальных траекторий изображена на рис.
24. Уравнения (51) можно, впрочем, считать очевиднымн (например, с механической точки зрения). Пример 2 Рассмотрим для точки, движущейся по закону (28) (с тем же ограничением (и) ( 1), аадачу о быстрейшем попадании на окружность (х')' -)- (тз)' = д' (52) из заданного начального состояния хю находящегося вне атой окружности. В этом случае мы также имеем задачу с подвижным правым концом: многообразием Я, служит окружность (52). Пусть хз = (Л сова, Лз!и а) — произвольная точка окружности (52).
Найдем оптимальную траекторию, дающую решение поставленной задачи с подвижным правым концом и оканчивающуюся в точке х,. В качестве ф (гз), т. е. вектора, нормального к окружности (52) в точке хд (в силу условий трансверсальности), мы должны взять один из двух векторов ( — сози, — шпа), (сова, з(па), первый из которых направлен внутрь окружности, а второй — в обратную сторону. Так как искомая оптимальная траектория должна подходить к точке х„располагаясь в н е окружности (52), то вектор фазовой скорости ~(х(Гт), и (Гт)) в точке х (Гз) = х, будет направлен либо внутрь окружности (52), либо по касательной к атой ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ 63 1 5! жности в точке х, (рис.