Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 9
Текст из файла (страница 9)
Пересечение гиперплоскостей Г.„ /.и ..., /.ь представляет собой (и — й)-мерную плоскость, называемую касательной плоскостью многообразия <И в точке х. Вектор, псходяший иэ точки х, тогда и только тогда лежит в касательной плоскости (т. е. является касательных! векторол! многообразия М в точке х), когда он ортогопалеп всем векторам (47). Наконец, отметим еще один простой факт, которым мы будем пользоваться в дальнейшем. Пусть х =>р ($), (=1, ..., п, (49) — параметрическая запись некоторой линии в пространстве Х или, в векторной форме, х = ф($).
Касательный вектор этой линии в точке, соответствуюшей значению я= $ь, имеет вид дч 6») дт (э») т ($») дую%») ( — ... )=, 50 »(а ' аа ' '' ' л»й / </» зхдлчк с почвижпыми концами 57 Если линия (49) лежит целиком на гладком многообразии М (некоторого числа измерений), то касательный вектор (50) этой липин является такяче касательным всктором многообразия Л( в точке орКо). Обратно, если задан касательный вектор многообразия М в точке хо ~ М, то существует па многообразии М линия, проходящая через точку хо и имеющая заданный вектор своим касательным вектором.
Иначе говоря, вектор, исходягдий из произвольной точки х, ~ М, тогда и только тогда является касательным вектором многообразия М, когда он касается некоторой линии, лежащей на М. Перейдем теперь к формулировке задачи оптимального управления с подвижными концами. Пусть 5о и 51 — гладкие многообразия произвольных (но меньших, чем и) размерностей го, гь расположенные в прострапггве Х. Поставим задачу: ипата допустимое упрпвление и(Г), которое переводит грпзовую точку из некоторого (зпрпнее не зпдпнпого) положения хо ~ 5о в некоторое положение х~ о= 5о и при этом придпет функционплу (7) минимальное значение (рнс. 20).
Эту задачу мы и будем Рис. 20. называть оптимальной задачей с подвижными концами. Если оба многообразия 5о, 5~ вырождаются в точки, то задача с подвижными концами обращается в прежнюю, уже рассмотренную нами задачу (задачу с закрепленнылщ концами). Ясно, что если бы точки хо, х~ были известны, то мы имели бы задачу с закрепленными концами. Поэтому управление и((), оптимальное в смысле задачи с подвижными концами, оптимально и в прежнем смысле, вз пгинцип млксим1 мл !гл. 1 т. е. принцип максимума (теоремы 1, 2) остается в силе и для задачи со свободными концами. Однако нужно в этом случае иметь еще соотношения, из которых можно было бы определить положение точек хм х~ на многообразиях 5ь, 5ь Такими соотношениями и являются формулируемые в этом параграфе условия трансверсальности.
Эти условия позволяют написать ть+ т, соотношений, включающих координаты концевых точек хь и хь Так как„с другой стороны, число неизвестных параметров (по сравнению с задачей с закрепленными концами) также увеличилось на те+с, (ибо положение точки хь на ть-мерном многообразии 5ь характеризуется ть параметрами, а положение точки х~ ~ 5, характеризуется т~ параметрами), то вместе с принципом максимума условия трансверсальности образуют «достаточную» систему соотношений для решения поставленной оптимальной задачи с подвижными концами. Привсдем теперь формулировку условий трапсверсальиости.
Пусть хь ~ 5ь, х~ ~ 5, — некоторые точки, а Ть и Т, — касательные плоскости многообразий 5ь и 5,, проведенные в этих точках. Плоскости Ть и Т, расположены в пространстве Л и имеют размерности соответственно т,, ть Пусть, далее, и(1), х(1), (ь ( 1 ( (ь — решение оптимальной задачи с закрепленными концами хь и хь Наконец, пусть ф(1) — вектор, существование которого утверждается в теореме 1. Мы будем говорить.
что вектор ф(1) удовлетворяет условию трансверсальности в правом конце траектории х(1) (т. е. в точке х(11))„ если вектор ф(11) = (ф1(1~), фг((~),..., фь(11) ) ортогопален плоскости Ть Иначе говоря„условие трансверсальности означает, что для любого вектора 0 =(8',О»,... ...,6"), принадлежащего (или параллельного) плоско. сти Тп выполнено соотношение (ф(11),8) = О. Лпалогнч.
ный смысл имеет условие трансверсальности в левом конце траектории х(1) (нужпо лишь заменить 11 и Т~ на (ь и Тг соответственно). Ясно, что условие трансверсальности в правом конце траектории х(() содержит т1 независимых соотношений, ибо в равенство (ф(1,), 6) = О достаточно подставить т~ линейно независимых векторов 8ь 8м ..., О„ь расположенных в плоскости Ть вэ зхдл гх с полвижнымн копнами Условно трапсверсальности в левом конце содержит гь независимых соотношений. Пользуясь условиями трансверсальности, можно сформулировать теперь решение задачи с подвижными концами, Т е о р е и а 3. (!усть и(!), Еь ( С ( !>, — допустимое управление, переводящее фазовую точку из некоторого положения хь е= 5ь в положение х| е= 5ь а х(() — соответству>ощш> траектория (исходящая из точки хь = = (О, хь)). Для того чтобы и(!) и х(!) давали решение.
оптах>альной задачи с подвижными концами, необходимо существование ненулевой непрерьиной вектор- функции зр(!), удовлетворяющей условиям, указанным в теореме 1, и, кроме того, условшо трансверсальности в обоих канвах траектории х(!). Разумеется, если одно из многообразий 5ь, 5> выро>кдастся в точку, то условие трансверсальности в соогветствующсм конце траектории х(() заменяется условием прохождения траектории х(() через эту точку. Для случая оптимальности по быстродействию в формулировке тсоремы 3 решение х(!) заменяется на х(!), а ссылка на теорему ! заменяется ссылкой на теорему 2.
Приведем элементарные примеры решения задач с подвижными концами. Пример ! Рассмотрим для точки, движущейся по закону (221 (с тем же ограничением ~и((1), задачу о быстрейшем попадании на ось х' из заданного начального состояния хь. В этом случае мы имеем задачу с подвижным правым концом: многообразие 5ь вырождается в точку х„, а многообразнем 51 служит х' = О. Вектор 0 = (0>,0т), касающийся многообразия 5, (в любой его точке), имеет вид 0 = (О, От), где 0' ~ 0 и, следовательно, условие трансверсальностн в правом конце .записывается в форме Оф,((>)+ О~фт((>) = О, откуда зрг(1~) =.- О. Так как по- прежнему функция зрт(!) линейна (см.
стр. 30), то из соотношения з)>т((>) = 0 вытекает, что фт(!) сохраняет постоянный знак прн (ь~(((ь Таким образом (см, (24)), в этом случае каждое оптимальное управление 60 ПРННЦНП МАКГНМУМА 1г.н. ! и(1) постоянно и равно +1 или — 1, и потому оптимальными могут быть только движения по параболам (25), (26) (без переключений). Предположим сначала. что начальное фазовое состояние хо находится сп р а на от прямой х' = О. Согласно сказанному выше, через точку хо проходят только две Ю фн)оныс траектории, )н)торые могут оказаться оптимальнымн: траектория (25), ! по кото(зой двн)кение н1н)исходит снизу вверх, н траектория (26), по когорой днн(л) жеане происходит сверху нннз (рнс. 2!). Если точка Хо РаГНОЛОжЕНа НЫШЕ ЛНННН Рнс 2! ЛО (см.
рнс. 7), то, двигаясь но параболе (25), фа)оная точка не попадет на ось х' =- О (рнс. 22а), и по)оа)у оптимальным может быть )олько дни>кение по параболе (26) Если же точка хо расположена на линии АО илн ниже нее, то оба движения (25), (26), приводят фазовую точку на ось х' = О (рис.22б). Итак, в этом случае имеются д в е траектории, удовлетно>> ряющне принципу максимума.
Однако легко видеть, что время движения по этим траекториям нз точки хо до осн х' = О различно. Действнтель'а но, проведя касательные к параболам (25) н (26) в точке хо, мы легко найдем (см. Рно. 22а. рис. 23), что ) )о1,)о ) ЯяР) = = о>оР! ) о,>оФ, а так как при и = ~1 время движения но луге параболы равно разности ординат (см. второе уравнение (22)), то движение по дуге хоЯА происходит дольше, чем но дуге хо9!.
Таким образом, и в этом случае оптимальным может быть только двннсение по траектории (26). Итак, в пра- злдлчл с подвижными концами вой полуплоскости оптимальпымп могут быть только движения по параболам (26), т. е. движения, совершающиеся при и = — 1. Рас. 22о. Аналогично, слева от оси х' = О оптимальными могут быть только движения по параболам (25), т. е. движения, совершающиеся при и = +1. Это и дает синтез оптимальных управлений: положив ~ +1 при х'<О, п(х', х') = (.
— 1 прп хг>О, мы получим совокупность всех оптимальных траекторий из системы дх' нхи — =х~, — =о(х', хт) ш (51) (ср. (27)). Фазовая картина оптимальных траекторий изображена на рис. 24. Уравнения (5!) можно, впрочем, считать очевидными (например, с механической точки зрения). Пример 2 Рассмотрим для точки, движущейся по закону (28) (с тем же ограничением ~и~ ( !), задачу о быстрейшсь злдачх с подвижными конплмп попадании на окружность (х')т+ (хз)з = о' (52) из заданного начального состояния хм находящегося вне этой окружности. В этом случае мы также имеем задачу с подвижным правым концом: многообразием 5, служит окружность (52).
Пусть х1 = (й соз а, й ып а) — произвольная точка окружности (52). Найдем оптимальную траекторию, дающую решение поставленной задачи с подвижным правым концом и оканчивающуюся в точке хь В качестве ф((~), т. е. вектора, нормального к окружности (52) в точке х, (в силу условий трансверсальности), мы должны взять один из двух векторов ( — соз а, — з1п х), (соз и, з(п а), первый из которых направлен внутрь окружности, а второй — в обратную сторону. Так как искомая оптимальная траектория должна подходить к точке хь располагаясь в н е окружности (52), то вектор фазовой скорости ~(х((~), и((1)) в точке х((1) = х| будет направлен либо внутрь окружности (52), либо по касательной к этой окружности в точке х~ (рис. 25). Вспоминая теперь, что скалярное произведение (Ф А), 1 (- (Р,), и (~,))) = О (ф ©, х (6,), и Я~ (5З) пгинцпп мйкспяуяА должно быгь неотрицательным (см.