Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 6
Текст из файла (страница 6)
Если же, наоборот, сначала и = — 1, а затем и = +1, то фазовая кривая заменяется Центрально симметричной (рис. 6, б) ). Рис. б. Рис 7. На рис. б надписаны иа дугах парабол соответствующие значения управляющего параметра и. На рис. 7 изображеио все семейство полученных тахим образом фазовых ! траекторий (АΠ— дуга параболы х' = — (х~)', расположенная в нижней полуплоскости; ВΠ— дуга параболы зз пгимегы зхдхчх сиптвзк х' = — — (хе)-', расположенная в верхней полуплоско- 2 сти). Фазовая точка движется по проходящей через начальную точку хь дуге параболы (26), если точка хь расположена выше линии АОВ, и по дуге параболы (25), сслн точка хь расположена ниже этой линии.
Иначе говоря, сслп начальное поло>ксиве хь расположено в ы ш е линии ЛОВ, то фазовая точка должна двигаться под воздействием управления и = — ! до тех пор, пока она нс попадет на дугу АО; в момент попадания на дугу АО значение и переключается и становится равным +! вплоть до момента попадания в начало координат. Если >ке начальное положение хь расположено н и ж е линии ЛОВ, то и должно быть равно +! до момента попадания на дугу ВО, а в момент попадания на дугу ВО значение и псрсключается и становится равным — !. Итак, согласно теореме 2, только описанные вь>ше траектории могут бь>ть оптимальными, причем из проведенного исследования видно, что из каждой точки фазовой плоскости исхочиг только одна траектория, ведущая в начало координат, которая может быть оптимальной (т.
е. задание начальной точки хь однозначно определяет соответствующую траекторию). Если бы мы были уверены в том, что оптимальная траектория всегда (т. е'. для любой начальной точки хь) существует, то могли бы с уверенностью сказать, что все найденные траектории являются оптнмальнымп. В главе 3 мы сформулируем теор ему с у где ство ва н и я для линейных систем оптимального быстродействия, из которой вытскаег, в частности, что в рассматриваемом примере для любой начальной точки хь существует оптимальная траектория (см. стр.
(47). Таким образом, найденные траектории (рис. 7) япл>потся оптимальными, и других оптимальных траекторий, ведущих в начало координат, нс существует. Полученное в рассмотренном примере решение оптимальной задачи можно истолковать следу>ощим образом. Обозначим через о(х',х') = о(х) функцию, заданную па плоскости х', хз так: > +1 ниже линии АОВ и на дуге АО, и(х) = — ! выше липни ЛОВ и на дуге ВО. я л. с, понтрягин я др. пгин!!пп мАксимук!л 34 !ГЛ. 1 Это означает, что, заменив в системе (22) величину и функцией о(х), мы получим систему дх' г1! 0х~ — =п(х!, х'), решение которой (при произвольном начальном состоянии хв) дае! оптимальную фазовую траекторию, ведущую в начало координат.
Иначе говоря, система (27) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных траекторий, ведущих в начало координат. Пример 2 с1!х Рассмотрим уравнение — „, + х = и, ) и) = 1, Это уравнение эквивалентно системе йх' — — =х !1! с1х' (28) зля которой мы, как и в первом примере, изучим задачу ! быстрейшем попадании в начало координат.
Функция Ч имеет вид т! = ф!х — ч))!х + фаи. (29) 1алее, для вспомогательных переменных !р!, фз мы по- тучаем систему уравнений (см. (19), (29)) '! огда на каждой оптимальной траектории значение и(1) управляющего параметра (в произвольный момент 1) равно о(х(1)), т. е.
равно значению функции о в той точке, в которой в момент 1 находится фазовая точка, пробегающая оптимальную траекторию: и (1) = о (х (1)). (з! пгимв ы зхлхчх синтвзл откуда фз — — А яп(! — аа), где А ) 0 и аа — некогорые постоянные. Соотношение (20) дает пам (учитывая (29) и условие !и)( !) и = ыйп Фз = я.п (А з|п(! — а )) = з(ьп(з!п(! — а )). (30) Отсюда следует, что функция и(1) получается из функции з(дп(з)п1), равной поочередно +! и — ! на интервалах длины и, при помощи сдвига на некоторый отрезок ао (рис. 8). Ргс 8. Для изучения кусков траекторий, соответствующих отрезкам времени, на которых и = 1 и и = — ), мы рассмотрим вспомогательную систему (3 !) (получающуюся из системы (28) прп и = О). Произвольное решение этой системы может быть записано в виде х' = — Я соз (1 + у), хз = )г яп (1 + у), (32) где 1г и у — постоянные (Й ) 0,0 ( у < 2п).
Таким образом, фазовыми траекториями являются окружности с центром в начале координат: (х')'+ (х')'" = Рх (33) (рис. 9, а)). Из (32) видно, что движение фазовой точки по окружности (ЗЗ) совершается по часовой стрелке, причем равномерно, с линейной скоростью 2п)т (один оборот за врсмя 2п). Отметим, в частности, что за промежуток времени, имеющий длину и, фазовая точка.
двигаясь по часовой стрелке, описывает ровно пол ов и н у окружности (33). пгипцип мхксимгмл 11ри и = ! сисзема (28) принимает вид (34) плн, иначе, (35) Вспоминая соотношения (3!) н (33), мы находим, что фззовые траектории системы (36) (или, что то же самое, спсгемы (34) ) представляюг собой окружности ( л 1)г ) (.У ~-а (36) т. е.
окружности с центром в точке Оп имеющей координаты (1,0). Эти окружности фазовая точка, движущаяся по закону (34) (т. е. по закону (28) при и = 1), пробегает по часовой стрелке, обходя за время и ровно половину окружности (рис. 9, б) ). Лналогично, при и = — 1 сисгема (28) принимает вид ее фазовыми траекториями являются окружности (х'+!)'+(х')'= )г' (37) с центром в точке О ь имеющей координаты ( — 1,0). 11о этим окружностям фазовая точка движется по часовой стрелке, проходя ровно половину окружности за время и (рис. 9,в)). Как было указано выше, каждое оптимальное управление и(!) является кусочно-постоянной функцисй, получающейся из функции з!дп(з)п(), равной поочередно +1 и — ! па интервалах длины л,, при помон!и сдвига на некоторый отрезок аз (рис. 8). Если оптимальное пяимвяы злд~чл сиптсзл 5Ы управление и(1) имеет впд, показанный на рис.
1О, т. е. поочередно равно +1 н — ! иа интервалах (1ми), (а, и+ а), (и+ а, 2п+ а), ... н, в заключение, на в) Рис 9. некотором интервале длины р с. и равно +1, то соответствующая оптимальная траектория может быть построена следующим образом. В течение заключительного отрезка времени (длнны б) фазовая точка движется по окрулы1остн вида (36) (нбо и = 1 на этом отрезке времени), причем по той нз 38 !Гл.
! пггпии!и млксимумх этих окружностей, которая проходит через начало координат (ибо искомая траектория должна вести в начало координат). Такой окружностью является окружность ! 2лы !хис. !О радиуса 1 с центром в точке О! (рис. 11а), По этой окружности фазовая точка попадаег в начало координат, проходя тугу, меньгиу!о половинь! окружности (нбо 1т ( л).
Таким образом, обозХ~ пачнв нижнюю полуокружпость этой окружности через М!О, мы найдем, что закл!очптельный кусок фазовой в ' , траектории представляет со- В! !!! бой некоторую дугу АО полу- А окружности М!О. Далее, в положение А фазовая точка попала, двигаясь в течение отрезка времени, имеющего длину и, под воз. действием управлении и = — 1 (см. рнс. 10), т. е. предыдущий кусок фазовой траектории представляет собой полуокружпость ВА с центром н точке О ь кончающуюся в точке Л (рис.
1!6). Так как дуга ВА равна полуокружности, то точка В симметрична А относительно центра О !, и потому точка В лежит на полу- окружности й!!Л!и симметричной полуокружности ОМ! относительно центра О ь Точно так же предшеству!ощан дуге ВА дуга СВ, соответствую!цая отрезку времени длины и, на котором и = 1, равна полуокружпостн с центром Оь н потому точка С лежит на полуокружпости М,Мм которая симметрична полуокружности й!!й!э относительно центра О! (рис. 11в), и т.
д. Таким образом, соответству!ощая фазовая траектория имеет вид, показанный па рис. 1!в (пачальный кусок фазовой тра- 39 ПРИМЕРЫ ЗАЦА'-!А С$П!ТГЗА ектории будет меньше половины окружности, если только О ( св — !в ( н; см. рис. 10). Рвс. 1!б. Фазовая траектория, соответствующая оптимальному управлению и(!), которое на заключительном отрезке Рвс. !!в. длины )! равно — 1 !а не +!), получается из траектории, изображснно!! па рис. 1!в, с помощью центра!!ы!ой ПРИНЦИП МАКСИМУМА !гл.