Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 6
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 6 - страница
На рис. 6 надписаны на дугах парабол соответствующие значения управляющего параметра и. На рис. 7 изображено все семейство полученных таким образом фазовых !гл. 1 ПРИНЦИП МАКСИМУМА траекторий (АΠ— дуга параболы хг - (х')', расположенная в нижней полуплоскости; ВΠ— дуга параболы х' = — — (х')', расположенная в верхней полуплоскости). Фаэовая точка движется по проходящей через начальную точку хс дуге параболы (26), если точка х, расположена выше линии АОВ и по дуге параболы (25), если Ряс.
7. точка хс расположена ниже этой линии. Иначе говоря, если начальное положение х, расположено в ы ш е линии АОВ, то фазовая точка должна двигаться под воздействием управления и = — 1 до тех пор, пока она не попадет на дугу АО; в момент попадания на дугу АО значение и переключается и становится равным +1 вплоть до момента попадания в начало координат. Если же начальное положение х, расположено н и ж е линии АОВ, то и должно быть равно +1 до момента попадания на дугу ВО, а в момент попадания на дугу ВО значение и переключается и становится равным — 1. Итак, согласно теореме 2, только описанные выигв траектории могут быть оптимальными, причем из проведенного исследования видно, что из каждой точки фаэовой плоскости исходит т о л ь к о о д н а траектория, ведущая в начало координат, которая может быть опти- ПРИМЕРЫ.
ЗАДАЧА СИНТЕЗА (+1 ниже линии АОВ и на дуге АО, р (х) = ~ ~ — 1 выше линии АОВ и на дуге ВО. Тогда на каждой оптимальной траектории значение и (г) управляющего параметра (в произвольный момент г) равно и(х(г)), т. е. равно аначению функции Р в той точке, в которой в момент 1 находится фааовая точка, пробегающая оптимальную траекторию: и(1) = р(х(1)). Это означает, что, заменив в системе (22) величину и функцией Р (х), мы получим систему Ых~ — = х~ ш —; = и (х', х'), (27) решение которой (при произвольном начальном состоянии х,) дает оптимальную фазовую траекторию, ведущую в начало координат.
Иначе говоря, система (27) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных траекторий, ведущих в начало координат. й Л. С. Поитрягии и лр. мальной (т. о. задание начальной точки ха однозначно определяет соответствующую траекторию). Если бы мы были уверены в том, что оптимальная траектория всегда (т. е. для любой начальной точки х,) с у щ е с т в у е т, то могли бы с уверенностью сказать, что все найденные траектории являются оптимальными. В главе 3 мы сформулируем теорему существования длялинейных систем оптимального быстродействия, из которой вытекает, в частности, что в рассматриваемом примере для любой начальной точки хр существует оптимальная траектория (см.
стр. 142). Таким образом, найденные траектории (рис. 7) являются оптимальными, и других оптимальных траекторий, ведущих в начало координат, не существует. Полученное в рассмотренном примере решение оптимальной задачи можно истолковать следующим обрааом. Обозначим черев р (х', х') = и (х) функцию, заданную на плоскости х', х' так: 34 ПРИНЦИП МАКСИМУМА ~гл. 1 11ример 2 К2х Рассмотрим уравнение — „,, + х=и, (и)(1. Это уравнение эквивалентно системе Лх2 —,=х', Н2 Лх2 — = — х'+ и, И2 (28) для которой мы, как и в первом примере, научим аадачу о быстрейшем попадании в начало координат. Функ- ция Н имеет вид Н = 2(2 х2 2У2хг + 2)22и. (29) Далее, для вспомогательных переменных 2Р„2Р2 мы полу- чаем систему уравнений (см. (19), (29)) и=э1йп2Рх=в(ап(Аэ)п(1 — а ))=з1яп(эш(4 — а )). (30) Отсюда следует, что функция и (~) получается из функ- ции э19п (зш 4), равной поочередно +1 и — 1 на интер- валах длины и, при помощи сдвига на некоторый отре- зок а, (рис.
8). ркс. 8. Для изучения кусков траекторий, соответствующих отреакам времени, на которых и = 1 и и = — 1, мы откуда 2р2 = А ейп (г — а„), где А ) 0 и а, — некоторые постоянные. Соотношение (20) дает нам (учитывая (29) и условие ~и~ ( 1) 35 ДРнмкРы.
3АЦАчА синтвзА рассмотрим вспомогательную систему (31) (получающуюся из системы (28) кри и = О). Произвольное решение етой системы может быть записано в виде х'= — Л соз(1+ у), х'=Л з1п (1+ у), (32) где Л ну — постоянные(Л ) 0,0 ( у (2п). Таким обра- зом, фааовыми траекториями являются окружности с цент- ром в начале координат:- (хг)з+ (хз)'=Л' (33) (рис. 9,а)). Иа (32) видно, что движение фазовой точки по окружности (33) совершается по часовой стрелке, причем равномерно, с линейной скоростью 2пЛ (один оборот за время 2п).
Отметим, в частности, что за промежуток времени, имеющий длину и, фазовая точка, двигаясь по часовой стрелке, описывает ровно п о л о в и н у окруя1- ности (33). При и = 1 система (28) принимает вид зх з з (34) или, иначе, л (х — 1) З1 †„, = — (х' — 1). (35) (х' — 1)'+ (хз)з = Лз, (36) Вспоминая соотношения (31) и (33), мы находим, что фа- зовые траектории системы (35) (или, что то же самое, системы (34)) представляют собой окружности 36 ПРИНЦИП МАКСИМУМА 1гл. 1 т. е.
окружности с центром в точке О„име1ощей координаты (1, О). Эти окружности фазовая точка, движущаяся по закону (34) (т. е. по закону (28) прн и = 1), в) Рис. 9. пробегает по часовой стрелке, обходя за время л ровно половину окружности (рис. 9,б)). Аналогично, при и = — 1 система (28) принимает вид Ых~ — =х, Л1 Их~ Х1 пРимеРы.
3АдАчА синтезА 37 фи ее фазовыми траекториями являются окружности ( '+1)'+ ( ')5=в' (37) с центром в точке О „имеющей координаты ( — 1, О). По этим окружностям фазовая точка движется по часовой стрелке, проходя ровно половину окружности за время н (рис. 9,в)). Как было указано выше, каждое оптимальное управление и (5) является кусочно-постоянной функцией, получающейся из функции з1уп (з!и 5), равной поочередно +1 Рис.
10. и — 1 на интервалах длины н, при помощи сдвига на некоторый отрезок а, (рис. 8). Если оптимальное управление и (г) имеет вид, показанный на рис. 10, т. е. поочередно равно+1 и — 1 на интеРвалах (55, и), (а, Я + а), х' (и + а,2п+ и),... и, в заключение, на некотором интервале длины р ( и равно +1, то соответствующая оптимальная траек- о торин может быть построена о, м, следующим образом. А В течение заключительного отрезна времени (длины р) фазовая точка движется по окружности вида (36) (ибо и = 1 на этом отрезке времени), причем по той нз этих окружностей, которая проходит через начало координат (ибо искомая траектория доля<на вести в начало координат).
Такой окружностью является окружность радиуса 1 с центром в точке О, (рнс. 11а). По этой окружности фазовая точка попадает в начало координат, проходя дугу, меньшую половины онрулсноети (ибо р ( п). Таким Рвс. Па ПГИНЦИГ1 МЛКСИМГМЛ 1гл. 1 образом, обозначив нижнюю полуокрунсыость этой окружности череа М,О, мы найдем, что заключительный кусок Рлс. 11б.
фазовой траектории представляет собой некоторую дугу АО полуокружности М,О. Далее, в положение А фазовая точка попала, двигаясь в течение отрезка времени, имеющего длину я, пРимеРы. 3АдАчА синтезА иод воздействием управления и = — 1 (см. рис. 10), т. е. предыдущий кусок фазовой траектории представляет собой полуокружность ВА с центром в точке О„, кончающуюся в точке А (рис. 11б).
Так как дуга ВА равна полуокружности, то точка В, симметрична А относительно центра О,, и потому точка В лежит на полуокружности Х1Х„симметричной полуокружности ОМ1 относительно центра О,. Точно так я~е предшествующая дуге ВА дуга СВ, соответствующая отрезку времени Рис. 12.
длины я, на котором и = 1, равна полуокруя<ностн с центром О„и потому точка С лежит на полуокружности МзМЗ, которая симметрична полуокружности Ф~Х, относительно центра Ог (рис. 11в), и т. д. Таким образом, соответствующая фазовая траектория имеет вид, показанный на рис. 11в (начальный кусок фазовой траектории будет меньше половины окружности, если только 0 ( а — ~, ( л; см. рис. 10).
Фазовая траектория, соответствующая оптимальному управлению и (8), которое на заключительном отрезке пРинцип максимумА длины Р равно — 1 (а не +1), получается из траектории, иаображенной на рис. 11в, с помощью центральной симметрии (рис. 12). Для такой траектории точки «стыка» дуг окружностей будут лежать на полу- окружностях ОХы М,М„Л,Л~ю ..., симметричных (относительно начала координат) полуокружностям ОМы ~УФ'ю МзМа ". Объединяя оба эти случая (рис. 11в и 12) вместе, получаем всю картину поведения фазовых траекторий Рис. $3. (рис.
13). На рис. 13 надписаны на дугах фааовых траекторий соответствующие значения управляющего параметра и. Из рис. 13 видно, что если начальная точка л, расположена в ы ш е линии ... МаМ,М,ОХ,И,(т'а составленной из бесконечного числа полуокружностей радиуса 1, то фазовая точка должна двигаться под воздействием управления и = — 1 до тех пор, пока она не попадет на дугу ...