Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004, страница 7
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 7 - страница
б) выделена линия переключения АОВ. Выше этой линии управление и = — !, а ниже и =+1. Если начальное положение х, расположено выше линии АОВ, то фазовая точка должна двигаться под воздействием управления и = — 1 до тек пор, пока она не попадет на дугу АО; в момент попадания на дугу АО значение и переключается н становится равным +1 вплоть до момента попадания в начало координат. Если же начальное положение х, расположено нитке линии АОВ, то и должно бысть равным +1 до момента попадания на дугу ВО, а в момент попадания на дугу ВО значение и переключается и становится равным — 1.
Итак, согласно принципу максимума (см. теорему 1) только описанные траектории могут быть оптимальными. Из проведенного построения видно, что через каждую точку фазовой плоскости проходит одна и только одна траектория описанного вида. Из некоторых дополнительных соображений следует, что все полученные траектории оптимальны. Полученное здесь решение задачи можно истолковать следующим образом. Обозначим о(х', х')= о(х) функцию, заданную на плоскости х', х' следующим образом: + 1 ниже линии АОВ н на дуге АО, п(х) = — 1 выше линни АОВ и на дуге ВО. Тогда на каждой оптимальной траектории значение и(1) управляющего параметра (в произвольный момент 1) равно и(х(1)), т. е. равно значению функции с в точке х(г): и (с) = и (х (г)). Это означает, что, заменив в системе (1) величину и функцией и(х), мы получим систему х'=хе > х'=и(х', х=1, решение которой (при произвольном начальном состоянии хч) дает оптимальную фазовую траекторию, ведущую в начало координат.
Иначе говоря, система (5) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных траекторий, ведущих в начало координат. В данном случае мы получили возможность определить управление как функцию о(х) точки х фазоаой плоскости. Такое решение задачи называется синтезом оптимального управления.
43 $11, Быстрейшая остановка математического маятника ограниченной по модулю силой В виде дифференциального уравнения сформулированная задача описывается следующим образом: «+х=и, !и!~( !. Это уравнение зквивалентно системе х'= х', х~= — х'+ и, (6) для которой мы, как и в предыдущем параграфе, изучим задачу о быстрейшем попадании в начало координат. Функция Н здесь имеет вид Н = ф,х' — ф,х'+ ~>,и> а матрица А имеет вид Далее, для вспомогательного вектора ф имеем уравне- ние ф = — ц'А, или, в координатном виде, чч =ф ° тв = — чч откуда фв = аз!п(! — ав), где а ) О и ав — некоторые постоянные.
Условие максимума (см. (9) гл. 4) записывается в виде айви = а в!п (! — ае) и = ! а в!п (! — а,) 1, откуда получаем и = з!йп ч'в в!ип (а в!п (! — ае)) = з!ип (в!п (И вЂ” а,)). Отсюда следует, что управление и (!) получается из функции в!ип(в!и !), равной поочередно +! и — ! на интервалах длины и, при помощи сдвига на некоторый отрезок ав (рис. 7). Для изучения кусков траекторий, соответствующих значениям и = -+.1, рассмотрим вспомогательную однородную систему (7) х-' = — х'.
Произвольное решение этой системы может быть записано в виде х! = — г соз [1 + У), х! = г з!и 0 + У). (8) где г, у — константы (г ) О, 0 ( у ( 2л). Таким образом, фазовыми траекториями системы (7) являются окружности с центром в начале координат: (х!)м + (ха)ч — г! (9) (рис. 8,а). Из (8) видно, что движение фазовой точки по окружности (9) совершается по часовой стрелке, причем равномерно, с линейной скоростью 2пг (один оборот Рис. 7 за время 2п). Отметим, в частности, что за промежуток времени, имеющий длину и, фазовая точка, двигаясь по часовой стрелке, описывает половину окружности (9).
При и = 1 система (6) принимает вид х'=х', (10) хт = — х! + 1, или, иначе, !! (х' — В =х, (1 !) — = — (х' — 1). Ю Вспоминая соотношения (7) и (9), находим, что фазовые траектории системы (11) (или, что то же самое, системы (!0)) представляют собой окружности ". центром в точке (1, 0): (х' — 1)з + (х')' = г'. (12) Эти окружности фазовая точка, движущаяся по закону (10), пробегает по часовой стрелке, обходя за время и ровно половину окружности (см. рис, 8,б).
Аналогично при и = — 1 система (б) принимает вид х! =х~, х = — х' — 1; ее фазовыми траекториями являются окружности (х1+ 1)э+ (хэ)з = г2 с центром в точке ( — 1, 0), По этим окружностям фазовая точка движется по часовой стрелке, проходя ровно половину окружности за время и (см. рис. 8, э). Как было указано выше, каждое оптимальное управление и(1) является кусочно-постоянной функцией, получающейся из функции э!нп(э!п1), равной поочередно Рэе. а +1 и — 1 на интервалах длины и, при помощи сдвига на некоторый отрезок ао (рис.
9). Если оптимальное управление и(!) имеет вид, показанный на рис.*9, т. е. поочередно равно +! и — 1 на интервалах (1э,а), (а,п+ а), (и+ а,2п+а), ... и, в заключение, на некотором интервале длины 8 с и равно +1, то соответствующая оптимальная траектория может быть построе. на следующим образом. В течение заключительного отрезка времени длины )! фаэовая точка движется по окружности вида (12) (ибо и = 1 на этом отрезке времени), причем по той из этих окружностей, которая проходит через начало координат 46 (ибо искомая траектория должна вести в начало координат).
Такой окружностью является окружность радиуса 1 с центром в точке 01 (рис. !0). По этой окружности фазовая точка попадает в начало координат, проходя дугу, меньшую половины окружности (ибо б ( и). Таким образом, обозначив нижнюю полуокруж. ность этой окружности через М~О, мы найдем, Г 1~ с и и и что заключительный кусок оптимальной траекто- Лл'+ и рии представляет собой Рис. 9 некоторую дугу АО полу- окружности М~О. Далее, в положение А фазовая точка попала, дви. гаясь в течение отрезка времени длины и под воздействием управления и = — 1 (рис. 11), т.
е. предыдущий кусок фазовой траектории представляет собой полуокружиость ВА с центром в точке О ь заканчивающуюся в точке А (см. рис. !1). Так как дуга ВА равна полу- окружности, то точка В симметрична А относительно '"б а г Рис. Ю Рис.
Ы центра О ь и потому точка В лежит на полуокружности Ф,Х,, симметричной полуокружности ОМ~ относительно центра О ь Точно так же предшествующая дуге ВА дуга СВ, соответствующая отрезку времени длины и, на котором и = 1, есть полуокружность с центром О„ и потому точка С лежит иа полуокружности М,М3 которая симметрична полуокружности й!пти относительно центра О~ (рис. 12) и т. д.
Таким образом, соответствую. щая фазовая траектория имеет вид, показанный на рис. 12 (начальный кусок фазовой траектории будег меньше половины окружности, если только 0 ( а — гс с ( и; см, рис. 9). Фазовая траектория, соответствующая оптимальном управлению и(1), которое на заключительном отрез! длины )) равно — 1 (а не +1), получаешься из траектори Рис. !2 Рис. 13 изображенной на рис. 12 с помощью центральной сии метрии (рис. 13).
Для такой траектории точка стыка дуг окружностей будут лежать на полуокружностя! Ой!1, М1Мы й1ь й1м ..., симметричных (относительнс начала координат) полуокружностям ОМ„ У!!Ус МсМз Объединяя оба зти случая (см. рис, 12, 13), получаем всю картину поведения фазовых траекторий (рис. 14). На рис. 14 надписаны на дугах фазовых траекторий соответствующие значения управляющего параметра и.
Из рис. !4 видно, что если начальная точка расположена выше линии ... МзМзМ~Ой!!Жзй!з Рис !4 составленной из бесконечного числа полуокружностей радиуса 1, то фазовая точка должна двигаться под воздействием управления и = — 1 до тех пор, пока она не попадет на дугу ...МзМзМ,О„ в момент попадания на эту дугу значение и переключается и остается равным +1 (фазовая точка при этом движется ниже линии ...МзМзМ!О!т'!1тз!!з...) до момента попадания на дугу Ол!!№Фз..., затем точка снова движется выше линии ...
МзМзМ!ОФ!Фзй/з . под воздействием управления и = — 1 и т. д. Последний кусок фазовой траектории (ведущий в начало координат) представляет собой дугу полуокружности М,О или полуокружности ФзО. Совершенно аналогично движется точка и в том случае, если начальная точка «з расположена ниже линии ...МзМзМзОд!!д!зЛ!з .. выше втой линии фазовая точка движется под воздействием управления и — 1, а ниже этой линии в под воздействием управления и=+1.
Итак, согласно теореме ! только указанные траек. торин могут быть оптимальными. Из проведенного по- строения видно, что через каждую точку плоскости проходит одна и только одна траектория описанного вида, ведущая в начале координат, которая может быть оптимальной. Из некоторых дополнительных соображений следует, что все описанные нами траектории оптимальны. Как и в предыдущем 5 10, полученное решение задачи можно истолковать следующим образом. Обозначим через о(х',ха)= о(х) функцию, заданную на плоскости х', хт соотношениями +1 ниже линии ... МаМтМ,ОйЕ,М2М~ ... и на дуге ... МзМтМ,О; о(х)= — 1 выше линии ...
МзМтМ,ОУ,М,М, ... и на дуге ОМ~У,й(, ... Тогда вдоль каждой оптимальной траектории х(Е) соответствующее оптимальное управление и(Е) имеет вид и(Е) = о(х(Е)). Это, как и в $10, означает, что, заменив в системе (6) величину и функцией о(х), мы получим систему (с разрывной правой частью) х' =ха, хз — х'+ о (х', хз) (13) решение которой (при произвольном начальном состоянии хо) дает оптимальную в смысле быстродействия траекторию, ведущую в начало координат. Иначе говоря, системы (13) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных в смысле быстродействия траекторий, ведущих в начало координат.
ПРИЛОЖЕНИЕ ОПТИМИЗАЦИЯ И ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ Научное сообщение *) Вопрос о том, чем следует заниматься, стоит для математиков, быть может, острее, чем для специалистов в других областях знания. Математика, возникшая как чисто прикладная наука, и в настоящее время имеет своей основной задачей изучение окружающего нас материального мира с целью использования его для нужд человечества. В то же время она имеет свою внутреннюю логику развития, следуя которой математики создают понятия и даже целые разделы, являющиеся продукто:и чисто умственной деятельности, которые никак не связаны с окружающей нас материальной действительностью и ие имеют в настоящее время никаких приложений.