Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 7
Текст из файла (страница 7)
~ 40 симметрии (оно. 12). Лля такой траектории гочки «стыка» дуг окружностей будут лежать па полуокружносгях ОЛ'ь М,Мз, озфз, ..., симметричных (относительно начала координат) полуокружностям ОЛ1,, Л',йз, МзМз, Рис 12. Объединяя оба эти случая (рис. ! !в и 12) вместе, получаем всю картину поведения фазовых траекторий (рис.
13). На рис. 13 надписаны па дугах фазовых траекторий соответствующие значения управляющего параметра и. Нз рис. 13 видно, что если начальная точка хз расположена в ы ш е линии .. МзМзМ1ОУ~Фзй(з, составленной из бесконечного числа полуокружностей радиуса 1, то фазовая точка должна двигаться под воздействием управления и = — 1 до тех пор, пока она пе попадет на дугу ... МзМзМ~О; в момент попадания на эту дугу значение и переключается и остается равным +! (фазовая точка при этом движется ниже липни ...
й!зМзй(,ОУ,'узЛ'з ...) до момента попадания на Пе!!МГРЫ ЗАДАЧА СП!!ТГЗ4 4! дугу О!У!Л~!У, ...; затем точка снова движется вы ш е линии ... М,М.М!О!у!г!гЛ'з ... под воздействием управления и = — ! и т. д. !1оследний кусок фазовой траектории (ведуший в начало координат) представляет собой дугу полуокружиости М!О или нолуокружпости !У!О. Совсрн!епво аналогично движется точка и в том Рис. 13. случае, если начальная точка х!! расположена ниже линии ... МзМзМ!ОЛ!!Фз1У4 .... выше этой линии фазовая точка движется под воздействием управления и = — 1, а ниже этой линии в под воздействием управления и = +1.
Итак, согласно теореме 2, только указанные траектории могут быть оптимальными, причем из проведенного исследования видно, что из каждой точки фазовой плоскости исходит только одна траектория, ведущая в начало координат, которая может быть оптимальной. Из теоремы существования, доказываемой в главе 3, вытекает, что в рассматриваемом примере для любой !гл ~ ПРИНЦИП МАКСИМУМА 42 начальной точки ха существует оптимальная траектория (см. стр.
!47). Таким образом, найденные траектории (рис. (3) являются оптимальными, и других оптимальных траекторий, ведущих в начало координат, не существует. 1(ак и в первом примере, полученное решение оптимальной задачи можно истолковать следующим образом. Обозначим через о(х',ха) = о(х) функцию, заданную иа плоскости х', х2 соотношениями: + ! Ниже линии ... МКМ М,ОН,И Иа ...
и на дуге ... МКМаМ,О; о(х) = — ! выше линии ... МКМ2МФ)У~)УЛз ° ° ° и на дуге 07У,Н27УА ° Тогда вдоль каждой оптимальной траектории х(!) соответствующее оптимальное управление и(!) имеет вид и (!) = о (х (!)). Это, как и выше, означает, что, заменив в системе (28) величину и функцией о(х), мы получим систему ДХ! ! — =х и э дх' — = — х'+ о(х', ха), (38) Пример 3 Рассмотрим теперь систему с двумя управляющими параметрами: — =х'-+и, их' л! (39) решение которой (при произвольном начальном состоянии ха) дает оптимальную фазовую траекторию, ведущ)чо в начало координат. Иначе говоря, система (38) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных траекторий, ведущих в начало координат.
ПРИМГРЫ. ЗАЛАЧА СИНТЕЗА 43 причем величины и', ит подчиним условиям (и' ~ ( 1, !ит)(!. для этой системы мы, как и в двух первых примерах, изучим задачу о быстрейшем попадании в начало координат. Выпишем функцию Н Н=ф, (ха+ и') +фу( — д'+и') (40) Таким образом, в случае оптимального управления каждый из управляющих параметров и', иу является кусочно-постоянной функцией, принимающей значения +1 и — 1.
Из рассмотрения системы (39) мы легко заключаем, что куски фазовых траекторий, соответствующие отрезкам времени, на которых и' = 1, и' = 1, представляют собой дуги окружностей с центром в точке Оьь имеющей координаты (1,— !). Аналогично при и' = 1, ит = — 1 и т, д., как это указано в следующей таблице: ! центры окружностей. являющихся со >тветствующимк фазовыми трзскториямв системы (39! Постоянные значения увраввяющих иараметров на некотором отрезке времени Точка Я2 ~ с координатами (1. — 1) Точка Я , с координатами (1, 1) Точка Я ~ 2 с координатамн ( — 1, 1) Точка Я, |скоорди 2итами ( — 1, — 1) и' 1 из 1 и' — 1 из — 1 и' =1 и' = — 1, и' = — 1, и' 1, и всполюгательную систему С!2)2 ИУ =фк фз и Из этой системы мы получаем ф, = Аз!п((+ а), фа= Л сов(1+ а), где А и сд — постоянные; Л > О, 0( а< 2п.
Соотно- шение (20) дает нам теперь (учитывая (40) и условия !и'~(1, )ит~(1) и' = з(опт!22 = з!дп(Л з(п(!+ о)) = з1дп(з(п(1+ а)) ит = з1дп фт = з!дп (Л соз (1 + а)) = з(ип (соз (! + а)). (41) ПГИНШ4П МАКСИМУМА 1тл 1 Во всех случаях движение по соответствующим фазовым траекториям (окружностям) совершается по часовой стрелке, причем равномерно, со скоростью один оборот за время 2я. В частности, за время, равное —. фа- 2' зовая точка пробегает четверть окружности. Из (41) следует, что в тот момент, когда аргумент !+ а проходит через точки й — (й — произвольное це- 2 лое число), один из управляющих параметров и', из меняет знак (так как в кажХ~ дой из этих точек либо синус, либо косинус проходит через гч нуль).
Иначе говоря, в моменты времени, для которых г + и = й —, происходит сме- 0 Х на значений управляющих параметров и', и', т. е. происходит смена центра ок- 0 ружностн, по которой движется фазовая точка. Такая смена центра происходит через Рчс. 14. Л каждые — единиц времени, 2 так что фазовая траектория составлена из четвертей окружностей с центрами Оьб О ьб О ~ П О,, Исключение составляют только первый и последний куски фазовой траектории: онп могут оказаться меньшими, чем четверть окружности. Далее, нетрудно понять, в каком порядке происходит смена центров.
Если при возрастании ! аргумент !+ а проходит через значение 1+ а = 2йи (й — целое число), то непосредственно перед этим моментом выполнялись соотношения и' = — 1, из =+1 (см. (41)), т. е. движение происходило по дуге с центром О, ь а после этого момента выполняются соотношения и' = +1, и' = = +1, т. е. движение происходит по дуге с центром Оь ь Иначе говоря, центр О ь ~ смсняется центром Оь ь Аналогично, центр Оь~ сменяется центром Оь, (при прохождении аргумента !+а через значение 2йп + — ' 2 пгпмггга з>ч" '.~ спнтгзх (см. (41) ), центр 0>, > сменяется центром 0 >, ь а центр 0 ь > — центром 0 ~ >. 1!а рпс. !4 стрелки указывают порядок смены центров.
Теперь угке нетрудно представить себе попечение фазовых траекторий. Для этого мы проведем слсдуюгцее вспомогательное построение. Рассмотрнь> окружность с центром 0 , ь проходящую через начало координат, и обозначим через ОМ, дугу этой окружности, расположенну>о под осью абсцисс (дуга ОМ, равна, очевидно, четверти окружности). Далее, обозначим через М1М. дугу, равную ОМ~ и получающуюся из нее переносом на отрезок ОМ6 аналогично построим дугу М>Мз и т. д.
(рис. 15), Заметим, что абсциссы точек Мь М,, Мз ... равны соответственно 2, 4, 6, ... !1овернув теперь линию ОМ1М>М> ..., составленную из равных четвертей и Зп окружностей, на углы —,, л, — вокруг начала координат, мы получим изображенные на рис. 16 линии ОХ>Л>>гуз, ОР>РэР> . ° ., 0010Аз Теперь начнем сгроить фазовую траекторию. Возьмем оптимальное управлсние (имеющсе на некотором конечном отрезке времени внд (41)) и предположим для определенности, что на последнем участке постоянства, имеющем длину !) ( —.
управля>ощие параметры принимают значения и' = +1, и' = +1. Соответствующий кусок фазовой траектории (рис. 17, а) ) представляет собой некоторую дугу АО четверти окружности 0>0 (цбо этот кусок лежит на окружности с центром О>,, и оканчивается в начале координат, а длина этого куска не превосходит четверти окружности). Согласно сказанному выше, центру Оь > предшествует центр О,, (рис, 14), и потому участок фазовой траектории, предшествующий точке А, является четвертью окружности с центром О» (дуга ВА па рис. !7,6)). Управляющие параметры имеют на этом участке значения и> = — 1, и' =+1, Так как точка А находилась на дуге 0~0, то точка В будет находиться на дуге, получающейся из 0~0 поворотом на угол — вокруг точки О ь ь т.
е. на дуге М>Мь пв!!мггы зклм!1 синтгзА Далее, центру О ! ! предшествует центр О ! ь и потому кусок фазовой траектории, предшествующий точке х! Рис. 17. '3, представлял собой четверть окружности с центром з точке О,, (дуга СВ на рис. !7,в)). Управляющие параметры имеют значения и! = — 1, и' = — 1. Так как пгинпип мхксимуи~А точка В находилась па дуге М,Л,, то точка С будет находиться на дуге, получающейся из М~Мз поворотом на угол — вокруг точки О ь ь т.
е. на дуге М2Жз Продолжая таким образом, можно вычертить всю фазовучо Рис. 18. траекторию. На рнс. !7,г) показана фазовая траектория, составленная из трех дуг, являющихся четвертямн окружностей, и двух дуг (начальной и конечной), каждая из которых меньше четверти окружности. Если бы мы предположили, что на последнем участке постоянства управляющие параметры принимают не значения и' = + 1, и' = + 1, а значения и' = — 1, и' = +1 или значения и' = — 1, и' = — 1 или, наконец, пгимггы.
зхдхчл спнтезл 49 значения и' = + 1, 6Р = — 1, то построили оы аналогичные фазовые траектории, получающиеся из траектории, изображенной на рис. !У,г), поворотом на углы и Зп —, и, —,. Четыре получающиеся таким образом фа- 2 ' зовые траектории изображены на рис. !8. Лпализируя значения управляющих параметров на отдельных кусках всех получающихся таким образом фазовых траекторий, мы приходим к следующему выводу. Линии ОМ~М,М6, ОЛ11йгсЛ'6 ..., ОР1Р6Р6 Рис. !9. ОДЯЛУ» ... разбивают плоскость иа четыре части, четыре «криволинейных квадранта», которые мы обозначим римскими цифрами 1, 11, 111, 1Ъ' !рис. !9). На кусках фазовых траекторий, расположенных в «квадранте» 1, управляющие парамегры принимают значения и' = = — 1, из = — !.
Под действием этого управления фааовая точка достигает линии ОМ,М6М, ..., и в момент ПРППЦИП МАКГПМУМА 1гл. ! и' = — 1, и'=+1, и' =+1, и'= — 1, и»= — ! в «квадранте» 1 н на линии ОА1~А1» ... в «квадранте» 11 и на линии ОР, Рз ... в «квадранте» Ц! и на линии ОЯ1Оз ... в «квадранте» 1»' и на линии ОМ,Мз ... и' = — ! и" =+1 из =+1 Итак, согласно теореме 2, только найденные траектории могут быть оптпмальнымп, причем пз проведенного исследования видно, что из каждой точки фазовой плоскости исходит только о д и а траектория, ведущая в начало координат, которая может быть оптимальной.
Из теоремы существования (гл. 3) вытекает, что в рассматриваемом примере для любой начальной точки хе существует оптимальная траектория (см. стр. 147). Таким образом, найденные траектории (рпс. 18) являются оптимальными, и других оптимальных траекторий, ведущих в начало координат, не существует. Как и в двух первых примерах, полученное решение оптимальной задачи можно истолковать следующим образом. Построим па плоскости х', х' две функции и ' (х', хз) и оз (х', х'): + 1 левее линии ...