Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 7
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 7 - страница
М,М,М,О; в момент попадания па зту дугу значение и переключается и остается пРимеРы. 3АдАчА синтезА +1 ниже линии ... МЗМ,М,ОХ,Х,Л~З и на дуге .. МЗМ,М,О; — 1 выше линии ... МЗМ,М,ОЛ",Л',Л' .. и на дуге ... ОХ,Х,Л; ... Р(х) = Тогда вдоль каждой оптимальной траектории х (~) соответствующее оптимальное управление и (1) имеет вид и (й) = Р (х (Ю)). Это, как и выше, означает, что, заменив в системе (28) равным +1 (фазовая точка при этом движется н и ж е ли„ни „,.
М,М,М,ОМ,И,Из ...) до момента попадания на дугу ОЛ',Л'зЛ'з ..., 'затем точка снова движется в ы ш е линии ... МЗМзМ1ОХ1ХзХЗ ... под воздействием управления и = — 1 и т. д. Последний кусок фазовой траектории (ведущий в начало координат) представляет собой дугу полуокружности М,О или полуокружности Я,О. Совершенно аналогично движется точка и в том случае, если начальная точка х, расположена н и >к е линии ...
МЗМ,М,ОЛ',Х,Хз .... выше этой линии фазовая точка движется под воздействием управления и = = — 1, а ниже этой линии — под воздействием управления и=+1. Итак, согласно теореме 2, только указанные траектории могут быть оптимальными, причем из проведенного исследования видно, что из каждой точки фазовой плоскости исходит только о д н а траектория, ведущая в начало координат, которая может быть оптимальной. Из теоремы существования, доказываемой в главе 3, вытекает, что в рассматриваемом примере для любой начальной точки хз существует оптимальная траектория (см. стр. 142). Таким образом, найденные траектории (рис.
13) являются оптимальными, и других оптимальных траекторий, ведущих в начало координат, не существует. Как и в первом примере, полученное решение оптимальной задачи можно истолковать следующим образом. Обозначим через и (ха, х') = и (х) функцию„заданную на плоскости х", хз соотношениями: 42 ПРИПЦПП МАКСИМУМА 1гл. 1 величину и функцией Р (х), мы получим систему дх~ ш г 1 — = — х1 + у (хт, х2), Л1 (38) решение которой (при произвольном начальном состоянии х,) дает оптимальную фазовую траекторию, ведущую в начало координат. Иначе говоря, система (38) представляет собой систему дифференциальных уравнений (с разрывной правой частью) для нахождения оптимальных траекторий, ведущих в начало координат.
Пример 3 Рассмотрим теперь систему с двумя управля1ощими параметрами: — =х +и, 2 1 Л1 (30) (40) Н = 2р1 (х'+ и') + 2Р2 ( — х'+ и2) и вспомогательную систему Из этой системы мы получаем 2р = А в1п (8+ а), 2рв = А соз (~ + а), где А и а — постоянные; А ) 0,0( а ( 2я. Соотношение причем величины и1, из подчиним условиям )и'! .=: 1, (и2((4. Для этой системы мы, как и в двух первых примерах, изучим задачу о быстрейшем попадании в начало координат. Выпишем функцию Н пРимеРы. 3АдАчА синтезА (20) дает нам теперь (учитывая (40) и условия (и1( м- 1, /й! ==-1) ц1= з)яп 1рт — — З1ип (А зш (1+ и)) = з(яп (э1п (1+ а)), (41) цв = з)ип тр = з(яп (А соз (1+ а)) = э(яп (соз (1+ а)).
Таким образом, в случае оптимального управления каждый из управляющих параметров и1, и' является кусочно- постоянной функцией, принимающей значения +1 и — 1. Из рассмотрения системы (39) мы легко заключаем, что куски фазовых траекторий, соответствующие отрезкам времени, на которых и1 =- 1, ц' = 1, представляют собой дуги окружностей с центром в точке О,„имеющей координаты (1, — 1). Аналогично при ц' = 1, ив = — 1 и т. д., как это указано в следующей таблице: Центр онружностео, евлвющнтс» соответствующими февовымн треенторнвмн системы (Ю) с координатами (1, — 1) с координатами (1, 1) с координатами ( — 1, 1) с координатами ( — 1, — 1) 01,1 о о о, Во всех случаях движение по соответствующим фазовым траекториям (окружностям) совершается по часовой стрелке, причем равномерно, со скоростью один оборот за время 2я.
В частности, за время, равное — ", фаэовая точка пробегает четверть окружности. Из (41) следует, что в тот момент, когда аргумент 1+ а проходит через точки Й вЂ” (Й вЂ” проиавольное це- 2 лое число), один из управляющих параметров ц', и' меняет знак (так как в каждой из этих точек либо синус, либо косинус проходит через нуль). Иначе говоря, в моменты времени, для которых 1+ а = Й вЂ”, происходит смена значений управляющих параметров ит, иэ, т. е. происходит с м е н а ц е н т р а окружности, по которой движется фаэовая точка. Такая смена центра происходит 44 ПРИНЦИП МАКСИМУМА !гл. д через кая<дые — единиц времени, так что фазовая траектория составлена из четвертей окружностей с центрами О, д, О,л, О,,; О,, Исключение составляют только первый и последний куски фазовой траектории: они могут оказаться меньшими, чем четверть окружности.
Далее, нетрудно понять, в каком порядке происходит смена центров. Если при возрастании 4 аргумент 1 + а 0 л, проходит череа значение д+а = 2йя ()д — целое число), то непосредственно и е р е д этим моментом выполнялись и,, ~ди соотношения и' = — 1, и' = = + 1 (см. (41)), т. е. двиРис. 14. жение происходило по дуге с центром О, „ а и о с л е этого момента выполняются соотношения ид=+1, из=+1, т. е. движение происходит по дуге с центром Одл Иначе говоря, центр О дд сменяется центром О,а. Аналогично, центр О,з сменяется центром О д (при прохождении аргумента ~ + а через значение 2)дя + — (см.
(41)), центр Од, д сменяется центром О д „а центр О,, — центром О,А. На рис. 14 стрелки указывают порядок смены центров. Теперь уже нетрудно представить себе поведение фазовых траекторий. Для этого мы проведем следующее вспомогательное построение. Рассмотрим окружность с центром О, „проходящую через начало координат, и обозначим через ОМ дугу этой окружности, расположенную под осью абсцисс (дуга ОМ, равна, очевидно, четверти окружности). Далее, обозначим через МдМд дугу, равную ОМ, и получающуюся из нее переносом на отрезок ОМ,; аналогично построим дугу МдМз и т.
д. (рис. 15). Заметим, что абсциссы точек М„М„ Мз ... равны соответственно 2, 4, 6, ... Повернув теперь линию ОМдМдМз..., составленную из равных чет- и Зя вертей окружностей, на углы —, я, — вокруг начала 4с ПРИНЦИП МАКСИМУМА [гл. 1 координат, мы получим изображенные на рис. 16 линии ОЛ~,Л~,Л~з .', ОргРР, ..., 0010зОз ... Теперь начнем строить фаэовую траекторию. Возьмем оптимальное управление (имеющее на некотором конечном отрезке времени вид (41)) и предположим для определенности, что на и о с л е д н е м участке постоянства, имеющем длину р ( —, управляющие параметры принимают значения ит=+1, и' =+1. Соответствующий кусок фазовой траектории (рис.
17, а)) представляет собой некоторую дугу АО четверти окружности ОдО (ибо этот кусок лежит на окружности с центром О,л и оканчивается в начале координат, а длина этого куска не превосходит четверти окружности). Согласно сказанному выше, центру Оьт предшествует центр О,А (рис. 14), и потому участок фазовой траектории, предшествующий точке А, является четвертью окружности с центром О зл (дуга ВА на рис. 17, б)). Управляющие параметры имеют на атом участке значения и' = — 1, и' =+ 1. Так как точка А находилась на дуге ~,0, то точка В будет находиться на дуге, получающейся из 0,0 поворотом на угол— вокруг точки О,л, т. е.
на дуге М,М,. Далее, центру 0 гл предшествует центр О и потому кусок фазовой траектории, предшествующий точке В, представлял собой четверть окружности с центром в точке О д 1 (дуга СВ на рис. 17, з)). Управляющие параметры имеют значения и' = — 1, и' = — 1. Так как точка В находилась на дуге МдМ„ то точка С будет находиться на дуге, получающейся из МдМ, поворотом на угол — вокруг точки О, ы 2 т. е. на дуге Ф,Фз.
Продолжая таким образом, можно вычертить всю фазовую траекторию. На рис. 17, г) показана фаэовая траектория, составленная из трех дуг, являющихся четвертями окружностей, и двух дуг (начальной и конечной), каждая иэ которых меньше четверти окружности. Если бы мы предположили, что на последнем участке постоянства управляющие параметры принимают не значения ит =-(.1, из =-+1, а значения иг = — 1, из =+1 п1'п11е1'ъ|. 3АЛА'1л синтезА 47 кли значения и' = — 1, из = — 1 или, наконец, значения ц1 =+1, из = — 1, то построили бы аналогичные фазовые зl и и а) Рис. 47, траектории, получающиеся из траектории, изобра1кен- и Зп кой на рис. 17, г)„поворотом на углы —, д, —, Четыре ЦР11»дцидд максимума 48 ~гл.
1 получающиеся таким образом фазовыо траектории изображены на рис. 18. Анализируя значения управляющих параметров на отдельных кусках всех получающихся таким обравом Рис. 18. фазовых траекторий, мы приходим к следующему выводу. Линии ОМ,М,М, ..., Од«"дддд»дт'» ..., ОР,Р,Р, ОДд~Щ»... разбивают плоскость на четыре части, четыре «криволинейных квадранта», которые мы обозначим римскими цифрами 1, 11, 111, 1Ч (рис. 19).
На кусках фазовых траекторий, расположенных в «квадранте» 1, управляющие параметры принимают значения ид = — 1, и« = — 1. Под действием етого управления фазовая точка достигает линии ОМ,М,М» ..., и в момент попадания пРимеРы. зАдАчА синтезА «51 яа эту линию значения управляющих параметров переключаются и становятся равными ит = — 1, и» = + 1, Йод действием этого управления фазовая точка движется Рис. «9. в «квадранте» 1« и достигает линии О~ЯД» ..., Причем в момент попадания на эту линию управляющие параметры принимают значения и' = +1, и' = — +1 и т. д. Все эти факты собраны в следующей таблице: Итак, согласно теореме 2, только найденные траектории могут быть оптимальными, причем из проведенного исследования видно, что из каждой точки фазовой плоскости исходит только о д н а траектория, ведущая в начало координат, которая может быть оптимальной.
Из теоремы существования (гл. 3) вытекает, что в ПРИНЦИП МАИСИМУМЛ [ГЛ. 1 рассматриваемом примере для любой начальной точки х, существует оптимальная траектория (см. стр. 142). Таким образом, найденные траектории (рис. 18) являются оптимальными, и других оптимальных траекторий, ведущих в начало координат, не существует.
Как и в двух первых примерах, полученное решение оптимальной задачи можно истолковать следугощим образом. построим на плоскости х1, х' две функции и1 (х', х3) и уз (х', х'): + 1 левее линии ...(131,13()1ОЛ11Л'3Л'3 ... и на дуге ... гЩ31,110, — 1 правее линии ...фф,1',),ОЛг,Х,Л1,... и па дуге ...Л' Л13Х10; и1(х1, х3) = +1 ниже линии РЗРЗР1ОМ1МЗМ3.