Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 10
Текст из файла (страница 10)
теорему 2 и, в частности, соотношение (21)), мы находим, что в качестве ф(!1) следует взять вектор ( — сова,— з!па), направленный по радиусу внутрь окружности. (Если вектор фазовой скоросгн !(х(1~),и(1~)) окажется направлсиным по касательной к окружности, то скалярное произведение (53) будет равно нулю, и потому в качестве 4. (1,) можно взять как вектор, направленный внутрь окружности, так и противоположно направленный вектор; в целях единообразия мы и в этом случае условимся считать ~р(1,) направленнгям внутрь окружности.) 14тяк, мы имеем: ф(1,) =( — сова, — з!па). Вспоминая теперь систему уравнений (см.
стр. 34) сч2 — = — 4и Ю длЯ нахождениа вектоР-фУнкцни ф (!) = (4ч (!), фз (!) ), мы получаем окончательно ф,(!)= — соз(! — 1, — а), тра(!)=з(п(! — 1, — а), !с(!(!о Соотношение (20) дает нам (учитывая (29) н условие (а(< !): и=а(цп4>,=з!рп(з!п(! — 1, — а)). (54) Если угол а удовлетворяет неравенствам 0(а( ( и, то на отрезке 1~ (и а) ~ ! ( 1, управление Ряа 26 и(!) будет, в силу (54), равно — 1, а перед этим будет попеременно равно +1 и — 1 на отрезках длины и (рис, 26). Таким образом, последний кусок фазовой траектории (оканчива|ошпйся в точке х,) предсгавляет собой дугу окружности с центром в точке (- 1,0), при- б б! злдбчб с подвижными концами чем эта дуга соответствует центральному углу и — бб, а предшеству!огцие куски фазовой траектории являются полуокружностями попеременно с центрами в точках (1,0) и ( — 1,0). Вид фазовой траектории показан на рис.
27. Если же угол а удовлетворяет неравенствам Рис 21. бт < сб < 2п, то траектория, изображенная на рис. 27, заменяется центрально симметричной. Легко видеть (см. рис. 28), что при 0 < а < и конец В последней дуги ВА рассматриваемой оптимальной траектории расположен на окружности радиуса 1 с центром в точке ( — Я вЂ” 1,0). При изменении а от 0 до и точка В описывает половину №!у! этой окружности, расположенную пад осью абсцисс.
Далее, предыдущий кусок СВ оптимальной траектории представляет собой полуокружность с центром в точке (1,0), и потому конец С этой полуокружности лежит на полуокружности МбМб, которая симметрична Ф!№ относительно центра (1, 0). Продолжая таким образом, мы и получим всю фазовую траекторию (рис. 29). Аналогично строигся центрально Л. С. Понтрнгин б ар. ЗАДА'!А С Г!ОДВИЖНЫМИ КОИЦАМИ симметричная траектория.
Общее расположение фазовых траекторий показано на рис. 30. Синтез оптимальных управлений осуществляется функцией о(х',х~), которая строится, как вытекает нз предь!дущего, следующим образом. К окружности (52) Рвс. 30. прикладываются справа равные между собой полуокружностн М!М,, М,МИ ... радиуса 1, расположенные под осью абсцисс.
Слева от окружности (52) строятся аналогичные полуокружности !у!!х'м !!х!хм ..., расположенные иад осью абсцисс. Функция в(х!,х') определяется теперь вне окружности (52): о(х!,х') равна +1 ниже линии ... й!хй(!М!Мх ... и равна — 1 выше линии ... М,М!И!И, ... Это и дает синтез оптимальных управлении: вх! 1 — =х', <!! !!х2 — = — х'+ п(х!, х~). пгпнцпп мккспмкмл й 7. Принцип максимума для неавтономных систем А Рассмотрим оптимальную задачу такого же вида, как н (4), (?), но в случае, когда функции Г'"- явно зависят от времени (область управления У предполагается пе зависящей от времени).
Таким образом, закон движения объекта н функционал, минимум которого ищется, принимают в рассматриваемом случае внд — =?'(х, и, 1), 1=1, 2, ..., и; (55) У = ~ ) ь (х ((), и (1), 1) й(. (56) с начальным условием х(1ь) = хе пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату хь. Для решения этой задачи введем еще одно вспомогательное неизвестное х"+', изменяющееся по закону ах" +' х" (гь) = го. ас Очевидно, что мы будем иметь х"+' = й Пространство переменных х', хз, ..., х", х"+' обозначим через Х'.
С помощью неизвестного х"+' система (57) может быть записана в следующем автономном (т. е. не зависящем Время (ь здесь прелполагается заданным, а 1~ — искомое время прохождения через точку хь Введя, как и прежде, новую координатухь = ~ ?ь(х(1), и(1), 1)Ш, мы сформус, лируем рассматриваемую задачу в следующей форме (ср. з 2).
В (и+ 1) -мерном фазовом пространстве Х даны точка хь = (О, хь) и прямая П, параллельная оси хь и проходящая через точку (О,х|). Среди всех допустимых управлений и = и((), обладаюи(их тем свойством, что соответствующее решение х(() системы — =?'(х, и, 1), 1=0, 1, ..., и, (57) пгин[п!и млкг!$иуч! пля пглвтономпы» сиГТГМ! вй явно от 1) виде: — „=1!(х х+'), .=0, 1, ..., и, ~„!+! 1 д! При этом мы должны найти оптимальную траскторию, соединяющую в пространстве И' точку(х', х', ..., х", 1,) с некоторой точкой прямой 5!, проходяшей! через точку (х,', хз„..., х,", О) параллельно оси х"+' (ибо конечное значение переменного х"+', т. е. момент времени, когда движущаяся точка приходит в положение хь не является заранее заданным).
Таким образом, мы приходим к обычной оптимальной задаче с закрепленным левым концом и подвижным правым концом. Напишем принцип максимума и условие трансверсальности для полученной задачи. Вспомогательная си. стема уравнений (12) имеет вид и!г! г~ д!~ — — — !=О, 1, ..., п, (58) дх О О л+1 д1 2.г д1 (59) и-О Согласно теоремам 1 и 3, для решения рассматриваемой задачи нужно составить функцию (о(х и х!!+!)+ ф 1! (х, и, х!!+!) + ... + !~!„1" (х, и, х"+!)+ф„+! ° 1. Эту функцию мы обозначим через Ж' (а не через Я, как в теореме 1), сохранив обозначение Я для функции дй(зр, х, 1, и) = ~Яв(х, и, 1) + ф!)'! (х, и, К) + ...
... + р„г" (», п, г), с помощью которой уравнения (57), (58) записываются в виде гамильтоновой системы дх! даз д!)! дМ с=0,1,..., и. Ж Щ !И дх! 7О пгпнцссп мхоспмумо )ГЛ. ! Точно так же максимум по и функции Ж* при фиксиро- ванных х', ср! мы обозначим через сс*(ср,х,х"+') (а не через .л', как в теореме 1), сохранив обозначение .Ж(ср,х, 1) для максимума (по и) функции Зь'(ф,х, 1, и) при фиксированных ср, х, й Таким образом, учитывая соотношение х"ч.! =1, мы можем написать М* =,Ж+ +се +ь М'= Х+!р с!. и потому соотношение Ж'= = Х* = О, выполняюгцееся вдоль оптимальной траек- тории (см, теорему !), принимает вид Я(Ф(1), х(1), 1, и(1)) =.Х(р(1), х(1), 1) — = — ф„ос(1).
(60) Наконец, условие трансверсальпости в правом конце траектории показываст, что прямая о! (параллельная оси х +') ортогональна вектору (фс(1,),ср,(1,),... ...,ср„+с(1!)). Иначе говоря, ср„!с(1,) = О. Вместе с со- отношениями (60), (59) это дает нам л о!с'(к(с), и (с), с) с, о=о Итак, мы получаем следусошую теорему (принцип максимума для неавтономных систем). Теорема 4.
Лусть и(1), 1о(1 ~1ь — такое допу- стимое управление, что соответствующая ему траектория х(1) системы (57), исходящая в момент 1о из точки хо, проходит в момент 1! через некоторую точку прямой !1. Для оптимальности управления и(1) и траектории х(г) необходилсо существование такой ненулевой непрерыв- ной вектор-функции ср(1) = (сро(1), ф! (1),..., ф„(1) ), со- ответствующей функциям и(1) и х(!) (см. (58)), что: 1' для всех 1, 1о ( 1 ( 1„функция Я (ър (1), х (1), 1, и) переменного и е= У достигает в точке и = иЯ макси- мума уй (ср (1), х (1), С, и (1)) = .Х (с)! (1), х (1), 1); (6!) 2' выполнень! соотноисения Фо(1) =сопя!(О, с „ (62) .лт(ср(1) х(1) 1) $ ~~)" вУ (х!с), и (с), О с, о-о принцип млксимхмл для нгсчвтономных систем т) Оказывается, далее, что если величины ф((), х(1), иЯ удовлетворяют системе (57), (58) и условшо 1', то функция фь(1) переменного 1 постоянна, а функция кл'(ф(1), х(1), 1) может лишь на константу отличаться от интеграла, указанного во втором соотношении (62), так что проверку соотношений (62) достаточно произвести лишь в какой-либо один момент времени ), 1„(1 1~,' например, вместо (62) достаточно проверить соотношения $ь(1,)~~0, Я(4 (1,), х(1,), (,)=О.
(63) Б. Если теперь предположить, что точка хь в которую точка хь должна переводиться с помощью управления и(1), не неподвижна, а перемешается, т. е. х, = = х1 (1), то формулировка теоремы 4 несколько меняется. Именно, пусть и(1), 1ь (1()ь — такое допустимое управление, которое точку хь в некоторый момент чх1 ~ времени 11 приводит в точку х1(1~), и пусть — „ т) „ ,, = =(д', д', ..., у") — касательный вектор к кривой х,(1) в момент 1,. Тогда, после введения вспомогательного персмепного хч~ы = — 1, мы получим, что многообразие 5; будет уже не прямой, параллельной оси х"+', а линией (х,'(8), хг(О), ..., х,"(О), О), где 0 — параметр.
Касательная этой линии в точке 8 = (, определяется вектором (д', дг,..., д", 1), и потому условие трансверсальности принимает вид Х фч(1~)у'+$ + (1~) 1=0. Отсюда, учитывая соотношенис (60), получаем П Яй(11) х(1~). (1)= — Ф. 1(11)= Х Ф,(1~)у'. ч Так как, наконец, согласно (60) и (59), функция Я(ф(1),х(1),1) является первообразной для ф (г) з)" (х М), и ()), с) д) О 0 [гл с пгинцпп максимума то мы получаем М(Ф(1), х(1), 1) = сс с =~х" ф.(1,)~.+~~ ') '",',"1'1'" ф.(1) и. (64) с,а о Это и есть соотношение, которым необходимо заменить второе нз равенств (62) в формулировке теоремы 4; в связи с этим соотношения (63) принимают вид п ~ъ(1с)(~0, М(с)'((с), х(тс), 1,)= ~.