Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 10
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 10 - страница
25). Вспоминая теперь, что окру скалЯРное произведение (,~р,), У(х(г,), и(г,))) =НЩ(г,), х(г,), и(~,)) (53) лжно быть неотрицательным (см. теорему 2 и, в частности, соотношение (21)), мы находим, что в качестве „~ (~1) следует взять вектор ( — соэ а, — З1п а), направленный по радиусу внутрь окружности. (Ксли вектор фазовой скорости 1 (х (11), и (11)) окажется направленным по рас.
25. касательной к окружности, то скалярное произведение (53) будет равно нулю, и потому в качестве 1Р (11) можно взять как вектор, направленный внутрь окружности, так и противоположно направленный вектор; в целях единообразия мы и в этом случае условимся считать 5Р (81) направленным внутрь окружности.) Итак, мы имеем: 1р(~1) =( — соза, — 51п а).
Вспоминая теперь систему уравноний (см. стр. 34) ')1 ~Ь лу тз' Ж т1 для нахождения вектор-функции 1Р (Г) = (ф1 (1), ф, (1)), мы получаем окончательно ф1 (1) = — соз (1 — 51 — О), 5РЗ(1) = 51п (1 — 81 — а), "О =- ~ =- "1. ПРИНЦИП МАКСИМУМА ~гл. 1 Соотношение (20) дает нам (учитывая (29) и условие !и/ ( т): и = з$ип ф, = з1яп (61п (г — К, — а)).
(54) Если угол сз удовлетворяет неравенствам 0 ( а (и, то на отрезке гд — (я — я) ( г ( Кг управление и (г) будет, Ркс. 26. в силу (54), равно — т, а перед зтим будет попеременно равно + Ф и — 1 на отрезках длины и (рис. 26). Таким Ряс. 27. образом, последний кусок фазовой траектории (оканчивающийся в точке х,) представляет собой дугу окружности с центром в точке ( — 1, 0), причем эта дуга соответствует центральному углу а — а, а предшествующие ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ 65 б б! 3 Л. С.
Повтвягвв и др. 66 ПРИНЦИП МАКСИМУМА кусни фазовой траектории являются полуокруя<ностями попеременно с центрами в точках (1, О) и ( — 1,0). Вид фазовой траектории показан на рвс. 27. Если же угол а удовлетворяет неравенствам и ==-.а ( 2п, то траектория, изображенная на рис. 27, заменяется центрально симметричной. Легко видеть (см.
рис. 28), что при 0 ( а ( я Ряс. 30. конец В последней дуги ВА рассматриваемой оптимальной траектории расположен на окружности радиуса 1 с центром в точке ( —  — 1, О). При изменении а от 0 до и точка В описывает половину )т',)т, этой окружности, расположенную над осью абсцисс. Далее, предыдущий кусок СВ оптимальной траектории представляет собой полуокружность с центром в точке (1, О), и потому конец С этой полуокружности лежит на полуокружности М,М„ которая симметрична )У,йэ относительно центра (1, О).
Продолжая таким образом, мы и получим всю фаэовую траекторию (рис. 29). Аналогично строится центрально симметричная траектория. Общее расположение фазовых траекторий показано на рис. 30. ПРИНЦИП МАКСИМУМА ДЛЯ НВАВТОНОмных СиСтЮИ Синтез оптимальных управлений осуществляется функией о (х1, хз), которая строится, как вытекает из преыдущего, следующим образом. К окружности (52) прикладываются справа равные между собой полуокружности ММ„М1М„...
радиуса 1, расположенные под осью 1 абсцисс. Слева от окружности (52) строятся аналогичные полуокружности )У1111„ 111,11'„ ..., расположенные над осью абсцисс. Функция и (х1, х') определяется теперь вне окружности (52): и (х1, х') равна + 1 ниже линии ...11'зЛГ1М1М,... и равна — 1 выше линии .„М1М1)У11т,...
Это и дает синтез оптимальных управлений: еы --=х, — = — х' + и (х', х') . З 7. Принцип максимума для неавтономных систем — =у1(х, и, 1), 1=1,2,...,п; У=11'(х(с), и(г), г) й. (55) (56) Время ~е адесь предполагается заданным, а 11 — искомое время прохождения через точку х,. Введя, как и прежде, 1 новую координату х'=~ уо(х(1), и(1), 1) с(1, мы сформу1о лируем рассматриваемую задачу в следующей форме (ср.
з 2). В (п + 1)-мерном фазовом пространстве Х даны точка хе = (О, хо) и прямая П, параллельная оси хе и проходящая 3' А. Рассмотрим оптимальную задачу такого же вида, как и (4), (7), но в случае, когда функции 7е явно зависят от времени (область управления Г предполагается не зависящей от времени). Таким образом, закон движения объекта и функционал, минимум которого ищется, принимают в рассматриваемом случае вид ПРИНЦИП МАКСИМУМА через точку (О, х). Среди всех допустимых управлений и = и (1), обладающих тем свойстпволг, что соответствующее решение х(1) системы — *;=/'(х, и, г), 1=0,1,..,,п, (57) с начальным условием х(ег) = хг пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату х'.
Для решения этой аадачи введем еще одно вспомога- тельное неизвестное х"+', иаменяющееся по аакону (г,) = г,. Очевидно, что мы будем иметь х"ы = г. Пространство переменных хг, хз, ..., х", х ы обозначим через Хи. С помощью неизвестного хим система (57) может быть записана в следующем автономном (т. е. не аависящем явно от г) виде: — * — = 7г (х, и, хи '), 1 = О, 1,..., п, 1и3и.1 — =1 дг При этом мы должны найти оптимальную траекторию, соединяющую в пространстве Хи точку (х'„хз„..., х",, 4>) с некоторой точкой прямой Яю проходящей череа точку (х'„хз„..., х"„0) параллельно оси х"'г (ибо конечное значение переменного х 'г, т.
е. момент времени, когда движущаяся точка приходит в положение х„не является заранее заданным). Таким обрааом, мы приходим к обычной оптимальной задаче с закрепленвым левым концом и подвижным правым концом. Напишем принцип максимума и условие трансверсальности для полученной задачи. Вспомогательная система уравнений (12) имеет вид п ч~ д(« — = — У вЂ”,ф„1=0, 1,..., и, (58) «г ~ы «~ и (59) и 0 ~ н принцип максимумА для нвавтономньгх систкм ее Согласно теоремам 1 и 3, для решения рассматриваемой еадачи нужно составить функцию ф~о(х, и, х""')+ф,7'(х, и, х"+')+... ...+ф„/" (х, и, хты)+ф„+, 1.
8 у функцию мы обовначим череа М"* (а не чарва Л, как в теореме 1), сохранив обоаначение о%" для функции Я" (ф, х, с, и) =фс7а(х, и, г)+ ф 7г(х, и, д) +... ...+ф„7'"(х, и, С), с помощью которой уравнения (57), (58) записываются в виде гамильтоновой системы Ех' доЯ" от; доУС" Ш дф; ' Ш дх~' 1=0 ... и. Точно так же максимум по и функции М * при фиксированных х', ф, мы обовначим через еда (ф, х, х ") (а не через ед, как в теореме 1), сохранив обоаначение ,ед(ф х, Ф) для максимума (по и) функции Л (ф, х, Ф, и) при фиксированных ф, х, 8.
Таким образом, учитывая соотношение хкм = ~, мыможем написать М"* = З"+ ф„+„ ,Яа = ее+ ф„+„ипотому соотношениеМ е = ед* = О, выполняющееся вдоль оптимальной траектории (см. теорему 1), принимает вид Л" (ф(~), х(с), с, и(с))=аду(ф(х), хЯ, й): — ф„„(д). (60) Наконец, условие трансверсальности в правом конце траектории покавывает, что прямая Яг (параллельная оси х"+1) ортогональна вектору (ф (8,), ф, (С~), ..., ф„, (сг)).
Иначе говоря, ф„„, (гД = О. Вместе с соотношениями (60), (59) это дает нам Итак, мы получаем следующую теорему (принцип максимума для неавтономных систем). Т е о р е м а 4. Пусть и (8), ~а ( д ( ~„— такое допустимое управление, что соотеетстщющая ему траектория х (1) системы (57), исходящая е момент до ие точки хю пгинцип млксимтмл Сгл. с 70 проходит в момент С, через некоторую точку прямой П. Для оптимальности управления и (С) и траектории х (С) необход мо существование такой ненулевой непрерывной веюпор-функции ф (С) = (~уг (С), ~Р, (С), ..., $„(С)), соответствующей функциям и (С) и х (С) (см. (58)), что: 1' для всех С, Сг ( С ( С„функция чЯ (ф (С), х(С), С, и) переменного и~У достигает в точке и = и (С) максимума М (1Г (С), х (С), С, и (С)) = Ж (~> (С), х (С), С); (61) 2' выполнены соотношения ~У,(С) =сопе$ ~0, - (р(С)..(С).
С)=~ ~ ""'*0);""") МСИ Пч 0 (62) чуо(С,)(0, М(зу(С,), х(С,),С,)=0. (63) Б. Если теперь предположить, что точка хы в которую точка хв должна переводиться с помощью управления и (С), не неподвижна, а перемещается, т. е. хс = хс (С), то формулировка теоремы 4 несколько меняется. Именно, пусть и (С), Сг = С ( Сд, — такое допустимое управление, которое точкУ хг в некотоРый момент вРемени Сс пРивоДит в точкУ х, (С,), и пусть — ' = (д', д',..., д") — касательный ш вектор к кривой хс (С) в момент С,. Тогда, после введения вспомогательного переменного х"е' = С, мы получим, что многообрааие Яс будет уже не прямой, параллельной оси х ы, а линией (х', (8), ха (8), ..., х" ,(8), 9), где 8— параметр. Касательная этой линии в точке 8 = с, Окозъсвается, далее, что если величины ф(С), х (С), и (С) удовлетворяют системе (57), (58) и условию $', то функция ф, (С) переменного С постоянна, а функция М(зр(С), х(С), С) может лшиь на константу отличаться от интеграяа, указанного во втором соотношении (62), так что проверку соотношений (62) достаточно произвести лишь в какой-либо один момент времени например, вместо (62) достаточно проверить гостю~ шения принцип мАксимумА для нвовтономных систем 71 1 7) определяется вектором (д', д', ..., д", 1), и потому условие трансверсальности принимает вид Х-Фо (1 ) д'+ Ф„1 (1 ) 1 = О.
о 1 ()тсюда, учитывая соотношение (60), получаем .я (1р (1,), х (1,), 1,) = — фа„, (1,) = у Ь, (1,) 7», т 1 '1 ак как, наконец, согласно (60) и (59), функция ос (1р(1), х ((), () является первообразной для 1г (1) 1 д/а(х(0, и (1), 0 а о то мы получаем .я ( р (1), х (1), 1) = а а =~~, ор (11) Д'+ ~ ~ — ' ' $ (()Ю.
(64) о 1 1,а О Это и есть соотношение, которым необходимо заменить второе из равенств (62) в формулировке теоремы 4; в свяаи с зтим соотношения (63) принимают вид "ро ((1) ( О, Ф (1р (81), х (1,), 11) = ~', 1(1 (1,) д' (65) В остальном же формулировка теоремы 4 сохраняется. В. Наконец, рассмотрим неавтономную оптимальную задачу с подвижными концами. Ограничимся случаем подвюкного правого конца. Пусть 8, (1) — перемещающееся г-мерное многообразие, дифференцируемым обрааом аависящее от 1. Задача заключается в отыскании такого допустимого управления и (1), 1 ( 1 ( (1, что точка, движущаяся по закону (55) с начальным условием х (8о) = хо, попадает в некоторый момент 1, на многообразие Я, (11), причем осуществляется минимум функционала (56).
Уточним прежде всего понятие «перемещающегося многообразиям Пусть в (и + 1)-мерном пространстве 72 ПРИНЦИП МАКСИМУМА ~гл. « переменных ха, х', ..., х", «рассматривается (г + 1)- мерное многообразие Я, определяемое системой уравнений ~,(х', х»,..., х", «)=О, 7» (х', х',..., х", «) =О, (66) ~„,(х«, х',..., х", «) =О. Предполагается далее, что левые части этих уравнений имеют непрерывные первые проиаводные по х', х', ..., х, 8 и что ранг функциональной матрицы (-ф в каждой точке многообразия 87 равен я — г. Рассмотрим теперь в пространстве Х переменных х', х», ..., х" систему уравнений г,(х", х',..., *", ~ ) =О, ~»(х', х',..., х', »») =О, (67) г„,(х', х»,..., х", «е) =О,' получающуюся из (66) при фиксированном значении « =«е.