Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 4
Текст из файла (страница 4)
О решении задачи для случая закрепленных пределов мы будем говорить ниже (см. 5 8). Управление и (~), дающее решение поставленной выше задачи, называется оптимальным управлением, соответствующим переходу из положения х, в положение хь а соответствующая траектория х(1) — оптимальной траекторией, Таким образом, основная задача заключается в отыскании оптимальных управлений (и соответствующих оптимальных траекторий). Важным частным случаем поставленной выше оптимальной задачи является случай, когда ~'(х, и) 1. постлновкл основнои злдлчи Для формулировки доказательства необходимого условия оптимальности нам будет удобно дать иную формулировку поставленной вьюне задачи.
Именно, до- бавим к фазовым координатам х', х', ..., х", меняю- щимся по закону (4), еще одну координату х', закон изменения которой имеет вид — =)ч(х', х', ..., х", и), где 1~ — функция, участвующая в определении функцио- нала с' (см. (7)). Иначе говоря, мы будем рассматривать систему дифференциальных уравнений — = 1~(х', х', ..., х", ис, ..., и') = — 1'(х, и), с = О, 1, 2, ..., а, правые части которой не зависят от переменного хсс.
Вводя в рассмотрение вектор х =(лл, х', хз, ..., х") =(хе, х) (и + 1)-мерного векторного пространства Х, мы можем систему (9) переписать в векторной форме д =г(х, и), (10) где ~(х, и) — вектор пространства Х, имеющий коорди- наты Ях, и), ..., 1" (х, и). Заметим, что вектор 1(х, и) не зависит от координаты хе вектора х. Пусть теперь и(с) — некоторое допустимое управле- ние, переводящее хе в хс, а х = х(1) — соответствующее решение уравнения (5) с начальным условием х(1а) = хм Обозначим через хо точку (О, хо), т. е. точку простран- ства Х, имесощую координаты О, х', ..., х,", где л', ... ...,х" — координаты точки ха в пространстве Х.
Тогда ясно, что решение уравнения (10), соответствующее управлению и(1), с начальным условием х(1е) =хо оп- ределено на всем отрезке 1е~1 =1с и имеет вид с х = $ (е (х (г), и (1)) сй, х = х (1). пиинпггп максимтма 20 ггл ~ В частности, при 1= г', мы получим б ха = ~ )е (х (1), и (1)) Ш = 7, х = хь г. е.
решение х(1) уравнения (10) с начальным условием х(те) = х„проходит при 1 = 1г через точку х = (Х, х~). Иначе говоря, обозначив через П прямую линию, проходящук> в пространстве Х через точку х = (О, х|) параллельно оси хе (эта прямая П образована всеми точками (а,хг), где число з произвольно; рис. 1), мы Рис. 1. можем сказать, что решение х(1) г1роходит в момент à — 1, через точку, лежащую па прямой П и имеющую координату ха = У. Обратно„если и(1) — такое допустимое управление, что соответствующее ему решение х(1) уравнения (10) с начальным условием х(1и) = хе = = (О, хи) проходит в некоторый момент 11 через точку х, ~П с координатой хе =7, то управление и(г) переводит (в пространстве Х) фазовую точку из положения х в положение хь причем функционал (7) принимает значение У. Таким образом, мы можем сформулировать поставленную выше оптимальную задачу в следующем эквивалентном виде.
В (п + 1)-мерном гразовом пространстве Х даны точка хе —— (О,хи) и прямая П, параллельная оси хи а проходящая через точку (О, хг). Среди всех допустимых 2! ПОстлнОВкл ОснОВнОЙ 3АдАчи управлений и = и(!), обладающих тем свойствол1, что соответствующее решение х(!) уравнения (10) с начальным условием х(1ь) = хе пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату хь. Эту задачу мы и будем решать.
Термины <оптимальное управление» и «оптимальная траектория» мы сохраним и для задачи в этой новой формулировке. Отметим некоторые простые свойства оптимальных управлений н траекторий, непосредственно вытекающие из формулировки основной задачи. Прежде всего, из автономности системы (9) вытекает, что при сдвиге вдоль оси 1 (рис. 2) свойства управлений пе меняются.
Рис. 2 Иначе говоря, если управление и(!), !ь а ! ( (н переводит фазовУю точкУ из положениЯ хь в положение х, и придаег функционалу (7) значение У, то при любом действительном Ь управление и(1+ Ь), (ь — и ~ 1 в- < 1,— и, также переводит фазовую точку из положения хь в положение х| и придает функционалу (7) то же значение 7.
Это позволяет перемещать начальную точку (ь отрезка !В(1~ !ь на котором задано управление и(!), в любую точку оси времени. Далее, если хь, хь ..., хь — конечная система точек фазового пространства Х и если существует управлецие ич(1), переводящее фазовую точку из положения х~ ~ в положение х, и придающее функционалу (7) значение Хь 1= 1, ..., й, то существует управление и(!), переводящее фазовую точку из положения хь в положение хА и придающее функционалу (7) значение 7!+ /а+ ° .. + У» пгинцип млксимтмл ~гл о В самом деле, в силу воэможности сдвигать управления вдоль оси времени, мы можем считать, что отрезки, на которых определены управления и;(Г), непосредственно примыкают один к другому (рис. 3), т.
е. что управление иг(г) задано на отрезке (о ~(1~(и где (о<(~ < ... <(о. Обозначим через и(т) управление, заданное на отрезке (о ( (( го и совпадающее на полуинтервале (о 1( Г( го с управлением иг((), т. е. «объединение» всех управлений ио (() . Непосредственно проверяется, что управление и(Г) переводит фазову|о точку из положения хо в положение хо и придает функционалу (7) значение 71+7»+ ... +Хо.
Заметим, что указанная операция «объединения» нескольких управлений была бы невозможна в классе н е п р е р ы в н ы х управлений (ибо в точках 1ь (и ..., (о, построенное управление и(1) может иметь разрывы первого рода, даже если управления ио(г) были непрерывными; рис.
3). Рис, 3. Из сказанного выше легко следует, что всякий кусок оптимальной траектории также является оптимальной траекторией (и аналогично для оптимальных управлений). Более точно, пусть и((), го ( г ( (ь — оптимальное управление, соответствующее переходу из положения хо в положение хь а х(() — соответствующая оптимальная траектория. Тогда, если го < то (т1 ((ь то управление и((), рассматриваемое на отрезке то ~ г ~ ть является оптимальным управлением, соответствующим переходу из положения х(то) в положение х(г1), а х(г), го( 1 (ть является соответствующей оптимальной тра- 23 ПУИНЦИП МАКСИМУМА екторией (рис. 4). В самом деле, обозначим значения интеграла (7), взятого по отрезкам Хо~ (~то, та( (1(т» т1 (Уо 1» соответственна через Х» Хо, Хз.
Тогда управление и(1), 1,(У = Х» переводящее фазовую точку из положения хо в положение х» придает функционалу (7) значение У=У~+Хо+Ум Ес- Х ли бы управление и(1), Х ля рассматриваемое на отрезке то(У<т» нс бы- ~ 1г ло оптимальным, то существовало бы некоторое управление о(1)„перево- ло дящее фазовую точку из Рис. 4. положения х(то) в положение х(т1) и придающее функционалу (7) значение Хо ( Х .
Но тогда мы получили бы управление, переводящее фазовую точку из положения х, в положение х1 и придающее функционалу (7) значение У, + Хг+Хо < Х, что противоречит оптимальности управления и(1), Уо ( 1 ( 1» 2 3. Принцип максимума Переходим теперь к формулировке теоремы, дающей решение поставленной основной задачи. (Доказательство этой теоремы приведено во второй главе.) Для формулировки теоремы, кроме основной системы уравнений (9): — „, =Х'(х, и), У=О, 1, 2, ..., п, (11) мы рассмотрим еще одну систему уравнений относительно вспомогательных (дополнительно рассматриваемых) переменных фо, ф» ..., ф„: д4ч т~ д)о(х, и) а ~-, д ' Если мы выбрали некоторое допустимое управление и(У), Уо(У(1» и имеем соответствующую фазовую [ГЛ ! ПРИНЦИП МЛКСИМУМЛ 24 траекторию х(1) системы (11) с начальным условием х([О) = ха, то система (12) принимает впд а — — 11, 1=0, 1, ..., п.
(13) л~р~ т ~ д!" (х [[), и([)) а О Эта система линейна и однородна; поэтому при любых начальпык условиях для [)и она допускает единственное решение ч =(фо чч МЪ, ° °, Ф) (определенное па всем отрезке [О 1([н на котором определены управление и(1) и траектория х(1)). Как и решение х([) системы (11), решение системы (13) состоит из непрерывных функций ф;([), имс[ощих всюду, кроме конечного числа точек (а именно, точек разрыва управления и(1)), непрерывные производные по й Всякое решение системы (13) (при любых начальных условиях) мы будем называть решением системы (12), соответствующим выбранному управлению и(1) и фазовой траскторни х(1).