Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 4
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 4 - страница
В этом случае функционал (7) принимает вид: ~о (8) и оптимальность управления и (1) означает минимальность времени перехода ив положениз хв в положение хп Задачу отыскания оптимальных управлений (и траекторий) в этом случае мы будем называть з а д а ч е й о б о п т имальном быстродействии. Для формулировки и доказательства необходимого условия оптимальности нам будет удобно дать иную формулировку поставленной выше задачи. Именно, добавим к фазовым координатам х', х', ..., х", меняющимся по закону (4), еще одну координату х', закон изменения которой имеет вид где 7в — функция, участвующая в определении функционала в (см.
(7)). Иначе говоря, мы будем рассматривать ПОСТАНОВКА ОСНОВНОЙ ЗАДАЧИ а 2! систему дифференциальных уравнений — =~'(х', х', ..., х", и', ..., и")12(х, и), 1=0,1,2, ...,и, (9) правые части которой не зависят от переменного х'. Вводя в рассмотрение вектор х =(х', хт, хз, ..., х") = (хз х) (и + 1)-мерного векторного пространства Х, мы ношам систему (9) переписать в векторной форме — „, =у'(х, и), лж (10) В частности, при 2 = 2, мы получим хе=~/'(х(2), и(8))И=3, х=х, т.
е. решение х (2) уравнения (10) с начальным условием х (2,) = х, проходит при 8 = 8, череа точку х = (У, хд). Иначе говоря, обозначив через П прямую линию, где у (х, и) — вектор пространства Х, имеющий координаты 1' (х, и), ..., 1" (х„и). Заметим, что вектор у(х, и) не зависит от координаты х' вектора х. Пусть теперь и (г) — некоторое допустимое управление, переводящее х, в х„а х = х (2) — соответствующее решение уравнения (5) с начальным условием х (2,) = х,.
Обозначим через х, точку (О, х,), т. е. точку пространства Х, имеющую координаты О, х,', ..., х",, где х„', ..., х",— координаты точки хз в пространстве Х. Тогда ясно, что решение уравнения (10), соответствующее управлению и (2), с начальным условием х (2,) = х, определено на всем отрезке Гз ( 2 ( 82 и имеет вид ~гл. « 20 ПРИНЦИП МАКСИМУМА проходящую в пространстве Х череа точку х (О, х,) параллельно оси х«(эта прямая П образована всеми точками (ь, х»), где число $ произвольно; рис.
1), мы можем сказать, что решение х (с) проходит в момент Г = 1 через точку, лежащую на прямой П и имеющую координату х' = л. Обратно, если и (е) — такое допустимое управление, что соответствующее ему решение х (е) уравнения (10) с начальным условием х (ее) = х« = (О, х«) проходит в некоторый момент е, через точку х, ~П с координатой х« = л, Рис. 1. то управление и (е) переводит (в пространстве Х) фазовую точку из положения х« в положение х„ причем функционал (7) принимает аначение л. Таким образом, мы можем сформулировать поставленную выше оптимальную задачу в следующем эквивалентном виде.
В (и + 1)-мерном фазовом пространстве Х даны точка х, = (О, хе) и прямая П, параллельная оси х' и проходящая через точку (О, х ). Среди всех допустимых управлений и = и (»), обладающих тем свойством, что соотвегпствующее решение х(е) уравнения (10) с начальным условием х(е») = х«пересекает прямую П, найти такое, для котороео точка пересечения с прямой П имеет наименьшую координату х«. Эту задачу мы и будем решать. Термины «оптимальное управление» и «оптимальная траектория» мы сохраним и для задачи в этой новой формулировке. ПОСТАНОВКА ОСНОВНОЙ ЗАДАЧИ гт Отметим некоторые простые свойства оптимальных управлений и траекторий, непосредственно вытекающие из формулировки основной задачи.
Прежде всего, ив автономности системы (9) вытекает, что при сдвиге вдоль оси 2 (рис. 2) свойства управлений не меняются. Иначе говоря, если управление и (г), 2е ( г ( Т„переводит фазовую точку из положения х, в положение х, и придает функционалу (7) значение У, то при любом действительном й управление и (г + й), ге — й ( 1 ( 1, — й, также переводит фазовую точку из положения хе в положение х, Рнс 2. и придает функционалу (7) то же значение У. Это позволяет перемещать начальную точку ~, отрезка 2, ( 8 ( 8„на котором задано управление и (г), в любуго точку оси времени. Далее, если х„х„..., хь — конечная система точек фазового пространства Х и если существует управление и,.
(г), переводящее фазовую точку из положения х,, в положение х, и придающее функционалу (7) значенйе УО 1 = 1, ..., й, то существует управление и (8), переводящее фазовую точку из положения х, в положение хь и придающее функционалу (7) значение У, + У, + ... + У„. В самом деле, в силу возможности сдвигать управления вдоль оси времени, мы можем считать, что отрезки, на которых определены управления и,.
(2), непосредственно примыкают один к другому (рис. 3), т. е. что управление и, (г) задано на отрезке г,, = 1 = гп где ге ' г, ( ... ( 8 . Обозначим через и (2) управление, заданное на отрезке 2е ( 8 ( 8 и совпадающее на полуинтервале 8;,( 8 =2, с управлением и, (г), т. е. «Объединение» всех управлений и; (г). Непосредственно проверяется, что управление и (г) переводит фазовую точку из положения хе в положение ПРИНЦИП МАКСИМУМА [гл.
« х„ипридаетфункционалу(7) значеннеХ, + л»+ ... + Х». Заметим, что указанная операция «объединения» нескольких управлений была бы невозможна в классе н е и р вр ы в н ы х управлений (ибо в кочках ~ы 8», ..., СА, Рис. 3. построенное управление и (с) может иметь разрывы первого рода, даже если управления и, («) были непрерывными; рис. 3). Иа сказанного выше легко следует, что всякий кусок оптимальной траектории также является оптимальной тр екторией (и аналогично для оптимальных управле/ ль! ний).
Болев точно, пусть хГИ и Я,с»=-г== «„— оптнмальу ~г ное управление, соответст- вующее переходу из поло- ,Е жения х» в положение хы а х (~) — соответствующая Рис. 4. оптимальная траектория. Тогда, если ~»(т»(т,(с„ то управление и (~), рассматриваемое на отрезке т, ( г ( т„ является оптимальным управлением, соответствующим переходу из положения х (т») в положение х (т,), а х (~), т»(С(ты является соответствующей оптимальной траекторией (рис. 4). В самом деле, обоаначим значения интеграла (7), взятого по отрезкам ~» = с ( т„т, (~(т„т, ( с( С„ соответственно через Х„о«, а .
Тогда управление и (с), ~» ( «(»„переводящее фааовую точку из положения х» в положение х,, придает функционалу (7) значение Х = У, + 7«+ е'». Если бы управление и (с), рассматривае- ЛЗ) / ПРИНЦИП Л1ЛКСИМУМА 23 мое на отрезке то ~ ( -= т„не было оптимальным, то существовало бы некоторое управление Р (1), переводящее фаэову1о точку иэ положения х( г„) в положение х(т,) и придающее функционалу (7) аначение Хл ( Хо.
Но тогда мы получили бы управление, переводящее фааовую точку иэ положения хо в положение х1 и придающее функционалу (7) значение 71 + )л+ Уо(Х, что противоречит оптимальности управления и ((), Ло ~ 1 = (1. а 3. Принцип максимума Переходим теперь к формулировке теоремы, дающей решение поставленной основной задачи.
(Докаэательство этой теоремы приведено во второй главе.) Для формулировки теоремы, кроме основной системы уравнений (9): — =Г" (х, и), 1=0, 1, 2, ..., и, (И) мы рассмотрим еще одну систему уравнений относительно вспомогательных (дополнительно рассматриваемых) переменных фо 1Г1 " ф,. — — ',— Лг„, 1=0, 1,, и.
(12) дФ1 и1 д/" (и, и) ди «=о Если мы выбрали некоторое допустимое управление и (г), го ( Г ( Г„и имеем соответствующую фаэовую траектоРню и (1) системы (И) с начальным Условием х (Го) = хо, то система (12) принимает вид и д1 71 '1 1(1а> 1=0~ 1~ 1 и (13) идо ч1 д(" (и(1), и(1)) .=о Эта система линейна и однородна; поэтому при любых начальных условиях для ф1 она допускает единственное решение (определенное на всем отрезке (о ( 1 ( 1„на котором определены управление и (Г) и траектория х(()). Как и решение х(1) системы (И), решение системы (13) состоит иа непрерывных функций лдо(Л), имеющих всюду, кроме ПРИНЦИП МАКСИМУМА Сгл. 1 конечного числа точек (а именно, точек разрыва управления и (С)), непрерывные производные по С.
Всякое решение системы (13) (при любых начальных условиях) мы будем называть решением системы (12), соответствующим выбранному управлению и (С) и фазовой траектории х(С). Мы теперь объединим системы (11), (12) одной ааписью, для чего рассмотрим следующую функцию о2Г переменных х, ..., х, ф>, ф„..., ф„, и, ..., и: ай" (ог, х, и) = (ф, с'(х, и)) = ~ ф„с'"(х, и). «-о Непосредственно проверяется, что написанные выше системы (11) и (12) могут быть с помощью этой функции Я" записаны в виде следующей гамильтоновой системы: (14) драч — — — — С=0,1, ...,п.
Ыф даЯ (15) ВС дх Итак, взяв произвольное допустимое (т. е. кусочно- непрерывное) управление и (С), Со (С ( С„и начальное условие х (Со) = хо, мы можем найти соответствующую (т. е. удовлетворяющую системе (14)) траекторию х (С) = = (хо (С), х» (С), ..., х" (С)). После этого мы можем находить соответствующие функциям и (С) и х (С) решения 'Р(С) = (Фо(С) "~~(С) ° ф (С)) системы (15). Еще раз подчеркнем, что вектор-функции х (С) и оР (С) непрерывны и всюду, кроме конечного числа точек, имеют непрерывные производные по С. При фиксированных (постоянных) значениях ор и х функция ав." становится функцией параметра и~ У; точную верхнюю грань значений этой функции мы обоаначим через СГ (ор, х): Ж (ф, х) =- зпр о т (ор, х, и).