Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 3
Текст из файла (страница 3)
Понтрягин Ноябрь 1968 года ГЛАВА 1 ПРИНЦИП МАКСИМУМА В 1. Допустимые управления Мы будем рассматривагь поведение объекта, состояние которого в каждый момент времени характеризуется п действительными числами х', х~, ..., х~ (например, координатами и скоростями). Векторное пространство Х векторной переменной х = (х', ..., х") является фазовым просгранством рассматриваемого оГ>ъекта. Поведение (движенне) объекта заключается (с математической точки зрения) в том, что переменные х', ..., х" меняются с течением времени. Предполагается, что движением объекта можно у и р а в л я т ь, т. е.
что ооъект снабжен некоторыми «рулямигг, от пологкения когорых зависит движение объекта. Положения «рулей» характеризуются точками и некоторой области управления (г', которая может быть любым множеством некоторого г-мерного евклидова пространства Е„; задание точки и (и', из,..., и') ен (/ равносильно заданию системы числовых параметров и', и', ..., и . В приложениях важен случай, когда (г является замкнутой областью пространства Е„. В частности, область управления 0 может быть кубом г-мерного пространства переменных ц~ и«и». ~иг~(1,1 1,2,...,г, (1) или каким-лнбо другим замкнутым ограниченным множеством этого г-мерного пространства. Физический смысл ПРИНЦИП МАКСИМУМА ггл. 1 рассмотрения замкнутой н ограниченной (в пространстве переменных и', иэ, ..., и") области управления 0 ясен: управляющими параметр;,ми и', иэ, ..., и" могут служить количество подаваемого в двигатель топлива, температура, сила тока, напряжение и т.
и., которые не могут принимать сколь угодно больших значений. Кроме того, в силу технической конструкции управляющей части объекта, между управляющими параметрамн и', и', ..., и" могут существовать связи, выражаемые одним или несколькими уравнениями вида гр(и', иэ, ..., и") =О. В этом случае область управления 0 может геометрически иметь более или менее сложный характер. Если, например, имеются два управляющих параметра и', и', которые в силу конструкции объекта имеют вид и' = = соз <р, и' = з1п ~р, где ~р — некоторый (произвольно задаваемый) угол, то областью управления будет окружность е (и~)э+ (и»)г (2) В дальнейшем мы просто будем говорить об области управления У и ее точках и 6 0 и будем представлять себе У в виде некоторого множества в пространстве переменных и', и», ..., й, считая его «точкой» и произвольную входящую в У систему управляющих параметров и =(и',иэ,...,и') (см., например, (1) или (2)), Каждую функцию и = и(1), определенную на некотором отрезке ге (1 < г1 времени г и принимающую значения в области управления О, мы будем называть управлением.
Так как 0 есть множсство в пространстве управляющих параметров и', и'... „и", то каждое управление и(~) (и'(~), иэ(г), ..., и'(г)) является вектор-функцией (заданной на отрезке («~', г'~ 1~), значения которой лежат в области управления ~/. В дальнейшем, в зависимости от характера поставленной задачи, мы будем накладывать на управление и(1) разлн ные условия (кусочной непрерывности, кусочной днфференцируемости и т.
и.). Управления, удовлетворяющие этим условиям, будем называть д о и у- ДОПУСТИМЫЕ УПРАВЛЕНИЯ' стимыми управлениями. В этой главе мы бидем считать допустимыми управлениями произвольные кусочно-непрерывные управления (со значениями в области управления 01), т. е. такие управления и = и(1), каждое из которых непрерывно для всех рассматриваемых т, за исключением лишь конечного числа моментов времени, где функция и(1) может терпеть разрывы первого рода. Во избежание недоразумений отметим, что, по определению разрывов первого рода, в точке разрыва т предполагается существование к о не ч н ы х пределов и(т — О) =!!т и(1), и(т+0)=Вгп и(!).
1 <т 1) '1 Из этого, в частности, следует, что всякое управление и(1) ограничено (даже если область С1 не является ограниченной). Значение кусочно-непрерывного управления и(8) в точке разрыва нс играет сколько-нибудь существенной роли в дальнейшем. Однако для определенности иам удобно предполагать, что в каждой точке разрыва т значение управления и(т) равно пределу слева: и(т) = и(с — О), (3) и что каждое рассматриваемое управление и(!) непрерывно в концах отрезка 1В ( с ( 11, на котором оно задано. Итак, допустимым управлениел1 мы условимся в этой главе называть всякую кусочно-непрерывную функцию и(г), (ь ( ! ( (1, со значениями в области управления С1, удовлетворяющую условию (3) в точках разрыва и непрерывную в концах отрезка ть ( т ~ 11, на котором она задана.
Кусочно-непрерывные управления соответству1от предположению о «безынерцнонности» рулей, так как значения функции иЯ могут (в момент разрыва) мгновенно перескакивать из одной точки области управления в другую. Этот класс допустимых управлений, по-видимому, наиболее интересен для технических применений развиваемой здесь теории, пгннпип мзкгимумА й 2. Постановка основной задачи Мы будем предполагать, что закон движения объекта (и закон воздействия «рулей» па это движение) записы- вается в виде системы дифференциальных уравнений — =)'(х', х2, ..., Х, и', ..., и') =)'(х, и), 1=1, 2, ...,.п, нли, в векгорной форме, —,=1(х, и)„ (6) где 1(х, и) — вектор с координатами ~' (х, и), ~т(х, и), ..., ~" (х, и), 1,1=1, 2,..., п, определены и непрерывны на прямом произведении Х Х (1.
Заметим, что система (4) автономна, т. е. правьь. ее части пе зависят явно от времени 1. Случай, когда правые части зависят от 1, мы обсудим ниже (см. $7). Если задан закон управления, т. е. выбрано некоторое допустимое управление а = и(1), то уравнение (5) принимает вид — 1(х, и(1)), (6) откуда (при любых начальных условиях х(1о) = хо) однозначно определяется закон движения объекта х = =-х(1), т. е.
решение уравнения (6), определенное на Функции 1' определены для любых значений векторной переменной хе= Х и для значений и, принадлежащих области управления К Они предполагаются непрерывными по совокупности переменных х', ха, ..., х", и и непрерывно дпфферепцирусмыми по х', х~, ... х". Иначе говоря, функции )'(х', х', ..., х" и) и дх! ИОстАНОВкА ОснОВнОЙ зАдАчи некотором отрезке времени. Именно, если управление и(1) задано на отрезке 1а 1<(ь и Оь Ом ..., ОА — его точки разрыва (первого рода), причем 1а < 01 < ОА <... ... < Од < 1ь то мы рассмотрим сначага уравнение (6) на отрезке (а < 1 < Оь где оно имеет непрсрывную правую часть.
Обозначим через х(1) решение этого уравнения с начальным условием х((а) = хм Если это решение определено на всем отрезке („< 1 < О~ и имеет в точке 0~ значение х(0~), то мы можем рассмотреть уравнение (6) на отрезке 01 < 1 < Ом воспользовавшись начальным значением х(0~). Это решение также обозначим через х(1).
Таким образом, построенное решение х(1) непрерывно во всех точках своего определения и, в частности, в «точке сопряжения» Оь Если теперь решение х(1) определено на всем отрезке 1„< 1< Ох и имеет в точке ОА значение х(ОА), то мы можем рассмотреть уравнение (6) на отрезке Оа < 1 < Оз, воспользовавшись начальным значением х(Од) и т. д. Полученное таким образом решение х(1) уравнения (6) является непрерывным и кусочподифферепцируемым; именно, во всех точках, кроме Оь Ом ..., Ом решение х(1) (там, где оно определено) является непрерывно дпфференцирусмым.
Построенное решение х(1) мы будем называть решением системы (4) (или уравнения (5)), соответствующим управлению и(1)' прп начальном условии х((а) = хм Это решснис можеа не быть определено на всем отрезке 1а < 1<1~ задания управления и(1) (оно может уйти в бесконечность). Мы будем говорить, чго допустимое управление и(!), 1а«.'(ь переводит фазовую точку из положения ха в положение хь если соответствующее ему решение х(() уравнения (5) (или, что то же, (6)), удовлетворяющее начальному условию х(1а) = х,, определено на всем отрезке 1а < 1 < 1~ и проходит в момент 1, через точку хь т. е.
удовлетворяет также конечному условию х(1,) = х,. Предположим теперь, что задана еще одна функция 1А(х1, х', ..., х", и) = 1"(х, и), определенная и непрерывная вместе с частными производными — '., 1= 1, д~~ дх' 2, ..., п, на всем пространстве Х;к', К Тогда основная задача (отыскание оптимальных управлений) может быть сформулирована следующим образом. ПРИНИК МАКСИМУМА !8 ~гл. 1 В фазовом пространстве Х даны две точки хс и хь Среди всех допустимых управлений и = и((), переводящих фазовую точку из положения хе в положение х, (если такие управления существуют), найти такое, для которого функционал 1 ~ (э (х (~), и (~)) й (7) В этом случае функпионал (7) принимает вид; (8) и оптимальность управления и(1) означает минимальность времени перехода из положения хе в положение хь Задачу отыскания оптимальных управлений (и траекторий) в этом случае мы будем называть задачей об оптимальном быстродействии.
принимает наименьшее возможное значение; здесь х(() — решение уравнения (5) с начальным условием х((е) = хо, соответствующее управлению и(1), а момент прохождения этого решения через точку хь Отметим, что (при фиксированных ха, х1) верхний и нижний пределы 1о, 1, в интеграле (7) ие являются фиксированными числами, а зависят от выбора управления и(1), переводящего фазовую точку из положения хэ в положение х1 (эти пределы опредсляются из соотношений х(1ч) = хм х(~1) = х,).