Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 3
Текст из файла (страница 3)
Этим самым задача была линеаризована: множество точек х (11), соответствующих указанным управлениям, хотя и невыпукло, но близко к выпуклому, так что возникла возможность построения опорной плоскости и перпендикулярного к ней вектора ф Л. Понтрягин Ноябрь 1968 года ГЛАВА 1 ПРИНЦИП МАКСИМУМА З $. Допустимые управлевия Мы будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется и действительными числами х', х», ..., х" (иапример, коордииатами и скоростями).
Векторное пространство Х векторной переменной х = (х', ..., х") является фазовым пространством рассматриваемого объекта. Поведение (движение) объекта заключается (с математической точки зреиия) в том, что перемекпые х', ..., х" меняются с течением времени. Предполагается, что движением объекта можно у п р а в л я т ь, т. е. что объект снабжен некоторыми «рулями», от положения которых зависит движение объекта. Положения «рулей» характеризуются точками и некоторой области управления У, которая может быть любым множеством некоторого г-мериого евклидова пространства Е„; задаиие точки и = (и', и», ..., и") (:П равносильно заданию системы числовых параметров иг, и', ..., и'.
В приложениях важен случай, когда У является з а м к и у т о й областью пространства Е,. В частиости, область управления У может быть кубом г-мерного пространства переменных и', и', ..., и': (и'((1, у'=т, 2, ..., г, или каким-либо другим аамккутым ограниченным миожеством этого г-мериого пространства. Фиаический смысл рассмотрения замкиутой и ограниченной (в пространстве перемеииых и,', и', ..., и') области управления У ясен: НРИНЦИП МАКСИМУМА 14 1гл, 1 управляющими параметрами иъ, и', ..., и" могут служить количество подаваемого в двигатель топлива, температура, сила тока, напряжение и т. п., которые не могут принимать сколь угодно больших значений.
Кроме того, в силу технической конструкции управляющей части объекта, между управляющими параметрами иъ, и', ..., и" могут существовать связи, выражаемые одним или несколькими уравнениями вида <р (иъ, иъ,;, и") = О. В этом случае область управления У может геометрически иметь более или менее сложный характер.
Ксли, например, имеются два управляющих параметра и', и', которые в силу конструкции объекта имеют вид и'=сов ър, и' = э1п ~р, где ъо — некоторый (произвольно аадаваемый) угол, то областью управления будет окружность (иъ)ъ+ (иъ)ъ (2) В дальнейшем мы просто будем говорить об области управления ъл' и ее точках и~У и будем представлять себе У в виде некоторого множества в пространстве переменных иъ, иъ, ..., и", считая его «точкой» и произвольную входящую в ъ1 систему управляющих параметров и = (и', иъ, ..., и") (см., например, (1) или (2)). Каждую.
функцию и = и (1), определенную на некотором отрезке 1 ( 1 ( 1, времени 1 и принимающую значения в области управления У, мы будем называть управлением. Так как У есть множество в пространстве управляющих параметров иъ, иъ, ..., и', то каждое управление и (1) = (а' (1), и»(1), ..., и" (1)) является в е к т о р - ф у н к ц и е й (ааданной на отрезке 1« ( 1 = 1,), аначения которой лежат в области управления ъл. В дальнейшем, в зависимости от характера поставленной задачи, мы будем накладывать на управление и (1) различные условия (кусочной непрерывности, кусочной дифференцируемости и т.
п.). Управления, удовлетворяющие этим условиям, будем называть д о п ус т и м ы м и у п р а в л е н и я м н. В этой главе мы бу; дем считать допустимыми управлениями произвольные кусочно-непрерывные уп р а в л ения (со значениями в области управления ъл), т. е. такие управления и=и (1), каждое из которых непрерывно для всех рассмат- ПОСТАНОВКА ОСНОВНОЙ ЗАДАЧИ риваемых 8, за исключением лишь конечного числа моментов времени, где функция и (с) может терпеть разрывы первого рода. )ЭО избежание недоразумеяий отметим, что, по определению разрывов первого рода, в точке разрыва т предполагается существование к о н е ч н ы х пределов и (т — О) =1! ш и (г), и (т+ О) =1пп и (с). с с с(т с) т Из этого, в частности, следует, что всякое управление и («) ограничено (даже если область сс не является ограниченной).
Значение кусочно-непрерывного управления и(с) в точке разрыва не играет сколько-нибудь существенной роли в дальнейшем. Однако для определенности нам удобно предполагать, что в каждой точке разрыва т значение управления и(г) равно пределу слева: и (т) = и (т — О), (3) и что каждое рассматриваемое управление и (с) непрерывно в концах отрезка ««( «( с„на котором оно задано. Итак, допустимым управлением мы условимся в этой главе называть всякую кусочно-непрерывную функцию и (г), с«( «( сс, со значениями в области управления сс', удовлетворяющую условию (3) в точках разрыва и непрерывную в концах отрезка с« ~ 1 ( сс, на котором она задана. Кусочно-непрерывные управления соответствуют предположению о «безынерционности» рулей, так как значения функции и (Ц могут (в момент разрыва) мгновенно перескакивать из одной точки области управления в другую.
Этот класс допустимых управлений, по-видимому, наиболее интересен для технических применений развиваемой здесь теории. 5 2. Постановка основной задачи Мы будем предполагать, что закон движения объекта (и закон воздействия «рулей» на это движение) записы- вается в виде системы дифференциальных уравнений ехс — =~с (х', х', ..., х", и', ..., й) =~с(х, и), 1=1,2, ...,и, (4) пвинцнп млксимтыл 1гл.
1 16 или, в векторной форме, (5) — =~(х, и), где ~ (х, и) — вектор с координатами ~'(х, и), 1з(х, и),..., ~" (х, и). Функции ~' определены для любых значений векторной переменной х(-Х и для значений и, принадлежащих области управления 7У. Они предполагаются непрерывными по совокупности переменных х', хз, ..., х", и и непрерывно цифференцируемыми по х", хз, ..., х". Иначе говоря, функции ~1(х~, х', ..., х", и) и х 1,1'=1,2, ..., в, определены и непрерывны на прямом проиаведении ХхУ. Заметим, что система (4) автономна, т. е. правые ее части не зависят явно от времени 1.
Случай, когда правые части зависят от 1, мы обсудим ниже (см. 3 7). Если задан аакон управления, т. е. выбрано некоторое допустимое управление и = и (1), то уравнение (5) принимает вид (6) откуда (при любых начальных условиях х (гз) = х,) однозначно определяется закон движения объекта х = х (1), т. е. решение уравнения (6), определенное на некотором отрезке времени. Именно, если управление и (1) задано на отрезке тз ( 1 ( 1, н О„О„..., Π— его точки разрыва (первого рода), причем 1, ( 8, ( О, ( ... ( 0„( 1„то мы рассмотрим сначала уравнение (6) на отреаке 1з = т ( О„ где оно имеет непрерывную правую часть.
Обозначим через х (1) решение етого уравнения с начальным условием х (1з) = х,. Если это решение определено на всем отрезке 1, ( 1 ( Од и имеет в точке О, значение х (О,), то мы можем рассмотреть уравнение (6) на отрезке 0,~1~ 0„ воспользовавшись начальным значением х (О,). Это реше- постАнОВкА ОснОВКОЙ зАдячи 17 з г1 .У=1~«(х(С), т«(«)) дг (7) принимает наименьшее возможное значение; адесь ние также обозначим через х (т). Таким образом, построенное решение х (Г) непрерывно во всех точках своего определения и, в частности, в «точке сопряжения» О,. Если теперь решение х (») определено на всем отрезке «( г ( О и имеет в точке О, значение х (О,), то мы можем рассмотреть уравнение (6) на отрезке Ог ( «( 6, воспользовавшись начальным значением х (0,) и т.
д. Полученное таким образом решение х («) уравнения (6) является непрерывным и кусочно-дифференцируемым; именно, во всех точках, кроме 0„9„..., Ою решение х («) (там, где оно определено) является непрерывйо дифференцируемым. Построенное решение х (г) мы будем называть решением системы (4) (или уравнения (5)), соответствующим управлению и («) при начальном условии х (т«) = х,. Это решение может не быть определено на всем отрезке г«( Г ( г задания управления и (») (оно может уйти в бесконечность). Мы будем говорить, что допустимое управление и («), г ( т ( «„ переводит фазовую точку из положениях» в положение х„если соответствующее ему решение х (8) уравнения (5) (или, что то же, (6)),удовлетворяющее начальному условию х (7») = х«, определено на всем отрезке ««( г ( й, и проходит в момент 8г через точку х„т. е.
удовлетворяет также конечному условию х (г,) = х . Предположим теперь, что задана еще одна функция 7» (х', хг, ..., х", и) = 7«(х, и), определенная и непрерывная дР вместе с частными производными —., « = $, 2, ..., и дхг' ™ '''1 м на всем пространстве Х х У. Тогда основная задача (отыскание оптимальных управлений) может быть сформулирована следующим образом. В фазовом пространстве Х даны две точки х«и х,. Среди всех допустимых управлений и = и (г), переводящих фазовую точку из положения х» в положение х, (если такие управления сущеапвуют), найтпи такое, для котпорозо функт)пенал шинник млксимгмл х (1) — решение уравнения (5) с начальным условием х (е,) = х„соответствующее управлению и (~), а ~, — момент прохождения этого решения через точку х,.
Отметим, что (при фиксированных хв, хт) верхний и нижний пределы гв, 1т в интеграле (7) не являются фиксированными числами, а зависят от выбора управления и (1), переводящего фазовую точку из положения хв в положение х, (зти пределы определяются из соотношений х (гв) = хю х (~,) = х,). О решении задачи для случая закрепленных пределов мы будем говорить ниже (см. 1 8). Управление и (~), дающее решение поставленной выше задачи, называется оптимальным управлением, соответствующим переходу ив положения хв в положение х„ а соответствующая траектория х (1) — оптимальной траекторией. Таким образом, основная задача заключается в отыскании оптимальных управлений (и соответствующих оптимальных траекторий). Важным частным случаем поставленной выше оптимальной задачи является случай, когда 7в (х, и) = — 1.