Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 36
Текст из файла (страница 36)
При этом мы сразу сформулируем задачу с подвижным правым концом (которая включает в себя, как частный случай, н задачу с закрепленным правым концом). Пусть дана функция )" (х', ..., х", у', ..., у", и), удовлетворяющая тем же условиям, что и фупкцни 1, 1= 1, ..., п. Пусть, кроме того, в Х задано гладкое й-мерное многообразие 5ь 0 ( А ( п — 1, н начальная функция ~р(1). Требуется в классе допустимых управлений выбрать такое управление и(1), 1» ( 1 ( 1ь чтобы траектория х(1), Уа — 0 (1 = (ь системы (20), соответствующая выбранному управлению и(1) н заданной начальной функции ~р(г), удовлетворяла краевому условию х(1,) ~ 5~ и интеграл и ~ (а(х(1), х(г — О), и(1))й( (31) и принимал минимальное значение.
Заметим, что пределы интегрирования в (31) не фиксированы; фиксированы лишь «краевые» условия: ~р(1) и 5ь Если 1" = 1, то мы получаем задачу об оптимальных быстродействиях для систем с запаздыванием. Рхзныг 3'~дхчи ~гл. 4 Если размерность многообразия 5, равна нулю, то оно превращается в точку, и мы получаем оптимальную задачу с закрепленным правым концом. Дадим теперь другую (эквивалент пую) формулировку пашей оптимальной задачи, более удобную для формулировки и доказательства основного результата.
Введем в рассмотрение (и+ 1)-мерное фазовое пространство Х переменной х = (хв, ..., х") = (хе, х) и обозначим через ь' множество всех точек (х0, х), для которых х ~ 5~ (т. е. 1. есть многообразие размерности й+ 1, являющееся прямым произведением многообразия 5~ на ось х~). Тогда наша оптимальная задача эквивалентна следующей задаче (ср. стр. 20 — 2!).
Система уравнений движения фазовой точки х(1) = (х~(1), ..., х" (1)) имеет впд — =) (х(1), х(1 — О), и(г)), !=О, 1, ..., и, (32) нли, в векторной форме, — =г'(х(1), х(1 — О), и(1)). (33) Требуется выбрать такое допустимое управление и(1), 1в с 1( 1,, чтобы соответствующая этому управлению н начальной функции й~(1) = (О, <р(1)), 1в — О (1~ йь траектория хЯ = (х~(1), х(Х)), гс (1( 8ь системы (32) удовлетворяла краевому условию х(~,) ~(. и при этом коордпната ха(1,) была минимальной.
Всякое допустимое управление и(1) и соответствующую траскторию х(1), удовлетворяющие сформулированным условиям, назовем оптимальными. Для решения поставленной задачи, как и раньше, введем в рассмотрение вспомогательный вектор тр = = (фм ..., ф„) и составим скалярную функцию л Я= ~ ~р,~'=(ф, 1) переменных фа, ..., ф„, х', ... а — О ..., х", у', ..., у", и. Через К(ф, х, у) обозначим верхнюю грань значений функции М' при фиксированных ф, х, р и при и, меняющемся на множестве К Введем, далее, в рассмотрение следующие две системы уравнений для вспомогательных переменных ф„, 4 2Л оптнмАльныв пгоцвссы с ЗАПАзчывхнигм 243 ф! ° ° ° ~ ти ° сЦ,. (С) дтг(4>(С), х(С), х(С вЂ” В), и 00) дС дх д 4(4'(С+" х" +" х(оь и" +"' -=0 1 . (34) й!Р (С! дгь" (2Р(С), х(С), х(С вЂ” 6), и(С)) ссс дх' с = О, 1, ..., и.
(35) Мы будем говорить, что система непрерывных кусочнодифференцируемых на отрезке (г ( 1 = 1! функций !)А1(с), чр! (1), ..., ф (1) соответствует функциям и П), („<1(11, и х(1), 14 — 0 1(11, если на отрезке 1, с 1( 11 — 0 она удовлетворяет системе (34), а на отрезке 1! — 0 ( 1 ( 1! — системе (35). Теперь мы можем сформулировать н е о б х о д и м о е условие оптимальности для поставленной задачи (в форме принципа максимума). Теорема 20 Пусть и(1), 1г (1 11,— такое допустимое управление, что соответствующая ему траектория х(1), (ь — 0 1 ~ 61, системы (32) с начальной функцией ср(1), 1~ — 0 ( 1 ( 1м проходит в некоторьсй момент 1! ) 1ь через некоторую точку многообразия Е.
Для оптимальности управления иЯ и соответствующей траектории х(с) необходи о существование такой нену- ЛЕВОЙ ВЕКтОр-фуНКции 2)2(1) = (ф!(1), ф!(1), ..., 2)2и(1)), соответствующей функциям и(1) и х(С), что: 1 для всех 8, сг ( 1 ( 11, выполняется условие максимума Я(2Р(1), х(1), х(1 — 0), и(с)) = Я (2)1(1), х(1), х(1 — О)); (30) 2' в конечньсй лсомент 1! выполнены соотношения 2~;ь(С!)~(0, ХИ(1!), х(Е!), х(1! — 0))=0 (37) (заметал!, что в силу уравнений (34), (35) мы имеем чр, = сопя(); 3' вектор (ф! ((1),, ф„(1!) ) ортогонален касательной плоскости многообразия 51, проведенной в точке х (1,) = (х'(с!), .... х" (с!) ). олзиыя зхллчи (гл 4 Заметим, что при применении этой теоремы возникает трудность, связанная с тем обстоятельством, что неизвестные функции х'(Г), ..., х" (1), ф1((), ..., ~р„(() входят в систему (32), (34) как с запаздывающим, так и с опережающим аргументом.
Для линейных систем эта трудность, очевидно, отсутствует. В случае оптимальности по быстродействию ()о — = 1) а вместо функцииЖ рассматривается функция Н = Х Ф ! о-~ переменных фь ..., ~р„, х', ..., х", у', ..., у", и; верхняя грань значений этой функции по и ~ Н (прн фиксированных ф, х, у) обозначается через М(ф, х, у). Заменяя в уравнениях (34)„(35) функцию Я функцией Н, мы сможем и в этом случае определить функции ~р~((), ... ..., ф„(1), (о (.1 ( 1ь соответствующие функциям и((), 1, ( т <(„н х Я, !о — 0 = ( < (ь После этого для случая оптимальных быстродействий сохраняется формулировка теоремы 20 с той только разницей, что функции Ж и М заменяются функциями Н и М, а условие 2' заменяется условием М (ф((,), х((~), х(1, — 0)))0.
Иначе говоря, условие оптимальности по быстродействию вытекает из гсоремы 20 совершенно таким же образом, как теорема 2 получается из теоремы !. Дока за тел ь ство теоремы 20 в общих чертах проводится по той же схеме, что и доказательство теоремы 1 (или теоремы 8). Мы проведем его, подробно отмечая те части доказательства, в которых необходимо произвести некоторые изменения, и опуская построения, ничем не отличающиеся от изложенных в главе 2, Пусть х(() — решение уравнения (33), соответствующее допустимому управлению и((), (о (( =. (ь и начальной функции юр(1), (о — 8 ( Г ( (о. Системой уравнений в вариациях для системы (32) назовем следующую линейную систему: д (дх' (0) ~ч / д!' (к (0, х (г — в), и (г)) и дх" о-о + д( (х(0 "" "' """ ь (1 — е)), 1=0,1, ..., .
(38) дво ОПТИМАЛЫ1ЫГ ПРОЦЕССЫ С ЗАПАЗДЫВАНИЕМ ЗА5 Мы будем рассматривать такие решения системы (38) па отрезке»а — 0 < 1 < 11 или на его части, которые соответствуют кусочно-неп р е р ы в н ы м начальным функциям; так как мы здесь не исключаем возможности разрыва решения в начальный момент 1м то для однозначного определения решения системы (38) необходимо задать (кроме начальной функции) начальное значение этого решения.
Таким образом, если 11(1) — произвольная кусочно-непрерывная функция, заданная па отрезке т — 0 < 1 < т, где те[(м 11), а $ — произвольный вектор пространства Х, то решением системы (38) с начальной функцией т1(1) и начальным значением ф мы будем называть такую функцию бх(1) = (бхе(1), бх'(1), ...
..., Ьх" (1) ), т — 0 < 1 < 11, которая на промежутке т — 0 < 1< т совпадает с Ч(1), на отрезке с<1< 11 непрерывна и удовлетворяет системе (38) и, кроме того, удовлетворяет соотношению бх(т) = 4. Это решение мы будем обозначать символом А1 т(11, $), г — 0 < 1 < 11. Мы условимся (при т — 0 < 1:-.= 11) считать А1, (тЬ $) с в я з ап н ы м вектором, исходящим из точки х(1), Таким образом, при заданных начальных элементах й и т) (1), т — 0 < 1 <т, определяется векторное поле Ас т (11, $), т — 0 < 1 < 11,' мы будем говорить, что векторы А1, »(11, $) этого поля получаются друг из друга перенюсоА1 вдоль траектории х(1).
Отметим следующие легко доказываемые свойства переноса, которые нам понадобятся в дальнейшем (ср. формулы (17) гл. 2). 1. Ан, 1, Й В) = й. П. Положим ~,(1) = А1, (т) Р т1 1, < г < т1 (11; тогда А (~, А,(т), $)) =А1,(1Ь ь), т1 ~~1~~»1. 111. А1,,(уЛ1+ум, у111+у Ь= — У1А1.»(ч1 в1)+У1АА»(Ь яэ)» т 0~~1~(11» где у1 и уз — произвольные действительные числа. П7. Пусть т)1(1) — некоторая кусочно-непрерывная функция, заданная на отрезке т — 0 е= 1 < т (где т ен[(м 111), 1п — некоторая константа и $ — произволь. ялзныв звлхчн [ГЛ. 4 246 ный вектор. ! !усть, далее, полуинтсрвалы 1, онрсдсляюгся так же, как и в $13, а т)(1) — функция, определенная на отрезке т — 9 < 1 < т следующим образом: 'й(1) = ея~(1) + о(е) во всех точках отрезка т — 0 <1<т, нс принадлежащих полуинтсрвалам 1;; ! т)(1) !<еМ на полуинтервалах 1,.
Тогда Аь,(т), е",-+о(е))=Аь,(ет)„е„;)+о(е), т<1<1,. Свойства 1 н П непосредственно вытекают из определения символа Аь ~(т1, я). Справедливость свойства П1 на отрезке 1о < ! < 1, + 0 вытекает из того, что на этом отрезке система (38) представляет собой линейную (неоднородную) систему о б ы к н о в е н н ы х дифференциальных уравнений. На последующих отрезках длины 0 (вплоть до 1~) свойство П1 можно доказать совершенно аналогично, воспользовавшись свойством П. Таким же образом устанавливается н справедливость свойства 1Ч. Перейдем тспсрь к вариациям управлений и т р а ек тор и й.
Пусть и(1), 1е < 1< 1ь — допустимое управление, а х(1) — соответствующая ему траектория уравнения (33) с начальной функцией ~р(1), 1е — 0 ==- < 1 < 1,. Правильпымн точками управления и(1) будут все точки его непрерывности, т. е. все, кроме конечного числа, точки отрезка 1о < 1 ~ 1ь Мы условимся всякое управление и(1), 1е <1 < 1ь продолжать за точку 1ь полагая и(1) = и(1~) при 1) 1,. Важно отметить, что при этом точка 1~ будет правильной точкой управления и(1).
Если т — произвольная точка непрерывности управления и(1), то, каковы бы ни были действительные числа р и д, имеет место соотношение чаче 1(х(1), х(1 — 9), и(1)) г(1= =е(Ч вЂ” р)Х(х(т), х(т — О), и(т))+о(е) (39) (ор. формулу (1) гл. 2). Пусть теперь и(1), 1е = 1 < 1ь — допустимое управление, х(1) — соответствующая траектория уравнения (33) $271 Оптимальные пгоцгсгы Г злпхздывспигм 247 с начальной функцией !р(1), 1е — 0 (1( 1м а а — символ, определяющий варьирование управления.