Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 31
Текст из файла (страница 31)
Отметим, что если матриць1 (а'(г)) и (Ь' (1)) постоянны, т. е. величины а! и Ь'„не зависят от времени, то из (88) следует, что В; = ( — 1)1-'Ат 'В, и потому векторы (89) совпадают, с точностью до знаков, с векторами (Э). Таким образом, в этом случае сформулированное здесь условие общности положения совпадает с условием общности положения, введенным в 5 17. 4 м1 токвнение с пггкменными коэоеицианткми Вет Функция Н Я, х, т', и) (см. стр. 74 и теорему 5) в рассматриваемом случае имеет вид Н=(тР, А(1)х)+ (ф, В(Г)и)+(ф, )(1)) = ф„а",(у)х + ~ $„Ь" (1)и'+ 2 ф,г"(1), (90) р,т «,о и а вспомогательная система (см.
формулу (69) гл. 1) записывается в виде сьрг — — ~ а'(1) ф„, 1=1, 2, ..., н, или, в векторной форме (ср. (5)), — = — А*(1) ф ти (91) в] Ср, сноску ыв стр. 134 Очевидно, что функция П, рассматриваемая как функция переменного и е= У, достигает максимума одновременно с функцией (ф, В(1)и). Максимум функции (ф В(1)и), рассматриваемой как функция переменного и~ Н, мы обозначим через РЦ, 1), Из теоремы 5 еле.
дует (см. формулу (70) гл. 1), что если и(Г), (о ( Г ( <1ь — оптимальное управление, переводящее фазовую точку из положения х, в положение хь то существует такое нетривиальное решение ф(1) уравнения (91), что (тр(Г), В(1)и(г))=Р(ф(1), г) (92) для всех й принадлежащих отрезку (о <1- 1ь Некоторую функцию, заданную па интервале а < 1 < ( Ь или на его части, мы будем называть кусочно-постоянной, если множество всех точек разрыва этой функции не имеет предельных точек внутри интервала а ( (1< Ь, а на каждом из интервалов, на которые интервал а(Г =Ь разбивается этими точками разрыва, рассматриваемая функция постоянная.
(Заметим, что точки разрыва могут накапливаться к концам интервала а < 1 <Ь) Теорема 15. Для каждого нетривиального решения ф(1) уравнения (9!) соотношение (92) однозначно*) оя- 208 лннгппыт. оптпмхльныг. ьыстэодвпствня !гл. з (~р(!), В(!) ш) =О при всех ! ~ М, Формула (9) заменяется соотношением (93) ($(!), В(!) св) = ~ ф„(!) Ь„'(!) гв".
(94) т,ь Так как функции а'(!) имеют и — 2 непрерывных производных, то функции ф(!), ..., ф„(!), составляющие решение уравнения (91), имеют и — 1 непрерывную производную; функции Ьр ОО также имеют, по предположепи|о, и — 1 непрерывную производную. Следовательно, функция (94) и — 1 раз непрерывно дифференцируема. Так как т — предельная точка множества М, то, в силу непрерывности функции (94), из соотношения (93) вытекает, что (1р (т), В (т) гв) О. ределяет управляющую функцию и(!); при этол оказьн вается, чг<> функция и(!) кусочно-постоянна и ее значениями являются лишь вершины лгногогранника К Это — теорема о «конечности числа переключений» для линейных уравнений с переменными коэффициентами (ибо всякое управление и(!) задано на некотором отрез к е 1, < ! < !ь целиком лежащем внутри интервала а < ! < Ь, и нз теоремы !5 следует, что число точек разрыва функции и(!) конечно).
В случае постоянных коэффициентов теорема 15 превращается в теорему 9. Д о к аз а телье т в о теоремы 15 вполне аналогично доказательству теоремы 9. Укажем лишь те незначительные изменения, которые следует произвести в доказательстве теоремы 9. Прсдпологким, что множество точек, в которых зпачепнс управления и(!) не определяется однозначно соотношением (92), имеет хотя бы одну предельную точку внутри интервала а < ! < Ь. Тогда, как н выше (см.
формулу (8) н относящийся к ней текст), мы сможем найти такое ребро ш многогранника (У н такое множество М, имеющее внутри интервала а < ! < Ь предельную точку с, что $23! ГРАВне11ие с НГРГА1Гннымн коэФФнцнентАмн 299 Далее, так как между каждыми двумя корнями днфференцируемой функции содержится хотя бы один корень ес производной, то производная функции (94) обращается в нуль в бесконечном множестве точек, име1ощем т своей предельной точкой. Но производная функции (94) имеет вид — ($(!),В(1)1Р) =( — А'(1)ф(!), ВЯи)',+(ф(~), и1)= =($(!), — А(!) В(!) Н1)+ (ф(1),Л, 1в) =($(!), В,,(!) Н1) (см.
(88)). Таким образом, на бесконечном множестве точек, имеющем т своей предельной точкой, выполняется соо сношение (1Г(!), В,(!) )=О, н потому (в силу непрерывности) Ц (т), В, (т) са) = О. Аналогично, между л1обымн двумя корнями функции (ф(!), Вз(!)ш) содержится хотя бы один корень сс производной; из этого с номо1цью тех же рассуждений получаем (11(т), Вз(т)и1) = 0 и т. д. В результате мы получаем соотношения (ф(т), В1(т!ю)=0, 1=1, 2, ..., п (95) (ср. (10), (! !)), В силу линейной независимости векторов (89) нз соотношений (95) вытекает, что ф(т) = О, н потому решение ф(!) уравнения (91) тривиально. 1!олучепное противоречие показывает, что множество точек, в которых управление и(!) Не определяется однозначно соотношением (92), не имеет предельных точек внутри интервала а < С ( Ь.
Дальнейшее доказательство не отличается от доказательства теоремы 9. Итак, теорема 15 доказана, Перейдем теперь к рассмотрению т е о р е м с у щ естт в о в а и и н и единственно ст и для снстсл1ы (86). Как н выше (см. (20)), рассмотрим фундаментальную систему решений 210 ЛИИЕЙИЫЕ ОПТИМЛЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ Э Лл однородного уравнения — А (1) х, удовлетворяющую начальным условиям ф,'.
((ь) = бИ!с и фундаментальную систему решений ф! (1), ..., ф"(1) уравнения (91), удовлетворяющую начальным условиям э1!! (1„) = б!. При этом соотношение (21) остается справедливым. Далее, решение уравнения (87), соответствующее произвольно выбранному управлению и(1), 1ь(1(1ь можно искать в виде (ср. стр. 142). В результате мы получаем следуЭощую формулу (ср. (22)): л *!Э=г' л.м)(.; Р 1!л".!л, в!л !БР!!л!л). Р6! У ! После этого теоремы 1! и 12 (в дословно тех же формулировках) переносятся и на рассматриваемый случай. Сохраняются и доказательства этих теорем — с заменой соотношения (22) соотношением (96) и вытекающими отсюда очевидными изменениями. Сохраняется и теорема существования (см.
теорему 13). Т е о р е и а 16. Если для процесса, описываемого уравнением (87), существует при заданном 1ь котя бы одно управление и(1), 1В ( 1 ( 1,, переводящее фазовую точку из положения хь в положение хЭ, то существует и оптимальное управление (с тем же начальным моментом 1ь), переводящее фазовую точку из положения хл в положение хь Д о к а з а т е л ь с т в о является дословным повторением доказательства теоремы 13 (с очевидной заменой ссылок на формулу (22) ссылками на формулу (96)).
Отметим только, что сдвиг времени, о котором упоминалось па стр. 147, теперь не может быть применен ввиду того, что уравнение (87) неавтономно; однако этот сдвиг времени теперь и не нужен, так как рассматриваЭотся лишь управления с начальным моментом 1В, З ея УРлвнгние с пГРГменнымн коэФФНИНГнтлми З11 3 а м е ч а н и е.
Все результаты настоящего параграфа получены в предположении, что функпии а'(1), Ь' (1) и 1'(1), входящие в систему (86), определены на некотором интервале а (1( Ь (возможно, па всей прямой) и функции 11(1) имеют на этом интервале первые непрерывные производные, а функции а'(1) и Ь: (1) имеют соответственно (и — 2)-е и (п — 1)-е непрерывные производные. (Кроме того, как всегда, предполагалось выполненным условие общности положения.) Нетрудно понять, что все полученные результаты остаются справедливыми, если функции а',(1), Ь' (1), 11(1) непрерывны, а нх производные (в указанном числе) являются лишь к у с о ч н он е и р е р ы в н ы и и функциями.
В самом деле, отметим на интервале а(1(Ь все точки, в которых хотя бы одна из указанных производных терпит разрыв непрерывности. Эти точки разбивают интервал а (1( Ь па части, на каждой из которых функции а'(1), Ь' (1), 11(1) имеют требуемое число непрерывных производных. К каждой из этих частей в отдельности можно применить теорему 15, и потому теорема 15 справедлива в применении ко всему интервалу а 1 Ь. Очевидно, что остается справедливой и формула (96), а потому также и теоремы существования и единственности.
ГЛЛВЛ 4 РАЗНЫЕ ЗАДАЧИ 2 24. Случай функционала, заданного несобственным интегралом Рассмотрим следующий вариант оптимальной задачи, сводящийся к рассмотрению бесконечного интервала интегрирования в функционалс l. В Фазовом пространстве Х дана точка хо. Среди всех допустимых управлений и(1), 1о ( 1< + оо, для которых соответствующая траектория х(1) системс« —,=~'(х', ..., х", и), 1=1, ..., и, и вне, (1) исходящая из точки хо, определена для всех 1 ) летворяет при 8-~- оо некоторым (заданным предельны и условиям, найти такое, для интеграл 1о и удовзаранее) которого У ~ го(х(1) и(1))д1 (2) сходится и принимает наименьшее возможное значение. На функции 1'(х, и) накладываются условия, аналогичные тем, которые были указаны в гл. 1, 2: они предполагаются непрерывными по х и и н непрерывно лнфференцируемыми по х', ..., х" на прямом произведении Х К П.
Отметим, далее, что мы будем понимать здесь под «допустимымн» управлениями. Функцщо и(!), слэчхп нвсавстасннага иитггпхлх 2!3 (1( ао, принимающую значения в области управления У, мы будем считать огра н и ч е ни о й, если множество всех точек и((), где 1 пробегает любой ко нсчн ы й отрезок, лежащий на промежутке Га ( ( ( со, имеет в пространстве Е„(содержащем область управления У) компактное замыкание. Принимая это определение ограниченности управления (и рассматривая лишь управления, заданные на промежутках вида (а (1( сс), мы в остальном сохраним определение класса допустимых управлений, данное в ~ 10.
В частности, в качестве класса допустимых управлений можно взять класс всех ограниченных (в указанном смысле) измеримых управлсний, заданных па промежутках вада 1э «1( оо, нли же класс всех ограниченных кусочно-непрерывных управлений (кусочпая непрерывность понимается в гом смысле, что иа всяком к о н е ч н о м отрезке, содержащемся в промежутке (э ( Г ( оо, управление и(1) имеет лишь конечное число разрывов первого рода). Наконец, сделаем еще замечания относительно «предельиых условий на бесконечности», упомянутых в формулировке задачи. Мы предполагаем, что эти условия имеют вид !ш1 х'(1) =х'„ (3) где х, =(х,', хп ..., х",) — заданная точка фазового пространства Х. Если для фазовой траектории х(1), соответству~ащсй допустимому управлению и(() и исходящей из точки хм выполнены условия (3), то мы будем писать х(со) = х, и будем говорить, что управление и(1), 1а ( (1( оо, переводит фазовую точку из положения хэ в положенис хь Решение поставленной оптимальной задачи дается теоремой 1 (илн теоремой 8) с очевидной заменой отрезка гэ < Г ( 1~ бесконечным промежутком Гэ - 1( со и с заменой условия прохождения траектории через некоторую точку прямой П предельными условиями иа бесконечности.
В самом деле, все рассуждения, приведенные в Я 13, 14, были связаны с выбором некоторой правильной точки т, удовлетворяющей условию т((б эти рассуждения дословна, без всяких изменений проходят и в случае 1~ = о. То же относится к формулировке и дока- !гл. 4 г»зпыв злдхчи зательсгву лемм 5 — 8 из й !5.