Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 49
Текст из файла (страница 49)
Задача (р) также является задачей Больца, но вырожденной, поскольку и не входит в лагранжиан, а и(1,) и и(1,)— в терминант. Уравнение Эйлера — Лагранжа поэтому превращается в (9), а условия'трансверсальности становятся бессодержательными: 0=0. Наконец, (у) является элементарной задачей и (10) есть просто теорема Ферма (см.
пп. 1.3.1 и 3.1,1). Условия дополняющей нежесткости и условия согласования знаков также, как мы знаем, написаны в соответствии с общим принципом Лагранжа, примененным к ограничениям типа неравенств (и. 3.1.5) Таким образом, основную теорему этого параграфа можно сформулировать так: если функции, входящие в постановку задачи, обладают достаточной гладкостью, то для локального экстремума выполнен принцип Лагранжа.
Условия стационарности можно переписать в более развернутом виде. В соответствии с (5) получаем: из (7) ~И = — Р(1) сг,(1)+ЕХАх(1) (7а) а=ь (иногда (7а) называют сопряженным уравнением); из (9) (9а) из (8) (8а) 301 и„ наконец, из (10) 0=( — 1)'-" Е (Е»)+1»„+ („,хх Кд = =( — 1)"-'1Х)А(()+р(г)( (1) — р(1)) + ь1=а + (с»+ ( 1)" Р (г»)х(г») = Г ОФ =( — 1)' '~ Х )" Ин) Р(г») «р(1») +1~ или р Ю ч (г») — ~,~4; Функцию Н(1, х, р, и) =Е„х — 1,= (У )=( — 1)" '11 .
(Гба) т =р~р((, х, и) — ~', ХА((, х, и) (13) К=О мы будем называть функцией Понтрягина рассматриваемой задачи. С ее помощью уравнения (7а) — (10а) и уравнение (2) можно записать еще и так: (14) (16) где и(1, х, р) — неявная функция, определяемая из уравнения Н,(1, х, р, и)=0. При выполнении стандартных условий применимости теоремы о неявной функции уравнения (14) принимают обычный вид канонической гамильтоновой системы (17) 302 И1») = ( — 1)»1.», Н (г,) = ( — 1)»-' 1,„, й = 0, 1. (Гб) 3 а м е ч а н и е.
Иногда функцию (13) называют функцией Гамильтона. Мы вкладываем в термин «функция Гамильтона» -или «гамильтониан» другой смысл, более естественный с точки зрения классической механики, и называем так функцию Я(1, х, р) =Н(1, х, р, и(1, х, р)), Полезно заметить, что набор условий, который доставляет сформулированная теорема, в некотором смысле является полным. Действительно, для определения неизвестных функций (х( ), р( ), и( )) мы имеем систему нз дифференциальных уравнений (2) н (7а) и конечного ураднения (9а). Выражая нз последнего (разумеется, когда это можно сделать, например, если выполнены условия теоремы о неявной функции) и (.) через х(.) и р( ), мы получаем систему из 2п скалярных дифференциальных уравнений (эквивалентную системе (17)).
Ее общее решение зависит от 2п произвольных постоянных н еще от множителей Лагранжа Х,, среди которых и независимых. Добавляя сюда еще 1, и 1„ мы получаем всего 2п+т+2 неизвестных. Для нх определения мы нмеем 2п+2 условия трансверсальности (15) н т условий дополняющей нежесткости (12).
Таким образом, число неизвестных совпадает с числом уравнений. Именно это и имелосв в виду, когда выше было сказано о «полноте» набора условий. Разумеется, разрешимости полученной системы уравнений указанное обстоятельство никак не гарантирует. 4 1.2. Редукция задачи Лагранжа к гладкой задаче. Обозначим через У пространство С(Л, К") и запишем задачу (1) — (3) п. 4.1.1 в виде З,($) — ех1г; Ф($)=0, З;(Е) ~~0, 1=1, ..., т, (1) где Ф($)(1)=х(1) — ~р(1, х(1), и(1)).. (2) Отображение Ф и функционалы З; определен«я в области 9»=((х( ), и( ) 8а 1»))(Х х(1), и(1))бр, (ЕЛ; 1„(,Е1п1Л, (Е„х(К,), 8„'х(1,)) ~ЯГ) пространства В.
Задача (1) имеет тот же вид, что задача п. 3.2.1 предыдущей главы, для которой принцип Лагранжа был уже доказан. Предположения соответствующей теоремы распадались на 'трн группы: банаховость основных пространств, гладкость отображений и замкнутость образа бесконечноыерного отображения. Проверим, что в задаче (1) все эти требования выполняются. Б а на х о вость пространств Я н У очевидна — пространства С' и С являются основными для нас примерами банаховых пространств (см.
пп. 2.1.1 и 2.1.2). 303 Гладкость (а именно непрерывная дифференцируемость по Фреше) функционалов Зо (=О, 1, ..., т, следует из результатов $ 2.4. Действительно, с интегральной частью мы можем поступать точно так же, как и в предложении 2 и, 2 4.2, заменив всюду х( ) на и( ), а дифференцируемость терминальной части доказана в п. 2.4.3 (это оператор крае. вых условий). При этом, согласно формулам (9) п. 2.4.2 и (3) и. 2.4.3, имеем для $=(х( ), и( ), г'„1,), ц = (й(') о( ) та М Эг($) !Ч1 = ~ 0ы(Г) й(1) +1..
(1) о И) г(1+ ~а +7г(1,) тг — 7с((о)то+(кто+(пЛ+(.„й(т.)+ +(.,й(1,)+(~х((о)т.-(-(.,х(Г„) т, (3) (ср. лемму п. 3.1.3). Отображение (2) также непрерывно диффереицируельо по Фреше (см. предложение 3 п. 2.4.1). Его производная, согласно (14) п. 2.4.1, имеет вид 6) 1о) (1) =й (г) ~рх (г) й (г) Ч~а (г) о (г) (4) Из непрерывной дифференцируемости по фреше функционалов З~ и отображения Ф следует их строгая диффереицируемость, требуемая в теореме о принципе Лагранжа.
Замкнутость образа отображения Ф имеет место в силу его регулярности: образ Ф'($)Е совпадает с У. Действительно, взяв произвольное у( ) Е )' = =С(Ь, К ), положим о( )=О, т,=т,=О. Уравнение Ф'(й) Р ( ), О, О, О) ( ) = р ( ) эквивалеятно линейному дифференциальному уравнению Ь(1) — ~р„(1)й(1)=у(1) с непрерывными коэффициентами, которое имеет решение й ( ) Е С' (гъ, К") в силу теоремы существования для линейных систем (п. 2.5.4). Таким образом, выполнены все условия теоремы п, 3.2.1. Для определенности будем считать, что (1) — задача на минимум.
Согласно принципу Лагранжа, если $ = = (х(.), й( ), 1„(,) — локальная минималь (1), то найдутся множители Лагранжа Х„ХЕК"' и элемент у'Е 304 Е)"=(С(сЛ, К"))' такие, что для функции Лагранжа .У($„у", Л, Л,)=.У(х( ), и( ), 1„(с; у', Л, Л,) = с,, т т = ) [ Х,ЛА (1 х и)) с(1 + ~~'„, Лсфс (1м х (1.), 1„х (1,)) + с, ~=о ~=о + у' о Ф (5) выполнены условия согласования знаков, дополняющей нежесткости и стационарности .Уе=ОФФ.У,е)=0, У„со=О, .Ус =О, й=О, 1.- Три соотношения, из которых складывается правая часть, мы называем далее стационарностью по х( ), и( ) и по 1„соответственно.
Однако мы замечаем, что функция (5) не тождественна функции Лагранжа (4) п. 4.1.1. Воспользовавшись теоремой Рисса об общем виде непрерывного линейного функционала на пространстве С(сс, К") (и. 2.1.9), мы можем утверждать лишь, что <у', т1( )>=~с( (1)Ч(1). Ь где т(1) =(т,(1), ..., т„(1)) — вектор-строчка из канонических функций ограниченной вариации. Подставляя это в (5) и учитывая обозначение (6) из и. 4.1.1, получаем т л-1(Есс;с *ос, июс) + с, с=о +) Й (1) (х(() — ср(К, х(1), и(Е)))+ Ь +1((„х((о), („х(1с)). (6) Сравнивая эту формулу с (4) — (6) из п.
4.1.1, мы видим, что функция Лагранжа .У получается из .У, если функция т( ) абсолютно непрерывна, а ее производная Равна нУлю вне [с„1с) и совпадает с Р ( ) в этом отРезке. Ситуация напоминает здесь п, 1.4.1. Подобно тому как лемма Дюбуа-Реймоиа позволила нам там вывести уравнение Эйлера без дополнительного предположения о дифференцируемости функции 1 — р(1) =Л; (г), подходящее обобщение этой леммы позволит нам сейчас доказать абсолютную непрерывность функции т( ), 305 4.1.3. Обобщенная лемма Дюбуа-Реймона. Пусть на отрезке [а, р] векторная функция а( ): [а, р1 — Ка' интегрируема по Лебегу, матричная функция Ь ( ° ): [а ()1 — »,2»(К" К»») непрерывна, »г( ): [а Я Ка — каноническая векторная функция ограниченной вариации; 㻠— различные точки интервала (а, р)» с»бК"', й=О, 1, ..., р. Если для всех й(.)ЕС»([а, р), К") имеет место ра- венство ~ а(() й(()й(+ ~ г(т(() (й(() — Ь(1)й(())+~~» с»й((») =О, а а »=о (1) р (г) = а (г) — р (г) Ь (() почти всюду, р (а) =р()») =О, р (г»+ 0) — р (㻠— 0) = с„.
(2) (3) (4) Доказательство. Положив й (() = у+ ~ т) (я) йя, мы получаем из (1) ( Р В Р ~ а(()Ш вЂ” ~ йч(() Ь(1)+~ с»г~у+ ~ а(() ~ »1(я) йяг((+ а а »=о а а Р Р г» + ~ йч(г) »1(г) — ) йч(г)Ь(г) ~ ц(я) с(я+ ),с» ~ г) (я)йя = О. Так как уЕК" и т)( )ЕС([а, р), К") можно выбирать произвольно и независимо друг от друга, то, во-первых, Р Р Р ) а(г)йг — ) йт(г)Ь(г)+~~ с»= 0 (5) (нбо можно положить »1( )=О, у — любое), а во-вторых, ЗОБ то функция т( ) абсолютно непрерывна; ее производная р( ) непрерывна на [а, Я, кроме, бьипь может, точек г», в которых она имеет ггределы слева и справа, абсолютно непрерывна в любом интервале, не содержащем пючек (ю и при этом для любого г1( )ЕС()а, Я, й") имеет место равенство в с в ) а (1) ) г) (з) г(з Й + ~ с(т(1) 11 (1)— а а а в о вз — ~ Ит(1) Ь(1) )'Ч(з) Ыз+~~'„св) ч(з)аз=О.
(6) а Я з=о и Меняя в первом и третьем члене порядок интегриро- вания в соответствии с формулой Дирихле ((5) и. 2.1.9), обозначая буквой з переменную интегрирования во вто- ром члене, полагая 1, а<з<4, х~" О(з)= О, 1<а<6 и используя равенство в в ) ) (г) 4 (г) = ~ 1 (г) р' (1) ог, (8) а а справедливое для абсолютно непрерывных функций [КФ, стр.
3591, преобразуем (6) к виду в~ в в ваяв 1Д,з~а)„~ ~~ ~~1н.~ ~„~,1 — )ф.драч)~.>и< а а и 1 в о в +) ~~~, сд~„,с1(з) п(з)Нз=) пЛ(з) т)(з)+~ от(з) т)(з)=О, а й=О Я И (9) где ° гв ' в Р Л (з) = ~ ~ ~ а (г) й — ~ г(т (1) Ь (1) + ~~', с,дг„, с„1 (п)1 с(п.
а а ч з а Функция Л( ) абсолютно непрерывна на ~а, р) и Л(и) =О, следовательно, это каноническая функция, а так как т( ) — также каноническая функция ограниченной вариации, то иэ (9) и свойства единственности в теореме Рисса (п. 2.1.9) Л(з)+т (з) = О. Следовательно, т( ) абсолютно непрерывна, а ее производная р(з) = = т'(з) при а~Гз равна (снова используем (8)) р (з) = т' (з) = — Л' (з) = в в = — 1а(1) И+р)р(1)Ь(1)а — ~' с,2,„,щ(з). з о Из втой формулы видно, в свою очередь, что р( ° ) непрерывна всюду, кроме точек („, где справедливо (4), и что имеет место (2).
Равенство р (1)) = 0 очевидно, а р(а)=0 эквивалентно (5), так что доказано и (3). ° 4.1.4. Вывод условий стациоиарности. Итак, мы показали, что если $ доставляет локальный минимум в задаче (1) — (3) п. 4.1.1, то найдутся такие множители Лагранжа Х,)0, ХЕК ' и у»ЕС(Ь, К»)', что выполнены условия согласования знаков и дополняющей не- жесткости для Х и условия стационарности а) .У,<>=О, б) .У„<>=0, в) .У,,=О, Ь=О, 1, (1) где .У определяется равенством (6) п. 4.1 2, а .У,! и .Уж ~ и Уы получаются из У,! и .У»~ и .У~ подстановкой х ( ) =-. х (.