В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 49
Текст из файла (страница 49)
й 4.1. Принцип Лагранжа для задачи Лагранжа 4.1.1. Постановка задачи и формулировка теоремы. Зафиксируем замкнутый отрезок А=(и, р1<=П и рассмотрим банахово пространство Е=С'(А, К")хС(А, К')хйхП, состоящее из элементов $=(х( ), и( ), 1„1,). 297 В этом пространстве рассмотрим задачу: 2),(х( ), и(.), 1„1,)= = ~ 1,(1, х(1), и(1))й(+ф,((м х(1,), Х„х(С,)) ех(г, (1) с, х=<р(Г, х(1), и(1)), (2) йь(х( ) и( ) 10 г1) и = $1;(Г, х(1), и(1))йр+ф((м х(1,), 8„х(1,))~~0. (3) и При этом в (1) — (3) ~;: У К, ф;: Мг — К, 1 = О, 1, ... ..., т; ср: У вЂ” К", где У и 77 — открытые множества в пространствах Кх й"х К' и 11хй"х Кх1(" соответст- венно. Все перечисленные функции предполагаются по крайней мере непрерывными. Знак ~~ имеет тот же смысл, что и в $ 3.2.
Задачу (1) — (3) мы называем задачей Лагранжа в понт- рягинской форме, Частные случаи этой задачи обсужда- лись в Я 1.4, 1.5 и в э 3.1. Функционалы того же типа, что и Яо содержащие как интегральную, так и терминальную части, были ранее названы функциона- лами Больца (см. пп. 1.4.2 и 3.1.3).
Если в ограниче- нии Я;~ ~0 терминальная часть является константой, с, т. е. оно принимает вид ~ ~,(С, х, и)й(~~ам то вслед и за Эйлером мы называем такое ограничение иэоперимет- рическим. Если, наоборот, отсутствует интегральный член, то ограничение ф;(1„х(1,), 1„х(1,))~~0 называется граничным, или краевым условием.
Ограничение (2) называется дифференциальной связью. Такой вид дифференциальной связи — разрешенный отно- сительно х — является характерным признаком понтря- гинской формы задачи. Лагранж задает дифференциаль- ную связь уравнением ф(1, х, х) = О (вкратце об этом говорилось в п. 1.5.1). Наконец, в отличие от гл.
1, отрезок времени [1„1,1 в задаче (1) — (3) не предполагается фиксированным. Четверку $=(х( ), и(.), 1„1,)ЕВ будем называть унравляаиым процессом в задаче (1) — (3), если 1„1, Е 1п1 Л, (1, х(1), и(1))ЕУ для 1ЕЛ и всюду на [1„8Д удовлет- воряется дифференциальная связь, т. е. х(1) =ср(1, х(1), 296 и(1)), и допустимым управляемым процессом, если эта четверка является управляемым процессом н, кроме того, выполнены условия (3). Четверка $=(х( ), и( ), ~;, 11) называется оптимальным в слабом, смысле процессом, или слабым экстремумом в задаче (1) — (3), если она является локальным экстремумом в пространстве Е, т. е.
если найдется такое е ) О, что для любого допустимого управляемого процесса $, удовлетворяющего условию (~$ — $1 (е, выполняется одно из неравенств: Я,($)ЪЯ,($) в случае минимума и З,($) = «=З,(я) в случае максимума. Функцией Лагранжа этой задачи называется функция ц .У(х( ), и( ), 1„~,; р( ), Л, Х,)=)Еб(+1, (4) где йчбК р( )ЕС'Р К ) 1=Р1 .
* и )бК ' — множители Лагранжа, ,Ь((, х, х, и)= Х ХА(1, х, и)+р(()(х — ~р(1, х, и)) (5) с=о — лагранжиан, или интегрант, и 1((о «м (м «1) Х Этфу((в* Хо (м Х1) (6) — терминант. Далее мы в этом и следующем параграфах пользуемся, как и ранее, следующими сокращениями: Е2(() =Т.2((, х(т), х(~), и(1)), Ь„(() = Е„(1, х (1), х (т), и (Г)), А„(1)=Ь„(С, х(8), х(~), й(г)), 1» = (.
Ио х Ие)* (~~ х (11))~ 5', =Я,„(х( ), и( ), 1„1„р( ), ), Х,) и т. п. Т е о р е м а Э й л е р а — Л а г р а н ж а. Пусть функции У- К, 1=0, 1, ..., т, ~р: У вЂ” К" и их частные производные по х и и непрерывны в открытом множестве У пространства КхК"хК', а функции ф~. 'йг- К, 1= =О, 1, ..., т, непрерывно дифференцируемы в открытом множестве яг пространства Й х Й"-х Йх Й", и пусть х( )чС'(б, й"), й(.)ЕС(б, 11'), 1„(,Е1п1й таковы, (Г, х(Г), и(1))ЕЪ', ГЕА (Гю.
х((ь) 11 х(11))ЕФ'. Если $ =(х( ), и( ), 1„1,) является оптимальным в слабом смысле процессом для задачи (1) — (3), то найдутся множители Лагранжа Х,)0 в случае задачи на минимум и е О в задаче на максимум, р( ) ~С'(Л, м"'), Х=(Х„..„Х„), не равные одновременно нулю и такие, что: а) выполнены условия стационарности функции Лагранжа: по х( ° ) (.2'„со — — 0): —,", Х„(г) + 1.„(г) = О, (7) 1(А) ( ) лй' (8) по и( ) (.2'„и — — 0): Е„(г) =о; (й) по гь А,=О, й=О, 1; (10) б) выполнено условие согласования знаков: Х~~О, 1=1, ..., т; (11) в) выполнены условия дополняющей нежесткости: Л;Вг($)=0, 1=1, ..., и. (12) Как н в Я 3.1, 3.2, неравенства (11) означают, что Я, =в 0, еслн в условии (3) Яг($)з 'О, Л;(О, если в (3) Зг($) ~О н Х; может иметь любой знак, если Зг($) =О.
Утверждение о существовании множителей Лагранжа, удовлетворяющих совокупности условий а) — в)„кратко называется нами принципом Лагранжа для задачи Лагранжа (1) — (3). Покажем, что утверждение теоремы находится в водном соответствии с общим принципом Лагранжа, о котором говорилось в гл. 1 н в п. 3.1.5. Действительно, 000 функция Лагранжа Я является функцией трех аргументов: х( ), и( ) и (1„1,). Таким образом, согласно общему принципу Лагранжа, надлежит рассмотреть три задачи: (а) Я(х( ), й( ), 1„1;, р( ), Х, Х,) ех(г, (р) .9" (х( ), и(.), К„1,; р( ), Х, Х,) — ех1г, (у) .2' (х (. ), й ( ), 1„1,; р ( ), ), ),) — ех( г. Задача (а) является элементарной задачей Больца, и условия стационарности (7) и (8) написаны в полном соответствии с п.
1.4.2 и теоремой и. 3.1.3. Задача (р) также является задачей Больца, но вырожденной, поскольку и не входит в лагранжиан, а и(1,) и и(1,)— в терминант. Уравнение Эйлера — Лагранжа поэтому превращается в (9), а условия'трансверсальности становятся бессодержательными: 0=0. Наконец, (у) является элементарной задачей и (10) есть просто теорема Ферма (см. пп. 1.3.1 и 3.1,1). Условия дополняющей нежесткости и условия согласования знаков также, как мы знаем, написаны в соответствии с общим принципом Лагранжа, примененным к ограничениям типа неравенств (и.
3.1.5) Таким образом, основную теорему этого параграфа можно сформулировать так: если функции, входящие в постановку задачи, обладают достаточной гладкостью, то для локального экстремума выполнен принцип Лагранжа. Условия стационарности можно переписать в более развернутом виде. В соответствии с (5) получаем: из (7) ~И = — Р(1) сг,(1)+ЕХАх(1) (7а) а=ь (иногда (7а) называют сопряженным уравнением); из (9) (9а) из (8) (8а) 301 и„ наконец, из (10) 0=( — 1)' "7.
(1»)+1„+1,хх(1») = =( — 1)"-'1Х)А(()+р(г)( (1) — р(1)) + ь1=а +(с»+ ( 1)" Р (г»)х(г») = Г ОФ =( — 1)' '~ Х )" Ин) Р(г») «р(1») +1~ или р Ю ч (г») — ~,~4; Функцию Н(1, х, р, и) =Е„х — 1,= (У )=( — 1)" '11 . (Гба) т =р~р((, х, и) — ~', ХА(1, х, и) (13) К=О мы будем называть функцией Понтрягина рассматриваемой задачи. С ее помощью уравнения (7а) — (10а) и уравнение (2) можно записать еще и так: (14) (16) где и(1, х, р) — неявная функция, определяемая из уравнения Н,(1, х, р, и)=0. При выполнении стандартных условий применимости теоремы о неявной функции уравнения (14) принимают обычный вид канонической гамильтоновой системы (17) 302 И1») = ( — 1)»1.», Н (г,) = ( — 1)»-' 1,„, й = 0, 1.
(Гб) 3 а м е ч а н и е. Иногда функцию (13) называют функцией Гамильтона. Мы вкладываем в термин «функция Гамильтона» -или «гамильтониан» другой смысл, более естественный с точки зрения классической механики, и называем так функцию Я(1, х, р) =Н(1, х, р, и(1, х, р)), Полезно заметить, что набор условий, который доставляет сформулированная теорема, в некотором смысле является полным. Действительно, для определения неизвестных функций (х( ), р( ), и( )) мы имеем систему нз дифференциальных уравнений (2) н (7а) и конечного ураднения (9а). Выражая нз последнего (разумеется, когда это можно сделать, например, если выполнены условия теоремы о неявной функции) и (.) через х(.) и р( ), мы получаем систему из 2п скалярных дифференциальных уравнений (эквивалентную системе (17)). Ее общее решение зависит от 2п произвольных постоянных н еще от множителей Лагранжа Х,, среди которых и независимых.
Добавляя сюда еще 1, и 1„ мы получаем всего 2п+т+2 неизвестных. Для нх определения мы нмеем 2п+2 условия трансверсальности (15) н т условий дополняющей нежесткости (12). Таким образом, число неизвестных совпадает с числом уравнений. Именно это и имелосв в виду, когда выше было сказано о «полноте» набора условий. Разумеется, разрешимости полученной системы уравнений указанное обстоятельство никак не гарантирует.
4 1.2. Редукция задачи Лагранжа к гладкой задаче. Обозначим через У пространство С(Л, К") и запишем задачу (1) — (3) п. 4.1.1 в виде З,($) — ех1г; Ф($)=0, З;(Е) ~~0, 1=1, ..., т, (1) где Ф($)(1)=х(1) — ~р(1, х(1), и(1)).. (2) Отображение Ф и функционалы З; определен«я в области 9»=((х( ), и( ) 8а 1»))(Х х(1), и(1))бр, (ЕЛ; 1„(,Е1п1Л, (Е„х(К,), 8„'х(1,)) ~ЯГ) пространства В.
Задача (1) имеет тот же вид, что задача п. 3.2.1 предыдущей главы, для которой принцип Лагранжа был уже доказан. Предположения соответствующей теоремы распадались на 'трн группы: банаховость основных пространств, гладкость отображений и замкнутость образа бесконечноыерного отображения. Проверим, что в задаче (1) все эти требования выполняются. Б а на х о вость пространств Я н У очевидна — пространства С' и С являются основными для нас примерами банаховых пространств (см. пп. 2.1.1 и 2.1.2).
303 Гладкость (а именно непрерывная дифференцируемость по Фреше) функционалов Зо (=О, 1, ..., т, следует из результатов $ 2.4. Действительно, с интегральной частью мы можем поступать точно так же, как и в предложении 2 и, 2 4.2, заменив всюду х( ) на и( ), а дифференцируемость терминальной части доказана в п. 2.4.3 (это оператор крае. вых условий). При этом, согласно формулам (9) п. 2.4.2 и (3) и. 2.4.3, имеем для $=(х( ), и( ), г'„1,), ц = (й(') о( ) та М Эг($) !Ч1 = ~ 0ы(Г) й(1) +1.. (1) о И) г(1+ ~а +7г(1,) тг — 7с((о)то+(кто+(пЛ+(.„й(т.)+ +(.,й(1,)+(~х((о)т.-(-(.,х(Г„) т, (3) (ср. лемму п.
3.1.3). Отображение (2) также непрерывно диффереицируельо по Фреше (см. предложение 3 п. 2.4.1). Его производная, согласно (14) п. 2.4.1, имеет вид 6) 1о) (1) =й (г) ~рх (г) й (г) Ч~а (г) о (г) (4) Из непрерывной дифференцируемости по фреше функционалов З~ и отображения Ф следует их строгая диффереицируемость, требуемая в теореме о принципе Лагранжа. Замкнутость образа отображения Ф имеет место в силу его регулярности: образ Ф'($)Е совпадает с У. Действительно, взяв произвольное у( ) Е )' = =С(Ь, К ), положим о( )=О, т,=т,=О.
Уравнение Ф'(й) Р ( ), О, О, О) ( ) = р ( ) эквивалеятно линейному дифференциальному уравнению Ь(1) — ~р„(1)й(1)=у(1) с непрерывными коэффициентами, которое имеет решение й ( ) Е С' (гъ, К") в силу теоремы существования для линейных систем (п. 2.5.4). Таким образом, выполнены все условия теоремы п, 3.2.1. Для определенности будем считать, что (1) — задача на минимум. Согласно принципу Лагранжа, если $ = = (х(.), й( ), 1„(,) — локальная минималь (1), то найдутся множители Лагранжа Х„ХЕК"' и элемент у'Е 304 Е)"=(С(сЛ, К"))' такие, что для функции Лагранжа .У($„у", Л, Л,)=.У(х( ), и( ), 1„(с; у', Л, Л,) = с,, т т = ) [ Х,ЛА (1 х и)) с(1 + ~~'„, Лсфс (1м х (1.), 1„х (1,)) + с, ~=о ~=о + у' о Ф (5) выполнены условия согласования знаков, дополняющей нежесткости и стационарности .Уе=ОФФ.У,е)=0, У„со=О, .Ус =О, й=О, 1.- Три соотношения, из которых складывается правая часть, мы называем далее стационарностью по х( ), и( ) и по 1„соответственно.
Однако мы замечаем, что функция (5) не тождественна функции Лагранжа (4) п. 4.1.1. Воспользовавшись теоремой Рисса об общем виде непрерывного линейного функционала на пространстве С(сс, К") (и. 2.1.9), мы можем утверждать лишь, что <у', т1( )>=~с( (1)Ч(1). Ь где т(1) =(т,(1), ..., т„(1)) — вектор-строчка из канонических функций ограниченной вариации. Подставляя это в (5) и учитывая обозначение (6) из и. 4.1.1, получаем т л-1(Есс;с *ос, июс) + с, с=о +) Й (1) (х(() — ср(К, х(1), и(Е)))+ Ь +1((„х((о), („х(1с)). (6) Сравнивая эту формулу с (4) — (6) из п. 4.1.1, мы видим, что функция Лагранжа .У получается из .У, если функция т( ) абсолютно непрерывна, а ее производная Равна нУлю вне [с„1с) и совпадает с Р ( ) в этом отРезке.