Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 48
Текст из файла (страница 48)
Второй способ основан на том, что вследствие неравенств Х! >О, 7!(х+Й) ~О сумма ~ Х!1!(х+Ь)(0 ! ! и, следовательно, [,(х+й)~).У(х+й, у', Х, 1) = =.У(х, у', Л, 1)+.У„(х, у', Х, 1)[Ь[-(- + — с„„(х, у', ~, 1)[й, й[+е,(й)= =!'ь(х)< В(й, Ь)+с!(й) (7) где через В (Ь, Ь) обозначена квадратичная форма —.К„„(х, у', Л, 1)(й, Ь(, а остаточный член г, (Ь)= о ДЬ!!'). Б) Обозначим через К конус, состоящий из тех Ь, для которых <Д(х), Ь> ~~О, 1) 1, Р'(х)Ь=О. В силу леммы Хоффмана произвольное Ь можно раз- ложить в сумму Ь,+Ь„где Ь,ЕК, а й, допускает оценку: !!Ь,!!(С, Х <Д(х), Ь>++/!Р'(х)й!! . (8) Воспользовавшись далее замечанием, сделанным в п.
3.3.4 после леммы Хоффмана, и формулой (5') п. 3.3.4 й, можно также разложить в сумму Ь,=й;+Ь;, где Ь; ~2, а Ь допускает оценку т ~л ~х~~~с,(д!а(»), в)!)-с,( — и<л~ь, ч>!. р~ Мы использовали то, что Р'(х)Ь,=О (ибо й,ЕК) и то, что ! <1;. (х), Ь,> ! = ! <Д (х), Ь; + Ь,"> ! = ! <Г) (х), Ь,> ! = = — <);. (х), Ь",> (ибо <1";(х), Ь;>=О, а <1((х), Ь,> ~0). В) Из (4) получаем = Г (х + Ь) — ~ ( ) = Р (х) Ь+ г, (Ь), О) );(х+Ь) = <Я(х), Ь>+р,(й), 1= 1, ..., т, (10) где !!г, (Ь)(! и !р;(Ь) ! — величины порядка О(!!Ь!!').
Исполь- ° зуя эти оценки в (8),. находим, что если х+й — допу- стимый элемент, то ~й,(!.=:С, 2.,'!р,.(Ь)!+!/г,(й)/~ . (11) Фиксировав е, ~(0, 11, о величине которого мы по- заботимся далее, выберем бб(0, !(В!(-') так, чтобы из неравенства (!Ь!!(6 следовали бы неравенства ~В 1 Х(р;(Ь)(+ ХК(й)(!а е (Ь!! (! (Ь)!Ж ~(й!!' (12) Далее выберем число А ) 0 так, чтобы АС, (ш(п Л;) — С, шах (Л; (! Д (х) !! ) — 1 э О, (13) и, наконец, выберем величину е, так, чтобы для е= = (С,+А) з, выполнялись бы неравенства е < 1, а(1 — з)' — 2((В((е(1+а) — 1В((з7 — и(2) О, (14) Г) Завершение доказательства. Пусть х+ -(-Ь вЂ” допустимый элемент.
Представим й, как и в Б), в виде суммы Ь=й;+Й;+й,. Возможны два случая: а) 1ЙЦ) Аа,((й(( и б) ((й,"(<Аз,,'(Ь(( В случае а) имеем из (9) при ((й(( =б Аз,((й((<((й,"((<С, — Х (Д(х), Й > . (15) Тогда вследствие (6), (15), (11), (12) и (13) получаем 1,(х+Й) = ((М, (((Ь ((З) = ):, (х) — ~ (Х,~; (~), Ь;+ Ь,> + г, (Й) ~) )~,(х)+АС,' (ш(пХ,) а, ~/й/(— — шах (Е, (((;-(х) (() С,е, ((Ь(( — е, ((й((= ~, (х) + ( ((и -(- е,(/(й~', (АС (ш(п Х,') — С, шах (Л,(()'; (х)(() — 1) ) ), (х).
/ ь Пусть теперь имеет место случай б), Тогда ((й",) = <Ае,((й((, значит, в силу (11) и (12), если обозначить й,' = Ь; + й„то Щ = ) й", + й, ~ ( (А (- С,) а,!(Ь (~' = е (й ((. Тогда Ь=й;-(-й;, где (1 — е)((Ь1=((й;~(~<(1+е)((й((. Теперь применим эти неравенства, а также (7), (2), (12) и-получаем (7) 1,(х+Ь))~о(х)+В(й й)+гв(й)= = 1, (х)+В Я+Ь„'Ь;+й)+г,(й) = (еь ((и =~,(х)+В(й;, Ь;)+2В(й;, й;)+В(Ь;, Й;)+г,(й) )~ >Ь(х)+(~(1 — )* — 26ВПе(1+а) — Ф(а' —,)!~Ч') Р, (х). Теорема доказана. ГЛАВА 1Ч ПРИНЦИП ЛАГРАНЖА В ЗАДАЧАХ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Предмет этой главы ясен из ее заглавия.
Особое внимание мы уделяем, с одной стороны, выявлению сходства двух разновидностей теории, подчеркивая это единымн обозначениями, а с другой †выяснен различий в классической и современной постановках задач. Сначала мы рассмотрим необходимые условия в так называемой задаче Лагранжа.
К этой задаче могут быть сведены многие остальные задачи классического вариационного исчисления. Затем будет выведен принцип максимума Понтрягина, являющийся одним из наиболее важных средств в современных задачах оптимального управления. Остальная часть главы посвящена более специальным классам задач и выводу следствий из общей теории. Менее подробно мы останавливаемся на рассмотрении достаточных условий экстремума, ограничиваясь только частными ситуациями.
й 4.1. Принцип Лагранжа для задачи Лагранжа 4.1.1. Постановка задачи и формулировка теоремы. Зафиксируем замкнутый отрезок А=(и, р1<=П и рассмотрим банахово пространство Е=С'(А, К")хС(А, К')хйхП, состоящее из элементов $=(х( ), и( ), 1„1,). 297 В этом пространстве рассмотрим задачу: 2),(х( ), и(.), 1„1,)= = ~ 1,(1, х(1), и(1))й(+ф,((м х(1,), Х„х(С,)) ех(г, (1) с, х=<р(Г, х(1), и(1)), (2) йь(х( ) и( ) 10 г1) и = $1;(Г, х(1), и(1))йр+ф((м х(1,), 8„х(1,))~~0. (3) и При этом в (1) — (3) ~;: У К, ф;: Мг — К, 1 = О, 1, ... ..., т; ср: У вЂ” К", где У и 77 — открытые множества в пространствах Кх й"х К' и 11хй"х Кх1(" соответст- венно.
Все перечисленные функции предполагаются по крайней мере непрерывными. Знак ~~ имеет тот же смысл, что и в $ 3.2. Задачу (1) — (3) мы называем задачей Лагранжа в понт- рягинской форме, Частные случаи этой задачи обсужда- лись в Я 1.4, 1.5 и в э 3.1. Функционалы того же типа, что и Яо содержащие как интегральную, так и терминальную части, были ранее названы функциона- лами Больца (см. пп. 1.4.2 и 3.1.3). Если в ограниче- нии Я;~ ~0 терминальная часть является константой, с, т. е. оно принимает вид ~ ~,(С, х, и)й(~~ам то вслед и за Эйлером мы называем такое ограничение иэоперимет- рическим.
Если, наоборот, отсутствует интегральный член, то ограничение ф;(1„х(1,), 1„х(1,))~~0 называется граничным, или краевым условием. Ограничение (2) называется дифференциальной связью. Такой вид дифференциальной связи — разрешенный отно- сительно х — является характерным признаком понтря- гинской формы задачи. Лагранж задает дифференциаль- ную связь уравнением ф(1, х, х) = О (вкратце об этом говорилось в п.
1.5.1). Наконец, в отличие от гл. 1, отрезок времени [1„1,1 в задаче (1) — (3) не предполагается фиксированным. Четверку $=(х( ), и(.), 1„1,)ЕВ будем называть унравляаиым процессом в задаче (1) — (3), если 1„1, Е 1п1 Л, (1, х(1), и(1))ЕУ для 1ЕЛ и всюду на [1„8Д удовлет- воряется дифференциальная связь, т. е. х(1) =ср(1, х(1), 296 и(1)), и допустимым управляемым процессом, если эта четверка является управляемым процессом н, кроме того, выполнены условия (3).
Четверка $=(х( ), и( ), ~;, 11) называется оптимальным в слабом, смысле процессом, или слабым экстремумом в задаче (1) — (3), если она является локальным экстремумом в пространстве Е, т. е. если найдется такое е ) О, что для любого допустимого управляемого процесса $, удовлетворяющего условию (~$ — $1 (е, выполняется одно из неравенств: Я,($)ЪЯ,($) в случае минимума и З,($) = «=З,(я) в случае максимума. Функцией Лагранжа этой задачи называется функция ц .У(х( ), и( ), 1„~,; р( ), Л, Х,)=)Еб(+1, (4) где йчбК р( )ЕС'Р К ) 1=Р1 . * и )бК ' — множители Лагранжа, ,Ь((, х, х, и)= Х ХА(1, х, и)+р(()(х — ~р(1, х, и)) (5) с=о — лагранжиан, или интегрант, и 1((о «м (м «1) Х Этфу((в* Хо (м Х1) (6) — терминант.
Далее мы в этом и следующем параграфах пользуемся, как и ранее, следующими сокращениями: Е2(() =Т.2((, х(т), х(~), и(1)), Ь„(() = Е„(1, х (1), х (т), и (Г)), А„(1)=Ь„(С, х(8), х(~), й(г)), 1» = (. Ио х Ие)* (~~ х (11))~ 5', =Я,„(х( ), и( ), 1„1„р( ), ), Х,) и т. п. Т е о р е м а Э й л е р а — Л а г р а н ж а. Пусть функции У- К, 1=0, 1, ..., т, ~р: У вЂ” К" и их частные производные по х и и непрерывны в открытом множестве У пространства КхК"хК', а функции ф~. 'йг- К, 1= =О, 1, ..., т, непрерывно дифференцируемы в открытом множестве яг пространства Й х Й"-х Йх Й", и пусть х( )~С'(б, й"), й(.)ЕС(б, 11'), 1„(,Е1п1й таковы, (Г, х(Г), и(1))ЕЪ', ГЕА (Гю.
х((ь) 11 х(11))ЕФ'. Если $ =(х( ), и( ), 1„1,) является оптимальным в слабом смысле процессом для задачи (1) — (3), то найдутся множители Лагранжа Х,)0 в случае задачи на минимум и е О в задаче на максимум, р( ) ~С'(Л, м"'), Х=(Х„..„Х„), не равные одновременно нулю и такие, что: а) выполнены условия стационарности функции Лагранжа: по х( ° ) (.2'„со — — 0): —,", Х„(г) + 1.„(г) = О, (7) 1(А) ( ) лй' (8) по и( ) (.2'„и — — 0): Е„(г) =о; (й) по гь А,=О, й=О, 1; (10) б) выполнено условие согласования знаков: Х~~О, 1=1, ..., т; (11) в) выполнены условия дополняющей нежесткости: Л;Вг($)=0, 1=1, ..., и.
(12) Как н в Я 3.1, 3.2, неравенства (11) означают, что Я, =в 0, еслн в условии (3) Яг($)з 'О, Л;(О, если в (3) Зг($) ~О н Х; может иметь любой знак, если Зг($) =О. Утверждение о существовании множителей Лагранжа, удовлетворяющих совокупности условий а) — в)„кратко называется нами принципом Лагранжа для задачи Лагранжа (1) — (3). Покажем, что утверждение теоремы находится в водном соответствии с общим принципом Лагранжа, о котором говорилось в гл.
1 н в п. 3.1.5. Действительно, 000 функция Лагранжа Я является функцией трех аргументов: х( ), и( ) и (1„1,). Таким образом, согласно общему принципу Лагранжа, надлежит рассмотреть три задачи: (а) Я(х( ), й( ), 1„1;, р( ), Х, Х,) ех(г, (р) .9" (х( ), и(.), К„1,; р( ), Х, Х,) — ех1г, (у) .2' (х (. ), й ( ), 1„1,; р ( ), ), ),) — ех( г. Задача (а) является элементарной задачей Больца, и условия стационарности (7) и (8) написаны в полном соответствии с п. 1.4.2 и теоремой и. 3.1.3.