В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 39
Текст из файла (страница 39)
Противоречие доказывает теорему. ° Теорема Дубовицкого — Милютина о субдифференциале максимума. Пусть 1„ выпуклые функции на локально выпуклом топологическом пространстве Х, непрерывные в точке х,; 1(х) = = щах (1! (х), ..., 1„(х)); 1 = («„..., !',) — набор индексов такой, что / =1(х«) при «Е1, ' ( <1(х«) при «(1. Тогда д~(х,)=спич (д~!, (х,) 0 . О д~„(х«)) = ! ! 1»!*'=х! !, *!«д! !»,), »»О, кх,-!). ь=! «~ - ~ ь= 234 Доказательство.
А) Если 1Е! и х*Едр;(х,), то ) (х) — 7 (х,) = ) (х) — 1; (х,) ) ); (х) — ~, (х,) ) > <х', х — х, > ~ х' Е д7 (х,) =о д) (х,) ~ 0 дР; (х,) =Ф мг =о д~ (х,) ~ сопч 1 В д~, (х,)), 1Р61 причем последняя импликация является следствием выпуклости д) (х,) (предложение 1). Обратное включение будет доказано индукцией по числу функций. При и=1 утверждение очевидно.
В дальнейшем будем предполагать, что для (и — 1) функции оно верно. Б) Лемма. Если функция 7(х) выпукла и неравенство ф(х) =7(х) — ~(х,) — <х', х — х,>. О (7) выполняется в некотором открытом выпуклом множестве У, причем ф (х) =- 0 для некоторого х Е У, то х" Е д1(х,). Доказательство. Покажем, что неравенство (7) имеет место при всех ' х; утверждение леммы следует отсюда по определению субдифференциала. Пусть х произвольно. Функция ф выпукла вместе с р, и если ф(х) < О, то для любого аЕ(0, 1) ф ((1 — а) х+ ах) ((1 — а) ф (х) + аф (х) = аф (х) < О. При достаточно малом а точка (1 — а) х+ахЕУ, и мы пришли к противоречию.
Следовательно, ф(х):и 0 при всех х. ° В) Пусть х'Ед~(х,). Покажем, что тогда либо х, является решением следующей задачи выпуклого программирования: ф,(х) = ~ь (х) — ~(х,) — <х', х — х„> — 1п1, (8) ф,(х)=7;(х) — р(х,) — <х*, х — х,>~(0, 1~1;, (9) либо утверждение теоремы верно. Действительно, если первое не имеет места, то для некоторого х ф0(х) < 0 фг (хд)~ ф' (х)(~0 4 ~4~ (10) По непрерывности неравенство ф, (х) < 0 сохраняется в некоторой выпуклой окрестности У3х, т. е. ~и(х) — 7(х,) « х', х — х,>, хЕУ.
(11) 235 Теперь вспомним, что х*Е дг(х,), а следовательно, должно выполняться-неравенство шах(Ц,(х), ..., Г'„(х)) — ~(х,)~<х', х — х,>. Сопоставив его с неравенством (11), заключаем, что при х~ У имеет место неравенство ф(х)=шах(1;(х) ! ЕФ(,» — ((х,) — <х', х — х,>~~0. (12) В то же время, согласно (10), ф (х) так (1; (х) ! (чь 1,) — ((х,) — <х', х — х,> ~ О, так что ф(х)=0 и по леммс х'ЕйГ(х,), где Дх) = гпах (Ц, (х) ! 1Ф Е,). Поскольку ( образовано (и — 1) функцией, то в силу индукционной гипотезы х'~сопч( 11 д(,„(х,)(с=саит) (1 д~с„(х,)~, 1~аз ~ / 1й.! Г) Зная, что х,— решение задачи (8) — (9), мы можем воспользоваться теоремой Куна — Таккера (п.
1.3.3); сле- дует обратить внимание на замечание, сделанное после доказательства этой теоремы: хотя в силу предложения 3 п. 2.6.2 наши функции непрерывны на 1п1 дою, вне него они могут обращаться в + оо. По теореме Куна †Танке существуют не равные нулю одновременно множитееги Лагранжа 3,„А;)О, 1~1„ для которых х,— точка минимума функции Лагранжа .Я'(х; Х)=Х,~р,(х)+ ~ Х;~р,(х).
1~ьь Кроме того, должны выполняться условия дополняющей нежесткости, согласно которым Х,=О, если ~р,(х,).= =1„(х,) — ~(х,)~0, т. е. при 1(1. Перенумеровав Х, в Ц, и ~р, в В„, имеем 2'(х, Л) = ~Хор,(х), а так как 16/ множители Лагранжа определены с точностью до поло- жительного множителя, можно считать, что ~Х, 1. 161 Теперь имеем Х (х, Л) з Я (х, Х) еа Х Ар (х) ) О еэ ебг ее ХЛР,.(х) — (~Ъ,.~У(х,) — ('~),) <х, х — х,>.-=Оеэ 1ег ~БРЕУ / ~СИ[ еьх" Е д ~ ~~'.',ХД( )) (х ). Применяя теорему Моро — Рокафеллара и учитывая, чтоиз определения субдифференциала вытекает очевидное равенство АРМС.>=~И.~, справедливое при Х> О, мы убеждаемся в том; что х'= ~Л,х,', х,*бд~,(хе)э ЕЕ1 Х О, ~ч.",Х, 1Е1 ГЛАВА 1П ПРИНЦИП ЛАГРАНЖА"ДЛЯ ГЛАДКИХ ЗАДАЧ С ОГРАНИЧЕНИЯМИ Основная цель этой главы †обоснован принципа Лагранжа для гладких задач с ограничениями типа равенств и неравенств, а также вывод достаточных условий экстремума для таких задач.
Общие результаты этой главы применяются затем в гл. 4 к задачам классического вариационного исчисления и оптимального управления. Поскольку на элементарном уровне часть материала излагалась уже в гл. 1, читателю рекомендуется параллельно просматривать соответствующие места в 33 1.3 — ! .4.
5 3.!. Злементарные задачи 3.1.1. Злементарные задачи без ограничений. Пусть Х вЂ” топологическое пространство, У вЂ” окрестность в Х, 1: У вЂ” й. Задача 7 (х) — ех1г (3) называется элементарной задачей без ограничений (экстремальной †зде и далее подразумевается).,В случае, если Х вЂ линейн нормированное пространство и ! обладает гладкостью в каком-либо смысле, то задачу (3) называют элементарной гладкой задачей; если Х вЂ” линейное топологическое пространство и ! †выпукл функция, то задачу (1) на минимум называют элементарнойеыпуклой задача1. Определение локального экстремума для задачи (3) см.
в п. 1.2.1. Если х доставляет локальный минимум (максимум, экстремум), в задаче (3), мы пишем кратко хЕ 1осш!пй(хЕ!осшахй, хЕ!осех1гй), Определения раз- 238 личных терминов, связанных с понятием гладкости см. в ~ 2.2. Начнем с простейшего — однпмерного случая, когда Х=й. Лемма. Пусть дуункция 1: П- 11 определена на некотором интервале П = К, содержаи(ем точку х.
а) Если ! имеет в точке х производные справа и слева и хЕ!оспппй (!осшахй), то )'(х+0)=вО, ~'(х — 0)~<0 Д'(х+0)<0, 7'(х — 0))0). (1) Если же в (1) вьтолнены строгие неравенства, то ха ~ !осш!п й (!остах й). Пусть далее функция !' дифференцируема й раз в точке х. б) Если хч!осш!пй(!осшахх)„то либо 1о1(х)=0, 1«-1<й, либо сушвствует такое з, 1<в<[йд ипо у'(х)= ° .. =1'" '(х) =О, 1 "т(х) > 0 (1'"'(х)<0). (2) в) Если сршествУет такое з, 1<в<[Й12$ что выполнены соотношения (2), то хЕ 1осш!из (1осшах ь). Утверждение б) при й = 1 (х к!осех!г й~ [' (х) = О) известно в анализе как теорема Ферма. Эту теорему мы доказали в п.
1.4.1. Доказательство. Утверждения а) сразу следу из определений односторонних производных н локального экстремума. Утверждение б) при й = 1 (теорема Ферма) вытекает из а), если учесть, что существование производной влечет за собой равенства 1'(х) =)' (х-1-0) = =1'(х — 0). Пусть далее й> 1 и для определенности речь идет о минимуме. По формуле Тейлора [(х+й) = ~,,11""''!!!!""1 1й +о Ю.
~=о Пусть ['(х) = ... = ['" " (х) = О, 1 < т ( й, )~">(х) чь О, Возможно одно из двух: т — нечетно и т — четно. В первом случае пусть ~р ($) =1(х+ ~/ $), $ б 11. Из (3) следует тогда, что фЕЕа(0) и гр'(0)=1'"'(х)/т! ФО, а по теореме Ферма должно бытыр' (0) = О. Противоречие показывает, что т должно быть четным. Но тогда, полагая >р ©=! (х+ ~/ $), $ ~ ~О, получаем нз (1) ф' (+О) = = 7'"'> (х)/т1 > О, доказывающее утверждение б). Утверждение в) сразу вытекает из формулы Тейлора 1(х+Ь) = =)(х)+~м»(х)Ь'l(2з)1+о(йм), нз которой видно, что если ~>">(х)>О, то хб1ос>п(пй, если же ~н'>(х)(0, то х Е! остах й. ° Следуиядие утверждения явлиотся почти непосредственными следствиями определений. Теорема 1 (необходимое условие экстремума перв а г о п о р я д к а). Прстпь в (з) х — нормированное линейное пространство и функция Г имеет в пючке хб У производную по направлению й.
Если х Е !оспин й (х ~ !осгпах а), то . 1'(х; !>) =в О (1'(х; )г) > О). (4) Следствие 1. пусть 7" имеет первую вариацию (первую вариацию по Лагранжу) в точке х. Если х б. !оспин й (хЕ1осп>ахй), то Ь+~(х, И),вО, ч>йб Х (6+7 (х, Ь) ~ О, Ч)> р Х) (б) (б) (х, !>) = О, Ч>й Е Х). Следствие 2. Пусть 1 имеет производную в смысле Фре>ие (Гата) в точке х. Тогда, если х~ 1осех1гз, пю >>' (х) 0 (~г (х) = 0).
(6) Утверждение следствия 2 также называют теоремой ферма. Точки х, в которых выг>олнено равенства (6), называют стационарными точками задачи ц). Теорема 2 (необходимое условие экстре. мума второго порядка). Пусть в (з) Х вЂ” нормированное линейное пространство и ) имеет вторую вариацию по Лагранжу в точке хЕП. Тогда, если ха!оси>1из ~х~ !остах й), то выполнены следующие соотношения: 6Дх, й) = О, >>>й Е Х, (7) 6'7(х, й) вО, Ч>!>чХ (бьг(х, й)ч. О, ч>!>ЕХ). (8) Дои аз а те ласта о. Равенство (7) содержится в следствии 1, Неравенства (8) немедленно вытекают из 340 определения второй вариации по Лагранжу и утверждения б) леммы, й11 Следствие 3, Пусть 1 имеет вторую производную в смысле Фреше в точке х.
Тогда, если хЕ!осш(пб (хЯ Е 1осшах э), то выполнены такие соотношения: 1'(х) =О, (9) ~ (х) ) 0 (7 (х) 0). (10) (Эти неравенства означают, что квадратичная форма У(« 1"(х)[Ь, Ь1 иеотрицательна (неположительна).) Д о к а з а т е л ь с т в о, Воспользовавшись формулой Тейлора (см. п. 2.2.5), имеем «р(а) ~ (х+с«Ь) 1 (х)+«х1' (х) [Ь1 + чг 1"Тх) [Ь, Ь[+о(сР), откуда б1 (х, Ь) = «р' (0) =1' (х) [Ь1, б'~(х, Ь)=«р" (0)=~" (х) [Ь, Ц, н остается сослаться на (7) и (8). 53 Следствие 2 утверждает, что локальные экстремумы являются стационарными точками. Мы упоминалн уже в п.
1.4.1, что обратное неверно. Чтобы получить достаточные условия, приходится привлекать к рассмотрению производные более высоких порядков, как это мы уже делали в лемме. Теорема 3 (достаточное условие экстремума второго порядка). Пусть в (б) Х вЂ” нормированное пространство и 1 имеет вторую производную в смысле Фреше.
Тогда, если выполнены соотнои«ения )' (х), О, (11) 1" (х) [Ь„Ь1)а(Ь1«, ч«Ь Е Х(1" (х) [Ь, Ь)а=а(Ь1«, «««Ь ЕХ) (12) для некоторого сс > О, ою хЕ!осш(пб (хЕ1осшахб). Доказательство. Если выполнено первое нз неравенств (12), то, снова обратившись к формуле Тейлора, имеем 1(х+Ь)=)(х)+Г(хт+-( 00 [Ь, Ц+06ЬИ) ) «(х) + 2 «Ь««+о««Ь«) > «(х) 241 если йчь0 и 1й) достаточно мала. Следовательно, х Е 1осппп й. Случай максимума рассматривается аналогично.
° Условие (12) называют условием строгой положигпельпоспги (отрицательности) второго дифференциала ~. 3 а м е ч а н и я. 1. В конечномерном случае, когда Х=К", утверждения теорем 1 — 3 хорошо известны из курса математического анализа (см. об этом также в п. 1.4.1). Теорема Ферма означает следующее: 1' (х) = 0 В» д) (х)!дх! =... = д( (х)1дх„= О. (13) Из необходимого условия второго порядка вытекает, что в конечномерной задаче на экстремум утверждение х Е 1осгп(п й влечет (помимо (13)) неотрицательную опре- !' дьГ(х) деленность матрицы ~ д д ): ~дх;дх ) ' х Е д д ~!~ ~~ ~~ч" (14) Условие положительной определенности матрицы (.' ) — 3 — ) гарантирует, как нетрудно убедиться, строгую д'1(х) ! дх, хг) положительность второго дифференциала (и, значит, является достаточным условием минимума в стационарной точке).