В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 60
Текст из файла (страница 60)
п. 1.4.1). Во втором х(.) принадлежит пространству КС'(11„1,1, К") функций с кусочно-непрерывной производной, наделенному нормой (~х( ))= зпр (х(1)), ик тки и локальный экстремум в этом случае называется сильным. У ив аж пенне 1. Проверьте, чтопространствоДСч((та, тт), 1Р) ноеынрованно, но не оанахово (т. е. не является полным). В обоих вариантах х( ) называется допустимой, если ее расширенный график ((1, х(Г), х(1)) ~ 1, <1< 1,) с$' и удовлетворяются краевые условия (2). Множества допустимых функций х( ) будем обозначать кв, Вводимые здесь и далее обозначения и терминология сохраняются на протяжении всего этого параграфа. Для краткости 370 задачу (1), (2) мы будем называть лроелтейитей задачей, опуская остальные подробности.
У и р а ж н е н и е 2. Докажите, что 1п( З (х( )) = 1п( 0 (х(.)). $аПС 1(т„и), аш Чl'ПКС 1(ан П), аш У к а и а н и е. Воспользуйтесь леммой о округлении углов (и. 1.4.3). Если х( ) доставляет сильный экстремум в задаче (1) и при этом х( ) непрерывна, то, очевидно, х( ) доставляет и слабый экстремум. Поэтому необходимые условия слабого экстремума являются (в случае непрерывности х( )) необходимыми и для сильного экстремума. Некоторые из необходимых условий мы уже знаем. В 2 1.4 элементарными средствами были выведены: у р а в н е н и е Эйлера — необходимое условие слабого экстремума и (для л=1) условие Вейерштрасса — необходимое условие сильного минимума.
Посмотрим теперь на простейшую задачу с общих позиций. С одной стороны, (1), (2) сводится к такой задаче Лагранжа: Я(х( ), и( ))= ~ (. (1, х(1), и(())й( — ех1г, (3) и х=и, х(те)=х„х(г,)=х,. Если предположить, что не только 1., но и ее про~ изводные. по х, и непрерывны в )т, то к (3) можно применить теорему Эйлера — Лагранжа 2 4.!. При этом слабая оптимальность процесса (х( ), й( )) в задаче (3) означает в точности то же самое, что слабая экстремальность х(.) в задаче (1), (2). Если х ( ) доставляет слабый экстремум в задаче (1), (2), то по теореме Эйлера — Лагранжй существуют такИе )е и фУнкциЯ Р( ) ЕСт(1(„(тД, Кна), что рЯ=)е1х(1, х((), х(1)), р(т)=Х,(ь(1, х((), х(1)).
Если !се=О, то все множители Лагранжа оказываются нулями; поэтому можно положить ) е = 1. Исключая р ( ), получаем систему уравнений Эйлера †„, ~' (() = (- (1) (4) (как всегда, здесь,т'.„(1)= т'.х (1, х(1), х(1)) и т. д.). 13е 371 С другой стороны, задачу (3) (предполагая для опре. деленности, что это задача на минимум; в задаче на максимум следует заменить Ь на — Е) можно рассматривать как задачу оптимального управления с П = и". Если предположить, что 1.
и (.„непрерывны по совокупности переменных, то можно применить к (1), (2) принцип максимума из $ 4.2. Прн этом оптимальность про. цесса (х( ), й( )) означает, что х ( ) Е КС1 (11„1Д, 11") доставляет в задаче (1), (2) сильный минимум. Из принципа максимума следует, что существуют ь, - О и кусочио-дифференцируемая функции р ( ): ~1,, 111 — К"' такие, что р(1) = 1,А„(1), кнн ф,Е(Ф, х(1), и) — р(1) и) = ие ал =Х.,Е(1, х(1), хЯ) — рЯх(С). (6) Равенство Х, = О здесь невозможно, так как иэ (5) ).,= =О~ р (1) = — сопз1, причем р (1) эь О (иначе все множители Лагранжа равны нулю).
Но если Ъ,,= О и р~О, то (6) ие может выполняться (иетрнвиальная линейная функция не имеет минимума на К'). Таким образом, Х,чэО н можно считать, что Х,=1. Условие (6) можно переписать в субдифференциальной форме р(1)Е(д;Е.)(1, х(1), х(1)). Если Е днфференцнруема также и по х, то из (6) следует равенство р(1) =Х,(1), и мы, с одной стороны, снова приходим к уравнению Эйлера (4), а с другой — иэ (6) получаем необходимое условие Вейерштрасси 1.(1, х(1), и) — Е(1, х(1), х(1))— — 1.; (1. х(1), х(1))(и — х(1))) О, (8) ~и Е 11", ч'1 Е Рою 1Д Введем в рассмотрение (ср.
п, !.4.4) <У вЂ” функцию Вейерштрасса (латинское ехсеззпз — излишек) 8(1, х, $, и) =-Е(1, х, и) — Е(1, х, 5)— — Е;(1, х, $) (и — $). (9) Тогда условие Зейерштрасса (8) можно записать в виде б'(1, х(1), х(г), и) О, УиЕК", У(Е(1„1,(, (10) Если допустить, что не только Ь и Е;, но и Ей„. непрерывна в У, то из (8) вытекает неравенство Е„„(1) ~>0 1ЕРо.
111. (11) Условие (11) называется условием Лежандра. Итак, уравнение Эйлера является необходимым усло. вием как слабого, так н сильного экстремума. Кроме того, из принципа максимума мы вывели еще два необ. ходимых условия сильного минимума — условие Вейерштрасса и условие Лежандра (в следующем пункте мы увидим, что последнее должно выполняться и для слабого минимума). 4.4.2. Условия второго порядка для слабого экстремума, Условия Лежандра и Якоби.
Лемма. Пусть функция Е непрерывна в г', а, кроме того, в У существуют и непрерывны ее производные Е„,, Еук' 1з 3 Если х( )ЕС'ф„1с(, К") удовлетворяет уравнению Эйлера, то при (й( )1с 0 справедлива следующая асиматотическая формула: Ю(х( )+й( ))=У(х( ))+1 (й(1)'Е,ЯЬ(1)+ и +2й (1) Г.„(1) И(1)+й(1) Е,; (1)й(1)) й(+ Доказательство. Как и в и. 242, окружив график х( ) компактом, целиком содержащимся в У, и воспользовавшись затем равномерной непрерывностью вторых производяых функции Ь на нем для оценки оста.
373 точного члена в формуле Тейлора, получаем разложение Е(1, х(1)+Ь(1), хЯ+ЬЯ) = =Е(1) -; й„(1) Ь(1)+Й„(1) Ь'(1)+ + ~ (Ь'(1) ~,. (1) Ь(1)+2Ь (1) ~,„(1) Ь(1)+ +Ь'(1)Е„;ЯЬ(1))+е(Ф, Ь( ))11Ь(1)~'+)Ь(1)$'~, (2) где е(1; Ь( )) — О равномерно на й при 1Ь( )Ь вЂ” О. Интегрируя это соотношение от 1, до 1„а затем еще, как всегда, интегрируя по частям линейный член а Ь(1) и учитыва(~ уравнение Эйлера, получаем (1). ° Если х( ) доставляет слабый минимум в задаче (1), (2) п.
4.4.1, то, заменяя в (1) Ь(.) на аЬ( ) и вычисляя при сс)О предел 11ш(7(х(.)-,'-аЬ( )) — Ю(х( ))]/а', мы получаем, что квадратичный функционал а(Ь( )) = ~ (Ь'(1) Е„„(1) Ь(1)+2Ь'(1) Е„„(1) Ь(1)+ +Ь (1) Х,„(1)Ь(1)) (1>О, (З) тЬ( )ЕС'Е„Я 1("), Ь(1,)=Ь(1,)=О. Это означает, что функция Ь( ) =О доставляет слабый минимум во вторичной экстремальной задаче Я (Ь (')) 1п1 Ь (1а) Ь (1~) О (4) По лемме о скруглении углов (п. 1.4,3) нижние грани функционала Я в множествах допустимых функций из пространств С" ((Ф„1Д, 11") и КС'(~1„Я, %1") совпадают.
Позтрму Ь( )=О доставляет также и сильный минимум в задаче (4). (Заметим, что ввиду однородности Я локальные минимумы оказываются и глобальными и различие между слабым и сильным минимумами сводится к изменению запаса допустимых функций.) По доказанному в п. 4,4.1 для задачи (4) должно выполняться условие Лежандра, которое, очевидно, имеет тот же самый вид ~;,(1)~>О.
в'(ЕЕ(е 1~1 (5) что и для (1), (2). Таким образом, условие Лежандра оказалось необходимый не только для сильного минимума, как в и. 4.4.1, но и для слабого. 374 Уравнение Эйлера для вторичной задачй (4) „— ', ~Е;„(!) й(1)+й,„(!) й Щ=й.„.(!) й(!)+Х„„(1) й(1), (5) называется уравнением Якоби исходной задачи (1), (2) и.
4,4.1. Определение. Точка т называется сопряженной к точке 1, (относительно функционала ((), если уравнение Якоби (6) имеет решение й( ), для которого й(!э)= = й (т) = О, но ') Е„; (т) й (т) ~ О. (7) т) Обычно в учебниках по вариационному исчислению сопряженные точки определяют в рредположении, что выполняется усиленное условие Лежандра Е.. (О > О.
При этом предположении эа Е . (т)л(т) =О~в(т)=О, и так как й(т) =О, то по теореме единственности Ь( ) — О. Поэтому условие (7) эквивалентно нетривиальности Ь ( ) и обычно заменяется этим предположением. 375 Теорема 1 (необходимые условия сла- бого экстремума в простейшей задаче). Лустэ функция Е удовлетворяет условиям леммы. Если х( ) доставляет слабый минимум в задаче (1), (2) п.
4.4.1, то 1) х( ) удовлетворяет уравнению Эйлера ((4) и. 4.4.1); 2) выполнено условие Лежандра (5); 3) выполнено условие Якоби: в интервале (1„! ) нет точек, сопряженных с 1,; 4) выполняется неравенство (3). В случае, когда х(.) досптавляет слабый максимум, в (3) и (5) следует заменить знак ) на <. Доказательство. Утверждения 1), 2) и 4) мы уже доказали (!) — в предыдущем пункте). Поэтому нуж- но доказать лишь 3).
Предположим противное, м пусть точка т~(1„1,) — сопряженная к г„а й( ) — соответ- ствующее решение уравнения Якоби: й(!а) = й(т) =О и имеет место (7). Положим й!О )'й(!), 1,<Г<т, ( О, т<1<(ы Тогда а(Ь( )) = т = ~ (Й(1),Е„„(1)Й(1)+ 2Ь(1) Е„(1)Ь(1)+ а +Ь Я (,„„ (1) Ь (1)) а = "")ЙЯ (Е„„(1)ЙЯ+Е„„ЯЬ(1))а+ +) Ь(1)'[Е„,(1)Ь(1)+Е„, ЯЙ(1)")гИ ь (здесь использовано, что Ь (1)'Е,„(1) Ь (1) =Й(1)' Е;, (1) Ь (1)).