Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 52
Текст из файла (страница 52)
321 (9) и (12) — как условия трансверсальности р (1,) +1, = О, — р (1,) + 1„, = 0 и (9а) — Й(Е,)+?и=О, Й(1»)+(и=О. (12а) Соответствующие преобразования проделываются так же, как в и. 4.1.1, и нет нужды их повторять. В точках разрыва управления в уравнении (8а) надо брать правую производную р,'( ) (левая тоже существует).
Непрерывность р( ) и Й( ) в точках разрыва управления (т.е. в точках излома х( )) носит название условия Вебера«трасса — Зрд»«ана. Можно проделать и здесь анализ «на полноту» набора необходимых условий, даваемых сформулированной теоремой. В сущности он не будет отличаться от того, что было сделано для задачи Лагранжа. Вместо того, чтобы определять и( ) как функцию х( ) и р( ) из условия В, =О, теперь это нужно сделать, исходя из соотношения (10). 4.2.3. Игольчатые вариации, Как и в простейшей ситуации, разобранной нами в п. 1.5.4, основной прием в 322 надлежит рассмотреть три задачи: (а) .У(х( ), и( ), У„1,; р( ), Х, Х,) (п1, (р) 2'(х(-), и( ), 1„1,; р( ), Х, Х») — 1п1, (у) .9 (х( ), и( ), 1„1,; р( ), Х, )»») 1п1.
Задачи (а) и (у) здесь те же самые, что и в п. 4.1.1. Поэтому' и соответствующие условия стационарности по х( ) и по 1» должны выглядеть здесь так же, как и в задаче Лагранжа и это действительно так. Что же касается задачи (р), та это элементарная задача оптимального управления из и. 3.1.4, и принцип минимума (10) .вполне соответствует условию (1) этого пункта.
Таким образом, приведенная выше формулировка теоремы действительно согласуется с общим принципом Лагранжа. Обычно условия стационарности (8), (9) и (12) записываются в другой форме: (8) — как уравнение Эйлера— Лагранжа (называемое также сопряженным уравнением) с(р ЯФ= — р(1)'р, Я+ Х, "4 ° (1)' ) и((), 1((т, т+а)„(1) '1 о, г Е 1т, т + а). Соответственно игольчатая вариация х(1; а, т, о) фазо- вой траектории х(1) определяется как решение задачи Коши х=ср(1, х, и(1; а, т, о)), х (т) = х (т). (2) С точностью до несущественного различия (вместо 1т, т+а) был взят полуинтервал (т — Х, т)) мы рассматривали подобную вариацию в и. 1.5.4.
Было обнаружено, что функция х(1; а, т, о) дифференцируема по а и при ()т ее производная у(1)=х ((; О, т, о) является решением уравнения в вариациях У=чъ(()у (3) 11е 323 доказательстве принципа максимума, которое будет из. ложено далее, состоит в замене рассматриваемой нами задачи~оптимального управления некоторой конечномерной экстремальной задачей или, точнее говоря, целым набором таких задач. Для этого мы включим оптимальный процесс (х( ), й ( ), („ (,) в некоторое специальное семейство управляемых процессов †«пакете игольчатых вариаций †рассмотрим ограничение задачи (1) †(3) п.
4.2.2 на это семейство. Нужное нам Семейство процессов зависит от. следующих параметров: начальные данные ((„х,), конечный момент времени 1,; набор а=(а„..., ай), где все а, ~ 11 достаточно малы; для краткости обозначим а=~~~~~а;; набор т=(т,, ..., тл), где 1, <т;<т,<... «=тх<1„ причем среди т; содержатся все точки разрыва оптимального управления й( ); набор з =--(о„..., ох), где о, ~П. В дальнейшем т и о фиксированы, а (Г„(„х„а) меняются, и по ним мы будем дифференцировать различные функции. Пусть сначала У = 1. Элементарная игольчатая вариация управления й (1), или просто чэлементарная иголкаэ, отвечающая паре (т, о), определяется равенствами с начальным условием и (т) =- !р (т, х (т) о) †!р(т (т) и (т)) (4) Следуя п.
'2.5.4, мы будем здесь и в остальной части параграфа обозначать через Й(1, т) фундаментальную матрицу решений уравнения (3). Кроме того, для сокращения записи введем специальное обозначение для правой части. равенства (4): Л!р(т, о) = ср (т, х (т), о) †!р (т, х(т), и (т)). (5) В этих обозначениях у (1) = х„ (1; О, т, о) = 12 (1, т) Л!р(т, о). (6) В п. !.5.4 мы смогли обойтись рассмотрением одной «иголки». Теперь нам понадобится целый их «накет», поскольку задача стала сложнее, и нам нужно иметь в распоряжении больше свободных параметров. В пакете объединяется любое конечное число иголок с параметрами (то о„с«!), ! = 1...
У. При этом существенна, что некоторые из этих иголок могут различаться только значениями управления о; при одних и тех же т,. Поэтому задавать иголки формулами, вида (1) теперь нельзя: при одинаковых т, разные иголки будут накладываться друг на друга. Чтобы избежать этого, мы сдвинем полу- интервал действия !'-й иголки на величину !а=! ч~~ а» /=! так что теперь это будет Ь!=1т!+и«, т,+!а+а!1 (очевидно, что если а > О и достаточно малы, то Л, не перекрываются). Согласна сделанным в п.
4.2.1 предположениям оптимальное управление й( ) непрерывно слева в точке 1, и справа — в точке !,. Продолжим й( ) вне отрезка 1«„1!1 с сохранением непрерывности (например, положив й(1) = =й(3,) при 1< 1» и и(1)— = й(1,) при 1> 1,) и впредь не будем этого оговаривать, Пусть все с«! > О. Определим игольчатую вариацию управления й( ) формулами и(1;а,т, о)= 324 и Я, 16(1,— 6, 1,+6)', 0 Ьо !=! оо 1 ~ Л!-— — т;+! ~~'., а!, т;+! ~~'~ ау+а! у=! /=! (7) Соответствующее семейство фазовых траекторий х(г1 Г„х„а, т, о) определим как решение задачи Коши х=~р(Г, х, и(/; сь, т, о)), х((,)=к,.
(8) Для краткости далее х,=х(Г,). Лемма о пакете иголок. 1) При достаточно малых а, ) О, 6 > О решение задачи Коши (8) такое, что ) г,— /,) < з„(х,— х,( < е„О <ау < е„(9) определено для /,— 6</ -.(1+6. 2) Если Г,— Г„х,— х, и сст(О, то х(Г; Г„х„а, т, о) — х(Г) равномерно на отрезке [/„г1). 3) Отображение (/о Гь, х„а) ь х(Г,; /„х„сь, с1 о) может быть продолжено до отображения, определенного и непрерывно дифференцируемого в некоторой окрестности точки (Г„ /ь, х„О), и пРи этом дх/д/1=хи(/б Гь* хь О т, о)= = ср(г„х (/1), и (г1)) = ~р (Г,), (10) дх/д/, = хп ( Г,; Г„х„О, т, о)— = — а(г„г,) р(г„~„~(г,)) = — и(г„г,) р(/,), дх/дх,=х„(Г,; /м х„О, т, о)=й(/„Гь), (12) дх/дсьь= хаь (Гх, 'Гь х О, т, о) = = ьг (Г„ /,) Л Р (т, ОЬ), (13) где ь1 (Г, т) — фундаментальная матрица решений системы уравнений в вариациях (3) и /)ир(т, о) определено формулой (5).
Доказательство этой леммы будет приведено в п. 4.2.6. Ясно, что она обеспечивает иам дифференцируемость терминальных членов, входящих в, условия задачи и. 4.2.2. Что же касается интегральных членов, то, как и в п. 1.5.4, мы посвятим им отдельную лемму. Лемма об интегральных функционалах, Пусть функции /;(/, х, и) удовлетворяют тем же условиям, что и в формулировке теоремы п. 4.2.2.
Если и(/, я, т, о) определено при а, ) О формулами (7), а х(Г; /„х„сь, г, о) — решение задачи Коши (8), 326 то функции Р;(1„ 1„ .х„ а) = = ~ )е (1, х (1; 1„х„а, т, о), и (1; сс, т, о)) й(, 1=0,1, ..., т, могут-быть продолжены до непрерывно дифференцируемых в некоторой окрестности точки (то ~„, х„О) функций и при етом дР,!д1,=Ри,(1„~„, х„О) =~,((о х(1,), й(1,))=~;(1,), (14) д~'ьФ(ь = Ри, ((г гч 'сч О) = = — ~г(~., хы й((ь))+Ры((ь) ЮИ., х„й(гь)) = 6Ю+Ры((ю)Ф((ю) (15) дР„'дхю — — Ры, (1~ (о ~со 4)) = — Ры (1,), (15) дР,Уда„= с ш„( й,; г„х„О) = Л~, (т„, оь)— — рос (тд) Ь%(т, оь), (!7) где ры(г) — решение задачи' Коши йрас(т)Мт= — ры(т) <р„(т, х (т), и (т))+ +Ры(т, х(т), и(т))„(18) ры(Ф;) =О для неоднородной линейной системы, сопряженной к системе уравнений в вариациях (3), а Ьгг(т, о) определяется формулой, аналогичной (5).
Доказательство этой леммы приведено в п. 4.2.7. 4.2.4. Редукция к конечномериой задаче. График оптимальной фазовой траектории х(1) лежит в области б и в силу второго утверждения леммы п. 4.2.3. (о пакете иголок) график решения х(1; г„х„а, т, о) задачи Каши (8) того же пункта также лежит в этой области при 1Е'11„1,1, если выполнены неравенства (9) п. 4.2.3 с достаточно малым а,. Значит, четверка (х(; г„хы а, с, о), и(; а, т, о), 1„1,) является управляемым процессом для задачи (1) — (3) и.
4.2.2. 326 Положим ! ~ ((о ~о Хоо а) — ф о(!о Хо ~» Х( ло оо Хоо ~~ то О))' ( ) Ег((л~ "оу х„а)=~ ~,.((, х((; г„хо а то о)~ и(! а т о))о(Г~ ~о (=0,1, ...,и; (2) В силу третьего утверждения леммы о пакете иголок и по теореме о супсрпозицип, функции (1) непрерывно дифференцируемы в некоторой окрестности точки (1„(„ х„О)'. Для функций (2) то же самоа следует из леммы об интегральных функционалах п.
4.2.3, Теперь мы можем рассмотреть конечномерную экстремальную задачу †сужен задачи (1) †(3) п. 4.2.2 на построенное семейство управляемых процессов. ~о((и (о ло а) = х'о(!о (о хо а)+Ч~((о оо, хо, а) !П1, (3) 1, (г„г„х„а) = Р, (1„(„х„а)+Ч', ((„1„х„а) ~~ О, (4) ао.-ьО, й =1, 2, ..., йг. (5) Для этой задачи точка (3„ К„ х„ 0) является локальным решением. Действительно, если выполнены ограничения (4), то четверка (х(; о„х„а, т, о), и(.; а, т, о), 1„г,) является допустимым управляемым процессом задачи (!) — (3) п, 4.2.2. Если а, в неравенствах (9) п.
4.2.3 достаточно мало, то в силу второго утверждения леммы о пакете. иголок выполняются неравенства (4) п. 4.2.1. Следовательно, верно неравенство (5) и. 4.2.1, откуда 7,(1„(„х„а) = =Го(х(; („х„а, т, о), и(, а, т, о), 1„(,)~ =«Уо(х( ), и ( ) Гм (о) =-Уо((„Го, хо, О), а это и означает, что ((,, („х„О) — локальное решение задачи (3) — (5). Применяя к задаче (3) — (5) правило множителей Лагранжа из 9 3.2, получаем следующее утверждение. Лемма (правило множителей Лагранжа для вспомогательной конечномерной за- 327 чающие всем возможным парам (т, о), тогда как наш «пакет» содержит любое, но конечное нх число.