Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 55
Текст из файла (страница 55)
Если все а» > 0 и достаточно малы, 340 то полуинтервалы Л„ входя»цие в определение (3), попарно не пересекаются и расположены между 1, и (» в порядке возрастания номеров. Пусть я, = т, +»а = т, +1 ~~.'~ а, — левый конец полуии/=1 тервала Ь„я,=т,=-1„зл.>, =т»», =1,. Докажем по индукции, что х (з,) = Х (з», т„, в»), (16) где $,=$ и $ =РоХ»,ох»,оХ»,о...оЯ,оХ,($,а), й)1;(17) в частности, $,= — РоХ,(й> с»)=Х(т»> т»> $). Поскольку при 1,=т,<1< я, дифференциальные уравнения в (7) и (1) совпадают и х(т,) =$=Х(т„т„$,), то в этом полу- интервале х(1)=Х(1, т„с,), и, переходя к пределу при Г я, И уЧИтЫВая таждЕСтВО Х(яо т„$,)=Х(я„, т„Х(т„ т„$,)), получаем (16) при Й= 1. Предположим, что (16) верно для некоторого й. Чтобы перейти по решению х( ) от я„до з»„„надо в силу (3) проделать следуюшее.
От з» до я»+а» решаем'уравнение (10) с начальны»» условием у» =х(я»), в результате чего получаем х(з»+а»)=У» (з»+а», я„, х(з»)). Далее от з»+а», т. е. от конца Л», до з»+,— начала Л»„„решаем уравнение (7) с начальным условием х, =к(з»+а») и получаем равенство х (я +,) = Х (я»+„я„+ с»», х (я„+ а»)) = =Х(я»+о з»+а», У, (з»+а», я„, х(я„)). Согласно (13) п. 2.5 5 справедливо тождество Х (г 'т> Х (т> гр х»)) Х (г> 1~> х») Воспользовавшись им и равенством (16), верным по индукционной гипотезе, получаем последовательно х(я»~»)=Х(з»~„т» „Х(т»+„т», Х(т»,я»+а», х(з»+а»))))= =Х(я»~о т»~о Х(т»»„т», Х(т„, я»+а», У,„(я +а», я, Х (я„, т„, $»))))).
(18) Теперь заметим, что если все а» > О, то т» < з„< я»+а», а так как при 1.=»т» уравнения (7) и (11) совпадают, то Х(т, з»+а», $)=Х(т», з»+а», $) и Х(з„, т„, $») = = Х(з, т, $ ). Следовательно, используя сначала опре- деления (13) и (14), а затем'(17), мы получаем Х(тхом т„, Х(тд, з +ад, Уо (з„+а„, з„, Х(зх, то, $о))))= =РоХхо 2 ($„, а)=РоХх оЯхо Х,о...оХ,Д,а) =$ +о.
Поэтому (18) совпадает с (16), в котором и заменено на й+1, и, таким образом, (16), верно при всех й) 1. Остается заметить„что при й= У+1 (16) превращается в равенство х(1,)=Х(1„1о вх )=Ь о= = Р о Х х о Ухо ... о Х, ($, 'а) = Й (в, а, т, и) (последнее согласно (12)) и, так как по определению х(~,)=Б ($, а, т, и), (15) доказано. ° Как уже было сказано, суперпозиция (12) непрерывно дифференцируема в некоторой окрестности точки (х„О). Следовательно, Б ($, а, т, о) (которая раньше была определена только при а, ) 0) допускает непрерывно дифференцируемое продолжение на эту окрестность. Согласно п. Б) отсюда вытекает, что х((о о„х„а, т, о) допускает (при фиксированных т, о)непрерывнодифферент цируемое продолжение на окрестность точки.(о„г„х„О).
Остается доказать лишь формулы (10) — (13) й. 4.2.3 для частных производных этой функции в точке ((„Ро, х„О). Г) Прежде всего заметим, что х(1 (о хо 0 т ")= — Х((о (о хо). (19) х(1 1о х(Го), О, т, о)— = Х(1, го х((о))=х(1), (20) х (1„1„х„а, т, и) = Б (х„а, т, о). (21) Согласно (19) и (21) частную производную по х, мы можем найти, применяя теорему п.
2.5.6 дх дх - - — — — ~ ди(х„в,т,о) ~ — = — (1„(„х„О, т, о)~ хо хо ™ 1х, =х(тд хо ~, =х(тд ="('ь 'о "о)~ =Я(1 1) (22) дхо ухо=х<то1 где И(1, т) — фундаментальная матрица решений уравнения в вариациях г = оа„(1, х (1), и (1) ) г (в формуле (2) п. 2.5.6 надо положить Р(1, х)= р(1, х, . й(о)) и учесть (20)). Этим доказано (12) п. 4.2.3. Теперь воспользуемся формулой (9), заметив, что, как было сказано в и. Б), в окрестности точек (1, 1, х(1,)), й=0, 1, производные функции Х(Г, („х,) можно вычислять, применяя классическую теорему о дифференцируемости по начальным данным (формулы (1) — (4) п.
2.5.7„ где снова Р(1, х)=~у(1, х, и(()). Дифференцируя (9) и учитывая уже найденную формулу (22), а также, что, согласно (20) и (21), В(Х((м Го~ х((о)) О~ т и) (х(~о) О т о) =х(К,, К„х(К,), О, т, о)=х(1,), имеем дх7дГ,=дХЯ, („х(1,))7д1, =гр(Км х(Е,), й((,)), дх)дг,=дЕ Д, О, т, и)!д$/з-",д дХ(1„(„х(М,)/дЕ,/~, ",,= =а(1„(.) [ — р(Г., ха), й(1,))1. Этим доказаны (10) и (11) п. 4.2.3.
Пусть теперь а,=О, 1чьй и аь > О. Обозначим для краткости х(1, иа)=х(1, 1„х((,), (О, ..., О, аю „О), т, о) При таком выборе а, согласно (3), в полуинтервале ~„(1 < т„+йа„дифференциальные уравнения (1) и (7) совпадают н х ((„а„) =х (Г,), а потому в этом полуинтервале х(1, аа) =х(Г) и, переходя к пределу, получаем х(т„4-йам иь) =х(та+Йа„). (23) далее, при та+Йаь(Г < та+Йаа+а„мы решаем дифференциальное уравнение (10) с начальным условием (23) и с и =ею откуда х(та+Фа„+а„) = =- У,х(т„+йиз+аю ть-(-йа„,х(ть+йаа)). (24) В оставшемся промежуткет~+(А-(-1)а„(Г(1, мы снова возвращаемся к уравнению (7), теперь уже с йачальным условием (24).
Этот промежуток мы разобьем иа два, фиксировав з так, что в интервале (т„, з) не было точек разрыва и( ). Величину аь) 0 будем считать столь малой, чтобы было т„< т»+(й+1)сс„< з. Имеем х ((„а») = Х (1 „з, х (з, а„)) = =Х((„з, Х(з, т +(«+1)сс», х(т„+(и+1)а„, а»))) = =Х ((„з, Х(з, т»-(-(1+1) а», )',» (т»+(й-(-1) а», т„-1- + йа», х(т»+Фа»))). При дифференцировании этой формулы мы должны учесть следующие равенства; ((1) п.
2.5.6; 1, и з фиксированы)„ — (з, 1„«(т», О)) ~, „, = — Й(з, т») ср(т», х(т»), й(т )), дХ дх»вЂ” ((5) и (6) и. 2.5.7; классическая теорема применима, поскольку на отрезке (т», з1 управление й( ) непрерывно и т» < т»+ Я+ 1) а» < з)' д)', ,), (1, т,х( ))~, х„=Ч(т», х(т),о,), д)', д( (т» 1» Х(~»))~ц=х = 'р(тЫ'С(т») "»)ю д'х' †» (т», т„, у,) = Е дУ» (формулы (4) — (6) п. 2.5.7, где следует положить Р (1, х)= =ср(1, х, о ) и учесть, что всегда Я(1, ()=Е); и, наконец, х(т )=ср(т„, х(с»), й(т»)) из (7).
Таким образом, дх дх(1" сс)~ дХ (" ~ ~ дХ(ь т»,х(т»)) + д (з т» х(т»)) ( д( (т» т» х(т»))(«+1)+ + у-(т» т» х(т»))й+ д (т», тм х(т„))х(т»)Й1~= „а Уа =11(1., з)( — 11(з т»)р(т» х(т»), й(т»))(й+1)+ +11(~, т»)(ср(т» х(») о )(а+1) — ср(» «( ) о )х+ +ср(т», х(с»), й(т») Йи=— = й ((„т») (~р (т„, х (т»), о») — ср (т„х (т»), и (т„))1, чем доказано (13) п. 4.2.3 (равенство 11((„з) й(з, ть)= =Р((„тл) имеет место по основному свойству фундаментальной матрицы (11) п. 2.5.4).
4.2.7. Доказательство леммы об интегральных функционалах. Пусть Ь=(В„'$„..., $ ), 1=((„)„..., )„), Р=(ЄЄ.. „Р ) (функции Р; определены в формулировке леммы в п. 4.2.3), и((, а, т, о) и х(Г; („х„а, т, о) имеют тот же смысл, что и в пп. 4.2.3 и 4.2.6. Рассмотрим при аь ) О задачу Коши для системы (и+и+1)-го порядка — / е(П х, и(й а, т, е)) '( х=~ /=ер((,х, я, и((,а,т, о))=~ ' ' ' (, р'((, х, и ((, а, т, е )) (1) х ((,) = х„ я ((,) = О. Уравнения для х здесь не содержат $ и совпадают с (1), (2) п. 4.2.6. Поэтому их решением является х((; („х„а, т, о), а тогда, как легко видеть, Р ((„(„х„а) = $ ((,; („х„а, т, о).
дг ~~о (2) (' ((о (о)1 а дх дав где /ни ОЫ ~(( т)=~а О у м м — фундаментальная матрица решений системы уравнений в вариациях Следовательно, возможность продолжения этой функции на неположительные аь и непрерывная дифференцируемость в некоторой окрестности (г'„(„х„О) вытекают из леммы о пакете иголок, примененной к системе (1), а значения производных находятся по формулам, аналогичным (10) — (13) п.
4,2.3: (Йп — прямоугольные блоки в матрице Й размерами а х л, а х ш, тха и т х и соответственно). Учитывая„что ф не зависит от $, мы получаем из (3), что (! является решением задачи Коши для махричного дифференциального уравнения н ( Я„012 ) (юр„(О О) (011 Я1а) (т йй (4) ((41 (т, т) Ом (т, т) ) (О Ет ) Решая поочередно четыре матричных уравнения, составляющие (4), имеем сй„((, т)(~((=Ч~„(!) г)м ((, т), й„(т, т)= Е„, откуда ь)„((, т).=()((, т) — фундаментальная матрица системы (3) п.
4.2.3. Уравнениям Ю„((, т)д(Г = Ь (!) ()„((, т), ();, (т, т) = О, удовлетворяет ()„($, т) =О, и по теореме единственности другого решения не может быть. Далее (()ы(( т)l«(=7~(!) ~!м =7. (!)(!(Г т) ()и((, т) =О~ откуда 8 йм ((, т) = ~ ~„(з) (! (з, т) с(з. В частности, — (г т)=р (т)=(р ( ) ° р ( )) является решением задачи Коши (!8) п. 4.2.3 (см. (!4) в п. 2.5.4; можно убедиться в этом также и непосред- ственно, дифференцируя по т и учитывая свойства фун- даментальной матрицы, описанные в той же теореме п. 2.5.4).
Наконец, «()вз(! т)(Ф(=1т(()()м((~ т)=О~ (2за(т~ т)=Ет. откуда ()„((, т)= — Е . Таким образом, (а(~„т) о ) Подставляя в (2) и отделяя то, что относится к $ (1;; 1„х„а, т, о) = Г (1„1„х„сс), мы получаем дГ)д1, = д$(д(, = 1 (1,), др7дг» = 41дг» = (1»» (Гс 1») Ч~ (1») 1)м (11 1») Йг») = = р. (1.)р (1 ) — 1 (г ) дР/дх» = д$!дх, =1«„(1„с,) = — р, (1,), дР!дссь = д$(дх» = й„(1„т») Ь~р (т», о») + +11„(1, т»)'й(( ° .)= — Р.(т )бр(т ° и )+й((т о.) что совпадает с (14) — (17) п. 4.2.3.
° $ 4.3*. Задачи оптимального управления, линейные по фазовым переменным Этот параграф посвящен одному специальному классу задач оптимального управления. Этот класс достаточно важен и с прикладной точки зрения, но для нас ок интересен не только этим. На примере задач с линейной структурой по фазовым переменным можно наиболее отчетливо продемонстрировать одну из самых принципиальных идей всей теории. Речь идет о «скрытой выпуклости», всегда присутствующей в задачах оптимального управления.
Именно она в конечном счете дает возможность записать необходимое условие в виде «принципа максимума», т. е. в форме, характерной для задач выпуклого программирования. И если в предыдущем параграфе мы старались подчеркнуть связь задач оптимального управления с общей теорией гладких экстремальных задач, то здесь на первый план выдвигается их связь с выпуклым анализом. Отметим еще, что (как это и характерно для задач выпуклого программирования) необходимые условия экстремума почти смыкаются здесь с достаточными. Наконец, и это тоже важно с точки зрения выявления скрытой выпуклости, мы будем в этом параграфе рассматривать измеримые управления, а не только кусочно- непрерывные.