В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 16
Текст из файла (страница 16)
(13) 1.5.4. Доказательство принципа максимума в задаче со свободным ионцом. Здесь принцип максимума Понтрягина будет доказан в простейшей ситуации, когда терминальная часть функционала отсутствует, один из концов закреплен, а второй свободен, т. е. в (1) п. 1.5.3 ф, = О, а в (2) ф~ (х„х,) = хм — хео 1 = 1, ..., и. Таким образом, мы имеем задачу 3 (х ( ), и ( )) = ) ((1, х (1), и (1)) а( — 1п1, (1) н х(1) — ф(1, х(1), и(1))=О, х(1,)=х„(2) иЕП, (3) Функции 1, („, ~р, д„предполагаются (иак и в предыдущем пункте) непрерывными по совокупности переменных.
Посмотрим, каи выглядит в этом случае принцип максимума Понтрягина. Поскольку у нас функция 1(х„х,) = = ~р~(хм — хм) не зависит от х„из условиц трансвер~ ~1 сальности (13) п. 1.5.3. получаем Е.„(1„, х(1,), х((с), и(1,))=р(1,)=0. (4) Далее, уравнение (12) п. 1.5.3 приобретает вид — -„", Е„ + Е„ = О оь †рг (1) = р (1) р„ (1) — Ц„ (1), (5) где мы ввели сокращенные обозначения: 7, (1) = ~„(1, х(1), й(1)), ~р,,(1)=ср„(1, х(М), й(1)). Еслидопустить,чтоЛ,=О, то вследствие единственности решения задачи Коши для однородного уравнения (5) должно быть р ( ) = О, а значиТ, а, силу условия трансверсальности иа левом конце (см. (13) п. 1,5.3) и р=О.
Но это противоречит условию теоремы, согласно которому не все множители Лагранжа могут быть одновременно нулями. Значит, Л,ыь О и можно считать Л,=1. Но тогда р( ) однозначно (в силу единственности решения задачи Коши для линейной неоднородной системы) определяется уравнением (5) и краевым условием (4). Суммируя сказанное, можно сформулировать принцип максимума так: Теорема (принцип максимума Поитряг и н а. д л я з а д а ч и с о с в о б о д н ы м к о и ц о м). Если процесс (х( ), й( )) является оптимальным в задаче (1) — (3), то для решения р(.) системы (5) — р(1)=рЯгг (1) — ИЯ с краевым условием р ((,) — О в точках непрерыености управления й( ) выполнен принцип максимума тах (р (1) ср (1, х (1), и) — ) (Ц, х (1), и)) = йчв =Р(г)Ч(1 х(() и(1)) — 1(1, х(г), й(1)).
Для доказательства этой теоремы, как и в предыдущих случаях, воспользуемся методом вариаций. Начнем е определенна элементарной — вейерштрассовской — игольчатой вариации, аналогичной той, что была применена в и. 1.4.4. Обозначим через Т, множество тех точек из (1„1,), в которых функция и( ) непрерывна. Зафиксируем точку т Е Т„элемент о Е П и число Л ~ О настолько малое, что [т — Л, т]~-[1„1,], Управление „(, и (р г „) 'й(1),если 16 — Л,т), (8) о, если 1Е [т — Л, т), назовем элементарной игольчатой вариацией управления й( ). Пусть ха(() =ха((; т, о) — решение уравнения х= = ф(1, х, иь(()) с начальным условием хь(те)=х(1,) =х,.
Назовем хь (1) элементарной игольчатой вариацией траектории, а пару (ха(г), их Я) — элементарной вариацией процесса (х( ), и( )). Пару (т, о), определяющую эту вариацию, будем называть элементарной иголкой. Доказательство теоремы как обычно разбиваем на этапы. Первые два этапа целиком относятся к теории обыкновенных дифференциальных уравнений.
А) Лемма о свойствах элементарной вариаци и. 1. Пусть элементарная иголка (т, о) фиксирована. Тогда суи(ествует такое Л, > О, что при 0(Л(Л,: 1) траектория хь( ) определена на всем отрезке [(е, (т1 и при Л(0 хь(1) х(() равномерно на [(„т); 2) при г'-эт, 0(Л~(Л„суи(естеует и непрерывна па Л производная Ы вЂ” „Лха(1; т, о) =га((; т, о), которая при Л = 0 определяется как производная 3) функция г эуЩ=ге((, т, о) на отрезке удовлетворяет дифференциальному уравнению у=ф (г)у справа; [т (г1 и начальному условию у(т)=ф(т, х(т), о) — гр(т, х(т), й(т)).
(10) Доказательство леммы основано надвухиэвест- ных фактах теории обыкновенных дифференциальных уравнений: локальной теореме существования н единст- венности и теореме о непрерывно дифференцируемой за-, висимости решения от начальных данных. Эти теоремы в нужной для нас форме содержатся в стандартных учеб- никах по обыкновенным дифференциальным уравнениям [10, 11, 151. Кроме того, читатель может обратиться к тексту й 2.5. Дояаагем лемму сиачала для случая, когда фуякяик й( ) вепрь рывиа. Рассмотрим дифференциальные уравнения л =ф(ц я, иа(г)), л = ф (г, я, й (г)).
Согласно (8) правые части этик уравнений совпадают при» < т — Л, а так как хь(»з) = ха= х(»з), то по теореме единственности решения задачи Коши х (») х(») при» < т — Л и по непрерывности $ (Л) = хь (т — Л) = х (т — Л). (13) В частности, з(Л) непрерывно дифференцируема по Л н а(0)=х(т), з'(0)= — х(с)= — ф(т,х(с), и (т)). ( ) Обозначим через Е (», з, $) решение задачи Кошиллядифференциального уравнения с фиксированным управлением ш х — — ср(», х, о), х(з) =6.
(15) В соответствии с локальной теоремой существования и единственности можно подобрать такие е, > О и б, > О, что Е(», з, $) определено при [» с[<бы [т — т[<бм[$ — х(с)[<е, а в силу теореыы о зависимости решения от начальных данных Ев непрерывно дифференцнруемая функция. Согласно (8) и (13) для определения х (») на отрезке [т — Л, т) мыдолжны в(15) положить $=3(Л)=х(т-Л) и если Л, < 6 выбрано так, что [5(Л) — х(т) [ < е, при О~Л~Лы то х (»)=Е(», т — Л, 5(Л)), — ?»~т.
В частности, т)(Л)=х (т) = Е (т, т — Л, $(Л)), (16) будучи суперпозицией непрерывно диффереицнруемых функций, сама непрерывно диффереицируема по Л и з)(0) =х(т), т)' (0) =- — Еч(т, т, $(0))+Е (т, т, 5(0)) $'(0)= = — Яз(т, т, а(0)) — ЯЛ(т, т, а(0)) ф(т, х(т), й (т)) (1?) в силу (14). Решение Я (», з, $) задачи Коши (15) удовлетворяет эквивалентному интегральному уравнению » Я (», з, $) = 6 + ) ф (о, Е (о, з, $), з) с»о.
(! 8) Дифференцируя его по з, имеем Ез(», з, $)= ф(з Я(з, з $), и)+~ф»(о, Е(о, з,й),о)Ех(о,з,Цйз 5 и, полагая»=з=т, Л=х(т), получаем (с учетом очевидного тождества Е (», », 5) =$) Е (т, т, х(г)) = — ср(т, х(т), о). (19) Аналогично, дифференцируя (18) по $ и подставляя те же значения аргументов, получаем Е (т, 'с, х(т)) =Е (20) (здесь Е=Щ/фз)=(бсз) — единичная матрица). Подставляя (19) и (20) в (17), имеем т)(0)*=х(с), с)'(0) ср(т, х (т), и)-ф(т, х (т), й(т)). (2Ц Далее, функция Е непрерывна в точке (т, т, х(т)), причем Е (т, т, х(т))=х(т), а х(.) непрерывна в точке т. Поэтомудлялюбого е > б существует такое 6 > О, что при ) 1 — т ! < 6, ) з — т ! < 6, ! с,— х (т)) < 6 выполняются неравенства ) Е (С, з, $) — х(т)) < е/2, (х(С) — х(т)! < е/2.
[22) Возьмем положительное Хс ~ 6 столь малым, чтобы при 0~)счцьс выполнялось неравенство ( в (х) — х(т)) < 6. тогда для т — )с с с еь с, з=т — ь и $=$(д) будут иметь место неравенства (22), откуда хс„(С) — й(С)/ ) Е (С, т — )с, В()С)) — х(С)! ч» ~(Е (С, т — д, ь(Л)) — х(т))+)х(т) — х(С)) < е/2+е/2=е.
Поскольку хь(с) юах(с) при сз~! с т — Зс, Очц)с~ос~!х„(С) — х(С)/ < е, Се~С~с', чем доказано первое утверждение леммы. Теперь обозначим через Х (, с)) решение задачи Коши для уран. пения (12) с начальным условием х(т)=с). По теореме о зависимости решений от начальяых данных существует такое ез, что Х(с, с)) определено при ) с) — х(т)( < еь тчцгец Сс и является непрерывно дифференцируемой функцией. Согласно (8) и (16), а также в силу теоремы единственности х„(С) = Х (С, с) (ь)). Снова, как суперпозяция непрерывно диффереицяруемых функций, х .(С) непрерывно диффереи- цнРУема по (с, Ц пРЯ т ж;!~ с, и Оч й~)сз, где хз выбРано так, чтобы прн О~-)с~)сз выполнялось неравенство ) с)(ь) — х (т)( < е,.
Полагая )сз=ш!п()с„э,з), мм видим, что верно второе утверждение леммы. Переходя от уравнения (12) к эквивалентному интегральному уравнению, имеем с учетом (!6) с х „(С)» й (д) + ~ ср (а, ха (а), й (а)) Иа. дифференцируя это уравнение по )с и полагая затем )с=О и обо. виачая, как и в условии леммы, у(с)= а— ьха(С), находим !ь»о' у(С)=т)'(О)+$ !рз (а, х(а), й(а))у(а)оа, »91 Зто иитегралъиое уравиеиие зквивалеятио уравиеиию (9) с вачальиым условием у(т)=т!' (О), совпадающим с (1О) ввиду (21). Если упрзвлеиие й(.) — кусочио-иепрерывиая фуикция, то поступаем следующим образом.
Для простоты пусть точек разрыва две, скажем, а„и аз, и т (в которой й(.) должио быть иепрерывиым) расположеиа между иими: гз < а, < т < аз < Г,. В полосе Ге~!~аз системы (11) и (!2) (в котовых при !=аз иужио считать управлеиие 'рзвиым его предельному зиачеиию й(пт — О)= йщ й(Г))совпадают в,-о и по теореме едииствеииости хд(!) = х(!). Теперь перехпдим в. полосу а,щ; !~аз (своза полагая иа ее граиицах управлеиве равиым предельиым зиачеииям й(аз+О) при !=а, и й(аз — О) пРи !=аз).
здесь мм Решаем УРавиеива (!!) и (12) с иачальиым условием х-х(аз). Наши предыдущие утверждения примеиимы, и мы убеждаемся в иепрерывиой диффереицируемости хь(!) по д. Накоиец, в полосе аза !~ !, (с тем же соглзшеиием о зиачеиии упрзвлеиия при !=аз) решаем паши диффереициальиые уравяеиия с иачальиыми условиями хх(аз) в х(аз). Еще раз ссылаясь иа теорему о зависимости решеиия от иачальиых даииых, доказываем иепрерызиую диффереицируемость хь(!) по з при аз~ ! а; ! и вычисляем у(г)=о зх! (!)~ тем же способом, что и раиьше.
° !а=о Б) Лемма о приращении функционала. Положим )((Х) = Я (хь ( ), иь( )) и докажем, что эта функции диффереицируема справа в точке Х = О. Пусть р( ) — решение системы (6) с краевым условием (7). Тогда Х'(+О)-дтд(хь( ), иь( )1, „=и( ° о). еде а(т, о) ~(т, х(т), о) — )(т, х(т), й(т))— — р(т) [!р(т, х(т), о) — !р(т, х(т), и(т))). (23) До к а з а тел ь от и о. Поскольку 2(3~) — )((О) =) г(г, х1,(!), их(!)) Е! — ~ ! (г, х(!), й(!)) Ег= $ [! (г, хх(!), й(!)) — г'(г, х(!), й(!))1М+ 1 + ) [((!. хх(!) ь) — ((!. х(!). й(г)1 Е!. 2' (О) Псп ~ ~) ~ С (С, «ь(С), и (С)) й ~ + х(х)-х(0) д Р т +Пгп х ( Р(С, х„(С), о) — С(С, х(С), й(С)1бС.