Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 15
Текст из файла (страница 15)
Задачу Лагранжа мы рассматривали в некотором банаховом пространстве. Здесь же, желая применять самые простые средства, изберем иной путь описания допустимых элементов, сходный с тем, о котором шла речь в п. 1.4.3, где простейшая задача классического вариационного исчисления была расширена до задачи в пространстве КС' ([1„1»1) кусочно-дифференцируемых функций.
Пару (х( ), и(.)) будем называть управляемым процессом в задаче (1) — (3), если управление и( ): [1„1»1 — П вЂ” кусочно-непрерывная функция, фазовая траектория х( ) кусочно-непрерывно дифференцируема и при этом всюду, кроме точек разрыва управления и( ), функция х ( ) удовлетворяет дифференциальному уравнению х (1) =»р(1, х(1), и(1)). Управляемый процесс называется допустимым, если, кроме того, удовлетворяются краевые условия.
Допустимый процесс (х ( ), й(.)) называется оптимальным, если найдется такое з > О, что для всякого дону стимого управляемого процесса (х(.), и( )) такого, что 1х(1) — х(1)((з, Ч»1~[1„1»1 выполняется неравенство 5(х( ), и(.))~Я(х( ), й(.)). Попробуем снова применить к задаче (1) — (3) общий прием Лагранжа, о котором речь шла в и.
1.3.2. Функция Лагранжа задачи (1) — (3) будет иметь тот же вид, что и в задаче Лагранжа — ограничения типа принадлежности (и ~ П) в функцию Лагранжа не включаются. Итак, Я'(х( ), и( ); р( ), р, Х,) ~ьс(1+1ь -(4) с, йз где с.(Е, х, х, и)=р(()(х — ср(Е, х, и))+Х,Е(Е, х, и), (5) Е(» х).=7 Ь"Ь(х х) р =)" (6) Далее, как всегда, нужно рассмотреть задачу Ю(х(-), и(.);р( ), р, Х,) Еп( (7) (считая множители Лагранжа фиксированными) «как если бы переменные были независимы». Задача (7) естественным путем распадается на две: .
.У(х( ), и( ); р( ), р, Х,)- ЕпЕ (пох( )), (8) .йс(хь( ), и(.); р( ), р, Х,)- Еп( (пои( ) бсЕЕ),(9) где через Я мы обозначили множества кусочно-непрерыв- ных функций со значениями в О. Задача (8) — это снова задача Больца; задача же (9) имеет, как легко понять, следующий простой вид: с, ~)((Е, и(Е))с(Е Еп(, и(.)ЕЯ, (10) с, где 1с(Е, и) =Х,Е(Е, х(Е), и) — р(Е) ср(Е, х(Е), и). Йеобходимое (и достаточное) условие экстремума в задаче (10) совершенно очевидно: й(.)6Я доставляет минимум в задаче (10) тогда и только тогда. когда всюду, кроме точек разрыва й( ) выполнено соотношение ппп 1с.(Е, и) = )с(Е, и (Е)) еэ йяа Еат)п Е,(Е, х(Е), х(с), и)=Е(Е, х(Е), х(г), й(Е)) 4Э ича еэтак'(р(Е) ср(Е, х(Е), и) — 1,Е(Е, х(Е), и)1 = ырра =р(Е)ср(Е, х(Е), й(Е)) — Х,Е(Е, х(Е), й(Е)).
(11) Необходимые условия экстремума в задаче (8), соединенные с(11), приводят к необходимым условиям экстремума в задаче (1) — (3), получившим название принципа максимума Понтрягина(из:Васпецнфическоговида условия (11)). Точнее, имеет место следующая теорема. ав Теорема (принцнп максимума Понтрягинаа).
Если (х( ), и( )).есть оптимальный процесс для задачи (1) — (3), то найдутся множители Лагранжа Х,=р,)рбо Р( )ЕКС'(11„г11, 11"), р=(р„..., ц,),не равные нулю одновременно и такие, ипо выполнено уравнение Эйлера лей. (1, х(1), х(1), и(1))=Е,,(1, х(1), х(г), й(1)), (12) принцип леаксимума (11) и условие трансверсальности '~'„'Р~ «(1) х(1) а(1)) ~1 1ь ( 1) д„(х(го) «(11)) й=0,1. (13) 1.5.4. Доказательство принципа максимума в задаче со свободным ионцом. Здесь принцип максимума Понтрягина будет доказан в простейшей ситуации, когда терминальная часть функционала отсутствует, один из концов закреплен, а второй свободен, т.
е. в (1) п. 1.5.3 ф, = О, а в (2) ф~ (х„х,) = хм — хео 1 = 1, ..., п. Таким образом, мы имеем задачу 3 (х ( ), и ( )) = ) ((1, х (1), и (1)) а( — 1п1, (1) н х(1) — ф(1, х(1), и(1))=О, х(1,)=х„(2) иЕП, (3) Функции 1, („, ~р, д„предполагаются (иак и в предыдущем пункте) непрерывными по совокупности переменных.
Посмотрим, каи выглядит в этом случае принцип максимума Понтрягина. Поскольку у нас функция 1(х„х,) = = ~р~(хм — хм) не зависит от х„из условиц трансвер~ ~1 сальности (13) п. 1.5.3. получаем г„(1„, х(1,), х(1,), и(1,))=р(1,)=О. (4) Далее, уравнение (12) п. 1.5.3 приобретает вид — -„", Е„ + Е„ = О оь †рг (1) = р (1) р„ (1) — Ц„ (1), (5) где мы ввели сокращенные обозначения: 7, (1) = ~„(1, х(1), й(1)), ~р,,(1)=ср„(1, х(М), й(1)).
Еслидопустить,чтоЛ,=О, то вследствие единственности решения задачи Коши для однородного уравнения (5) должно быть р ( ) = О, а значиТ, а, силу условия трансверсальности иа левом конце (см. (13) п. 1,5.3) и р=О. Но это противоречит условию теоремы, согласно которому не все множители Лагранжа могут быть одновременно нулями. Значит, Л,ыь О и можно считать Л,=1. Но тогда р( ) однозначно (в силу единственности решения задачи Коши для линейной неоднородной системы) определяется уравнением (5) и краевым условием (4).
Суммируя сказанное, можно сформулировать принцип максимума так: Теорема (принцип максимума Поитряг и н а. д л я з а д а ч и с о с в о б о д н ы м к о и ц о м). Если процесс (х( ), й( )) является оптимальным в задаче (1) — (3), то для решения р(.) системы (5) — р(1)=рЯгг (1) — ИЯ с краевым условием р ((,) — О в точках непрерыености управления й( ) выполнен принцип максимума тах (р (1) ср (1, х (1), и) — ) (Ц, х (1), и)) = йчв =Р(г)Ч(1 х(() и(1)) — 1(1, х(г), й(1)). Для доказательства этой теоремы, как и в предыдущих случаях, воспользуемся методом вариаций. Начнем е определенна элементарной — вейерштрассовской — игольчатой вариации, аналогичной той, что была применена в и. 1.4.4. Обозначим через Т, множество тех точек из (1„1,), в которых функция и( ) непрерывна.
Зафиксируем точку т Е Т„элемент о Е П и число Л ~ О настолько малое, что [т — Л, т]~-[1„1,], Управление „(, и (р г „) 'й(1),если 16 — Л,т), (8) о, если 1Е [т — Л, т), назовем элементарной игольчатой вариацией управления й( ). Пусть ха(() =ха((; т, о) — решение уравнения х= = ф(1, х, иь(()) с начальным условием хь(те)=х(1,) =х,. Назовем хь (1) элементарной игольчатой вариацией траектории, а пару (ха(г), их Я) — элементарной вариацией процесса (х( ), и( )). Пару (т, о), определяющую эту вариацию, будем называть элементарной иголкой. Доказательство теоремы как обычно разбиваем на этапы. Первые два этапа целиком относятся к теории обыкновенных дифференциальных уравнений.
А) Лемма о свойствах элементарной вариаци и. 1. Пусть элементарная иголка (т, о) фиксирована. Тогда суи(ествует такое Л, > О, что при 0(Л(Л,: 1) траектория хь( ) определена на всем отрезке [(е, (т1 и при Л(0 хь(1) х(() равномерно на [(„т); 2) при г'-эт, 0(Л~(Л„суи(естеует и непрерывна па Л производная Ы вЂ” „Лха(1; т, о) =га((; т, о), которая при Л = 0 определяется как производная 3) функция г эуЩ=ге((, т, о) на отрезке удовлетворяет дифференциальному уравнению у=ф (г)у справа; [т (г1 и начальному условию у(т)=ф(т, х(т), о) — гр(т, х(т), й(т)). (10) Доказательство леммы основано надвухиэвест- ных фактах теории обыкновенных дифференциальных уравнений: локальной теореме существования н единст- венности и теореме о непрерывно дифференцируемой за-, висимости решения от начальных данных.
Эти теоремы в нужной для нас форме содержатся в стандартных учеб- никах по обыкновенным дифференциальным уравнениям [10, 11, 151. Кроме того, читатель может обратиться к тексту й 2.5. Дояаагем лемму сначала для случая, когда функция й( ) вепрь рывиа. Рассмотрим дифференциальные уравнения л =ф(ц я, иа(г)), л = ф (г, я, й (г)). Согласно (8) правые части этик уравнений совпадают при» < т — Л, а так как хь(»з) = ха= х(»з), то по теореме единственности решения задачи Коши х (») х(») при» < т — Л и по непрерывности $ (Л) = хь (т — Л) = х (т — Л).
(13) В частности, з(Л) непрерывно дифференцируема по Л н а(0)=х(т), з'(0)= — х(с)= — ф(т,х(с), и (т)). ( ) Обозначим через Е (», з, $) решение задачи Кошиллядифференциального уравнения с фиксированным управлением ш х — — ср(», х, о), х(з) =6. (15) В соответствии с локальной теоремой существования и единственности можно подобрать такие е, > О и б, > О, что Е(», з, $) определено при [» с[<бы [т — т[<бм[$ — х(с)[<е, а в силу теореыы о зависимости решения от начальных данных Ев непрерывно дифференцнруемая функция.
Согласно (8) и (13) для определения х (») на отрезке [т — Л, т) мыдолжны в(15) положить $=3(Л)=х(т-Л) и если Л, < 6 выбрано так, что [5(Л) — х(т) [ < е, при О~Л~Лы то х (»)=Е(», т — Л, 5(Л)), — ?»~т. В частности, т)(Л)=х (т) = Е (т, т — Л, $(Л)), (16) будучи суперпозицией непрерывно диффереицнруемых функций, сама непрерывно диффереицируема по Л и з)(0) =х(т), т)' (0) =- — Еч(т, т, $(0))+Е (т, т, 5(0)) $'(0)= = — Яз(т, т, а(0)) — ЯЛ(т, т, а(0)) ф(т, х(т), й (т)) (1?) в силу (14). Решение Я (», з, $) задачи Коши (15) удовлетворяет эквивалентному интегральному уравнению » Я (», з, $) = 6 + ) ф (о, Е (о, з, $), з) с»о. (! 8) Дифференцируя его по з, имеем Ез(», з, $)= ф(з Я(з, з $), и)+~ф»(о, Е(о, з,й),о)Ех(о,з,Цйз 5 и, полагая»=з=т, Л=х(т), получаем (с учетом очевидного тождества Е (», », 5) =$) Е (т, т, х(г)) = — ср(т, х(т), о).
(19) Аналогично, дифференцируя (18) по $ и подставляя те же значения аргументов, получаем Е (т, 'с, х(т)) =Е (20) (здесь Е=Щ/фз)=(бсз) — единичная матрица). Подставляя (19) и (20) в (17), имеем т)(0)*=х(с), с)'(0) ср(т, х (т), и)-ф(т, х (т), й(т)). (2Ц Далее, функция Е непрерывна в точке (т, т, х(т)), причем Е (т, т, х(т))=х(т), а х(.) непрерывна в точке т. Поэтомудлялюбого е > б существует такое 6 > О, что при ) 1 — т ! < 6, ) з — т ! < 6, ! с,— х (т)) < 6 выполняются неравенства ) Е (С, з, $) — х(т)) < е/2, (х(С) — х(т)! < е/2.
[22) Возьмем положительное Хс ~ 6 столь малым, чтобы при 0~)счцьс выполнялось неравенство ( в (х) — х(т)) < 6. тогда для т — )с с се~ с, з=т — ь и $=$(д) будут иметь место неравенства (22), откуда хс„(С) — й(С)/ ) Е (С, т — )с, В()С)) — х(С)! ч» ~(Е (С, т — д, ь(Л)) — х(т))+)х(т) — х(С)) < е/2+е/2=е. Поскольку хь(с) юах(с) при сз~! с т — Зс, Очц)с~ос~!х„(С) — х(С)/ < е, Се~С~с', чем доказано первое утверждение леммы. Теперь обозначим через Х (, с)) решение задачи Коши для уран.