Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 14
Текст из файла (страница 14)
Лемма. Для любой х( )ЕС'([с„(с1) такой, испо х (Гс) = х (Г,) = 0 д,(сс* Р) дс, до. да ' дй дяде ~Ь дй дд 6У,(х(.), х( ° )), 67,(х( ), у( ))~ 63 ( ( ) ( )) 67 ( ( ) у( ))! са. ю (4) Д о к а з а т е л ь с т в о. Если определитель (4) Ф О, то отображение (сс, 6) с (ф,(а, с1), ф,(сс, 6)) переводит некоторую окрестность точки (О, 0) на некоторую окрестность точки (ф,(0, 0), ф,(0, 0)) (соответствующую теорему об обратном отображении мы уже использовали в п. 1.3.2). В частности, найдутся такие сх и б„а, следовательно, и допустимая функция х( )+схх( )+бу( ), что фс(сс, р)= = — у,(х( )+схх(.~+6у(.))=3,.(х( )) — е, где е>0, а 78 и, положив Хс=О, кс=1, немедленно получаем (2).
Б) Пусть Ьу,чмО и, значит, существует функция у( ) ЕС'([Г„Гс1), у(Г,)=у(1,) =О, для которой вариация 67,(х( ), у( )) ~ О. Рассмотрим функции двух переменных фс(сс,~))=дс(х( )+гсх( )+бу( )), 1=0, 1, <р,(и, !3) =<р,(0, 0) = 6,(х( )) =и,. Это противоречит тому, что х( ) доставляет локальный минимум в задаче (1). ° В) Из равенства (4) имеем 62,(х( ), х(.)) — '("„' " ' ) 62,(х( ), х( ))=0 аз, (х ( ), у( )) (знаменатель здесь по предположению отличен ст нуля).
Полагая ),=1, Х,= — 62,(х( ), у( )) /67, (х(.), у( )), убеждаемся, что А,62,(х( ), х( ))+Х,67,(х( ), х( ))— = О (5) для любой х( -) ЕС" ([1„1,1), у которой х((,) =х(1,)=0. Легко видеть,' что левая часть (5) имеет вид ~ ((Д Ро(()+7 р~(()) х (()+() очи(()+1Л (()) х(()) г(1- Применяя основную лемму вариационного исчисления, получаем уравнение — — „' ().,р, (()+).,р, (1))+(Х,д, (1)+1„4, (1)) = О, совпадающее с (2). Я Задачу (1') впервые рассмотрел Эйлер в своей знаменитой работе 1744 г.
Там же методом ломаных было, получено соотношение (2). Собственно говоря, это и составляло основное содержание работы. Несомненно, в ней уже содержатся начала метода множителей Лагранжа. В заключение бегло рассмотрим задачу со старшими производными: Р(х(.))= ~ ~(1, х,х,х,...,х<"')~(г- ех1г, и хсо(Г,)=х[, 1=0, 1, 1=0, ..., и 1.
За подробностями отошлем читателя к [21 или [31. Эту задачу будем исследовать в пространстве С ([(„г,1) функций, непрерывных вместе с производными до порядка и на отрезке [г„гД. Функцию 7 и ее производные по х, х, ..., хьо будем предполагать непрерывными по совокупности переменных. Пусть х ( ) — функция, подозреваемая на экстремум, Вычислим первую вариацию 79 функционала по Лагранжу: с4/ « ««с*сс,*ссс-((хссс*"сс)с. ссс ГдЕ р (1)= — (с, Х(1), ..., Хс"С(Г)). Из условия локальной экстремальности вытекает, что Ы(х( ), х( ))=О, если только хм'(г;)=О, Е О, 1, 1'=О, 1, ..., н — 1. Интегрируя (7) по частям (предоставив читателю сформулировать нужные требования иа гладкость ру( )), преобразуем первую вариацию к виду с~/ « с«с*с с,*с сс=((вс — сссс со)*с сс с с О и, применив обобщение основной леммы классического ваРиацнонного исчислени Я на слУчай фУнкций из С" (1 1„1«1) с услови ями х'с ' (1,) = О, с = О, 1, 1' = О, 1, ..., и — 1 (это обобщение также предоставляем продумать читателю), получим, что необходимым условием экстремальности х ( ) является выполнение следующего уравнения, называемого уравнением Эйлера — Пуассона: л ( — 1)7 ~ — „С ) — „((, х (1), х (1), ..., хио (Г)) О.
с=в $1.5. Задача Лагранжа и основная задача оптимального управления 1.5.1. Постановки задач. Важным этапом в историй естествознания явилось сочинение Жозефа Луи Лагранжа «Аналитическая механикаэ, опубликованное в 1788 г. В частности, трактат Лагранжа сыграл исключительную роль и в развитии вариационного исчисления. Именно там была поставлена следующая задача на условный экстремум: Р(х( ))=11(с, х(1), х(1)) с(1- ех1г, с« Ф(с, х(с), х(1)) =ОезФ (1, х(1), х(())* О, 1=1, ...,щ, х(с«) = х„х(1,) =х,. Здесь х( ): (г„г,) $Р, 1: й х й" х й" 11, Ф: Кхй'х)с" К . Задачу (1) и различные ее модификации, связанные с дополнительными ограничениями (другими граничными условиями, дополнительными интегральными соотношениями и т. и.; см.
также 1.2.б), стали называть впоследствии задачей Лагранжа. Для решения задачи (1) Лагранж использовал тот основной прием, о котором говорилось в п. 1.3.2,— правило множителей. Впрочем, оно не было им аккуратно обосновано, и потребовалось более ста лет для того, чтобы придать рассуждениям Лагранжа вид строго доказанной теоремы. Отметим два наиболее важных частных типа ограничений, охватываемых общим выражением (2).
Ограничение Ф(1, х) =О, когда функция в (2) не зависит от х, называется в вариационном исчислении фиговым. В механике фазовые ограничения называют также гояономными связями. Другой случай — когда соотношения (2) можно разрешить относительно производных х. Тогда зто ограничение записывается в форме уравнений х=ф(1, х, и), х( ) г( 1 ~ рп и(,) ~1 ( ~ Яг р Я~срп~рг Кл Переменные х( ) здесь называют фазовыми, переменные и( ) — управлениями. Этому важнейшему случаю мы н уделим основное внимание. Точнее говоря, будем рассматривать далее задачу Л (х ( ), и (.)) = = ) 1(1, х(1), и (1)) а1+ф,(х($,), х (11)) — ех!г, (1') ь х — ф (1, х, и) О, ф (х (1,), х (1,)) = =0(взф(х(10), х(Ю,))=0, 1=1, ...,в) (2) Прн этом в (1'), (2') ~ У вЂ” К, ~Г У вЂ” й", ф: Яг- К', где У и Яг — открытые множества в пространствах Кх х К" х 1с' и 1с" х К" соответственно.
Моменты времени 1, и г, будем считать здесь фиксированными. Ограничение х — ~р (1, х, и) = 0 называется дифференциальной связью, ограничения ф(х(1,), х(1,))=0 называются граничными или краевыми условиями. Задачу (1'), (2') будем называть задачей Лагранжа в понтрягинсной форме. Все функции ), ~р и»р предположим непрерывно дифференцируемыми. Далее в гл.
1У будет рассмотрен еще более общий случай, когда Г«и 1, также могут меняться, допускаются изопериметрические ограничения типа равенств, неравенств и т. п. Задачу (1'), (2') будем рассматривать в банаховом пространстве У= С' ([«„Г,1, 1«") х С ([1,, «,1, 11") Иначе говоря, будем рассматривать пары (х(.), и(.)), где х ( )— непрерывно дифференцируемая и-мерная вектор-функция, а и (.) — непрерывная г-мерная вектор-функция. Пару (х( ), и( )) будем иногда сокращенно обозначать через г. Элемент г=(х( ), и (-)) ~ Л будем называть управляемым процессом в задаче (1'), (2'), если х(1)=~р(1, х(1), и(1)), у(~[(„г»1, и допустимым управляемым процессом, если, кроме того, удовлетворяются краевые условия.
Допустимый элемент г=(х(.), й( )) будет называться оптимальным в слабом смысле процессом или слабым мии мумом в задаче (1'), (2'), если он доставляет локальный минимум в задаче, т. е. если найдется такое з) О, что коль скоро 1х — х~~, «". а н 1и — и~» < е, то Р(г))У (г). 1.5.2. г(еобходимые условия в задаче Лагранжа. Попробуем применить к задаче (1'1, (2') предыдущего пункта общий прием Лагранжа, о котором шла речь в п.
1 3.2. По аналогии с конечномерным случаем функцию Лагранжа следует записать так: Я (х ( ), и ( ); р (.), р, Х,) = ~ 1, с(1+1, (1) и где Е(Г, х, х, и)=р(1)(х — <р((,х,и))+Л»[(Г, х, и), (2) 1(х„х,) = ~~.", (л~»р, (х„х,), 2,»=-р,. (3) То, что «терминальная часть» или терминант функции Лагранжа 1 имеет вид (3), не вызывает сомнения — здесь имеетея полное подобие с конечномерным случаем. Что же касается ограничения х=ц~(г, х, и), то оно должно выполняться для всех г ~ [1„1,1, и соответствующий «множитель Лагранжа» р( ) по аналогии должен быть функцией 1, а его вклад в функцию Лагранжа имеет вид интеграла, а не суммы. 82 Еа(1, х(1), х(1), й(Ф))=0, и условия трансверсальности Ц (Г» Х((а) Х(за) "(ГЭ))=( — 1) й=,, (Х (за) Х(1«)) Уг = 0,1. (7) Вследствие того, что Ь не зависит от и, а 1 от и, уравнение Эйлера по и имеет вырожденный вид (б), а условий трансверсальности «по и» нет вовсе.
Эту теорему (и даже в несколько более общем виде) мы докажем в $ 4.1 как прямое следствие общей теоремы, Итак, функция Лагранжа составлена, Следуя рецепту Лагранжа, нужно теперь искать условия экстремума полученного выражения, «как если бы переменные были независимы». Иначе говоря, следует рассмотреть задачу .Ы'(х( ), и( ); р( ), р, )ьэ)- ех(г, (4) считая множители Лагранжа фиксированными. Задача (4)— зто задача Больца, рассмотренная в п.
1.4.2. Выписанные там условия экстремума в применении к задаче (4) приведут к правильным уравнениям, называемым уравнениям Эйлера — Лагранзса. Точнее, имеет место следующая теорема. Теорема Эйлера — Лагранжа. Если г= =(х( ), и( )) — оптимальный в слабом смысле процесс для задачи (1'), (2') п. 1.5.1, то найдутся множипмли Лагранжа )ьэ=)ьэ) 0 в задаче на минимум и (О в задаче на максимум, р (.) ~ С" (1(„Я 1(э), р =(р„..., р,), не равные одновременно кулю') и такие, что будут вьиолнены уравнения Эйлера — — „«Ь„(г, х(Г), х(г), и(г))+т-„(г, х(г), х (г), й(г))=0, (5) (б) ') )чатематик-пурист отметит вопиющую неточность в этой фразе: 1е и р, это числа, а р( ) — элемент функционального пространства, так что они и не могли бы равняться одному и тому же нулю одновременна.
Каждое нз них может равняться или не равняться своему нулю в своем пространстве. Однако все мы так привыкли отождествлять нули всех пространств, что эта фраза уже не режет глаз. касающейся правила множителей Лагранжа для гладких бесконечномерных задач. Отметим, что нз этой теоремы следует необходимое условие экстремума в изопериметрической задаче (с произвольным числом изопериметрических условий) и уравнение Эйлера †Пуассо для задач со старшими производными.
Изопериметрические ограничения с, Юс(х( ))=$1,(1, х, х)с!с=а„(=1, ..., т; хЕК", можно учесть, введя новые фазощге переменные, связанные со старыми дифференциальной связью' х„э, (1) = 1с(1, х,(1), ..., х„(!), х,(с)„..., х„(1)) иудовлетворяющие краевым условиям х„+, (1,) — х„+,(1,) =а„1=1, „т. Если теперь применить теорему Эйлера — Лагранжа, то получатся нужные необходимые условия в изопернметрической задаче.
При исследовании задачи со старшими производными ее можно свести к виду (1'), (2'); полагая х=х„, х,=х„..., х„=и и применяя далее теорему Эйлера — Лагранжа. 1.5.3. Принцип максимума Понтрягина. В пятидесятых годах многочисленные потребности прикладных дисциплин (техники, экономики и др.) стимулировали постановку н рассмотрение нового класса экстремальных задач, получивших название задач оптиэсапьного управления. Необходимое условие экстремума для задач этого класса— «приицип максимумаэ, — сформулированное Л. С.,Понтрягиным в 1953 г., было доказано ц развито впоследствии им, его учениками и сотрудниками (см. [12!). Важно отметить, что это условие имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решение"задачи оптимального управления входит решение вспомогательной задачи на максимум (отсюда название — «принцип максимумаэ).
Здесь мы будем рассматривать частный случай общей постановки задачи оптимального управления, когда в'задаче Лагранжа в понтрягинской форме (см. (1') и (2') п. 1 5.1) появляется еще одно дополнительное условие яа управление: и~И. Точнее говоря, будет рассматри- И ваться такая задача: 3(х(), и())- С» = ~ ) (г» х(1)» и (Г)) сй+фь (х(»»), х (1»)) — «гп1» (1) »» х(г) — »р(1, х(1), и(1))=О, Чь(х(1,), х(1,)) О, 1=1, ..., з, (2) иЕП. (3) Функции )', ф, фг — такие же, как в (1'), (2') п. 1.5.1, а П вЂ” фиксированное множество в К». Более общая задача будет рассмотрена в гл. 1У.