Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 41
Текст из файла (страница 41)
Прежде всего отметим, что в силу выбора начальных условий для функций ву(~) и )((в) соотношение (68) выполнено. Далее, из (90) и (93) непосредственно следует соотношение (67). Наконец, соотношения (65) и (66) доказываются, исходя из неравенств (91) и (92), совершенно так же, как в главе 2 из неравенства (34) было доказано соотношение (11) (в доказательстве должны быть сделаны очевидные иаменения, свяаанные с тем, что рассматривается пространство Х, а не Х).
Итак, теорема 21 полностью докааана. ГЛАВА 5 ПРИНЦИП МАКСИМУМА И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ В этой главе мы рассмотрим связь, существующую между теорией оптимальных процессов н классическим варнационным исчислением. Будет показано, что оптимальная задача, изученная в главах $, 2, является обобщением задачи Лагранжа в вариационном исчислении и эквивалентяа ей в случае, когда область управления П является открытым множеством г-мерного векторного пространства Е,. Далее, мы покажем, что в случае о т к р ы т о г о множества У из принципа максимума следуют все основные необходимые условия, известные в вариационном исчислении (в частности, критерий Вейерштрасса). Однако в случае, когда У вЂ” з а м к н у т о е множество пространства Е„(не совпадающее со всем Е„), условие Вейерштрасса перестает действовать, т.
е. теорема о том, что для достижения минимума функционала необходимо выполнение условия Вейерштрасса, становится н е в е р н о й. Таким образом, существенное преимущество принципа максимума по сравнению с классическими теоремами вариационного исчисления состоит в том, что он применим для любого (в частности, замкнутого) множества У~Е„. Расширение класса возможных областей управления У . по сравнению с классическим случаем открытых множеств весьма существенно для технических приложений теории. Именно случай з а м к н у т о г о множества УС Е„наиболее интересен в задачах оптимального управления и, в частности, в прикладных вопросах. Например, даже простейшие задачи, приведенные в з б,не могли бы быть рас- ОСНОВНАЯ ЗАДАЧА 261 а зю смотрены методами классического вариационного исчисления, так как область управления 7У являлась замкнутым множеством и значения оптимальных управлений во всех примерах лежали н а г р а н и ц е У.
Если в любом из этих примеров мы ограничимся рассмотрением открытого множества, отбросив граничные точки области управления Ц, то классические теоремы дадут такой ответ: оптимальных управлений не существует. Это, конечно, может слуясить указанием на то, что управляющий параметр должен принимать аначения в а г р а н и ц е множества У, но такого соображения отнюдь не достаточно для решения задачи, ибо нужно знать, к а к и м о б р а з о м должен изменяться управляющий параметр на границе области У. Например, в случае линейных задач нужно знать, каково может быть число переключений, из каких вершин многогранника У в какие происходят переключения и т.
п. На зги вопросы классическая теория на может дать никакого ответа; в то же время, как мы видели на примерах, принцип максимума содержит информацию, достаточную для решения указанных вопросов. В $29 мы выведем из принципа максимума необходимые условия для основной задачи вариационного исчисления.
В з 30 мы докажем эквивалентность задачи Лагранжа и оптимальной задачи гл. 2, а также выведем из принципа максимума критерий Вейерштрасса в случае, когда область управления У представляет собой открытое множество г-мерного векторного пространства Е„. Для простоты изложения мы ограничимся рассмотрением сильных экстремумов вариационных задач. $ 29. Основная задача вариациоиного исчисления Хотя основная задача вариационного исчисления и является частным случаем задачи Лагранжа, рассматриваемой в следующем параграфе, тем не менее мы посвящаем основной задаче отдельный параграф, так как связь между принципом максимума и необходимыми условиями вариационного исчисления особенно отчетливо выступает в атом простейшем случае.
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ [гл. 5 Определения Пусть в (и + 1)-мерном пространстве ссс"+1 действительных переменных (с, хс,..., х") = (с, х) задана кривая х(1) уравнениями хс =хс(с), с = 1,..., и, Се([([1. Коли функции хс([), с =- 1,..., и, абсолютно непрерывны и имеют ограниченныв производные, т. е. во всякой точке существования производной выполнено соотношение ~(М = сопзс, с'= 1,..., и, ахс (с) то мы будем говорить, что кривая (1) абсолютно неирерыена. Далее, обозначим точни х(с ) и х(сс) соответственно через хе и хс; мы будем говорить, что кривая (1) соединяет точки (се, хо) и (сс, х,) или же что она удовлетворяет краеемлс рслоеиллс х(.) = х.
(2) Назовем 6-окрестностью абсолютно непрерывной кривой (1) множество всех абсолютно непрерывных кривых х(с) = (хс (с) ... х (С)) с ( [(1 удовлетворяющих условию (хс([) — хс®((6 при [е~[(е„с'= 1, 2,..., и. Пусть теперь 6 — некоторое открытое множество пространства В"+1 и пусть действительная функция г'(1, х',..., х", и',..., и") =~(с, х, и) определена для любой точки (с, х)~0 и любых действительных значений и',..., и".
Будем предполагать, кроме того, что функция 1 непрерывна и непрерывно диффврвнцирувма по всем аргументам. Предположим, что кривая (1) целиком лежит в области С. Тогда определен интеграл ОСНОВНАЯ ЗАДАЧА 263 а 29) Уравнения Эйлера и условие Лежандра Мы покажем сейчас, что всякая зкстремаль является оптимальной траекторией для некоторой оптимальной задачи. Рассмотрим следующую систему и-го порядка: — =и', 1=1,..., п, (4) и интегральный функционал э' = э (х, и) = ~ / (1, ж',..., з", и',..., и") Ж = н = $ ~ (е, х, и) о(е.
(5) Здесь и = (и',..., н") — управляющий параметр, который который мы будем рассматривать как функционал от Вектор-функции х(О, 1о ( Г ( тм Очевидно, что для любой кривой х(8), ео ( г ( Фы принадлежащей 6-окрестности кривой (1), функционал Х(х) также определен, если 6 ) О достаточно мало. Абсолютно непрерывную кривую (1) назовем (сильной) энстремалью для функционала (3), если существует такое 6) О, что на множестве всех кривых х(1), 1о ( 1( 1„ расположенных в 6-окрестности кривой (1) и удовлетворяющих тем же краевым условиям (2), функционал (3) принимает свое наименьшее (или наибольшее) аначение при х = х. В дальнейшем мы будем рассматривать только случай м и н и м у м а. Таким образом, кривая (1) будет называться зкстремалью функционала (3), если существует такое 6 ) О, что для любой абсолютно непрерывной кривой х(О, 1о =.
е ( 1ы принадлежащей 6-окрестности кривой (1) и удовлетворяющей краевым условиям х(1о) = х„х(1,) = х„ выполнено неравенство Х(х) ) э(х). Основная задача вариационноэо исчисления состоит в нахождении всех зкстремалей данного функционала (3) при заданных (закрепленных) краевых условиях (2). 264 ~гл. 5 Вхэихционное исчислвние выбирается в классе всех ограниченных измеримых вектор-функций. Таким образом, область управления У совпадает в данном случае со всем и-мерным пространством Е„переменных и',..., и".
Имея в виду применения к вариационному исчислению, мы определим здесь оптимальные траектории задачи (4), (5) несколько иначе, чем это было сделано в главах 1, 2. Именно, пусть пределы интегрирования в (5) фиксированы. Измеримое ограниченное управление и(~), 1е ( 1 ( 1„и соответствующую абсолютно непрерывную траекторию х(г) системы (4) с краевыми условиями (2) мы будем нааывать оптим льн ми, если существует такое 6 ) О, что, каково бы ни было управление и(1), для которого соответствующая траектория х(1) системы (4) удовлетворяет краевым условиям (2) и находится е 6-окрестности кривой х(е), выполняется неравенство Х(х, и) ти ) Х(х, и).
Иначе говоря, здесь при определении оптимальных управлений и траекторий мы будем сравнивать траекторию х(е) не с о в с е м и другими траекториями х(е), а только с траекториями, расположенными в 6-окрестности кривой х(~). Всякая траектория, оптимальная в смысле гл. 1, 2, является оптимальной и в смысле принятого здесь определения, но, вообще говоря, нв наоборот. Таким образом, оптимальных управлений и траекторий в принятом здесь смысле б о л ь ш е, чем оптимальных управлений и траекторий в смысле глав 1, 2. Нетрудно понять, однако, что принцип максимума, как н е о б х о д и м о е условие оптимальности, для оптимальных управлений и траекторий в принятом здесь смысле сохраняется е той же самой формулировке.
В самом деле, при докааательстве принципа максимума в главе 2 мы сравнивали траекторию х(1) только с траекториями вида х*(1) = х(1)+збх(1)+о(з), где з — бесконечно малая величина. При достаточно малом з траектория хе(г) лежит в 6-окрестности кривой х(г) (каково бы ни было ваданное число 6), и поэтому все рассуждения главы 2 проходят б е з и з м е н е н и й для управлений и траекторий, оптимальных в рассматриваемом здесь смысле. 265 ОСНОВНАЯ ЗАДАЧА а Зю Сформулированная оптимальная задача (4), (5) является задачей с закрепленными концами и закрепленным временем (см. э 8).
Очевидно, что всякая оптимальная траектория задачи (4), (5) является экстремалью интеграла (3) и наоборот (достаточно, в силу (4), заменить в интегИх' (~) рале (5) величины и' (() производными ( ). Поэтому принцип максимума, представляющий собой необходимое условие оптимальности, является в то же время и необходимым условием для того, чтобы кривая х (() была экстремалью интеграла (3). Это простое соображение и позволяет применять принцип максимума при решении вариационной задачи (3).
В силу теоремы 6 для решения поставленной оптимальной задачи мы должны составить уравнения для вспомогательных неизвестных фа, ф„..., ф„и функцию ай, которые, в силу (4), принимают здесь вид Я" = фа~ ((, х, и) + ф,и'+ ф,и'+... + ф„и", (6) (7) Условие максимума, указанное в теореме 6, дает ="Е' М (О, (г) г (~)) = = шах (фа/ ((, х ((), и) + '5" фа (() иа) (8) иге а=1 (почти всюду на отрезке (а ( ( ( („ ср. теорему 8). Так как область управления У совпадает со всем пространством Еа (для справедливости последующих рассуждений достаточно было бы потребовать, чтобы она была о т к р ы т ы м множеством в Е ), то точка максимума и = и (() функции Л (ф((), х((), (, и), рассматриваемой как функция переменного и~У, является ее с т а ц и он а р н о й точкой. Следовательно, из (8) вытекает, что 266 ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ (гл.