Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 14
Текст из файла (страница 14)
Подчеркнем, что вектор-функции х (1) и ф (е) абсолютно непрерывны (как решения систем дифференциальных уравнений). При фиксированных (постоянных) значениях ф и х функция аЗ становится функцией параметра и ~ У; точную верхнюю грань значений этой функции мы обозначим через М (ф х): Ф(ф, х) = зпр ай" (ф, х, и). ие о Равенство, выполняющееся почти всюду, мы будем указывать знаком (=). Иначе говоря, если уг (1) и ф, (Е) — две функции переменного 1, определенные на отрезке Ее(Е = 1ю то запись р,(1)(=) р,(е) г ! !! ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 9$ Т е о р е м а 8.
Пусть и (1), гз (1 11,— такоедопустил,ое управление, что соответствующе ему траектория (г) (см. (9)), исходящая в момент Сз из точки хз, опред~лена на всем отрезке 11 ( 1 ( С, и проходит в момент 1, через некоторую точку прямой Н. Для оптимальности управления и (1) и траектории х (1) необходимо сущеапвование такой ненулевой абсолюпьно непрерывной вектор-функции чр(1) = (1уг (1), $1 (1), ..., 1р„(1)), соответствующей функциям и (с) и х (8) (см. (10)), что: 1' функция ЫХ (чу (г), х(Е), и) переменного и (: 0 почти всюду на отрезке 4з -.1 ( 11 достигает в точке и = и (1) максимума ~2( (у(1), х(й), ™(1))(=)М(1р(1), х(1)); (11) 2' в конечный момент 11 выполнены соотношения 1рз(с,) ( О, лу(чр(1), х(11)) =О. (12) Оказывается, далее, что если величины 1Р (1), х (Ю), и (1) удовлепворяют системе (9), (10) и условию 1, то функции ф> (1) и и (чу (1), х (1)) переменного 1 являются постоянными, так что проверку соотношений (12) можно проводить не обязательно в момент с„а в любой момент 1, 10(г(г1.
Теорема 8 почти дословно совпадает с теоремой 1, сформулированной в первой главе. различие заключается в том, что теорема 8 справедлива для любо го класса Р допустимых управлений, в то время как теорема 1 относится лишь к классу кусочно-непрерывных управлений. Далее, условие максимума (11) выполняется лишь и о ч т и в с ю д у, в то время как в теореме 1 оно выполнялось всюду (см. равенство (16) гл.
1). Нетрудно понять, что теорема 1 вытекает из теоремы 8. В самом деле, применим теорему 8 к случаю, когда класс П совпадает с классом всех кусочно-непрерывных управлений. Обозначим через Х множество тех точек отрезка 1з ( 1 ( г„в которых выполняется условие максимума (11). Иначе говоря, если 1 ~ 11', то е2!" (1р(1), Х(1), и(С))- еЛ1" (чр(1), Х(1), О) (13) для любой точки о ~ П. Так как множество )т' имеет на отрезке го ~ 1( 11 полную меру и так как управление 92 докАЗАтвльство пРинципА ИАксимумА [гл.
3 и (8) принадлежит классу 11, т. е. непрерывно в концах отрезка гз ( ~ ( г, и непрерывно с л е в а в любой точке разрыва (см. соглашение о значениях в точках разрыва, стр. 15), то для любой точки т отрезка ~, ( г ( ~, существует такая последовательность точек т„т„..., т„, множества Ф, сходящаяся к т, что 11ш и (тд) = и (т). В силу (13) мы имеем а% (ф(ть), х(т„), и(т„)))ей (ф(та), х(т„), Р), Р(- У. Далее, так как аЯ" — непрерывная функция своих аргументов ф, х, и и так как функции ф (~), я (~) непрерывны, то 1пп Й" (ф(т„), х(т„), Р)= Я (ф(т), х(т), Р); а со точно так же 11ш У2" (ф(тд), х(ть), и(та)) = Я" (ф (т), х(т), и (т)) (ибо Иш и (ть) = и (т)).
Сопоставляя последние три соотношения, мы находим Л" (ф(т), х(т), и(т)) )РЯ" (ф(т), х(т), Р) (для любого элемента Р ~ 0), т. е. ЛГ(ф(т), х(т), и(т)) = Ф(тр(т), х(т)). Итак, условие максимума выполнено в л ю б о й точке т отрезка ~, ( г ( 1,. Тем самым теорема 1 доказана (в предположении, что справедлива теорема 8). Доказательству теоремы 8 посвящены следующие четыре параграфа.
9 12. Система уравнений в вариациях и сопряженная ей система В приводимых ниже доказательствах часто будет встречаться положительный параметр е, который мы будем считать величиной первого порядка малости. Величины, как векторные, так и скалярные, имеющие более высокий порядок малости (по е), мы будем обозначать символом о (е) о (Р) ( т.
е. 11ш — =0). При этом даже для обозначения в систвмА уРАВнвнии В ВАРиАциях 93 в с21 р а в л и ч н ы х величин более высокого порядка малости,чем в,мы будем применять о д и н и тот же символ о (е) (так что, например, о (в) + о (в) = о (е)). Пусть и (С) — произвольное допустимое управление, заданное при(о ( Ф ~ С„ах(С) = (хо(С), х (С), ...,х" (2)) = (х' (2), х (с)) — соответствующее этому управлению решение системы (7) с начальным условием х (Со) = хо. Обозначим через у (2) решение, соответствующее тому же управлению и (2) и исходящее (в тот же момент со) яз близкой к хо точки (14) уо = хо+ воз + о (в) где 9о — постоянный (т.
е. не зависящий от параметра в) вектор пространства Х. Решение у (2) имеет вид у (2) = х (2) + вбх (2) + о (в), (15) где бх (2) = (бхо (2), бх' (С), ..., бх" (С)) — не зависящий от в вектор, определяемый следующей системой у р а в н ений в вариациях: о о (бх ) ~С дС (х(С), и (С)) б дс д а=о при начальном условии бх (2,) = ф,. (Суммирование в правой части соотношения (16) можно было бы производить от 1 до п, так как функции 7с (х, и) не зависят от х'.) 3 а м е ч а н и е 1. Величина о (е) в формуле (15) зависит, конечно, и от с, т. е.
имеет вид о (в, с). Однако она р а в н о м е р н о по с имеет более высокий порядок малости, чем е, т. е. дробь ' равномерно по 2 (: [со, Сс] о(в, с) в стремится к нулю при в с. О. 3 а м е ч а н и е 2. Предположим, что величины и о (в) в формуле (14) непрерывно зависят от параметра т, изменяющегося в к о м и а к т н о м множестве со' (т. е. имеют вид $о (У), о (в, т)) и, кРоме того, величина о (в, т) ~гл, з ' 04 докАЭАтРльство пРинципА мАксимумА имеет р а в н о м е р н о по т ~ Л~ более высокий порядок.
о (е, т) малости, чем е (т. е. дробь ' равномерно по У ~: )у ' стремится к нулю при е — э О). Тогда формула (15) остается справедливой, причем бх (г) зависит теперь и от па раметра у ~ Л', а величина о (е), зависящая теперь и от у, т.е. имеющая видо(е, ~, У), имеет равномерно по у (- )т', 1 ~ (г„~,) более высокий порядок малости, чем е (т. е. (' ' -э0 равномерно по г, у при е -+ О). е Уравнения (16) позволяют каждому вектору $, = бл (84) поставить в соответствие семейство векторов $, = бл (8) (для г, больших чем ~,). Мы условимся считать $, = Ьх (1) с в я э а н н ы м вектором, исходящим иэ точки х (1).
Таким образом, каждый вектор $ю заданный в точке лю определяет векторное поле Я,), заданное вдоль траектории л (8). Мы будем говорить, что векторы этого поля получаются из начального вектора Ц переносом вдоль траектории л (1). Обозначим через Х, векторное пространство, получающееся из Х переносом начала координат в точку л (8), т. е. пространство связанных векторов, исходящих иэ точки х(~). Вектор $, = Ьл (1) является элементом этого пространства Х,. Обозначим, далее, через А, и преобрааование пространства Хп на пространство Х„переводящее каждый вектор $4 пространства Хь в вектор й, пространства Х, получающийся из $4 переносом вдоль траектории х (1). Так как система (16) линейна и однородна, то преобразование А...
линейно и невырожденно. Кроме того, оно, очевидно, однородно, т. е. переводит начало координат пространства Хи в начало координат пространства Хг Рассмотрев вместо 44 и г любые другие моменты времени 1', 1" (взятые на отрезке, на котором определены и управление и (г) и решение х(О), мы аналогичным образом определим линейное невырожденное однородное преобразование А,, ~ пространства Х, на пространство Х1 . Очевидно, что эти линейные преобразования обладают следующими свойствами (Š— тождественное преобразование): Аг,~ =Е; Аг .г Аг,ю =Аг,у. (17) СИСТЕМА УРАВНЕНИИ В ВАРИАЦИЯХ О сс) Согласно определенисо преобрааований Ас с,, векторы А,, (~О) обраауют семейство векторов, получающихся иа и 'переносом вдоль траектории х (с), и потому удовле- ЬО ~~воряют системе (16): и -'с [А (З ))с= г' ~Р ( (с)' (с)) [А ($ И и л,в деи е О 2=0, 1, ...,и.
(18) Сравним теперь системы (16) и (8). Эти системы линейны и однородны, а матрицы их имеют соответственно вид: дг (е(с), и (с)) ) ( д/ (е(с), "(с)) ) (' ' ) ~- дев ! ~ дхс Иначе говоря, эти матрицы получаются друг из друга транспонированием и переменой знака, т. е. системы (16) и (8) — сопряженные. Заметим, что системы (8) и (16) мы можем рассматривать лишь в том случае, если выбрано управление и (с), со ( с ~ с„и соответствующая ей траектория х (с) (т.
е. решение системы (7)), ибо функции и (с) и х (с) входят в правые части систем (8) и (16). При этом, в силу линейности систем (8) и (16), решения этих систем мы можем рассматривать иа всем отрезке с ~ с ( с„ если решение х (с) определено на всем этом отреаке. Из сопряженности систем (8) и (16) вытекает, что зели Ор (с) = (с[со (с), с)сс (с), ..., 2)с„(с)) — произвольное решение системы (8), а бх (с) = (бхв (с), бх' (с), ..., 6х" (с))— произвольное решение системы (16), то скалярное произ- ведение п (Ч (с), 6 И)) = ч'„р.
(~) 6' (с) а=О постоянно на всем отрезке св ( с = с,. В самом деле, далее, решение (15) переписывается, очевидно, следующим обрааом: 27(С) — х(С) = ЕАс, с,(ЗО)+о(е) = = Ас.с. Ь (ЮО) — х(СО)) + о (е). (19) а гг1 ВАРИАЦИИ УПРАВЛЕНИЙ И ТРАЕКТОРИЙ 97 9 (3. Вариации управлений и траекторий Пусть и (г) — некоторое допустимое управление, определенное на отреаке го ( ~ < з,. Выберем некоторые моменты времени т„ т„ ..., т„ т, удовлетворяющие неравенствам го ( т, ~ т, ( ... (т, < т ( Г, и является правильными точками для управления и (з).