Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 14
Текст из файла (страница 14)
92 доклзьгвльство пгнппипь мгксимкмк ~гл, ь В (п+ 1)-мерном фазовом пространстве Х переменных хь, х', ..., х" данта точка хь = (О, хь) и прямая П, параллельная оси хь и проходящая через точку (О,х,). Среди всех допустимых управлений и = иЯ, обладающих тем свойством, что соответствующее решение х(1) системы ~ =('(х', ..., х", и), 1=0, 1, ..., п, (7) с начальным условием х(1ь) = хь пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату хь. Лля формулировки принципа максимума мы, как и в главе 1, введем в рассмотрепне спстему уравнений — — 1 = О, 1, ..., и, (8) дан т ~ д(ь (х ь) ВГ дх~ а-О для вспомогательных неизвестных фь, фь ..., ф„ и функцию ь вв (ф, х, и) = И>, г (х, и)) = )' ф,Г (х, и), с помощью которой уравнения (7) и (8) записываются в виде гамильтоновой системы ~Ь' дМ ~11 дйч ' дФс (1О) дГ дх1 Взяв произвольное управление и(1), (ь 1 < 1ь класса 0 (т.
е. допустимое) и начальное условие х(1,) = = хь, мы можем найти соответствующую (т. е. удовлетворя1ощую системе (9) ) траекторию х(1) = (хь(1), х'(1),. „.,х" (1)). Предположим, что она определена на всем отрезке 1ь(1( 1ь Тогда, подставив функции и(1) и х(1) в правые части системы (1О), мы получим линейную систему относигельно неизвестных фь, фь ..., 4, коэффициенты которой определены и непрерывны на всем отрезке 1ь (1 (ь Каждое решение Ф (1) = (фь И, Ф~ (1) - * *. 4'ь 11)) 9 и! ФОРА)УЛНРОВКА ПРИН)П)ПА МАКСПМУМА 93 этой системы (оно также определено на всем отрезке 1ь ( 1( 1)) мы будем называть решением системы (1О), соответствующим функциям и(!) и х(1), Подчеркнем, что вектор-функции х(1) и ф(1) абсолютно непрерывны (как решения систем дифференциальных уравнсний). При фиксированных (постояниых) значениях ф и х функция ав становится функцией параметра и ен П; точную верхнюю грань значений этой функции мы обозначим через 4!())),х): .Ж ()г, х) = зпр Я 1)1, х, и).
ияи Равенство, выполняющееся почти всюду, мы будем указывать знаком (=). Иначе говоря, если )р)(1) и ц)з(1) — две функции переменного 1, опрсдслспиые яа отрезке (и ( 1 < 1ь то запись )9! (1) (=) ч. (1) будет означать, что функции )р, и )рг почти всюду совпадают. Цель настоящей главы сос гонт в доказательстве принципа миксимума (теорема 8) и условий трансверсальности. Т е о р е м а 8. Пусть и Я, 1ь < 1 ( 1ь — такое допустимое управление, что соответствующая еми траектория х(1) (см. (9)), исходящая в момент 1ь из точки хь, определена на всем отрезке 1, ~ 1 < 1, и проходит в момент 1) через некоторую точку прямой П.
Для оптимальности управления и(1) и траектории х(1) необходимо существование такои ненулевой абсолютно непрерывной вектор функции ф(1) =(фь(1),ф)(1),...,))) (1)), соответствующей функциям и(1) и х(1) (см. (1О)), что: 1' функция,"йв ()р(1), х(1), и) переменного и ~ П почти всюду на отрезке 1ь "1 - 1) достигает в точке и = и(1) максимума Я (ф (1), х (1), и (1)) (=) й) ())) (1), х (1)); 2' в конечный мол)ент 1, вь)полнены соотношения )Ри(Х))(0, ий(ф(11), х(!)))=О. (12) 94 доккзлтальство пгипцшгк млксим«мх !гл е Оказывается„далее, что если величины зр(!), х(!), и(!) удовлетворяют системе (9), (10), и условию 1', то функции фь(!) и .ФЕ(зр(!),х(!)) переменного ! являются постоянными, гак что проверку соотношений (!2) можно проводить не обязательно в момент !и а в любой момент 1, то~!(6ь Теорема 8 почти дословно совпадает с теоремой 1, сформулированной в первой главе.
Различие заключается в том, что теорема 8 справедлива для л ю бог о класса 0 допустимых управлений, в то время как теорема 1 относится лишь к классу кусочно-непрерывных управлений. Далее, условие максимума (11) выполняется лишь п о ч т и в с ю д у, в то время как в теореме! оно выполнялось всюду (см. равенство (16) гл. 1). Нетрудно понять, что теорема 1 вытекает нз теоремы 8. В самом деле, применим теорему 8 к случаю, когда класс О совпадает с классом всех кусочно-непрерывных управлений. Обозначим через У множество тех точек отрезка 1е( ! ( !ь в которых выполняется условие максимума (11). Иначе говоря, если ! ен У, то М(~)((), х(1), и(!))' вЯ(ф(!), х(!), о) (13) для любой точки о ~ У. Так как множество )У имеет на отрезке !ь < ! < 1~ полную меру и так как управление и(!) принадлежит классу П, т. е.
непрерывно в концах отрезка !ь ( ! ~ й н непрерывно ел е в а в любой точке разрыва (см. соглашение о значениях в точках разрыва, стр. 15),то для любой точки т отрезка !ь ( 1( 1, существует такая последовательность точек ть тм ..., тж ... множества У, сходящаяся к т, что !пп и(ть) = и(т). В силу (13) мы имеем М(Ф(ть), «(т„), и(т~)))М($(т~), «(т„), о), оыУ. Далее, так как Я вЂ” непрерывная функция своих аргументов $, х, и и так как функции 4)(1), х(1) непрерывны, то 11гп у8(4((т«), «(ть), о)=ЖЦ(т), «(т), о); А.+ ао 95 системА уРАйнениЙ В ВАРиАциях точно так же 1!ш Я(4 (ТА), х(ТА), и(ТА)) =Ж(1! (Т), х(т), и(т)) (ибо 1нп и!Та) =и(т)). Сопоставляя последние три соот- ношения, мы находим Ж(ф(т), х(т), и(т)) ) ЯЯ(т), х(т), о) (для любого элемента о ее (/), т.
е. Итак, условие максимума выполнено в л ю б о й точке т отрезка ГВ ( ! < !ь Тем самым теорема 1 доказана (в предположении, что справедлива теорема 8). Доказательству тсоремы 8 посвящены следующие четыре параграфа. 9 12. Система уравнений в вариациях и сопряженная ей система В приводимых ниже доказательствах часто буде| встречаться положительный параметр В, который мы будем считать величиной первого порядка малости. Величины, как векторные, так и скалярные, имеюшис более высокий порядок малости (по В), мы будем обозначать о (е! символом о(В) (т. е.
1пп — = О). При этом даже для е-+О обозначения различных величии более высокого порядка малости, чем В, мы будем применять один н тот же символ о(е) (так что, например, о(е)+ о(В) = о(е)). Пусть и(!) — произвольное допустимое управление, заданное при !а (1( !ь а х(!) = (х'(!),х'(1),... ..., х" (1) ) = (ха(!), х(!) ) — соответствующее этому управлению решение системы (7) с начальным условием х(1,) = хм Обозначим через у(1) решение, соответствующее тому же управлению и(1) и исходящее (в тот же момент 1В) из близкой к х, точки (14) (гэ = хо + Вьс + о (В) 96 докхзательство пгинпипл млкснмии (гл. т где Ко — постоянный (т. е. не зависящий ог параметра е) вектор пространства Х. Решение у(() имеет вид у(г) = х(()+ ебх(()+ о (е), (15) где бх(() =(бхо((),бх'((),...,бх" (1)) — не зависяший оз е вектор, определяемый следующей системой у р а в н еннй в вариациях: И(бх) ~ д)'(х(О, о(О) б о 1 О ! и (16) при начальном условии бх ((о) = Фо.
(Суммирование в правой части соотношения (16) можно было бы производить от 1 до а, так как функции ['(х, и) не зависят от х'.) 3 а меча ние 1. Величина о(е) в формуле (15) зависит, конечно, и от (, т. е. имеет вид о(е, (). Однако оиа р а в н о м е р н о по ( имеет более высокий порядок малости, чем е, т. е. дробь — — ' равномерно по (~[(о, Я о(е,О е стремится к нулю при е-э О, 3 а м е ч а н н е 2. Предположим, что величины ~о и о(е) в формуле (14) непрерывно зависят от параметра т, изменяющегося в ком пакт ном множестве й( (т. е.
имеют вид Ко(т), о(е, т)) и, кроме того, величина о(е, т) имеет р а вн о мер и о по т ~ У более высокий порядок о(е, т) малости, чем е (т. е. дробь — ' равномерно по те=))( е стремится к нулю при е- 0). Тогда формула (15) остается справедливой, причем бх(() зависит теперь и от параметра т е= й(, а величина о(е), зависящая теперь и от т, т.
е. имеюшая вид о(е, (, т), имеет р а в номер но по те=)т', (ни[(о, Я более высокий порядок малости, чем о(е, (, т) е (т. е. ' ' — 0 равномерно по (, т при е-эО). Уравнения (16) позволяют каждому вектору = бх((о) поставить в соответствие семейство векторов $~ — — бх(() (для (, больших чем Го). Мы условимся считать ~~ — — бх(() с вяза иным вектором, исходящим из точки х((), Таким образом, каждый вектор йо, заданный система хглвненин В ВАгилцийх в точке хм определяет векторное поле ДД, заданное вдоль траектории х(1). Мы будем говорить, что векторы этого поля получаются из начального вектора $э переносом вдоль траектории х(1). Обозначим через Х, вскторпое пространство, получающееся нз Х переносом начала координат в точку х(1), т.
е. пространство связанных векторов„исходящих из точки х(1). Вектор $, = бх(Е) является элементом этого просгранства Хь Обозначим, далее, через Ао и преобразование пространства Хв на пространство Хь переводящее каждый вектор эв пространства Хч в вектор $, пространства Хо получающийся из $э переносом вдоль траектории х(1). Так как система (16) лннейна и однородна, то преобразование Ась линсйпо н невырогкденпо. Кроме того, оно, очевидно, однородно, т.
е. переводит начало координат пространства Х;, в начало координат пространства Хь Рассмотрев вместо 1а и 1 любые другие моменты времени 1', 1" (взятые на отрезке, па котором определены н управление и(1) и решение х(1)), мы аналогичным образом определим линейное невырожденнос однородное прсобразованис Лм,~ пространства Х~ на пространство Хгч Очевидно, что эти линейные преобразования обладают следующими свойствами (Š— тождественное преобразование): Л.; ~ = Е; Лн . и ° Агч н = А-, ~ . Согласно определению прсобразовапийЛ~ ве векторы Аь н (Ц) образуют семейство векторов, получающихся из Ва переносом вдоль траектории х(1), и потому удовлетворяют системе (16): н (, ~ ч э1 (х(аи(г)) (18) 1=0, 1,...,и.