Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 17
Текст из файла (страница 17)
ь О|грег|елим теперь две (очевидно, непрерывные и неотрицательные) функции й+(р) и й-(р) действительного !ю доклзятельство пгинципя млксимтмл !гл. ! переменного р, положив: + ) р при р~)0, ( О при р)0, ~0 при р(0; т!. — р при р<0. При (р!)з+ (ра)а+ ... + (р")а ~ (1 формула а = а (р', ..., р") = ь П !! -(! — -„'К! '!) -«-'К!'!Р'!,!--'К! И.; ! ! определяет зависящий от и дейсгвигсльных чисел р'.... ..., р" символ а(р', ..., р'") (действительно, у нас имеется к о н е ч н о е число символов а, а,, а',, причем ю все коэффициенты Ь+(р), Ь (р) и 1 — — ~~~ )р'~, как ! ! легко видеть, неогрицательны.) Вектор Лх, соответствующий символу а = а(р', ..., р"), имеет, в силу леммы 2 и соотношений 1! = — е;, Ь! (р) + Ь (р) = ~р~, Ь+(р)— — Ь-(р) = р, следующий вид: ь .*.-( --'к!, ).+ ! ! л и + — '~Ь'(р')( +,)+ — „','„Ь (р!)( +и= ! ! ! ! и .!-[!+ —.'К(-И->!'И;-! И+ —,'- ! ! л И + — ~! (Ь~ (р ) — Ь (р ))е! = с+ — ~ р е!.
Следовательно, если точка (р', ..., р") пробегает в пмерном числовом пространстве единичный шар (р')'+ " - + (р")' ( 1, (ЗО) % и1 основные леммы то вектор Лх„(точнее, конец этого вектора) также пробегает и-мерный шар в пространстве Х„а именно шар 1 радиуса — г с центром в точке А, ортогональный лучу П Е. Прн тех же условиях конец вектора еЛх, (все векторы исходят нз точки х(т), т. е. из начала координат пространства Х,) пробегает пмерных шар Е. радиуса ~Ф) е —, ортогональный лучу Г.; П центр шара Е, расположен в точке А, луча 1., находящейся на расстоянии Ы от точки х(т), где с( — длина вектора с ,е, (рис.
31). Так как в нашем рассуж- 1 денни расматриваю гся лиань ! такис символы а, которые яв- А ляются линейными комбинациями (с неотрицательными коэффициентами) к о н е ч н ого числа символов а, а,, а,', Рис. 31. 1 = 1, 2, ..., и, то точки ть оь 1= 1, 2, ..., з, входящие в определение символа а = = а(р',..., р"), одинаковы для всех этих символов, т, е. не зависят от р', ..., р"; точка т также фиксирована. Числа же йь ..., 61„и й (определяющие проварьированное управление и*(1)) зависят, причем непрерывно, от р', ..., р". Поэтому мы будем писать,„",(1) и 6>, чтобы подчеркнуть зависимость величии и'(1) и 61 от р', ..., р".
Траекторию х'(1), исходящую из точки хо и соответствующую управлению и" (1), будем обозначать через х,"(1), так что соотношение (21) (в котором Во = О, нбо начальная точка совпадает с хе при всех е) даст нам х,'(т+ еб.',) = х(т)+ еЛл, + о(е). (31) Отметим, что траектория л,*(1) непрерывно зависит от параметров р', ..., р"; точно так же число й, н е и р е р ы в н о зависит от р', ..., р". Поэтому и точка к," (т+ ей,) н е и р е р ы в н о зависит от р', ...,р", а ве- 112 докхзчтгльство пгиппипи максимума (гл а личина о(в) имеет равномерно по р', ..., р" более высокий порядок малости, чем е (см. замечание на стр. !05).
Следовательно, когда точка (р', ..., р") описывает шар (30), точка (3!) пробсгаст (при лгобом фиксированном е) некоторый «диск» Г, (т. е.. непрерывный образ шара (30); этот диск можст имегь самопересечения и т. п.). С точностью до малых более высокого порядка, чем е, диск Е, «совпадает» с шаром Е, (см. (31)); точнее говоря, точки лиска г«отстоят от соответствую1цих точек шара Е, на величину болсс высох(с) кого порядка малости, чем е (равномерно для всех точек шара Е,).
Точка же цересеченш1 этого шара с линией Л (сущсствующая при достаточно малых е) отстоит от точки х(т) и от границы шара Е, па величину порядка е. Следовательно, при достаточно малом е диск Ее Ъ пересекает линию Л в пекотоС рой точке ») (рис. 32). Выберем такое в. Так как вссь диск Ее соРнс. 32. стоит из точек вида (3!), то дока- занный факт пересечения Е, с линней Л означает; существуют такие р', ..., р" (лежащие в шаре (30)), что х„(т+ ей(,) ~Л. Иначс говоря, обозначив всличины и,'(1), х„"(1), соответствующие выбранным значениям р', ..., р", через и (1), х„(() и полагая т+ еМ« = т', мы получим х»((е) = хе„х,(т') ~ Л, н лемма 3 доказана. Л е м м а 4 Если управление и(1) и соответствующая ел1у траектория х(1), 1о -1 -.11, оптимальны, то для лю- ") Факт существования такой точки пересечения представляется наглядно «очевндным»; строгое докааатсльство легко проводится элементарпымп средствами т о п о л о г и н (с помощью понятия индекса пересе«ения; см., например, В.
Г. Б олтан ск и й, Гомотопнческая теория непрерывных отображений и векторных полей, Труды Метем. института им. В. А. Стеклова, т. ХАРЧИ, !955; определение индекса пересечения «отображенных», т. е, искривленных цепей дано в п. 512 этой книги, а супгествование прн достатоню малом а точки пересечения диска ге н линии Л вытекает иэ предложения (г) на стр.
69). о и] основпыг леммы бой правильной точки т((о (т <1~) луч Ьп исходяи1ий из точки х(т) и идущий в направлении отрицателын>й полуоси хо, не принадлежит внутренности конуса К, (т. е. проходит либо вне этого конуса, либо по его границе) . Доказательств о. Допустим, что при некотором т луч й, принадлежит внутренности конуса Кп 11рпменим лемму 3, принимая за линию Л (и за луч Е) луч Т., Тогда мы получим, что существует такое управление и,(1), для которого соответствующая траектория х„(1) (исходящая из той же точки х,) проходит в некоторый момент т') 1о через точку, лежащую па луче 1, Иначе говоря, х'(т')=х'(т), 1=1, 2, ..., и; хо (т ) ( хо (т). Определим на отрезке 1о (1 =1~+ (т' — т) управление и„(1), положив и (г) при (о~~(~<т и„,(1) = и(1 — (т' — т)) при т' ( У(1, + (т' — т).
Траектория х,„(1), соответствующая управлению и„(1) и исходящая из точки хо, совпадает, очевидно, на отрезке 1о ( 1 ( т' с траекторией х,(1), так что, в частности, х' (т')=х'(с), 1=1, 2, ..., и; хо (т') ( хо(т). Далее, па отрезке т' < 1 < 1> + (т' — т) траектория х„(1) имеет вид х (1) = х (1 — (т' — т)) + р, 133) где р — постоянный вектор р = (хо (т') — хо (т), О, О, ..., О).
(Это получается непосредственной подстановкой решения (33) в уравнения (7) с учетом того факта, что правые части системы (7) не зависят от 1 и хо; вектор р определяется тем условием, что в точке т' — точке «стыка» !!4 докозттельство поинципА овхксимумА !Гл о двух кусков траектории х„„(!) — эта траектория должна быть непрерывна.) При ! = !1+ (т' — т) получаем х,. (1, + (т' — т)) = х (1,) + р. Иначе говоря, точка х,„(!!+ (т' — т)) лежит на прямой П, определенной в 5 1! (ибо век-ор р параллелен оси х'), и, кроме того, „о (! ! (, .)) о(!) ! о (.) „о(.)< .о( (см. (32)). Но это противоречит оптимальности траектории х(!) и управления и(!). Таким образом, предположение, сделанное в начале доказательства, приводит к противоречию, и лемма 4 полностью доказана. й 15.
Доказательство принципа максимума В этом параграфе мы будем предполагать, что х(!), !о ( ! = !и — оптимальная траектория (соединяющая точку хо с некоторой точкой прямой П, см. Ч !!), а и(!) — соответствующее оптимальное управление. Пусть т — некоторая правильная точка управления и(!). Согласно лемме 4, луч Е, не принадлежит внутренности конуса К„ так что этот конус не заполняет всего пространства Х, Поэтому существует опорная гиперплоскость к конусу К, в его вершине, т. е.
такая гипсрплоскость Г, что весь конус К лежит в одном из двух замкнутых полупространств, опредсляемых гнперплоскостью Г, (Гиперплоскость Г, обладающая этим свойством, может быть пе единственной; последующие рассуждения справедливы для любой такой гиперплоскостн.) Уравнение гиперплоскости Г (в пространсгве Х,) можно запил сать в виде Х аохо =О, где хо, х', ..., х" — текущие а-и координаты.
Так как умножение всех коэффициенгов и,„па одно и то же отличное от нуля число нс меняет гиперплоскости Г, то мы можем считать (изменив, если нужно, знаки всех чисел а на обратные), что конус К, лежит / н Р"С * " УГ О «(Х „~(о). с=о Иначе говоря, для любого вектора Лх, определяемого ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 1!ь формулой (22), выполнено неравенство (а, бх) ~< 0 (Лх я К,), (34) где через а обозначен вектор (агь аь ..., а„) (ибо совокупность векторов (22) и есть конус К,). Полагая в формуле (22) бг~ = б(р = ...
=б1, = О, мы получим ох = =((х(т), и(т)) б1, и, в силу (34), (а, г(х(т), и(т))б1)(0. Так как это неравенство справедливо при любых И (как положительных, так и отрицательных) „то (а, 1 (х (т), и (т))) = О, т. е., иначе говоря, ,У6(а, х(т), и(т)) =0 (351 (это соотношение выполняется, если вектор а удовлетворяет условию (34)). Обозначим через ф(1, а) =(фо (1, а), 4ь (1, а), ..., ф„(1, а)) решение системы уравнений (8) (соответствующее изучаемым оптимальным и(1) и х(1)) с начальным условием ф(т, а) =а. (36) Решение ф(1, а) определено на всем отрезке 1ь < 1 < 1ь так как система (8) линейна.
Л с м м а 5. Если вектор а удовлетворяет условию (34), то во всякой правильной точке управления и Я, лежаи(ей на полуингервале (ь < 1 < т, выполнено соотношение ,Ж (ф (1, а), х (1), и (1)) = я (ър (Т, а), х (1)). Пусть т~ — правильная точка управления и(1), расположенная на полуинтервале 1ь (1 = т, а о~ — произвольная точка области управления К Рассмотрим символ а (см. 3 14) с единственной точкой т| (т. е. з = 1) и с числами Иь И, соответсгвсино равными единице и нулю: а=(т„о„т, 1, 0). !16 докАЛАтгльство пРинципА мАксимумА )ГГ! т Тогда вектор Лх (см. (22) ), соответствующнй этому символу а, будет иметь значение Лх = А,, и [~(х(т!), о!) — 1(х(т!), и (т!))). В силу соотношений (34) н (36) получаем отсюда (Ф(т, а), А, 11 (х(т!), о!) — 7(х(т!), иИ!)))) (О, и пегому, согласно лемме 1 и соотношению А,„,, = Е (см.
(!7)) (А)г(тг„а), 7(х(т!), о,) — 1(х(т!), и(т,)))(О. Это соотношение переписывается (в силу определения функции ое) в виде 7о (4. (т„а), х(т,), о,) — Я(г)г(ти аг, х(т,), и(т,)) (О, а так как это неранено~во справедливо для любой точки о, е= с/, то мы получаем Я(!)г(ть а), х(т,),и(т,)) = гпах Ж(~, (т,, а), х(т,), о,) = и =.Х(г1(тг, аг, УИ,)), и лсмма 6 доказана. Соотношение, указанное в 'лемме 5, справедливо н при 1 = т (ибо т — правильная точка): 7о (гр(т, а), х(т), и(т)) =.Х(!)г(т, а), х(т)). Поэтому, в силу (35) н (36), мы получаем следующее утверждение. Л е м м а 6. Если вектор а удовлетворяет услоогио (34), го ЯЯ(т, а), х(т)) =О.