Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 47
Текст из файла (страница 47)
Докажем теперь формулу (30) для полуинтервала у ~ тва1а ункция (23) имеет на полуинтервале тв ( г ( тв, вид Р(1) = и(8)+зби(1)+о(з), где (32) Ьи(1) = (ЬИ1(1),..., Ьиа+1(й), О,..., 0), так как „вав(У) па+1(1),..., ьв(1) =,а(У). Следовательно, умножая равенство (31) на Ьиа и сум- мируя получающиеся соотношения по а = 1, 2,..., з+1, получим: в+1 а а1В1 в = — +ЛУ вЂ” + "~Р1в — ")ЬИ=О, у=О, 1,..., и. (ЗЗ) % 2 В-1 Определив вектор-функции АЗ (1) равенствами ~В (У) = (Ув (У), ", Уз (У)), ~ = 1, " , , перепишем равенства (33) в виде в ( ~+Л(1) ЬР+Хйв® аз)ЬИ(1) 0 (34 В=1 В силу (26) функция и (1) = и (1) + еби (1) + о(е) удов- летворяет равенствам (а = 1,..., з): о,(Р(1), 1) = о (и(1)+еби(1)+о(е), й) = =ов(и(й), 1)+е ( ( ()', Ьи(1))+ о(з) =О.
305 з 33) доказатвльство ТБОРкмы 22 Но мы имеем: о (и (С), с) = асс(и(С)) — уа(и(С)) =О, дв„(и (с), с) два (и (с)) дв ди следовательно, дев(~ (с)) би(с))н 9 а = 4 е (' .".' и соотношение (34) сводится к равенству — +Л() —,)б (с)=(), ~,(~ (.—. дг" др) которое и является доказываемым равенством (30). Подставив выраясения (23), (24) в систему (21) и приравняв члены при е, получим: в',б, дг" (е (с), и Я) дг" (е (с), а (с)) дг(е(') "(с)) б +~И*(с) "(')) би+дн(*(с) "(') 0)б =0 Умножив, далее, второе уравнение на Л (с) и сложив его с первым, получим, если учесть равенство (30), следующее соотношение: 'С (б ) (дг(е(С) а(С)) дг(е(С),и(С))) Е х= де (с) дй (е(с), (с), О) б (35) д„ Полученное линейное неоднородное уравнение относительно бх (с) мы назовем уравнением в вариациях для системы (21).
Оно зависит только от самой системы (2Ц, и, следовательно, главная часть приращения бх (с) траектории у (С) однозначно определяется начальным значением бхс и значением параметра бр. По аналогии со сказанным в гл. 2 (стр. 94) мы будем говорить, что векторы бх (с) получаются переносом вектора бх (9) = бхе, заданного в точке х (0), вдоль 30З пРОцессы пРи ОГРАниченных кООРдинАТАх ~гл, в траектории х (»),и введем для операции переноса, завися- щей от параметра бр, обозначение бх (») = Рсв (бр) бхв ° Следующие формулы очевидны: (б)в) б = Рс,(б(в) Р, (б)в) б, д, Рс в (уб)в)убх =уРЦ в (б(в) бх, Рв в (б)вв+ б)вв)(бхд+ бхв) =РК в (б)вв) бхв+ Рс в(б(вв)бх . (36) д(х(»)+ ебх(»)+о(е)) = О и, следовательно, (дд(хО)) б (»)) = О, (37) т.
е. бх (»)~Т (х (»)). В частности, всегда бх (»в) б Т (х (» )) При б)в = О уравнение (35) превращается в однородное уравнение д (дУ(х (в), и (в)) ди (х (в), и (в)) ) дх Наряду с этим уравнением рассмотрим сопряженное с ним уравнение дф дУ( (в), и(в)) +А (») др(х(в), (в)) ) вр, (33) дв ~ дх дх Обозначим через границы д (х) = О в лежит объединению определении символа Т (х (»)) касательную плоскость точке х (»). Если х (») не принадокрестностей 0»н участвующих в (17), то, как уже отмечалось, О зз1 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 22 307 Во иабежание недоразумений запишем уравнения (38), (39) покоординатно в виде двух систем (и+ 1)-го порядка: е (бтв) = ~„(е — + Лв д а) бхай =О а=з в = О, 1,..., л.
Если бл (2), вр (2), зв~з(2„— произвольные непрерывные решения уравнений (38), (39) соответственно, то (ОР(1), 6ю(2)) = сопзз (40) (ср. стр. 95). Фундаментальную систему решений уравнения (38) обозначим через ВРО (З)~ ~ ВРа (З) а сопряженную с ней систему решений уравнения (39)— через ОРО (2) тьа (2) Имеем: (рв (2), в (2)) = 61 Ь(Е,) = ~ вр„(В,)62а(В,), а=з запишется в виде 6 (з)=Р1,2 (6р)6 (0,) = и =~~евра(2)(бх (Е,)+ ~ (р (т), Л(т) д-бр,)сзт) (41) а=з в, Решение бм (з), 0,(2(02, 2,(0, ( 0,(11, неоднородного уравнения (35), удовлетворяющее начальному условию 808 ПРОЦЕССЫ ПРИ ОГРАНИЧЕННЫХ КООРДИНАТАХ [ГЛ.
В Вычисление производной д[в Нам понадобится явный вид этой производной, поэтому займемся адесь ее вычислением. Имеем: в й(х, [в) = 8(х+[[ ) ', иа(х) и[а) = а 1 ии (хв [ [в ~~ и (х) вввтю хи [ [1 ~~ и (х) вввви) а=1 где )т[ = (1[[01, ..., Л[и). Введем обозначения: 1[' = Х'+ [В ~ ~ а (Х) М, 1 = Ои . и и; Ч= (0[0 ., 1[и). а=1 Тогда 0 дв' Ъ~ ~~~[[ да (Ч) (а(х и) + [В ~[~ ~~~[~ да (в[) да[ (х) Л[авд (х и) а=з а, З-0 в=1 в =("'"' х(х, и))+[ ~( ""' )ув) (;.' ', х(х, и)). 1=1 Следовательно, и в '"(*,"') =( '[~ Д~~"~ ( (х, и) ~~ ц(х)~Ч~) ~ + а, З=В 1=1 + ~Чв[ (дд (ж) ) (да[(ж) .( ) в=1 в и ав(х) ~~( ), ~а(~, и)М)[+ в=[ а, В=О вдо пРОцвссы пРи ОГРлниченных НООРдинАГАх ~гл, е Таким образом, мы построим класс Ф еарьироеанных решений и* (Г), х* (1) системы (21) — еариаиий решения и (д), х (д), де -е(~д, системы (21) при 6(д = О.
Строго говоря, каждый элемент (и* (~), х* (~)) множества Ф будет являться не одним решением системы (21), а целым семейством решений, зависящих от положительного бесконечно малого параметра з. Тем не менее мы для удобства часто будем говорить о варьированном решении (и* (1), х~ (д))(-Ф, а также о вариации и* (д) управления и (д) или вариации х* (д) траектории х (д), составляющих данное решение и* (~), х* (~) системы (21). Отметим здесь же, что множество Ф будет состоять из варьированиых решений не одной какой-нибудь конкретной системы (21), а из варьированных решений всех систем вида (21), зависящих от выбора функции В (т. е.
символа (17)). Однако каждый данный элемент (и* (д), х* (д))д--Ф будет являться семейством решений одной и той же системы вида (21). Варьированное управление строилось в гл. 2 заданием его параметров (см. определение символа и на стр. 104). Точно так же и теперь каждое варьированное решение ие (г), х* (г) системы (21) (точнее, семейство варьированных решений) будет строиться при помощи задания параметров этого решения. Поэтому мы определим сначала п а р а м е т р ы варьированного решения, а затем опишем способ построения самого решения по заданным параметрам.
Эти параметры естественно разбить на две группы: параметры строящегося управления и* (д) и параметры строящейся траектории хе (~). Обозначения т„..., тд', й„..., бдд; дд,..., да; Р„..., Рл; т, бд будут иметь здесь тот же смысл, что и в э 13. Так как управление и (г) кусочно-непрерывно, то т„..., т — точки непрерывности управления и (д). Точку т мы всюду в дальнейшем будем считать совпадающей с концевой точкой 1д отрезка 1е =е(ед (это возможно, так как управление и (г) непрерывно в точке ~д).
Далее, в качестве Р„..., Р мы разрешим брать только такие точки области управления 6Г, что для любого д = 1,..., й точка х(т,.) траекториих(~) регулярна относительно точки Рд Совокупность параметров то бго РО бд, 2 Зз) ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 22 (44) Иа = И,1 2 (2), ха = х,*, 2 (С). (45) Начальное значение ха (2,) траектории ха (2) определим формулой ха (2~) = х (22) + ебха, (46) где бха = б)2 ~'.> иа(х(22)))па. (47) а=1 Из (46) следует, что при достаточно малом з имеют место соотношения аз(х(2а)) = а2(ха(то)) 1= 1 " з (48) причем (при достаточно малом е) а, (х* (22)) = а~ (х (22)) = 0 при ~~ ч- 'х (2а), а;(ха(22)) = аз(х(2а)) = 1 пРи Зз = х(22).
входящих в определение варьированного управления иа(2), мы будем, как и в гл. 2, обозначать символом з. Однако варьированное управление и* (2), соответствующее символу а, мы определим не так, как в гл. 2 (см. стр. 98), а несколько иначе, проводя его построение одновременно с построением соответствующей варьированной траектории ха (2). Это объясняется тем, что при определении варьированного управления по способу, принятому в гл. 2, соответствующая варьированная траектория может на отрезках Х, выйти за пределы области С. В качестве параметров строящейся варьированной траектории х* (2) мы примем величины, входящие в символ 5 (см. (17)).
Переходим к построению решения и* (2), х* (2) системы (21), определяемого символами а, б. Это решение будет определено на отрезке 2а(2(22+ 262. Чтобы подчеркнуть зависимость решения и" (2), х* (2) от выбора символов з, 5, мы будем обозначать функции и*, х*, когда потребуется, соответственно через 312 ПРОЦБССЫ ПРН ОГРАНИЧКННЫХ КООРДИНАТАХ [ГЛ. О Из (47) и (48) мы получаем: й(х Ио)~ еб)о) = 6'(хааа)+ебхо+ еб(А,~ ~па (х (~о)) аа) = аьи = д (х (~о)) = О. (49) Из способа построения траектории (45) будет непосредственно следовать, что при е — ~ 0 траектория х* (1) равномерно по с стремится к х (~) на отрезке 8о(г~~м Поэтому из (49) следует, что х* (~) целиком лежит в замкнутой области 6 (см.
стр. 299). Как и в гл. 2 (ср. стр. 98), мы записываем полуинтервал 1; неравенствами т, + е(о ( ~ ~ т, + з ((о + й,). По заданному начальному значению (46) построим теперь на отрезке ~о(~(т, + е1, (т. е. от начальной точки го до левого конца полуинтервала 1,) при помощи конструкции, описанной на стр. 300 — 302, решение системы (21) вида (23), (24) и положим функции (44), (45) равными этому решению на отрезке ~о(8=тг + е1м Таким образом, па (~) = и (8) + эби (~) + о (е), ха(й) =х(г)+ебх(й)+о(е), Г,(й(т,+е(Р Следовательно, при 1о ( 1 = тг + э1г функция бх(о) является решением уравнения в вариациях (35): бх (о) = Рь и (бр) бх (оо) Мы продолжим теперь решение ио (~), х* (г) с сохранением непрерывности функции х* (1) на полуинтервал 1г (предполагая, что он не является пустым, т.
е. 6~г ~ 0) при помощи следующей конструкции. Точка х (тг) по условию регулярна относительно Р,. Обозначим через дд (Р),..., д, (Р), а~О, функции ($) для точки Р,. Тогда мы имеем (обозначая через В функцию Вы где б — символ, входящий в определение строящегося варьированного решения): В(х(т1), и, 0) = д1(Р1) =... = д,(Р,) = О, 2 333 ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 22 З2З и система В (у, Р, еб(2) = дв (г) =... = д, (г) = 0 (50) разрешима относительно некоторых 2 + 1 координат вектора Р вблизи значений х (т,), Р„зб)2 = О, например, относительно первых 2+ 1 координат: Р1 01 (у Рв+2 Рг зб)2) 1=1,..., 2+1, 1~3+1~г, где функции 61, 1 = 1,..., г + 1, непрерывно дифференцируемы по всем аргументам. Очевидно, аргумент у в функциях 61 может принимать аначение ха (т,), так как при е -э 0 полуинтервал Хв стягивается к точке т1 и хз(т,+е1,) = х(т1+е(1)+ебх(т,+е(1)+о(з)-гх(т,).