Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 49
Текст из файла (страница 49)
Д о к а з а т е л ь с т в о. На основании леммы 1 через вершину х ((1) конуса к*~:.Т (х ((г)) можно провести (и — 1)- мерную плоскость Г, лежащую в Т (х (~,)) и отделяющую конус й* от луча Х,. Обозначим через Х = ()(г, )(„..., )(„) лежащий в плоскости Т (х ((г)) вектор, ортогональный к плоскости Г и направленный таким образом, что луч Ь лежит в том замкнутом полупространстве, определяемом плоскостью Г, в которое направлен вектор )(, а конус й* — в другом замкнутом полупространстве. Тогда )(о(0 и для любого вектора Ьх*~й* выполнено соотношение (т,, Лхх) =О. (60) 2 20 докАзАтельство теогемы 22 (ОкончАниед 319 Далее, так как вектор )( лежит в плоскости Т (х (сд)), то векторы )( и бган д(х(2~)) (61) линейно независимы. Определим искомую функцию др (2) как решение уравнения (57) с конечным значением дг (дд) =)( (62) Легко видеть, что равенство (58) выполняется.
В самом деле, пусть в некоторой точке непрерывности т, управления и (г) выполнено неравенство Я (др(тд), х(т,), и(тд))(вд(др(тд), х(т,)), т. е. сУЩествУет такаЯ точка Рд~сГ, относительно кото- рой точка х (тд) регулярна, что РУ9" (др(т,), х(тд), Рд)) Я (д(д(т,), х(тд), и(тд)). (63) Построим решение ие (2), х* (Г), Г,(д =д„системы (21), взЯв в качестве символа а символ (тд, Р„62д = 1, 62 = 01 и в качестве б символ, в котором г = 0 (т. в. ~о а, (х), Юд отсутствуют) и бр = О.
Иа (53) следует, что в этом случае Ах* =РЧ .. (0) (У'(х(тд), Рд) — ~(х(тд), и (т,))). Поэтому формулы (40), (63) дают ()(, Лх~) =(дР(сд), Ра и(0)(~(х(тд), Рд) — д(х(тд), и(т,))) = =(ду(тд), д (х(тд), Рд) — )д(х(тд), и(т,))))0, что противоречит неравенству (60). Доказательство равенства (59) и условия а) совпадает с доказательством соответствующих формул (12) гл. 2.
Условие б) следует из независимости векторов (61) и равенства (62) (см. замечание 4 к теореме 22). Докажем, наконец, условие в). Пусть и* (г), х* (2), Са(2=-2д, — решение системы (21), соответствующее пустому символу а (т. е. символу, для которого й = 0 и бд = 0) и некоторому символу 9, не со- деРжаЩемУ точки х (Га) в качестве одной из точек 9, 32о пРОцкссы пРи ОГРАничннных кООРдинАтАх [Гл.
8 Из формул (53), (41) следует, что в этом случае Лх*=рс.с,(МО=брХ р.(ес) $(Ф" В А(сИ вЂ” '," а. а=э Формулы (62), (60) дают а с' св. в**с-вв2(вщ, в.св с1св свс, лсвсс в"„вв~= а 0 с, с, =6~$(р(с),Лр)) — '" (с= — б~ 1 Лр) — ,'" (с О, др = д др Св св так как Л (О = — (вр (~), Л (~)) и, в силу двойственности систем функций (срс,..., ср„), (срс, ..., ф"), имеем Х(ф(сс). т. (сс)) Ф (с) =ф(с) в 1 Л(с) — „", У,~..( ())(а';В, П')),ал==О.
с, а 1 Интегрируя по частям и принимая во внимание равенства ас (х (га)) = ас (х (~,)) = О, с = 1,..., г, получимс в $ ~~ ~~ „( (ю))(~л( (с)), Лг„)а~О. с, а=с (64) Так как точки ьс можно выбирать на траектории х (с) произвольно (лишь бы онн не совпадали с ее концами) и так как, далее, окрестности Осс сколь угодно малы, функции а, (х (~)) неотрицательны и сссс — внешние векторы (по отношению к области 6), то из неравенства (64) следует неравенство д~Л (О.
дЛ Подставив в последнее неравенство выражение для— дсв из (42) и учитывая, что 6)с~О, получим: 9 щ докАЗАткльство творимы 22 (Окончании) 321 Зто неравенство и выражает условие в), так как область сс задается вблизи границы неравенством я (х) =. 0 и, следовательно, прайа(х (с)) — внешняя нормаль к границе д(х) = О. Для завершения д о к а з а т е л ь с т в а т е о р е и ы 22 надо, во-первых, доказать, что скалярная функция Х (С) = — (ср (С), Л (С)) удовлетворяет соотношению с диЯ" (с(с(С), х(с), и(С)) ) ( )др(х(с),и(с)) '(с ( )дд„(иЯ) (65) ди ди ,йи " ди и=! и, во-вторых, доказать равенство и1У (СР(С), х(С), и(С вЂ” О))=т(ср(С), х(С)) в точках разрыва управления и (С) и постоянство функции Я' (С) =йис (ср (С), х (С), и(С)) ва отрезке С (С(СС.
В точках разрыва управления, согласно принятому условию, полагаем Ж (С)= Я (СР(С), х(С), и(С вЂ” О)). Для доказательства равенства (65) заметим, что координаты вектора Л (С) = (Лг (С),..., )Си(С)) удовлетворяют уравнениям д(С(х(с), и (с)) Лс СС1 др (х (с), и (с)) чс с дгр (и(с)) =0 В=с с'=О, 1,..., и, а=1,..., г+1. Умножая это уравнение на ф; (С) и складывая полученные соотношения при всех у = О, 1,..., и, получим г + 1 равенств (а = 1, ..., г + 1) ди2С (ф(с), х(с), и (с)) ди" ~() др(х(с), и(С)) ЧС Сс,дтг( (С)) с=с из которых функция Х (С) однозначно определяется. С другой стороны, и2' (с(с(С), х (С), и (с)) = и (ср (С), х (с)) 11 Л, О, Поитрисии и ар 822 пзоцкссы пеи огглничвнных коогдинлтлх (гл.
е и, по правилу множителей Лагранжа, д»2у (сз (с), х (с), и (с)) д» » )„»ср дд(х(с) »60) % т»с(!де.(»(с)). а 1 следовательно, Х (с) = )с" (с). Докажем теперь равенство аЗ" (ср(с), х(с), и(()) =т(ф(!), х(!)) (66) в точках разрыва управления и (с).
Пусть в точке разрыва т управления и (() выполнено соотношение Й" (т) =Л" (с()(т), х(т), и(т — 0)) ~ т (ср(т), х(т)). Тогда найдется такая точка и! !=- ю (х (т)), что »2Г(ср(т), х(т), и(т — 0))(»72" (с)с(т), х(т), и,). (67) Из условия и!~ сс (х (т)) непосредственно следует (см. стр. 290 — 291) существование такой непрерывной функции из (С), определенной для значений (, близких к т, что и*(с)(-ю(х(с)), и*(т)=и!. Учитывая, что функция Я (ср(с), х (!), и» (с)) непрерывна по с, а управление и (!) непрерывно в точке т слова, мы для любой достаточно близкой к т точки ((т из неравенства (67) получим неравенство М"(с)с (0 х (!) и (с)) ( ауу" (ср (с) х (с) и* (с)) Следовательно, для рассматриваемых с получаем неравенство М" ( р (с), х (т), и (с)) ( Я" (с) (г), х ((), и* (()) ~ т ( р ((), х (г)), противоречащее равенству (58).
Равенство (66) доказано. Аналогично доказывается и равенство %" (ср(с), х(с), и((+0))=т(ф(с), хЯ). (68) Из равенств (66), (68) следует непрерывность функции а.т (с) = т (ср (с), х (()). Следовательно, для доказа- 324 процвссы ПРи ОГРАничвнных кООРдинАтАх (гл. о управления и ((), так как вблизи точки и (т) множество У задается неравенствами дд(и)(0, ..., д,(и)(0, н потому ив допустимости управления и (() следует, что для любых достаточно близких к т значений г д (и (г)) ( О.
Итак, теорема 22 полностью доказана. й 35. Некоторые обобщения В етом параграфе мы приведем несколько очевидных обобщений теоремы 22. Мы ограничимся формулировкой результатов, так как их доказательства лишь незначительно отличаются от доказательства теоремы 22. При доказательстве теоремы 22 решающую роль играла зависимость между векторами х, и, заданная уравнением Вид функции был использован лишь при доказательстве условий б) — в) теоремы 22.
Беглый анализ доказательства убеждает нас в справедливости нижеследующей теоремы 23. Пусть заданы т непрерывно днфференцируемых функций р; (х, и), д = д,..., т, не зависящих от координаты хо. Регулярная относительно точки иоЯУ точка х, удовлетворяющая системе рд(х, ио)=...=р (х ио)=0 определяется так же, как и прежде, только в данном случае вместо независимости векторов (7) надо потребовать независимость векторов дрд (х, ио) др,„(х, ио) дед (ио) ддв (ио) ди ' ' ' ' ' ди ' ди ' ' ' ' ' ди Те о рема 23. Пусть и((), го(г(цд, — оптимальное управление, а х (о) — соотеетствуюи)ая ему регулярная нвнотогыв ововщкния 325 » 3»1 оптимальная траектория уравнения (5), удовлетворяющая на отрезке Е„( Е ( Е1 системе уравнений: р1(х(Е), и(Е))=...=р (х(Е), и(Е))=0.
(70) Тогда существует такая ненулевая непрерывная вектор- функция ~1> (Е) = (1К (Е), ..., 1у» (Е)), Е» ( Е ( Е1, что на отревке Ег ( Е ( Е, функции и (Е), х (Е), 1Р (Е) удовлетворяют систпеме уравнений вг О»ТЕ (ф, х, и) гф »а 4ф д»ТЕ" (зу, х, и) ~ др„(г, и) а 1 и выполняется условие максимума »»Е (»р (Е), х (Е), и (Е)) = т (1Р (Е), х (Е)), причем т(1р(Е), х(Е))=0; кусочно-гладкие функции Л; (Е), Е = 1,..., т, Е == Е = Е1, определяются иг условия максимума как множители Л'агранжа в формуле »В » д»ТЕ" (ф, х, и) ~1) др,(в, и)+ ~1 до»(и) »=1 а-1 кроме того, ф,=сопаЕ =.О.
К сформулированной теореме легко сводится решение оптимальной аадачи, в которой вместо равенств (70) фигурируют неравенства р,(х, и)(0,..., р (х, и)(0. В самом деле, введя т дополнительных скалярных УпРавлЯюЩих паРаметРов оо 1 = $,..., т, УДовлетвоРЯющих неравенствам о1 ) О, и рассматривая вместо неравенств (7$) равенства р (х, и)+о =...=р (х, и)+о =О, мы придем к условиям теоремы 23. 326 пРОцессы пРи ОГРАниченных коогдинлтлх [гл, в Наконец, отметим, что теорема 22 непосредственно обобщается на тот случай, когда область 6 задана вблизи границы несколькими, например двумя, неравенствами у,(х)~0, у,(х)(0, а регулярная оптимальная траектория лежит на (и — 2)- мерном «ребре», заданном уравнениями д,(х) =у,(х) =0; при этом, естественно, предполагается, что гиперповерхности у,(х)=0, д,(х)=0 находятся в общем положении вдоль траектории, т. е. что векторы ~', ~' линейно независимы.
3 36. Условие скачка Оптимальная траектория, лежащая в аамкнутой области 6, частично может лежать в открытом ядре области 6, частично — на границе области. Для того чтобы однозначно проследить такую траекторию, недостаточно принципа максимума и теоремы 22. В самом деле, принцип максимума дает полную систему необходимых условий, которым удовлетворяет всякий участок оптимальной траектории, целиком лежащий в открытом ядре области 6, а теорема 22 дает необходимые условия, которым удовлетворяют участки, целиком лежащие на границе области 6.