Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 50
Текст из файла (страница 50)
Пусть ~М (2] д1(х (2Ь и <!)) д 'Р 2) (т)= — Х. т <(4 т, М (ф (!), х (!), и (!)) = Х (2Г (!), х (!)) О. Из неравенства (88) следует, что хотя бы одна из функций ф-(!), ф+(!) отлична от нуля. Ниже доказывается, что всегда ф — (!) ~ О и, следовательно, функция 2р-(!) удовлетворяет всем условиям принципа максимума. Докажем теперь, что либо 2р~ (т)=2р (т)+р8габд(х(т)), х (()~О, (!) = — ~(т — !), т, <!<т. (92) Очевидно, УСЛОВИЕ СКАЧКА 341 либо (Р (т)+1(дга()д(х(т))=,0, рчьО. Тем самым условия скачка будут доказаны, так как функцию $-(1), т( (1( т„можно принять за функцию (72), а функцию ф+(1), т (1(тз,— за функцию (73), если Ор+(1) Ф О.
Выберем варьировянные траектории $'(1), х" (1) следующим образом. Положим 69=61=0, о'(1)=о(1), 6~ = — й(, где й(' — произвольный вектор, не касательный к границе д(х) = 0 в точке х(т) и направленный во вне области б. Эти данные однозначно определяют Варьированную траекторию ~'(1). Для определения варьированной траектории х*(1) мы будем считать символ а пустым, а символ $ — содержащим единственную точку Ь( = х(т(): (( =- (~( = — х (т(), а, (х), Ж, 60 = 1).
Следовательно, в силу (47), бх (т) = ((( = баа~ т. е. условие (8!) выполняется, )Аля Векторов, определенных формулами (78), (79), получим выражения (см. (53) и формулу (22) гл. 2): а 6= — А~-са О(й()= — Х Ч(а(т — т() )У', (93) а О а Г ч Ь'= ~ %,( О(- Ш.(- ) (О' О(, Л ((() д а, (9(( а О где Х Ч(,(0) )У' = Х (ра (т) )У.' = )у".
а О а О Здесь через (ра((), ..., (р.((), 0 ((( т — т(, обозначена фундаментальная система решений уравнения в вариацияк для уравнения (76). 34Р пРО[ЕРссы пРи ОГРАпи1!Гипых коогдие!АТАх [Гл. 6 Через 1)еа(1), ..., ер ([) обозначим систему функци11, сопряженную с его(!), ..., ер„(1). мы имеем: л — (х, 5) = Х (х, Р.
(т — т ) [У') = а-о л л = Х (х„А —.,),4.( —.,))У')=Хх.л'"=К(9),)У), где $(О) = Х х,ЕР (О) — начальное значение функции (89). а ! Из равенства (92) следует: (х, 5) = й- ( ), )(7). (95) Аналогично, равенство (94) дает: и (х', 5')= — Й'(), )(7)+ ~ (ф'([), л(т)) ф [(= = — ()'(), )([) — ~ Л(() ф~(, л где Л(!) = — (4(е+(!), Л(!)). Используя выражение (42) для — н интегрируя по частям, получим: деЕ д[е (Х', б ) = — (Ч'( ), )[7) — ~Л([) а ( ([)) ("',"'"'.
д7Ц + и + ~ д! а!(хЯ)( ~.„, [[1))[11= — (е). (т), Л[)+ +Л( )(дя(х[т)) у)+1 дЛ ( (Ф))(да(х[!)) Ж),(( Складывая это равенство с (95) и учитывая неравенство (87), находим: (Х, б)+(Х*, б')=(еь ( ) — е[е ( )+Л( ) Ея[„"~')), )(7)+ + ~ — „1 а!(х([))( — ~да"", У)й(~0. (96) УСЛОВИЕ СКЛЧКЛ 343 Величина может быть сделана сколь угодно малой при заданном Ф за счет выбора малой окрестности (~„ входящей в определение функции а1(х), в то время как первое слагаемое равенства (96) от этой окрестности не зависит.
Следовательно, для произвольного вектора )у', не касательного к границе д(х) = О В точке х(т) и направленного наружу относительно области 6, справедливо неравенство (ф (т) — ф (т)+ л(т) игад л(х(т)), Ж) (О, (97) которое, в силу произвольности вектора й(, эквивалентно равенству Ф (г)=ф (т)+цагадц(х(т)). (98) Вектор ф-(т) чьО, так как из равенства ф (т) =О и неравенства (88) следует неравенство ф+(т) ~ О; с другой стороны, из (98) получаем соотношение ф+ (т) = и пгаб д (х (т)) ~ О, которое в силу соотношения ф(тз) =у* противоречит включению (86).
При ф+(т) = О получаем: (г)+ и йгаб а(х(т)) =О, р ФО. Таким образом, теорема 24 доказана в том случае, когда х(т~) — внутренняя точка области б. Пусть теперь х(т~) лежит на границе д(х) = О. Этот случай легко сводится к рассмотренному: достаточно определить функцию ЯВ (Г) иа отрезке О ( 1 ( т, где т1 ( О, и затем устремить точку 6 к т~., мы получим семейство функций 14 (Г), О ( 1(т, для которых существует искомая предельная функция Ф вЂ” ((), тг ~ ~ г < т. 344 ПРОЦЕССЫ ПРИ ОГРАНИЧЕННЫХ КООРДИНАТАХ ГГЛ. 6 Замечание !. Если участок х(!), т < 4 < тг, также принадлежит открытому ядру области 6, то неравенство (97) заменится неравенством (гр (т) — бр+ (т), )6') < О, из которого следует равенство 6Р (т) = гг (т) + р цтаб д (х (т)), и ) О, Отсюда вытекает, что если система уравнений относи- тельно и (гр (т), 7(х(т), и)) =4г =0 имеет единственное решение и (т — 0) = и (т + 0), 7(х(т), и(т — 0)) =7(х(т), и(т+0)) то вектор касается границы д(х) = 0 в точке х(т); другими словами, оптимальная траектория в точке стыка х(т) остается гладкой.
3 а м е ч а н и е 3. Если оптимальная траектория лежит иа к у с о ч н о-г л а д к о й границе области 6 (до сих пор мы рассматривали область 6 с гладкой границей), то уравнения всякого участка траектории, целиком лежащего на гладком куске границы, уже найдены в $ 32. При переходе траектории с одного гладкого куска границы на другой выполняются условия скачка, вполне анапогичные условиям (74), (75). 3 а меч а н ие 2. Если участок х(!), т < ! < тг, лежит на границе д(х) = О, то вектор атаби(х(т)) и вектор 7(х(т), и(т+0)) ортогональны и условие скачка дает: (6Р (т), 7(х(т), и(т — 0)))= =(6Г (т)+!Аргайл(х(т)), 7(х(т), и(т+0)))= =(6Р (г), ~(х(т), и(т+0)))=,4г" (бр (т), х(т))=0. ФОРМУЛИРОПКА РЕЗУЛЬТАТА. ПРИМЕРЫ 345 2 37.
формулировка основного результата. Примеры Объединяя теоремы 22, 24 и принцип максимума, мы приходим к следующей теореме, дак>щей полную систему необходимых условий, которым удовлстворяет всякая регулярная оптимальная траектория, являющаяся рсшепнсм оптимальной задачи $31. Т е о р е м а 25. Пусть оптимальная траектория уравнения (5) целиком лежит в замкнутой области 6, содержит конечное число точек стыка, и пусть всякий ее участок, лежащий на границе области б, регулярен. Тогда всякий участок траектории, лежащий в открытом ядре облисти 0 (за исключением, быть может, концов траектории), сдовлетворяет принципу максимума; всякий ее участок, лежащий на границе области 6, удовлетворяет теореме 22; в каждой точке стыка вьгполняется условие скачка (теорема 24). Пример ! Условия скачка справедливы и для следующей оптимальной задачи.
Пусть фазовое пространство Х разбито на две части Хь Х2 гиперповерхностью й(х) = О. Пусть в части Х2 уравнение движения фазовой точки имеет вид их — =~, (х, и), а в части Х2 — вид — =1~(» ). лх л~ 2 Требуется выбрать такое допустимое управление, чтобы фазовая точка из начального положения х1 ~Х, попала на прямую П ~ Х„параллсльпую оси х', и координата хь конца траектории была минимальной. Траектория движения в каждой из частей Хь Х2 бу.- дет удовлетворять принципу максимума, а в момент перехода через границу раздела д(х) = О будет. выполняться условие скачка. При выводе условия скачка в рассматриваемом слу* ае началыюс смешение варьнрованной траектории 345 НРОцессы пРН ОГРлниченных кООРдинАТАх [Гл. э должно лежать строго на границе раздела п(х) =О.
Поэтому лемму, приведенную на стр. 333 — 334, невозможно использовать, и доказательство ~ 36 проходит лишь если ни один из векторов ~~(х(т), и(т — 0)), )г(х(т), и(т+0)) в точке стыка х(т) не касается гиперповерхности д(х) = О. Пример 2 Если изучается обычная вариационная задача, то из условия скачка непосредственно следуют известные условия преломления экстремалей. В качестве примера выведем здесь эти условия для простейшей вариацион- ной задачи. Пусть плоскость переменных х, у делигся линией й(х, у) = 0 на две части Х„Хг н пусть заданы две точки (хн у1) Е=Х,, (хм ут) ~Хм Требуется соединить эти точки непрерывной кусочно-гладкой линией у = у(х) таким образом, чтобы достигался минимум функционала хг ~ г" (х, у, у') г(х, х1 где (~н ~г — гладкие функции) (' ~, (х, у, у') при (х, у) еи Х„ Р(х, у, у') = г.
)г(х, гГ, Э') пйн (х, 1)~Хг. Введем обозначения: А"= ~ г (х, у, у')г(х х'=х, хг=у, и=у'. х! Область управления 0 — открытое множество числовой прямой. Принцип максимума записывается следующим об- разом (легко доказать, что грг чь 0 и, следовательно, можно положить грг = — 1): дхг Дхг дхг — = г" (х, у, и'), — =1, — =а=у'; ггг(го Щг дл Щг дР— =О, дт ' ггг дх ' дГ да ' гэ = — Г(х, у, у')+ гр, + гргу'=шах=О, % зн ФО»МУЛИРОВКА РЕЗУЛЬТАТА. ПРИМЕРЫ 347 Условия М = гпах и Аа = О соответственно дают: дл ду ф1=г у ° ду ' ду' Из условия скачка ф+ = ф-+ )А дгаба(х, У) следует: 12 ~уг (У ) 1! ду (У ) +1 й Ду~ Дуг +)А э д1,, д1... д1~ д11 где (й1', )у~) — вектор нормали к линии д(х, у) = О в точке перелома траектории.
Обозначим через У' тангенс угла наклона касательной к кривой д = О в точке перелома. Имеем: д1г д11 ду' ду' 1 12 11+ (у ) (у ) д1,, д1,, У'' ду' ду' откуда получаем известную формулу (см. Г ю нте р Н. М., «Курс вариацнонного исчисления», М.— Л., )941) 11+ ду (~ — (У ) ) =) +,У (У (У ) ) Пример 3 В качсстве иллюстрации рассмотрим следующую геометрическую задачу. В а-мерном евклидовом пространстве Х переменной х = (х',..., х") задана замкнутая область В неравенством д(х) ( О, причем граница д(х) =О (99) области В является гладкой регулярной поверхностью с непрерывна меняющейся кривизной, т.
е. функция д(х) дважды непрерывно дифференцируема и вектор пгаб д(х) нигде на поверхности (99) в нуль не обращается. В области В заданы две точки хо, хь Найти в области В кривую С наименьшей длины, соединяющую точки ха и хь Мы покажем, что из теоремы 25 выгекает следующий геометрически очевидный результат. Пусть кривая С наименьшей длины состоит из нескольких участков, попеременно расположенных в открытом ядре области В 343 ПРОЦЕССЫ ПРИ ОГРАПИЧЕННЫХ КООРДИНАТАХ !ГЛ. 6 (кроме, быть может, концов участка) и на границе (99).
Тогда участки, лежащие в открытом ядре области В, являются отрезками прямых; участки, лежащие на границе (99), являются геодезическими на поверхности (99), причем вектор главной нормали кривой С на этих участках направлен во впе области В; наконец, в точках стыка двух соседних участков прямолинейный участок, проходящий в открытом ядре области В, касается поверхности (99). Таким образом, линия С пе имеет утловых точек. Для доказательства рассмотрим следующую оптимальную задачу. Задана система уравнений !!х' — =и, 1=1,...