Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 48
Текст из файла (страница 48)
Следовательно, еслиу- достаточно близкая к х(г1) точка границы д(х) = О, то из л(у) е= й вытекает, что л(у) = у. Так как прн достаточно малом е точка х*((~ + ей) (принадлсжащая границе д(х) = 0) как угодно близка к точке х(Г~), то из соотношения л(х" ((~+ей)) ~Е вытекает, что х'(1, +ей) = л(х" ((~+ай)), и потому х*((~ + ей) сеть отличная от х(11) точка луча Е. Однако это противоречит предположению об оптимальности решения и(г), х(().
о зл! дорлзктвльство теоремы оо (окончлниш 325 Таким образом, лемма ! доказана. Л ем м а 1!. Существует такое непрерывное решение нр(1)=йо(1), я(>>(1), °, >(>н(1)), 1о~(1~(1о (бб) уравнения дгр / д,' (х(г), и(г)) + др(х(О, и (!)! '! т ~ дх дх что в каждой точке непрерывности оптимального управления и(1) выполняется условие миксилрума ЖИ(1), х(1), и(1)) =т(>(>(1), х(1)», (58) причем пг(т(>(1>), х(1,)) =О, (И) и выполнены следующие условия; а) >ро(1) = сопз! ( О; б) вектор яр(1о) неколлинеарен вектору 8габ д (х (1,)); в) кусочно-гладкая скалярная функция Л(1) = = — (я(>(1),Л(1)) такова, что в точках ее дифферпщируемости вектор дЛ „, агабд(х(1)) направлен внутрь области б или г>бращается в нуль.
л(оказательст во. На основании леммы ! через вершину х(1,) конуса й* с: Т(х(1, ) ) можно провести (п — 1)-мерную плоскость Г, лежащую в Т(х(1,)) и отделяющую конус А от луча 1. Обозначим через у = = (>(о, Хь ..., т„) лежащий в плоскости Т(х(1,)) вектор, ортогональный к плоскости Г и направленный таким образом, что луч 1, лежит в том замкнутом полупространстве, определяемом плоскостью Г, в которое направлен вектор 1(, а конус й* — в другом замкнутом полупространстве. Тогда 1(о ( О и для любого вектора Лх я й' выполнено соотношение (1(, Лх') (О.
(бО) 1! Л, С, понтрягин н нр. аяв пРОцессы пги ОГРАниченных кООРдинАтАх [Гл. А Далее, так как вектор [[ лежит в плоскости Т(х(1[)), то векторы 7 и ягае[ о (х (1,)) (61) линейно независимы. Определим искомую функцво ф([) как решение уравнения (57) с конечным значением Ф(1!) =К (62[ Легко видеть, что равенство (58) выполняется. В самом деле, пусть в некоторой точке непрерывности управления и(Г) выполнено неравенство Я(ф(т,), х(т,), и(т,)) ( Ач($(т,), х(т,)), т. е.
существует такая точка о[ ~ е[, относительно которой точка х(т[) регулярна, что Уй(зй(Г,), х(т,)„о,) > М(~р(т[), х(т,), и(т,)). (63) Построим решение и*(1), х*(1), 1ч ( Ю ([н системы (2!), взяв в качестве символа а символ (т[ о[, б![ = 1, б! = О) и в качестве [[ символ, в котором з = 0 (т. е. ьь ае(х), Ф[ отсутствуют) и б[е = О. Из (53) следует, что в этом случае бх'=Ри,,(0)(7(х(т,), о) — 1(х(т,), и(т,)]). Поэтому формулы (40), (63) дают ()[, Ьх")= Й(1[), Рп .. (0)([(х(т,), о,) — г(х(т ), и(т,)))= (11(т,), 7(х(т,)„о[) — К(х(т,), и(т,))) > О, что противоречит неравенству (60).
Доказательство равенства (59) и условия а) совпадает с доказательством соответствующих формул (!2) гл. 2. Условие б) следует из независимости векторов (61) и равенства (62) (см. замечание 4 к теореме 22). Докажем, наконец, условие в). Пусть и*(1), х*(1), 1е (1([ь — решение системы (21), соответствующее пустому символу а (т. е.
символу, для которого й = 0 и б[ = 0) и некоторому символу о, не содержащему точки х([о) в качестве одной из точек Ь;. 323 пРОцессы пРи ОГРАннчГнных кООРдинАТАХ 1гл. е Это неравенство и выражает условие в), так как область 6 задается вблизи границы неравенством д (х) ~ 0 и, следовательно, дга!( д(х(Е)) — внешняя нормаль к границе д(х) = О. Для завершения доказательства теоремы 22 надо, во-первых, доказать, что скалярная функция Л(Е) = = — (!Р(Е), А(Е) ) удовлетворяет соотношению дл'(!1(0, х 0), и (О) ди Л(Е) дР(х(0, и(еВ + х! (Е) дда(и 00) ди та д а ! и, во-вторых, доказать равенство Я6 (!1 (Е), х (Е), и (Š— 0)) = т (ф (Е), х (Е)) и точках разрыва у и р авлення и (Е) и постоянство функ- ЦИИ,Ж(Е) = Я(!Г(Е), х(Е), и(Е)) па отрезке Еа ( Е ( Е!.
В точках разрыва управления, согласно принятому усло- вию, полагаем Я~ (Е) = М (з1 (Е), х (Е), и (Š— 0)). Для доказательства равенства (65) заметим, что ко- ординаты вектора Л(Е) = (Ле(Е),..., Л" (Е)) удовлетво- ряют уравнениям дЕ! (х (Е), и (!)) др (х (О, и (0) х-с, дда (и (Е)) +ЛЕ(Е) +~ Еа(Е) =О, а-! 1=0,1,...,л, а=1,...,з+1, Умножая это уравнение на ф!(Е) и складывая по- лученные соотношения при всех Е = О, 1, ..., и, получим з+! равенств (а = 1, ..., з+ 1) дЯ (!$! О), х ( О, и (Е) ) диа =Л(Е) . + ~.„(Е) ' дР (х(е), и (О) ', «уча(и 00) ди а диа ! из которых функция Л(Е) однозначно определяется.
А З!! дОкАЗАТГлъстВО теОРГмы 22 (ОкОнчАнт!е! 399 С другой стороны, 76(!! (!), х((), и(!))=-т(!р(!), х(г!) и, по правилу множителей Лагранжа, дта (~р(г(, х ((], и (0) ди (~) ии(и((!. и ((!) + ~ ~, () дь(и (0) ди та и„ а=! следовательно, й(!) = Х:"(!), Докажем теперь равенство Я(ф(~), х((), и(!)) =т(ф((), х(()) (66) в точках разрыва управления и(!). Пусть в точке разрыва т управления и(() выполнено соотношение 'уб(т) = Я((ф(т), х(т), и(т — О)) Ф т(ф(т), х(т)).
Тогда найдется такая точка и! ~ и!(х(т)), что йй(2(!(т), х(т), и(т — О)) < 76(ф(т), х(т), и!). (67) Из условия и! Ен в (х(т) ) непосредственно следует (см. стр. 297 — 298) сущсствовапне такой непрерывн'й функции и*(!), определенной для значений г, близких к т, что и*(() ен е2(х(!) ), и*(т) = иь Учитывая, что функция М(ф(!), х(!), и'(!)) непрерывна по г, а управление и(г) непрерывно в точке т слева, мы для любой достаточно близкой к т точки ! ( т из неравенства (67) получим неравенство Я (ф ((), х ((), и (!)) ( йй (ф ((), х (у), й (()). Следовательно, для рассматриваемых ( получаем неравенство М(2р(!), х((), и(()) < М(2р ((), х((), и" Я) ~(т(2р(0, х(()), противоречащее равенству (58). Равенство (66) доказано.
Аналогично доказывается и равенство М (вр (!), х (!), и (( + О)) = т Щ ((), х (г)). (68) ззо ИРОцессы НРН ОГРАниченных ХООРдинАтАх 1Гл б Из равенств (66), (68) следует непрерывность функции Ж(1) = и(!(!(!), х(()), Следовательно, для доказательства постоянства функции Ж(!) на отрезке 1а ~ ( ! ( г! остается доказать, что она постоянна на каждом интервале одновременной дифференцируемости функций !(!(!), х(!), и(!). Имеем (см. формулы (9), (1О)): а-! а Ю (() 4!а(а (г)) =Х" гг! а ! !АЙ (Г) Допустим противное; пусть, например, в точке т чь О. (69) ггг Мы имеем: д! (и (т)) = ...
= д, (и (т)) = О, где д!(и), ..., г),(и) — функции (1) для точки и(т). Следовательно, функция д!(и(()) меняет знак в точке т, что, однако, противорсчнг предположению о допустимости управления и(1), !ак как вблизи точки и(т) множество Докажем, что иены соотношения вательно, в рассматриваемых точках г выполНча (а (О) =О, о= 1, ..., з, и, следо- г!екотоеыг ововщсния зз) (/ задается неравснствами а!(и)(0, ..., д,(и) <О, н потому нз допустимости управления и(!) следует, что для любых достаточно близких к т значений 1 д!(и(г)) к О. Итак, теорема 22 полностью доказана. 3 33. Некоторые обобщения В этом параграфе мы приведем несколько очевидных обобщений теоремы 22.
Мы ограничимся формулировкой резульгатов, так как их доказательства лишь незначительно отличаются от доказательства теоремы 22. При доказательстве теоремы 22 решающую роль играла зависимость между векторамн х, и, заданная уравнением р(х, и)=0. Вид функции был использован лишь при доказательстве условий б) — в) теоремы 22. Беглый анализ доказательства убеждает пас в справедливости нижеследующей теоремы 23. Пусть заданы т непрерывно дифференцируемых функций р;(х, и), ! = 1, ..., т, не зависящих от координаты хо. Регулярная относительно точки иое= у точка х, удовлетворяющая системе р,(х, ио) = .. = р (х, и,) О, определяется так же, как и прежде, только в данном случае вместо независимости векторов (7) надо потребовать независимость векторов др, (х, ио) др~ (х, ио) дч! (ио) део (ио) ди ' ''" ди ' ди ' '' ди Те ар ем а 23. Пусть и(г), го ~ г ~ ~г, — оптимальное управление, а х(Г) — соответствугощая ему регулярния оптимальная траектория уравнения (5) „удовлетворяющая Зао пяоцкссы пни огяхниченпых кооядинлтхх 1гл.о на отрезке 1о ~ 1 ( 11 системе уравнений: р,(х(1), и(1))= ...
=р (х(1), и(1))=0. (70) Тогда существует такая ненулевая непрерывная вектор- функция зр(1) = Яо(1),...,зр„(1)), 1о (1 = 1ь что на отрезке 1о ( 1 = 1, функции и(1), х(1), ър(1) удовлетворяют системе уравнений Их дМ(Е. х. и) — и)—= И дте (Ф х, и) + С Л др. ( . и) сИ дх ~.~ о дх и ! и выполняется условие максимума 7й(1г(1), х(1), и(1)) =гпЦ(1), ту)ц причем т (1в (1), х (1)) =— 0; кусочно-гладкие функции Л;(1), 1= 1, ..., т, 1о (1 1ь определяются из условия максимума как множители Лагранжа в формуле дМ (Е, к. и) ~ ~ дро(х, и) Т' дно(и) и кроме того, фо = сопя( ( О.
К сформулированной теореме легко сводится решение оптимальной задачи, в которой вместо равенств (70) фигурируют неравенства р,(х, и)(0, ..., р (х, и)(~0. (71) В самом деле, введя т дополнительных скалярных управляющих параметров оь 1= 1, ..., т, удовлетворяющих неравенствам о, ) О, и рассматривая вместо неравенств (71) равенства р,(х, и) + о, = ... = р (х, и) + о = О, мы придем к условиям теоремы 23. ззз УСЛОВИЕ СКАЧКА Наконец, отметим, что теорема 22 непосредственно обобщается на тот случай, когда область 6 задана вблизи границы несколькими, например двумя, неравенствами д, (х) ( О, д,(х) (~ О, а регулярная оптимальная траектория лежит на (л — 2)- мерном «ребре», заданном уравнениями д,(х) =дт(х) =О; при этом, естественно, предполагается, что гиперповерхностн д,(х)=О, д (х)= О находятся в общем положении вдоль траектории, т.
е. что векторы ', ' линейно независимы. $ 36. Условие скачка Оптимальная траектория, лежащая в замкнутой области 6, частично может лежать в открытом ядре области 6, частично — на границе области. Для того чтобы однозначно проследить такую траекторию, недостаточно принципа максимума и теоремы 22. В самом деле, принцип максимума дает полную систему необходимых условий, которым удовлетворяет всякий участок оптимальной траектории, целиком лежащий в открытом ядре области 6, а теорема 22 дает пебходимые условия, которым удовлетворяют участки, целиком лежащие на границе области 6. Недостает еще условия сопряжения, которому удовлетворяет всякая пара примыкающих друг к другу участков оптимальной граекторин, один из которых лежит в открытом ядре области 6, а другой — иа ее границе.
Это условие мы называем у с л о в и е м с к а ч к а для вектор-функции ~р((), которая в момент перехода от одного участка к другому может терпеть разрыв (см. формулировку теоремы 24). Докажем прежде всего одну простую лемму, которая нам понадобится ниже. Л е м м а. Пусть х(Г), ~е ( ~ = (ь — траектория уравнения (5), лежаи(ая в замкнутой области 6 и соотоет- 334 пРОНГссы пРН ПГРхничГнпых кооРдинлткх |Гл е ствующая некоторол|у допустимол|у управлению, и пусть х(14) — единственная точка траектории, лежащая ни границе д(х) = О области 6. Если вектор бх((е) не касается границы д" (х) = О в точке х(1ь) и нипривлен внутрь области 6, то вирьпрованная траектория х*(!), (ь < ( < (ь с начальныл| значением х'((ь) = х(Ь) + ебх(Я целиком лежит в открытол| ядре области 6, Д о к а з а т е л ь с т в о.
Мы имеем: х'(()=х(!)+ ебх(О+о(е), ( ~ „', бх(~ь)) =а < О. Следовательно, прп достаточно малых е ) О величина я (х*(()) а(х (Ф)) +е ( в бх(()) +о(е) Мд(( ((! отрицательна. В самом деле, для значений ! ) Гы близких к 1ы это следует из неравенств и(х(В) < О, а < О. Для значений г, удаленных от гы величина ~д(х(!)) ~ больше величины ~ е ( и, бх(г)) + о (е) ~ и, кроме того, д(х(()) ( О. Пусть и(1), гь ( ! < гь — допустимое управление, а х(!) — соответствующая траектория (не обязательно оптимальная) уравнения (5), целиком лежащая в замкнутой области 6.