Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 45
Текст из файла (страница 45)
Необходимость ограничиться регулярными траекториями, определение которых приведено ниже, вызвана не недостатком метода доказательства теоремы 22, а существом вопроса. Дело в том, что при выводе любых необходимых условий, которым удовлетворяет заданная оптимальная траектория, ее нужно сравнить с другими оптимальными траекториями, удовлетворяющими тем же краевым условиям, т. е. включить (путем соответствующим образом выбранного метода вариаций) оптимальную траекторию в некоторое «достаточно богатое» семейство близких траекторий, лежащих в 6.
Однако нетрудно привести пример оптимальной траектории, лежащей на границе области 6, л ю б а я вариация которой выходит за пределы области 6 и для которой теорема 22 неверна. Это исключительное явление не имеет места, если рассматриваемая траектория регулярна. Именно, адесь будет доказано, что соответствующими вариациями управления всякую регулярную траекторию можно включить в достаточно богатое семейство траекторий, лежащих в замкнутой области 6.
10 Л. С, Поитзитии и ИР. 29) ПРОЦЕССЫ ПРИ ОГРАНИЧЕННЫХ КООРДИНАТАХ [ГЛ. Е Основные определения Введем обоеначения: р(, )=,'~ ",„'*'Г(*, )=~ "," .~(*, )= а О а 1 =(",'.*', л*, )), др (х, и) [' др др др [ (6) дх '[ дха ' дх1 ' ' ' ' ' дха ) ! (О Р Р) ди [ди1' ''''ди" /' Для того чтобы траектория ж (!), Та ~ ! ( г[, уравнения (5), соответствующая управлению и (!), целиком лежала на границе у (х) = О, очевидно, необходимо и достаточно, чтобы выполнялись равенства у(ж(Ф))=0, р(л(!), и(!))=О, [а([([„ первое иа которых утверждает, что начальная точка траектории лежит на границе области 6„а второе — что фааовая скорость движущейся вдоль траектории точки в каждый момент времени касательна к границе. Точку ж(-Х наеовем регулярной относительно точки и![=-У, если выполняются следующие условия: 1) р (л, и,) = 0; др(х, и!) ди 3) если и! — граничная точка множества У и д! (и), [ = 1, ..., г — функции (1) для точки и„то векторы др (х, и!) де! (и!) да (и,) (7) ди ' ди ' ' ' ' ' ди линейно неаависимы.
Остановимся на геометрическом смысле условия 3). Прежде всего ясно, что условие 2) можно считать частным случаем условия 3), если в последнем условии » Зм ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ НА ГРАНИЦЕ 291 полагать г = О, когда и, — внутренняя точка множества У. В дальнейшем мы так и будем поступать. Ие неаависимости векторов (7) следует, что гладкое (г — е)-мерное «ребро» (3) границы области У находится в точке и, в общем положении с (г — 1)-мерной гиперповерхностью, заданной в окрестности точки и, уравнением р (х, и) = О.
Следовательно, е ( г — 1; другими словами, и, не может быть вершиной границы множества У, в которой сходятся г различных (г — 1)-мерных граней. Отметим еще тот очевидный факт, что понятие регулярности точки х относительно и, не зависит от сделанного нами выбора функций (1) для точки и,. Обозначим через е» (х) множество всех точек и~У, относительно которых регулярна точка х. Множество ю (х) ~У может, конечно, оказаться и пустым. Траекторию х (2), 2« = 2 ( «„ уравнения (5), соответствующую управлению и (г) и целиком лежащую на границе области 6, назовем рееуллрной, если и (2)т:ю (х (2)) в каждой точке непрерывности 8 управления и (2) и воли и (2 — 0) ~ а (х (2)), и (Ф+ 0) ~ е» (х (2)), когда 8 — точка разрыва управления и (8).
Для точек х, лежащих на границе области 6, для которых множество в (х) непусто, определим величину т («р, х) равенством т(«р, х)= аер Я («р, х, и), аеа ЕЕ где, как и раньше, аЯ («р, х, и) = ~ ', ф„~"(х, и) = («р,,)'(х, и)). а=« Если х — регулярная точка границы у (х) = 0 относительно точки и~У и для некоторого вектора «р выполняется равенство ау (»р, х, и)=т(«р, х), то, по правилу множителей Лагранжа, существуют такие »0* 292 пРОцЕссЫ ПРИ ОРРАНИчеНнЫх КООРДИНАТАХ (ГЛ, г действительные числа Л, т„..., т„что ' диЯ" (да, х, и) Л др(х, и) + Ч,д до„(и) (8) ды ди ~ы " ди и 1 где ддд (и), ( = 1,..., г, — функции (д) для точки и, а вектор — определяется формулои л" ди дав ( диЯ ддЯ ) Кроме того, введем обозначения: д«уд" (»Р, х, и) (' деЯ" диЯ" декад" ~ дх ( дх» ' дхд ' '''' дхи ) (О дМ- дЮ) д«дУ." (ф х, и) ( дийт диЯ .
д«Уд" ~ х, и. Отметим, что векторы ~~' ', р ' не зависят от выбора функций дд (и), д = 1,..., г. Далее, вектор — является параллельной направлению дд„(и) др (х, и) ды ди и проекцией вектора — на касательную плоскость (т — г)- доЯ" ди мерного «ребра» (3), также инвариантному относительно выбора функций дд (и). Следовательно, множитель Л в формуле (8) не зависит от выбора функций дд (и). Если и — внутренняя точна множества У, т. е. г = О, диЯ" др (х, и) то нз (8) следует, что векторы, Р * коллинеарны. Т е о р е м а 22. Пусть х (д), (« = ( ( д„— регулярная оптимальная траектория уравнения (5), соответстоаующая оптпимальному управлению и (1) и целиком лежащая на границе области 6. Тогда найдется такая непрерывНаа ВЕКтОР-УДУНКЦил»Р (() = (1Р» (С),..., Д(ти (1)), («( г ( $„ и такая кусочно-непрерывная, кусочно-гладкая скалярная ЯункцияЛ (1), д» д ( дд, что на отрезке д» = г ( Фд будут выполняться нижеследующие равенства (9) — (дд) и о Зз) ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ НА ГРАНИЦЕ 293 условия а) — в): ати даЯ" (!д, а, и) д р эл.
(Ф, х, и) +Л(г)др(х, и) (10) а! дх д аа" (ор(г), х(г), и(г))=т(ор(г), х(с))=0, (11) где Л (С) определяется иг условия максимума (11) как множитель Лагранжа при векторе ' ( ' ) в формуле (8); др (х, и) ди а) координата !)!о (г) = сопзо ( 0; б) вектор ор (го) отличен от нуля и касается границы у (х) = 0 в точке х (го); в) во всех точках дифференцируемости функции Л (Г) векпоор ягаб у(х(Г)) направлен внутрь области 6 или обращается в нуль Сделаем несколько замечаний принципиального характера, разъясняющих смысл условий а) — в). 3 а м е ч а н и е 1. Равенство оуо (Г) = сопзо следУет из независимости правой части уравнения (10) от координаты х' Уравнения (9) — (11) и условие а) аналогичны принципу максимума.
Условия б) и в) специфичны для рассматриваемого случая и обсуждаются в замечаниях 4, 5. 3 а м е ч а н и е 2. Из условия максимума непосредственно следует возможность подразделения отрезка Го ( Г ( г! на частичные отрезки точками деления го = то ( т! ( ° ° ° ( ть ( ть.! = г! таким образом, что на отрезке т, ( г ( т! „1 = О, 1, ...,)с, выполняется равенство да2Г (оу (О, а (О, и (!)) ди о др(х (!), и (!)) + Ч! Е>(Г) дта (и (~)) ди ~в та ди а 1 294 пэоцвссы пги огглничвнньгх коогдинатлх Шл.
в и Х(с)= У', ф„(г)а" (с)=(~рр), а(ю)), а=О (12) где а (К) = (а' (г),..., а" (г)) — кусочно-непрерывная, кусочно-гладкая вектор-функция. 3 а м е ч а н и е 3. Уравнения (9) — (11) обращаются в тождество, если ~р (г) = — О, Х = О, ~, ( ~ ( ~,. Покажем, что если ~р (~,) ~ О, то ф~) ~ 0 для любого г, и наоборот, иэ ф (8 ) = 0 следует зр (8) = О, ~э ( Г = г . В самом деле, подставив выражение (12) для Х (г) в уравнение (10), получим однородное линейное дифференциальное уравнение относительно ф(О, для которого справедлива теорема единственности, откуда и следует наше утверждение.
3 а м е ч а н и е 4. Для выяснения смысла условия б) заметим, что система (9) — (11) всегда имеет, кроме решения и (г), х (~), ф (~) = О, Х (~) = О, еще следующее тривиальное решение: и (г), л (с), ф (г) = т йтад 9 (л (г)), Л (Е) :— т, где т — проиавольное число. В этом легко убедиться непосредственной подстановкой. Легко проверить также, что если и (г), м (г), ~р (г), Х (г) (13) — некоторое решение системы (9) — (11), то ее решением является и и (г), л (й), зр (й) + т огай д (х (г)), Х (с) + т, где т — проиавольиое число. где дй,..., 9<С, з ) О, — функции (1) для точки и (т,+0), а т<0 (г), ..., т<4~ ® — некоторые функции. Это равенство эквивалентно на рассматриваемом отреаке системе г линейных уравнений относительно а+1(г неизвестных Х, т('~,..., Ф> с кусочно-непрерывными, кусочно-гладкими коэффициентами и свободными членами, матрица которой имеет ранг г + 1.
Следовательно, функцию А (8) можно представить на всем отрезке 8,( ~ ( ~, в виде 295 9ЗМ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 22 Следовательно, прибавлением к функциям 1Р (2), Л (2), входящим в решение ((3), членов вида ТЯга1(К(х (~)), т мы всегда можем добиться того, чтобы начальное значение 1Р (га) + ТКгайл(х (Ца)) лежало в касательной плоскости границы у (х) = 0 в точке х (1а). Если это начальное значение — нулевое, то исходное решение было тривиальным, так как, учитывая замечание 3, можно утверждать, что 2р (1) = — татайу(х (1)), Л (1) = — т. Таким образом, из условия б) следует нетривиальность решения системы (9) — (11). Из сказанного следует, что условие б) эквивалентно требованию неколлинеарности векторов ар (1а) и ега11 е (х (1а)).
3 а и е ч а н и е 5. Условие в) возникает вследствие того, что при варьировании траектория х (8) сравнивается не только с соседними траекториями, так же как и х (1) лежащими на границе у (х) = О, но и со всеми близкими траекториями, принадлежащими замкнутой области 6. Доказательству теоремы 22 посвящены следующие два параграфа. з 33.
Доказательство теоремы 22 (основные построения) Некоторые обозначения Введем обозначение дг" / д11 '1 — — 1=0г (~ ...~ п~ )=1г ...~ г, и и будем рассматривать эту матрицу как оператор из пространства Е, векторов и = (и',..., и") в пространство Х векторов х = (х', х',..., х") и одновременно как оператор из пространства векторов ар = (1(г„..., $„) в пространство Е„: г г а=1 а=! а=1 дГ" (Х, и) ( Ч1 д1г 'Ч1 д/" ) даЯ (Гз, Х, и) ди ~~и диг "г ~и диг ") ди а=э а=а 296 пгоцвссы пги огглничвнпых коогдинатхх 1гл, О Пусть Л = (У, ..., Л ) — вектор пространства Х. Матрицы также будем рассматривать как операторы, действующие на векторы 1р, л, и по формулам: п а О а=О Г Л а Я=Л(Π— ~ и)=Л ~О О а а=1 (14) Построение функции д(т,и,(1) Приступаем теперь к построению скалярной функции Л (л, и, р), играющей основную роль при доказательстве теоремы 22.
Зафиксируем О точек ~,, 1 = $, ..., з (г ) 0), на траектории м (~), ни одна из которых не совпадает с концом траектории л (Ф1); равенства ~1 = а (1О) и ~1 = ~1 при 1 ~ 1 возможны. Через )т1 обоаначим вектор, не касающийся границы я (м) = 0 в точке ~1 и направленный во вне области 6; в остальном вектор ЖО произволен. Так как область 6 в окрестности границы задается неравенством 4 (х) ( О, то (бга1( р(Ц), 1О1) ) О. В атом параграфе м (~), ~О ( 1( ~„— произвольная регулярная траектория уравнения (5), соответствующая управлению и (~) и лежащая на границе я (ж) = 0 области 6. В з 34 мы будем дополнительно предполагать, что и (~), л (1) оптимальны. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 22 И 33! 297 Пусть О~! — достаточно малая окрестность точки 9! в Х, замыкание которой не содержит точки х ((!); единственное дополнительное требование, накладываемое на ОГ,, заключается в том, что при 9! ~ х (33) аамыкание окрестности ОГ! не содержит также точки х(33).