Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 48
Текст из файла (страница 48)
Подставив функции 61, 1 = 1,..., г + 1, в первое иа уравнений системы (21), получим: Й У'(у 01 (у Рв+2 Гг Ебр) Рг) =У (у, Рв+2,..., Рг, зб)2). (51) Подставим теперь в правую часть вместо параметров Р"2,..., Рг СООтВЕтСтВувщИЕ КООрдИНатЫ Рв-з,..., Рг точки Р1 и воаьмем решение полученного дифференциального уравнения с начальным значением х* (т, + е1,) на полуинтервале 21. Это решение х* (2) и будет служить на полуинтврвале 11 продолжением решения ха (2), 2 (2'(т + з11. Продолжение управления и~ (1), 2 (2(т1 + е11, на полуинтервал 2'1 зададим формулой и*(2) = (91(ха(2), ив+2,..., Р'„еб)2),... ив+1 (Ха (2) Рв+2 Ег Збр) Рв+2 аг) 2 ~ .7 Допустимость управления и* (2), 2~11 и равенство В (хз (2), из (2), еб(2) = О, 2 (: 1„ очевидны. Из построения, кроме того, следует, что и* (2) — непрерывная на полуинтервале 12 функция, равномерно стремящаяся на атом полуинтервале к значению Р 3(4 пРОцессы пРи ОГРАниченных кООРдинАГАх (Гл.
6 при з -~ О. Если т, = т, =... = тд(тджх, то мы проделаем аналогичное построение на полуинтервалах Хю..., Х; (взЯв вместо Рд соответственно точки Р„..., Р,) и опРеделим таким образом решение и* (1), х* (1) на отрезке до~с~де Затем функции и~ (д), х* (д) вновь продолжаются на отрезок т,~1 =.т;„д+ з(;ы (т. е. вплоть до левого конца полуийтервала Х,~д) при помощи конструкции, изложенной на стр.
300 — 302 (с уже имеющимся начальным значением х* (т;)) и т. д. вплоть до точки дд. Таким образом, если 61~0, то семейство варьированных решений и*(1), х*(1), 1,(1(8д+е61, системы (21) определено. Пусть 61)0. Решение ие ((), х*(1) уже построено на отрезке 8з(1~1д. Легко видеть, что точка х~ (1д) регулярна относительно точки и* (сд) = и* (1д — 0). В самом деле, первое условие регулярности следует из того, что для значений д, близких к 1д, имеем: В(х*(1), иа (1), ебр) = р(х*(1), ие(1)) = О, ибо при этих аначениях 1 точка х* (1) лежит на границе области д: д(х*(()) = О.
Второе и третье условия регулярности следуют из регулярности точки х (1д) относительно и (1д) = и (1д — 0) и иа соотношений х* (1,) — д- х(дд), и* (1д) — д. и (дд) при е-+О. Следовательно, конструкция, при помощи которой мы определили решение и" (1), х* (1) на полуинтервалах Хд, позволяет нам непрерывно продолясить функции ие (1), х* (1) аа 1д вплоть до точки 1д + ебг.
Таким образом, по заданным параметрам и, 11 мы построили семейство варьированвых решений системы (21). Равенство (51), очевидно, выполняется и при 1д(С(1д+е61. Отметим, что траектория (45) не определяется параметрами а, 5 однозначно. В самом деле, она зависит от выбора переменных Р', относительно которых разрешается система уравнений (50) во время построения варьироваиного решения на полуинтервалах ХО Аналогичный произвол имеется при продолжении решения на отрезок гд (1 = дд + збд в случае бд ) О. Зтот произ- Э 221 докАЗАТРльство теогемы 22 315 вол легко устранить, зафиксировав для каждой точки и (1) те переменные и1, относительно которых раарешается система (50) вблиаи системы значений х (2), и (2), збр, = О, где д1, ..., д„г ) О, — функции (1) для точки и (2). (В случае, если 2 — точка разрыва управления и (2), то переменные э1, относительно которых раарешается система (50), могут быть различными для точек и (1 — 0) и и (2+0).) После принятых соглашений ааданием символов а, б семейство траекторий (48) однозначно определяется, так как траектории этого семейства строятся на отрезках между полуинтервалами 71 однозначно (см.
замечание на стр. 302). Построение конусов Ка, Йа Нас будет теперь, как и в гл. 2, интересовать отклонение конца варьированной траектории (45) от точки ю (21). Совершенно так же, как это сделано в гл. 2 (стр. 99— 103), докааывается формула х* (21+ зб1) = ю (2 ) + еЛ;га + о(з), (52) где вектор Л.га не зависит от э и определяется формулой йэга=Р „, (бр) б* +У( (2 ), (21)) 51+ + ~Р1Рт (бр)[~(х(т„), э„) — У(х(т„), и(т„))) 62„. (53) а 1 Чтобы подчеркнуть зависимость вектора Л,т* от выбора символов а, 5, мы будем (если нужно) обозначать этот вектор символом Л.г, "и Иэ равенства (37), справедливого для близких к значений 2, следует, что (54) Ьха (- Т (т (1,)).
Пусть теперь а', (1' и а", 5" — две пары символов, определяющих варьирование управлений и траекторий, а Х' и Х" — неотрицательные числа. Положим Е=Л" +Л-а-, (=) 5+)аЬ". Из свойств переноса (см. формулы (36)) и из того факта, что в формулу (47) величина 6(А входит линейно, 316 ПРОЦЕССЫ ПРИ ОГРАНИЧЕННЫХ КООРДИНАТАХ [ГЛ, З а в формулу (53) величины бхо, бд Ь|, входят линейно, непосредственно вытекает, что йх 3 — Хйх ' и+А Лх" и' ° (55) Полученная формула показывает, что всевозможные векторы вида Лх', ю отложенные в пространстве К отточких(~,), образуют выпуклый конус свершиной в точке х (~,), который мы будем обозначать через К*. Иа (54) следует, кроме того, что конус Кз лежит в касательной плоскости Т (х (8,)) границы л (х) = О, проведенной в точке х (8,).
Конус К* мы используем при доказательстве условий скачка (з 36). Для доказательства же теоремы 22 нам потребуется другой выпуклый конус й*, содержащийся в К*. Именно, будем рассматривать только такие символы 5, для которых ни одна из точек ~, не совпадает с начальной точкой х (~,) траектории х (~). В этом случае иа формулы (47) следует, что бхз = О, т. е. что варьированная траектория х* (О начинается в точке х (~з).
Если Ь'и 5" — символы указанного вида (т. е. не содержащие точки х (~Р) среди точек ь;), а А, л" — неотрицательные числа, то )'6' + 3,"5" — также символ того же вида. Поэтому, откладывая от точки х (~,) всевозможные векторы вида Лх,* ю где 5 — символы, не содержащие точки х (~а) среди точек ~О мы получаем выпуклый конус с вершиной в точке х (8,), который будем обозначать через йз. Так как М" с:Кзс:Т (х(г,)), то конусы й*, Кв не более чем и-мерны. Поэтому внутренностью этих конусов мы будем называть множество их внутренних точек по отношению к плоскости Т (х (г,)), а внутренними лучами — лучи с вершиной в х (1,), принадлежащие этим конусам и содержащие их внутренние точки.
4 34. Доказательство теоремы 22 (окончание) Для выполнимости всех построений предыдущего параграфа достаточно потребовать, чтобы траектория х(~), г (г(г„лежащая на границе области 6, была регулярной, $ эц докАЭАтвльство твогвмы 22 (окончянив) 3д7 Предположим теперь дополнительно, что и (1) и х(~) оптимальны. Обоаначим через Т, луч, выходящий иэ точки х (~д) и направленный вдоль отрицательной полуоси х'. Очевидно, что Бс:Т (х(дд)). Л е м м а 1. Луч Т не является внутренним лучом конуса йе.
Д о к а а а т е л ь с т в о. Обозначим череа и проекцию (например, ортогональную) пространства Х на плоскость Т (х (1д)). Пусть х* (7) — варьированная траектория, соответствующая символам а, 6, где ь — символ, не содержаЩий точки х (де) сРеДи точек 1,д (так что тРаектоРиЯ х* (д) начинается в точке х (де)). д'ак как хе (дд+ еб1) = х (7д) + аЬх*+ о (е), причем х (1 )~Т (х(7д)), Ьх"'ЕТ (х(дд)), то я (хе (дд + обд)) = х (дд) + еЬх*+ о (е). Следовательно, главные (линейные по е) части векторов я(х*(дд+еб7)) — х(8д) и хе(Ед+абЕ) — х(Юд) совпадают н потому заполняют в Т (х (1д)) один и тот же конус й*.
Допустим теперь, что луч Т является внутренним лучом конуса й*. Тогда, в силу леммы 3 гл. 2, существуют такое е ) О (которое можно предполагать как угодно малым) и такие символы п, 6, что им соответствует варьированная траектория х* (~), начинающаяся в точке х (де) и кончающаяся в такой точкех* (дд + ей), что и (х* (ед + ебс)) — отличная от х (ед) точка луча д,. Отображение и, рассматриваемое на гравице у (х) = О, является, вблизи точки х (1д), вааимно однозначным. Следовательно, если у — достаточно блиакая к х (ед) точка границы д (х) = О, то из и (у)~Т, вытекает, что н (у) = у.
Так как пРи Достаточно малом е точка хе (1д + ебг) (принадлежащая границе у (х) = 0) как угодно блиака к точке х (Ед), то иа соотношения и (х* (1д + еЫ))(:1, вытекает, что х* (8д + ей) = и (хе (1д + еЫ)), и потому х* (ед + еб7) есть отличная от х (~д) точка луча Т. Однако 3(3 пРОцессы при ОРРАниченных кООРдинАтАх (гл. б это противоречит предположению об оптимальности решения и ((), х (1). Таким образом, лемма 1 доказана. Л е м м а 11. Существует такое непрерывное решение бр(с)=(р,(с), р,(б), ..., ~р„(с)), с,~(~с„(56) уравнения сИ~ ( д1'(х(О, а(О) др(хр), а(с)] что в каждой точке непрерывности оптимального управления и (с) выполняется условие максимума РЗ" (бр(С), х(С), и(б))=т(бр(б), х(()), (58) причем т(бр(е,), х(1,))=0, (59) и выполнены следующие условия: а) ~рб (~) = сопзб (0; б) вектор ~Р ((б) неколлинеарен вектору йтаб у(х(сб)); в) кусочно-гладкая скалярная функция Л (с) = = — (~Р (С), Л (1)) такова, что в точках ее дифференцируемости вектор —,игабу(х(()) дЛ направлен внутрь области 6 или обращается в нуль.