Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 44
Текст из файла (страница 44)
Примем параметр и за фазовую переменную, а за управляющий параметр примем производную от и. Тогда вместо уравнения движения (4) в и-мерном фазовом пространства Х мы получим систему Их — =1(х, и), лг 0и — =6 Ж в (и+г)-мерном фазовом пространстве Х)(Н„, где о (И, ..., о') — кусочно-непрерывное (безынерционное) управление, областью возможных значений которого является единичный г-мерный куб 1о'1~1, 1 1, ..., г, а областью возможных значений фазовой точки (х, и) является прямое произведение Х Х К Отметим еще, что принцип максимума справедлив для оптимальных траекторий, которые лежат внутри открытого ядра 6, за исключением нонцов, лежащих на границе втой области.
Пусть концы х(1о), х(1~) оптимальной траектории х(С), Сан" Ф а Сь лежат на границе я(х) О. Тогда участок траектории при 1з+т(1( 11 — т, т) О„це« ликом лежит в открытом ядре области О, и потому существует функция ф,(1), 1а+т (1( 11 — т, удовлетворяющая требованиям принципа максимума (теорема 1) эча пгоцягсы при огнхничгниых Координхтлх игл а применительно к участку х(г), (э+ т ( ( = 1~ — т. Можно считать, что длина вектора ф,(1о+ т) равна единице. В силу компактности единичной сферы конечномерного векторного пространства можно выбрать такую последовательность положительных чисел ть ть , ть ..., сходящуюся к нулю, что последовательность векторов ~(:,,(~0+ т,), ю'=1, 2, ..., имеет предел ~рм Очевидно, что функция ~р((), (э ( ( < гь соответствующая траектории х(1) и удовлетворяющая начальному условию ф(Г0) = фо, внутри отрезка 1э - ( ((~ служит пределом функций ф,,(~), ( 1, 2, ..., и потому является искомой.
ф 32. Оптимальные траектории, лежащие на границе области В этом параграфе сформулирована теорема 22, дающая полную систему необходимых условий, которым удовлетворяет всякая регулярная оптимальная траектория, целиком лежащая на гладкой границе д(х) =0 области 6. Необходимость ограничиться регулярными траекториями, определение которых приведено ниже, вызвана не недостатком метода доказательства теоремы 22, а существом вопроса. Дело в том, что при выводе любых необходимых условий, которым удовлетворяет заданная оптимальная траектория, ее нужно сравнить с другими оптимальными траекториями, удовлетворяющими тем же краевым условиям, т.
е. включить (путем соответствующим образом выбранного метода вариаций) оптимальную траекторию в некоторое «достаточно богатое> семейство близких траекторий, лежащих в 6. Однако нетрудно привести пример оптимальной траектории, лежащей на границе области 6, л ю б а я вариация которой выходит за пределы области 6 н для которой теорема 22 неверна.
Это исключительное явление не имеет места, если рассматриваемая траектория регулярна. Именно, здесь будет доказано, что соответствующими вариациямн уп- о зя оптимлльныв толвктогии нл гглпицв 297 равлеиия всякую регулярную траекторию можно вклю- чить в достаточно богатое семейство траекторий, лежа- щих в замкнутой области 6. Основные определения Введем обозначения: р (х, и) = ~~ ~ „ ) (х, л и) =- ~~ , 1' (х, и) = а-! =( д, 7(х, и)), а-о др(х,и) / др др дх (, дхо ' дх' первое из которых утверждает, что начальная точка траектории лежит па границе области 6, а второе— что фазовая скорость движущейся вдоль траектории точки в каждый момент времени касательна к границе.
Точку х е Х назовем регулярной относительно точки и! е— = У, если выполняются следующие условия: 1) р(х, и,) =О; 2) Р ' ' ФО; ди 3) если и! — граничная точка множества 17 и !7!(и), 1, ..., з,— функции (1) для точки и!, то векторы др(х, и,) дд!(и,) до,(и!) ди ' ди ' '''' ди (!) линейно независимы. Для того чтобы траектория х(1), 1о с 1 < (ь уравнения (5), соответствующая управлению и(1), целиком лежала на границе и(х) =О, очевидно, необходимо и достаточно, чтобы выполнялись равенства д(х((о))=О, р(х(1), и(1))= — О, 1о- '1~(1! в9а пгоцвссы пни оггхничгнных коогдннлтхх 1гл. в Остановимся па геометрическом смысле условия 3). Прежде всего ясно, что условие 2) можно считать частным случаем условия 3), если в последнем условии полагать з = О, когда и,— внутренняя точка множества 17. В дальнейшем мы так и будем поступать.
Из независимости векторов (7) следует, что гладкое (г — з)-мерное «ребро» (3) границы области 0 находится в точке и' в общем положении с (г — 1)-мерной гипсрповерхностью, заданной в окрестности точки ив уравнением р(х, и) = О. Сле,,овательно, з ( г — 1; другими словами, и, не может быть вершиной границы множества 17, в которой сходятся г различных (г — 1)- мерных граней. Отметим еще тот очевидный факт, что понятие регулярности точки х относительно и, не зависит от сделанного нами выбора функций (!) для точки иь Обозначим через в(х) множество всех точек и е=- К относительно которых регулярна точка х. Множество а(х) с: 0 может, конечно, оказаться и пустым.
Траекторию х(1), 1в(1~ 1ь уравнения (5), соответствующую управлению и(1) и целиком лежащую на границе области б, назовем регулярной, если и(1) ен е=- а(х(1)) в каждой точке непрерывности 1 управления и(1) и если и (1 — О) ен гв (х (1)), и (1+ О) ен гв (х (Р)), когда 1 †точ разрыва управления и(1).
Для точек х, лежащих на границе области 6, для которых множество гв(х) непусто, определим величину т Ц, х) равенством гл(е, х)= знр уй(1г, х, сс), и ~ а оа где, как н раньше, л ге(ф, х, и)= ) ф,г'(х, и)=(а:, Г(х, и)). а-о Если х — регулярная точка границы д(х) = О относительно точки и ен 0 и для некоторого вектора вр выполняется равенство Ж(тр, х, и) гп(ср, х), 9 зг! оптимАльн!св ТРАРктоРии ПА ГРАИП!!Г 299 то, по правилу множителей Лагранжа, существуют та- кие действительные числа )., Рь ..., ч„что дгв(!Р, х, и) ) др(х, и) ~ дд,(и) ди д Л ти ди и ! где д!(и), ! = 1, ..., е,— функции (1) для точки и, а дМ вектор — определяется формулой Кроме того, введем обозначения: Отметим, что векторы ~~' ', ' не зади ' ди висят от выбора функций д!(и), ! = 1, ..., з.
Далее, х вектор ~ т д, является параллельной направлеа-! др(х, и) дМ нию ' проекцией вектора — па касательную ди ди плоскость (à — з) -мерного «ребра» (3), также иивариантному относительно выбора функций д!(и). Следовательно, множитель ), в формуле (8) не зависит от выбора функций д!(и). Если и — внутренняя точка множества У, т. е. е -О, то иа (8) следует что векторь! дМ д (х,и) коллинеарны.
т е о р е м а 22. пусть х (1), (ь ( 1 ~ (! — регулярная оптимальная траектория уравнения (8), соответствую- и(ая оптимальному управлению и(1) и целиком лежасцая на еранице области 6, Тогда найдется такая непрерывная вектор-функция ф(1) = (!рь(1), ..., !р„(1)), Зоо процессы при огрлничгнных коорлинлтлх [гл. е !р ( ! ( !ь и такая кусочно-непрерывния, кусочно-гладкая скалярная функция Л(1), !ь ( ! ( (ь что на отрезке 1ь ! ( 1~ будут выполняться нижеследующие равенства (9) — (11) и условия а) — в): — = — ~(х, и), дх дгк(~1, х, и) ~й д~) сЩ дЯГ(~), х, и) др (х, и) сЫ дх дх (9) (10) "ла (ф (1), х (!), и (!)) = и (ф (!), х (1)) = О, (1 1) где Л(1) определяется из условия максимума (11) как др (х, а) множитель Лагранжа при векторе ' в формуле ди (8); а) координата фо(!) = сопя! ( 0; б) вектор ф(!ь) отличен от нуля и касается границы д(х) = 0 в точке х(1ь); в) во всех точках дифференцируемости функции Ц1) вектор — угад д(х(!)) дЛ (г) направлен внутрь области 6 или обращается в нуль !т.
е. ~ ~(0). Сделаем несколько замечаний принципиального характера, разъясняющих смысл условий а) — в). 3 а меча ни е !. Равенство фь(г) = сопз! следует из независимости правой части уравнения (10) от координаты хь. Уравнения (9) — (11) и условие а) аналогичны принципу максимума. Условия б) и в) специфичны для рассматриваемого случая и обсуждаются в замечаниях 4, 5. Замечание 2. Из условия максимума непосредственно следует возможность подразделения отрезка !ь (1( 1, иа частичные отрезки точками деления л ля оптимлльныг. ттлвктогии нл гглницв ЗО1 таким образом, что на огрсзке т~ (1( т~+ь 1= О, 1, ..., А, выполняется равенство дФ($ (О, к(0, и 00) ди Л (() р (* ( )' и ( )) ( ~ ш (1) ди а ди а ! где 9п), ..., 9~4~, з)0, — функции (1) для точки и(тс+0), а чн)(1), ..., т~о(() — некоторые функции. Это равенство эквивалентно на рассматриваемом отрезке системе г линейных уравнений относительно з+ 1 ( г неизвестных Л, т",>, ..., т',н с кусочно-непрерывными, кусочно-гладкими коэффициентами и свободными членами, матрица которой имеет ранг э+1.
Следовательно, функцию Л(1) можно представить на всем отрезке (а < 1 ( 1, в аиде Л(1)= ~ чр (1)аа(() (чр((), и(()), (12) а-о где а(1) = (аа(1), ..., а" (1)) — кусочно-непрерывная, кусочно-гладкая вектор-функция. 3 а м е ч а н н е 3. Уравнения (9) — (11) обращаются в тождество, если ф(1) ам О, Л(() = О, Ко < ( ~ (ь Покажем, что если ф(1а) чь О, то ф(() чь 0 длЯ любого Е, и наоборот, из ф(Ка) = 0 следует ф(1) — = О, (о ~ В самом деле, подставив выражение (12) для Л(1) в уравнение (10), получим однородное линейное дифференциальное уравнение относительно ф((), для которого справедлива теорема единственности, откуда и следует наше утверждение.
3 а меч а н не 4. Для выяснения смысла условия б) заметим, что система (9) — (11) всегда имеет, кроме решения и(1), х(1), ф(Е) = О, Л(() — О, еще следующее тривиальное решение: и(1), х((), ф(1) =тдга4 д(х(()), Л(()=т, где ч — произвольное число. В этом легко убедиться непосредственной подстановкой. заз пгопвссы пэи огглпичвнных коогдинлтлх [гл а Легко проверить также, что если и(1), х(1), Ф(1), Х(1) (!3) — некоторое решение системы (9) — (Н), то ее реше- нием является и и(1), х(1), ср(1)+тдгабу(х(1)), Х(1)+т, где ч — произвольное число. Следовательно, прибавлением к функциям ~р(1), Х(1), входящим в решение (13), членов вида т втаб я(х(1)), т мы всегда можем добиться того.
чтобы начальное значение $(10) + т угад д(х(1э) ) лежало в касательной плоскости границы д(х) = О в точке х(10). Если это начальное значение в нулевое, то исходноа решение было тривиальным„так как, учитывая замечание 3, можно утверждать, что ар(1) = — ч йтад д (х(1)), Х(1) вв — ч. Таким образом, из условия б) следует нетривиальность решения системы (9) — (11). Из сказанного следует, что условие б) эквивалентно требованию неколлннеарности векторов ~р(1~) и угад д'(х(1о) ).
Замечание 5. Условие в) возникает вследствие того, что при варьировании траектория х(1) сравнивается не только с соседними траекториями, так же как и х(1) лежащими на границе я'(х) О, но и со всеми близкими траекториями, принадлежащими замкнутой области 6. Доказательству теоремы 22 посвящены следующие два параграфа. $ ЗЗ, Доказательство теоремы 22 (осиовные построения) Некоторые обозначения Введем обозначение а1 ~ а1'~ докхзАтсльство тгоромы оо и будем рассматривать эту матрицу как оператор из пространства Е„ векторов и = (и', ..., и') в пространство Х векторов х = (х',х', ..., к") и одновременно как оператор из пространства векторов ~р = (фо, ... ..., ф„) в пространство Е„: Г х Г дт д) д;о д;л — =у —.«'-(е '-' " у — ) д» диа ), диа ' '''' диа а-! а-1 а л л д) (х, и) ~о д)а та дГа ) даа (ф х, и) а-о а-о Пусть Л = (Ло .
) л) — вектор пространства Х. Матрицы Л дР( ' ) =(Л' дР("'. )), (, !'=О, 1, ..., и, дх ~ дх) др(х, и) l с др(х, и)~ да ди( ) )о та~ л — Ф= — (л, р)= — Х др др др та дх дх ' дх г «-о )=л~ и)=Л~ др д»а Л Р х=л( — ", дх ' дх (14) — иа др диа Л Р и=л~ — Р, ди ~,ди В этом параграфе х((), (о ( 1( (ь — произвольная регулярная траектория уравнения (б), соответствующая управлению и(() и лежащая на границе д(х) = 0 области 6. В 5 34 мы будем дополнительно предполагать, что и((), х(Г) оптимальны.