Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 11
Текст из файла (страница 11)
с),(1с)д'. (65) у с В остальном же формулировка теоремы 4 сохраняется. В. Наконец, рассмотрим пеавтопомпусо оптимальную задачу с подвнжнымп концами. Ограничимся случаем подвижного правого конца. Пусть 5с (1) — перемещающееся г-мерное многообразие, дифференцнруемым образом зависящее от 1. Задача заключается в отыскании такого допустимого управления и(1), 1в ( 1 < 1ь что точка, движущаяся по закону (55) с начальным условием х(1в) = хм попадаст в некоторый момент 1с на многообразие 5с(1,), причем осуществляется минимум функционала (56). Уточним прежде всего понятие «перемещающегося многообразия».
Пусть в (п + 1) -мерном пространстве переменных х', хс, ..., х", с рассматривается (г+ 1)- мерное многообразно 5с, опредсляемое системой уравнений 1'с(х', т', ..., х", 1) =О, 1 (х!, хс, ..., хл, 1) =О, (66) 1„,(хс, хс, ..., х", 1) =О. Предполагается далее, что левые части этих уравнений имеют непрерывные первые производные по х', хс, ...
хд1 х ..., х", 1 и что ранг функциональной матрицы ( — ') 'ХдхС) в каждой точке многообразия 5с равен и — г. Рассмот- 4 71 пР!!чпнп м1кспх!хг!л Лля нг«вто!юмных шютгм та рим теперь в просгрансгве Х переменных х', х', ..., х" систему уравнений 1'!(х', х~, ..., х", 1") =О, ),(х!, х', ..., х", 1') =О, (67) (Ъ-! а Ъл у") — О получа!ощуюся пз (66) прп фпкспрованнол! зпачеппп 1= 1*.
В силу сделанных предположений, система (67) определяет в пространстве Х некоторое г-мерное гладкое многообразие, которое мы обозначим через 5!(1"). При различных значениях Р' мы получим целое семейство многообразий 5! ((), меняющих (вообп!е говоря) свое положение и форму при изменении й В этом смысле мы и говорим о «перемеща!ощемся многообразии 5!(1)!!. Пусть и(1), х(1) да!от решение поставленной задачи. Обозначим через Т! касательную плоскость к многообразию 5!(1!) в точке х(1!).
Так как множество всех векторов, касательных к многообразию Я в точке (х(1!), 1!) и имеющих вид (!7!, дз, ..., д", 0), имеет размерность г, а многообразие Я имеет размерность, большу!о г, то существуют такие числа д!, ..., д", что вектор (д!,...
..., д",! ) касается многообразия 5!" (в точке (х(1!), С!) ). Эти числа д!, дз, ..., д" дадут иам возможность написать соотношения (64), 65), которым должен удовлетворять вектор ф(1). Наконец, как и в 3 6, будем говорить, что вектор !р(() =(фо(1),!р!(1),...,!р„(1)) удовлетворяет условию трансверсальности в правом конце 1!, если вектор !р(г!) = (фФ(1!),!рз(г!),...,!р„((!)) ортогоналсн плоскости Т, (т. е. касательной плоскости многообразия 5!(1!) в точке х(1!)). При этих условиях имеется следующее предложение (обобщенис теоремы 3 на неавтономный случай).
Теорем а 3*. Лля того чтобы и(1) и х(1) дпвали решение оптимальной неавтономной задачи с подвижным правым концом, необходимо существование ненулевой непрерывной вектор-функции ф(1), удовлетворяющей условиям, указанныл! в теореме 4, с заменой соотношений (62), (63) соотношениях!и (64), (65), и, кроме того, условию трпнсверсальности в точке 1ь пгинцип млксимумх 74 Г. Выведем теперь нз теоремы 4 аналогичное необходимое условие для оптимальности по быстродействию.
Иначе говоря, рассмотрим для точки, движущейся по закону (55), задачу о быстрейшем переходе из заданного начального фазового состояния ха в заданное фазовое состояние хь Для решения этой задачи в теореме 4 следует положить )э(х, и, 1) = 1. Функция Ж принимает в этом случае вид л Я(ф х, 1, и) = ф, + 2 ф,) (х, и, 1). ч-! Вводя и-мерный вектор ф = (фь фм ..., фп) и функцию и Н(ф х, 1, и) = Х ф,)'(х, и, 1), м мы можем записать уравнения (55) н (58) (кроме урав- нения (58) для 1= О, которое теперь пе нужно) в виде гамильтоновой системы дх' дН дг дф,' дф дп дк~ (68) 1=1,2,...,п, (69) 1=1,2,...,п.
При фиксированных значениях ф, х, 1 функция Н становится функцией параметра и; точную верхнюю грань значений этой функции мы обозначим через М(ф,х,1): М(ф, х„1) = впр Н(1р, х, ~, и). и~о В силу соотношения Н (ф, х, 1, и) = Ж(ф, х, 1, и) — фо, мы получаем М (ф, х, 1) = я (ф, х, 1) — фм Это утверждение легко вытекает из теоремы 3 после введения новой переменной х"+' = 1 (ср. доказательство теоремы 4). Отметим, что если многообразие 51 неподвижно, то соотношения (64), (65) совпадают с (62), (63), так как в этом случае вектор (0,0,...,0,1) касается многообразия Я".
З Т) ПРИНЦИП МйКСИМУМй ПЛЯ НЕЛВТОНОМНЫХ СИСТВМ 75 и потому условия (61), (62) принимают теперь вид Н (!р ((), х ((), (, и (()) =- М (!р ((), х (!), () = Р =М(,р(1) х(() () — р,= ~ ~' ')'(х(" "'" !) ) (() й(- р,) 1, 1 д)~(х (!), и (!), !) ) д1 1, т=! Таким образом, мы получаем следующую теорему. Т с о р е м а 5. Пусть и Я, (ь ( 1 = ть — допустимое управление, переводящее фазову1о точку из положения хь в положение хн а х(() — соотве1ствУ1оЩал тРаектоРиЯ (см.
(55) или (68)), так что х(1ь)= хы х(1!)= х!. Юля оптимальности (в смысле быстродействия) управления и(() и траектории х(1) необходил1о существование та- кой ненулевой непрерывной вектор-функции !)>(() = = (!р!(!), !рг((),..., ф„(!)), соответствующей функциям и(!) и х(() (см. (69)), что: 1 для всех 1, !ь ~ ! ~ (н функция П(!р(1), х((),(,и) перел1енного иаир достигает в точке и=и(!) макси- мума П Я (т), х (!), 1, и (1)) = М (тр (т), х (!), !); (70) 2' выполнено соотношение М(рьх((), ()4Х '" ("О;"(')'б Ф.(()й(.
(71) 1, т-! Оказывается, далее, что если величины !)>((), х((), и(() удовлетворяют системе (68), (69) и условию 1', то раз- ность между левой и правой частями соотношения (71) постоянна, так что проверку соотношения (71) доста- точно произвести лии1ь в какой-либо один момент вре- мени 1, 1ь((((1, например, вместо (71) достаточно проверить соотношение М ( Р (1,), х (1,), (,) ) О.
(72) Д. Если точка х1, в которую точка х, чолжна пере- водиться с помощью управления и(1), не неподвижна, 76 >ГЛ. ! ПРИНЦИП МАКСИМУМА а перемсщае>сн, т. е. х, = х>(!), !о формулировка теоремы 5 несколько меняетсн. Именно, пусть и(!), (е ( ~ г( Гь — такое допустимое управление, которое фазовую точку из положения хо в некоторый момент времени >1 переводит в положение х!(1!). Положим Тогда (ср. (64), (65) ) соотношения (71), (72) замен>потея следу>ощнми: М (>)> ((), х ((), 1) ) и и ) ~~ >)> (г') "+ ~ ~ ' ' >г„(1)Ж, (73) 1 1, У-1 М (ф (!1), х (1!), г!) ) 2 ф (г!) >7У. В остальном же формулировка теоремы 5 сохраняется. Задача с подвижным правым концом рассматривается апалоп!чно (ср.
стр. 72 — 74). й 8. Задача с закрепленным временем А. Прсдпологким теперь, что рассматриваетсн такая жс оптимальная задача, что и в ь 2 (или в ) 7, т. е. с зависимостью функций )" от времени), ио с условием, что время Ге начала движе!шн точки (нз положения хе) и время !!ее попадания в точку х! заданы заранее, так что время 11 — (Р закреплено. Решение этой задачи мы легко получим из предыдущих рассмотрений. Как и в предыдущем параграфе, добавим к системе уравнений — =)'(х, и, 7), 1 1, ..., л, (75) еще одно уравнение Л и+1 — =! >>! с начальным условиемх" Р!((>>) = 1м Тогда х" Р> = — (, и мы Рнн>вини! к слезук>н>ей оптимальной задаче.
77 ЗАДАЧА С ЗАКРЕПЛЕННЫМ ВРЕМЕНЕМ он В (п + 1) -мерном пространстве переменных х', ..., х", х"+' заданьо две точки (хо,1о) и (хь11). Фазовая точка движется по закону д — =1'(х, и, х"+'), 1=1, ..., п, дх" + — =1. дГ Найти управление иЯ, под воздействием которого фазовая точка переходит (начав движение в момент 1о) из положения (хо, 1о) в положение (хь1,), а функционал и 7 ~ )о(х и хло ~) дт (76) принимает наименьшее возможное значение. Здесь момент времени 1, попадания в точку (хь т,) можно не считать фиксированным (ибо в силу соотношения х +' = — 1 попадание в точку (хь1,) может произойти только в момент 11), и потому применима теорема 1. Согласно теореме 1, мы должны для решения задачи ввести переменное хо, составить функцию и Я =,7д+~~„,,= ~, ф) (х, и, х"+)+ф„+, а о дф дМ (771 Ж дх Щ„~, дЗЬ Соотношения (16), (17) теоремы 1 принимают теперь вид уд()(О.
х(1), 1, и(1))+ )... (1) =ХИ>(1), х(1). 1)+ ф.+,(1), Ф ((о)(О М(1'(1), х(1), 1)+фо. (7)=0, и рассмотреть для вспомогательных переменных фо сле- дующую систему уравнений: !гл. ! 78 ПРИИИИП МАКСИМУМА илн, что то же самое, вид 76 (т(> ()), х ()), ), и ())) = Х Ор ()), х ()), 1), >1>о ()о) (~ О, (78) .>т 1>)> (1), х ())„ )) + Ф„ + ! ()) = — О. (79) Если бы все величины фо(1), >(»(1), ..., >1>„()) в некоторый момент времени ) обращались в нуль, то мы имели Г>ы Я(г(>()), х()), ), и()) ) = О, и потому >(>„+г()) = О (см, (78), (79)), что невозможно. Таким образом, >1>о()), ...
..., г)>„()) есть ненулевое решение системы (77). Это позволяет нам выбросить из рассмотрения функцию >(>„+>(1) и соотношение (79). Мы получаем, таким образом, следующую теорему. Теорема 6. Пусгь и ()), )о ( ) < )>, — допустимое управление, переводящее фазовую точку из положения хо в положение хь а х()) — соответству>ощая траектория (см.
(75)), так что х()о) = хо, х()!) = х! (моменты времени го, )! фиксированы). Для того чтобы и()) давало решение поставленной' оптимильной зидачи с закрепленньгм временем, необходимо существование такой ненулевой непрерывной вектор-функции >р()) = (фо()), >)>>()),...,>)> ())), соответству)ощей функциям иЯ и х()) (см. (77))„что: 1' для всех ), )о ( 1 ( )>, функция Ж(ф()), х(1), ), и) переменного ион(7 достигает в точке и=и()) максимума Я (>) ( 1>, « (1), ), и ))) = .Х (>1 (1), х О), )); 2' функция >1>о()) негголожительна (что достаточно проверить лишь в какой-либо одной точке отрезка )о ( ( ) ( )ь так как, в силу (77), >1>о — — сог>з().
Отметим, что эта теорема в такой же степени решает задачу с закрепленным временем, в какой теорема 1 решает задачу с незакрепленным временем. Умепьпгение числа условий на одно (а именно, отсутствие, по сравнению с теоремой 1, условия М(!)>()!),х(1>)) = 0) компенсируется адесь тем, что и число неизвестных параметров уменьшается на единицу, так как время 1, прохождения траектории через точку х, теперь з а д а н о. Б.