Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 11
Текст из файла (страница 11)
В силу сделанных предположений, система (67) определяет в пространстве Х некоторое г-мерное гладкое многообразие, которое мы обозначим через Я«(«а). При различных значениях 8«мы получим целое семейство многообразий 8,(~), меняющих (вообще говоря) свое положение и форму при изменении «. В этом смысле мы и говорим о «перемещающемся многообразии вф)». Пусть и («), х («) дают решение поставленной задачи.
Обозначим через Т, касательную плоскость к многообрааию Я, (8,) в точке х (~,). Так как множество всех векторов, касательных к многообразию Я в точке (х (~,), г,) и имеющих вид (д', д', ..., д", 0), имеет размерность г, а многообразие 81 имеет размерность, большую г, то существуют такие числа д', ..., д", что вектор (дт, ..., д", 1) касается многообразия Я7 (в точке (х (~,), г,)). Эти числа д', д», ..., д" дадут нам воэможность написать соотношения (64), (65), которым должен удовлетворять вектор «р (г).
Наконец, как и в 5 6, будем говорить, что вектор «р («) = (ф» («), »р, (~), ..., ф, (8)) удовлетворяет условию принцип мякснмтмя для нкявтономныл снетки тЗ Г. Выведем теперь из теоремы 4 аналогичное необходи- мое условие для оптимальности по быстродействию.
Иначе говоря, рассмотрим для точки, движущейся по закону (55), задачу о быстрейшем переходе из заданного начального фазового состояния х, в заданное фазовое состояние х,. Для решения этой задачи в теореме 4 следует положить (з (х, и, г) = т. Функцияа2; принимает в этом случае вид п '~ (1р» ' и)="Ь+Х Ф4'(* " ') у=1 Вводя и-мерный вектор ф = Яы ф„..., ф„) и функцию п Н(ф, х, г, и) = '5', фч~'(х, и, г), т мы можем записать уравнения (55) и (58) (кроме урав- нения (58) для с = О, которое теперь не нужно) в виде гамильтоновой системы с'х' дН вз дФ' аИ дН ш ~ъ~' (68) ( = 1, 2,..., п, (69) ( = 1, 2,..., и.
трансверсальности в правом конце Г„если вектор ф (Гг) =(т1(гз) Фз (Гт), ", ф„(Г,)) ортогонален плоскости Т е. касательной плоскости многообразия 8, (гг) в точ„е х (г,)). При этих условиях имеется следующее предложение (обобщение теоремы 3 на неавтономный случай). Т е о р е м а 3*. Для того чтобы и (Г) и х (г) давали решение оптимальной неавтономной задачи с подвижным прввым концом, необходимо существование ненулевой непрерывной вектор-функции ф (г), удовлетворяющей условиям, указанным в теореме 4, с заменой соотношений (62), (63) соотношениями (64), (65), и, кроме того, условию трансверсальности в точке Это утверждение легко вытекает из теоремы 3 после введения новой переменной х"л' = г (ср. доказательство теоремы 4).
Отметим, что если многообразие Ят неподвижно, то соотношения (64), (65) совпадают с (62), (63), так как в этом случае вектор (О, О, ..., О, $) касается многообразия Я. 74 ПРИНЦИП МАКСИМУМА 1гл. 1 При фиксированных эначениях 1Р, х, ( функция Н становится функцией параметра и; точную верхнюю грань эначений этой функции мы обозначим череэ М (1р, х, т): М(1Э, х, 1) =апрН(ф х, 1, и).
чеи В силу соотношения Н (ф, х, (, и) = о7т (ф, х, (, и) — фь, мы получаем М(ф, х, 1) = еР(ф, х, () — $ю и потому условия (6$), (62) принимают теперь вид Н (ф (г), х (г), г, и (г)) = М (ф (1), х ((), г) = =- (р(г),.В()-Ч.= $,'~""(0;""'ф,(М вЂ” Ь 1~ 1 — 1 ~ тР д)т(х(1), о(1), 1) 1!ч 1 Таким абрагом, мы получаем следующую теорему. Т е о р е м а 5. Пусть и (1), го (1 ( 11, — допустимое управление, переводящее фазовую точку иг положения хг в положение х„а х (г) — соответствующая траектория (см. (55) или (68)), так что х ((о) = хо, х ((1) = хт. Для оптимальности (в смысле быстродействия) управления и (1) и траектории х (() необходимо существование такой ненулевой непрерывной вектор-функции ф (г) = = (1р1 (г), фг (1), ..., ф, (()), соответствующей функциям и (г) и х (г) (см.
(69)), что: $' для всех г, го(г(г„функция Н(ф(й), х(г), (, и) переменного ит--П достигает в точке и = и (г) максимума Н(ф(1), х(1), Ц и(1)) =М(ф((), х(1), 1); (70) 2' выполнено соотношение М(У(1), х(1), ) - ~,У; "(*('о);""'ф,(1)а. (74) С, т 1 Оказывается далее, что если величины ф (й), х (г), и (т) удовлетпворяют системе (68), (69) и условию 1', то разность между левой и правой частями соотношения (74) $ 3) ЗАДАЧИ С ЗАКРКПЛВННЫМ ВРВМКНКМ 15 постоянна, так что проверку соотношения (71) достал1очно произвести лишь в какой-либо один момент времени 1, 1о =- 1 ( 11; например, вместо (71) достаточно проверить соотношение М (1р (1 ), х (1 ), 1 ) ) О. (72) Д. Если точка х1, в которую точка хе должна переводиться с помощью управления и (1), не неподвижна, а перемещается, т. е.
х, = х, (1), то формулировка теоремы 5 несколько меняется. Именно, пусть и (1), се -=. С ( 11, — такое допустимое управление, которое фазовую точку из положения х, в некоторый момент времени 1, переводит в положение х, (1,). Положим Тогда (ср. (64), (65)) соотношения (71), (72) ааменяются следующими: М(ф(1), х(1), 1)» а о ~'ч(11) д + ~ ,'~ д фч(1) асю (73) ч 1 1, ч 1 ч М(ф(1,), х(1,), 11) ~ )', фч(1,) д . ч В остальном же формулировка теоремы 5 сохраняется.
Задача с подвижным правым концом рассматривается аналогично (ср. стр. 71 — 73). 4 8. Задачи с закрепленным временем А. Предположим теперь, что рассматривается такая же оптимальная задача, что и в 3 2 (или в 3 7, т. е. с зависимостью функций 7"" от времени), но с условием, что время 1, начала движения точки (из положения х,) и время 11 ее попадания в точку х, з а д а н ы з а р а н е е, так что время 11 — со закреплено.
Решение этой аадачи мы легко получим из предыдущих рассмотрений. 7В ПРИНЦИП МАКСИМУМА |гл. д Как и в предыдущем параграфе, добавим к системе уравнений Ых| — =~д(х, и, г), д=1,...,п, (75) еще одно уравнение 6х""~ — =1 (Й с начальным условием х'в' (дв) = гз. Тогда х"+д = д, и мы приходим к следующей оптимальной задаче. В (п + 1)-мерном пространстве переменных хд, ..., х", х+' заданы две точки (хз, |з) и (хд, дд). Фазовая точка движется по закону Нх~+~ — = 1.
|| Найти управление и (д), под воздействием которого фазовал точка переходит (начав движение в момент гз) из положения (хз, ~з) в положение (хд, 1д), а функционал с, ,7 = 1 /0(х, и, х"+д) Ю (76) |д принимает ддаимп|ыиее возможное значение. Здесь момент времени зд попадания в точку (хд, дд) можно не считать фиксированным (ибо в силу соотношения х"": — г попада- ниев точку(хд, 1д) можетпроизойти только в момент гд), и потому применима теорема Согласно теореме 1, мы должны для решения задачи ввести переменное хз, составить функцию чую *=о~ +К+д=,~~~ дуаР'(х и х )+дуя.|д в О и рассмотреть для вспомогательных переменных ф| следующую систему уравнений: (77) д в'д дд зи алдлчи с злкввплвнньпи втвмвнвм 77 Ооотношения (16), (17) теоремы 1 принимают теперь вид ,У'(1Р (С), х (7), Е, и (7)) + Р„„ (7) = М (1Р (Е), х (7), г) + ф.„ (С), фз (7з) ~ О, ю (~Р (е), х (7), с) + 1Р„„ (7) = О, или, что то же самое, вид ,77" (~Р(Е), х(г), 7, и(г))= ®(ф(г), х(Ю), 7), Рз(гь)~0, (78) .~(ф(е), х(г), г)+чр„ы(Ф)=0, (79) Если бы всв величины ф (г), ф (й), ..., ф„(й) в некоторый момент времени с обращались в нуль, то мы имели бы Я (1Р (т), х (7), й, и (7)) = О, и потому ф„ы (Е) = 0 (см.
(78), (79)), что невозможно. Таким образом, ф, (с),..., ф„(С) есть н е н у л е в о в решение системы (77). Это позволяет нам выбросить иа рассмотрения функцию ф,яч (7) и соотношение (79). Мы получаем, таким образом, следующую теорему. Т е о р е м а 6. Пусть и (7), Сз ( 7 ( 7ю — допустимое управление, переводящее фазовую точку из положения х е положение хю а х (7) — соответствующая траектория (см.
(75)), так что х (7з) = хз, х (7,) = хт (моменты времени ез, ~т фиксированы). Для того чтобы и (г) давало решение поставленной оптимальной задачи с закрепленным временем, необходимо существование такой ненулевой непрерывной векторфункции $ (г) = (рз (г), ~рт (г), ..., ф,(г)), соответствующей функциям и (7) и х (7) (см. (77)), что: 1' для всех 7, Сз (7 ( Ц„функция аЗ"(ф(7), х(Е), С, и) переменного и~П достигает в точке и = и (г) максимума Л ( р (г), х (7), 1, и (Е)) = -Ю И (г), х (7), 7); 2' функция ф (т) неположительна (что достаточно проверить лишь в какой-либо одной точке отрезка 7 ( ~ ~ 7, так как, в силу (77), ф = сопеФ).
Отметим, что ета теорема в такой же степени решает задачу с закрепленным временем, в какой теорема 1 решает задачу с незакрепленным временем. Уменьшение числа условий на одно (а именно, отсутствие, по сравнению с теоремой 1, условия Ф Щ(7,), х (7,)) = 0) компенсируется здесь тем, что и число неизвестных параметров уменьшается на единицу, так как время С, прохождения траектории через точку х, теперь е а д а н о. пгинпип мякаимгмя ~гл, г Б. Рассмотрим теперь задачу с закрепленным временем и подвижными концами хз, хи Обозначим через Яз и Яч многообразия (в пространстве х', ..., х"), на которых должны выбираться концевые точки х, х . Тогда в пространстве переменных х', хг, ..., х", х'"' мы также получаем задачу с подвижными концами. Именно, концы (хз, гз) и (хг, Сг) искомой траектории должны находиться соответственно на многообразиях Яз и Я„причем 8,.
состоит иа точек вида (х, ~г), где х~8о 1 = О, 1. Рассматривая условия трансверсальности (теорема 3) для многообразий 8з, 8, и, как и прежде, отбрасывая координату х"+', мы находим, что теорема 3 остается справедливой (в той же формулировке) и дает решение задачи с подвижными концами в случае аакрепленного времени. Таким образом, теоремы 1 и 3 остаются верными и для аадачи с закрепленным временем, если в формулировке теоремы 1 отбросить второе иа соотношений (17). Обратимся, в частности, к случаю, когда (в аадаче с аакрепленным временем) правый конец совершенно свободен. Иначе говоря, рассмотрим аадачу: найти такое допустимое управление и (г), йз ( г ( г„ чтобы соответствующая траектория (см.