XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 33
Текст из файла (страница 33)
Ответ в ней просматривается в содержательной постановке задачи: чтобы из пункта А попасть в пункт В за кратчайшее время, нужно двигаться с максимально возможным ускорением. тКми на педаль и все! Найденное решение позволяет определить синтезирующую функцию: х1 ( 1, х1< О; ц[хмхз) =— [х~[ [ — 1, х1 > О.
7.7. Неавтономные системы В общем случае неавтономной системы правая часть закона движения и подынтегральная функция целевого функционала зависят явно от времени 1, т.е. закон движения имеет вид [7 54) х = у[г,х,и), 254 7. ПРИНЦИП МАКСИМ~'МА и т где х = (хм ..., х„), и = (им ..., и,), а целевой функционал записывается следующим образом; 1(х, и) = Х" (8, х, и) й.
(7.55) х1 = 1 (х„„м х, и), х2=1 (х„тмх,и), 2 (7.56) хп4л = 1 (хи-,-мх,ц), в.ь1 а функционал 1(х, и) вид 1(х,и) = 1' (х„~ь~.,х,и)й, (7.57) где ~" ~ 1 = 1. Мы преобразовали неавтономную и-мерную задачу в автономную, но с расширенным фазовьья пространством. Как и выше, считаем, что функции 7~(г,х,и) и 1(1,х,и) = т = (11, ..., 1") непрерывны по совокупности переменных и непрерывно дифференцируемы по части переменных х.
Также полагаем, что момент времени 11 прохождения через точку иа шльного состояния х известен, а. момент времени Хя про- 1 хождения через конечную точку хв не задан и должен быть найден. Область управленпл Г не зависит от времени. Как и в случае систем обыкновенных дифференциальных уравнений, поставленная задача может быть сведена к автономной задаче введением дополнительного переменного х„ы. К закону движения добавим уравнение х„ь1 = 1, а к начальным условиям .--- соотношение х, ь1(11) = 1ь Эти два условия равносильны тождеству х ь1(г) = 1.
Теперь в расширенном составе фазовых переменных система (7.54) принимает вид 255 7. 7. Неавтономные системы В новой задаче требуется найти оптимальную гпраенторию, соединяющую точку (1ы х11, ..., х1) расширенного фазового пространства с некоторой прямой, проходящей через точку (О, хгр ..., х~) параллельно оси Ох„л 1 (конечное значение 1я переменного х„с1 нам не известно). Таким образом, преобразованная задача .--- это задача с фиксированным левым и подвижным правым концами.
Коли в задаче оптимального управления (7.54), (7.55), (7.2), (7.3) (в частности, в задаче (7.1) — (7.4)) известны и начальный момент времени 1м и конечный момент времени 1а, то такую задачу называют задачей с фиксированным временем. Преобразование такой задачи введением дополнительного переменного приводит к задаче с фиксированными концами в следующей формулировке.
Требуется найти управление и(~), которое переводит фазовую точку системы (7.56) из положения (1ч, хр ..., хя1 в момент времени 11 в положение ю (6э, хсм ..., х~) в момент времени 1г, причем функционал (7.57) принимает наименьшее значение. Мы можем не считать фиксированным момент времени 1я попадания в точку (х, 1г), так как в силу тождества х„лл = 1 попадание в точку (х, 1я) может произойти только в момент времени 7а.
С учетом этого мы можем к данной задаче применить теорему 7.1. Согласно этой теореме, для получения необходимых условий знсзпремума функционала мы должны составить функцию Понтрягина Н* = 7 ф 7' (хаааа, х, и) + фп.~~ = Н + ф„ям (7.58) где Н(7,Ф,х,и) = ~~ ф 1 "(1.,х,и) прежнее выражение функции Понтрягина, не учитывающее дополнительную, (и+1)-ю переменную., в котором за этой переменной оставлено старое обозначение 1. Сопряженная система 256 7. ПРИНЦИП МАКСИМУМА записывается следующим образом: 1=0,п, (7.59) дН д1 Соотношения в условиях 1' и 2' теоремы 7.1 принимают вид: Н '1 г, Ф * Я, х * ф, и ' Я ) + ф„* ~ (1) = М (г, Ф ' Я, ж" (7) ) + ф„* „~ (1), ~Дгз) < О, М(7,Ф*(г),а*®) + Ф„*г, Я = — О.
(7.60) Сократим в первом условии на ф„*,,(г): Н(г,Ф*(1),ж*(1),и'(г)) = М(г,Ф*(г),т*(г)). (7.61) Если бы функции фо(1), ф~ ®, ..., ф„*(1) в некоторый момент времени 1о обращались в нуль, то мы имели бы Н(го;Ф*(го),~*(го),и'(го)) = О, откуда, согласно (7.60) и (7.61), ~„* г,(Хо) = О. Но тогда ф,(1) = О, г = О, и+1, как решение линейной системы дифференциальных уравнений с нулевыми начальными условиями. А это противоре гит теореме 7.1. Таким образом, Ф*(г) = (1го(1), ..., ф„(~)) есть ненулевое решение системы (7.59). Это позволяет уменьшить размерность задачи и не рассматривать функцию фв г1 и второе из соотношений (7.60).
Мы приходим к следующему утверждению. Теорема 7.8. Пусть (а*(г), и'(1)), 1Е [1012), оптимальный процесс для задачи с фиксированным временем. Тогда существует ненулевая вектор-функция Ф*(г) = (фо(г), ...., ф„(1)), соответствующая этому процессу, такая, что: 257 7. 7. Неаатоиоыиые системы 1' для любого 1 Е ~1м 1г] функция Н11,Ф*(1), х'ф.,и) переменного н достигает при и = н*1е) максимума Н(1,Ф*(е),х*(1),н) = М(1,Ф*(1),х*11)); 2' Фо(1) < 0 1Е ~11 йг1 У Как и вьппе, уо = сопя|. Поэтому условие 2' теоремы достаточно проверить в какой-то одной точке отрезка.
Эта теорема в такой же степени позволяет решить задачу с фиксированным временем, в какой теорема 7.2 позволяет решить задачу ео свободным временем. Уменыпение количества условий на одно (отсутствует условие М1г, Ф'(1з),х*(1з)) = 0) компенсируется уменьшением количества неизвестных на одно 1задан момент времени 1з). Обратимся к случаю, когда при фиксированном моменте времени 1з правый конец свободен.
Это задача о том, как из данного положения х за данное время 1з — 11 пройти по траектории с произвольным конечным положением при минимуме данного функционала. Условия трансверсальности тогда имеют вид ф, (ЬД = д г(1з) = ... = ф,,(ЬД = О. Оледовательно, узе у'= О, и мы можем принять 1ие = — 1. Тогда при 1 = 1з должно выполняться условие (7.62) Ф(1з) =(-1, О....., 0). Для рассматриваемого случая необходимое условие оптимальности состоит в том, что функция Н достигает максимума при любом 1 на оптимальном управлении и(1) и выполняется (7.62). Отметим, что в задаче с фиксированным временем и свободным правым концом часто целевой функционал является не ингнегрильным, а смеишнным: Са (7.63) 258 Т. ПРИНЦИП МАКСИМ УМА В этом случае смешанный функционал необходимо преобразо- вать в интегральную форму (см. 4.5): сс 1[х, и~ = ~ 1а(с, х, и) + + — Т[х(с)1 ей.
(7.64) Т[х(сс)] с1 с2 11 Пример 7.4. Рассмотрим систему с законом движения Х1 Х2~ х2 = — хс+ 2и. (7.65) Пусть даны: огрвсвичение на управление — 1(2 ( и, < 1., началь- ное состояние хс(0) = — 1, х2(0) = 1 в момент времени ~1 = О, целевой функционал 1[хс,хз,и1 = иЙ1+х2(с2), а (7.66) сс 1[Х1,Хг,и) = и+ + 2) С1с. х2(0) ссх2Я 1с с11 о (7.67) Третье слагаемое в подынтегральной функции можно заме- нить, используя закон движения: СсХ2 (с) сй = — х1(1) + 2и. где 12 = 2и известно. Поставленная задача это задача с фиксированным временем и свободным правым концом., функционал в этой задаче смешанный. Преобразуем функционал в интегральный согласно (7.64): 259 Т.
7. Неавтономные системы С учетом краевых условий и заданного конечного времени 12 = 2л. приходим к следующему виду целевого функционала: 1 л),, )=((3 ~- — — )ло=/)3 —,)й~-1. )7В8) 2я Появившееся постоянное слагаемое 1 никак не влияет на вы- бор оптимального решения, и его можно отбросить, заменив исходный функционал другим: л'()хпхг,и) = (Зи — хл)й. о К данной задаче применима теорема 7.8.
Запишем функцию Понтрягина: О = Фо(Зи — хл) + л))лиг+ рг( — хл + 2и) = = ( — лЛ)о — Фг) хл + Ф) хг + (З)))о + 2лрг) и. Эта функция является линейной по управлению и и поэтому достигает максимального значения либо при и = — 1/2, либо при и = 1 в зависимости от знака выражения Злро + 2)))2, т.е. — — Зфо(1) + 2л)22 ф ( О; и (л)= 1, Злро(с) + 2лрг(л) ) О. (7.69) Запишем систему для сопряг)сенных переменных: ~о=о, )Р) = )Ро+)Рг, (7.70) 42 Ф1 Общее решение системы имеет вид ~о(~) = Сз, )р) (1) = — Сл соя | + Сг о1п1., Фг(~) = С) о)в~+ С2соо~ — Сз, 260 7. 111'ИНЦИН МЛКСИМУМЛ а учитывая краевые условия лае(2я) = — 1, фг(2я) = ~л2(2я) = 0 для сопряженных переменных на правом конце., находим Сл = О, С2 = — 1, Сз = — 1, т.е.
4е = — 1, улг = — яш1, ф2 =1 — сов1. Итак, Зуле+ 2ггл2 = — 1 — 2соя1, н мы можем записать экст1леллальпое управление, анализируя знаки функции — 1 — 2соа1 (рис. 7.13): 0<1< — я; 2 з 2 4 з з ' — лг < 1 < — 70 4 з --г <1< 2я. 1 2' и (2)= (7.71) 1 2' < Хг = Х2~ и2= жл 1~ (7.72) решая которую, получим хг(1) = Сл соа1+ С2ялп1 — 1, х2(1) = — Сг я1п1+ Слсоя1.
(773) Из начальных условий жл (0) = — 1, ж2(0) = 1 определяем постоянные интегрирования Сг и С2. С учетом этих постоянных имеем х1 1г) = яш1 — 1, х211) = соя1. (7.74) Поскольку найдено лишь одно Рис. 7.13 аправлепие, удовлетворяющее принципу максимума, оно и будет оптимальным при условии, что оптимальное управление в данной задаче существует. Оггределим экстремальную траекторию, соответствующую найденному управлению.
Для этого необходимо решить систему (7.65) 2 при двух возможных значениях и. На промежутке ~0, -я~ при и = — 1/2 имеем систему 261 7.7. Неаетононгные системы Очевидно, что при движении по найденной траектории в мо- 2 мент времени 1 = -я фазовая точка будет находиться в состо- 3 янин 2 ~ГЗ 2 1 хг( — и) = — — 1, хз( — и) = — —. 3 2 3 2 /2 4 На промежутке ( — я, — гг~ оптимальная траектория опреде- 13 'з ляется системои < Х! — Х2~ х2 = — хг+2. Общее решение этой системы имеет вид хг (1) = Сг сое1+ С2 яви+ 2, х2 (1) = — Сг вш1+ С2 соИ. 1775) ,73 1 ГЗ 1 3 — — 1 = — — Сг + — С2 + 2, — — = — — Сг — — С2 2 2 2 ' 2 2 2 Решая эту систему, находим С1 = —, С2 = 1 — .
Следовательз з,Гз /2 4 но, на промежутке (-гг, -я~ оптимальной будет траектория хг1г) = — сое1+ (1 — ) яп1+ 2 З 7 З ГЗг 2 г, 2 х 21г) = — — яп г + (1 — ) сов г. З . 7 ЗгЗ~ 2 2 17.76) /4 На промежутке ( — гг, 2гг] оптимальная траектория удовлетворяет той же системе 17.72), что и на первом участке, и, 4 следовательно, имеет вид 17.73). Согласно 17.76), при 1 = -я имеем (4 ) 7 — ~73 (4 ) ЗЪГЗ вЂ” 1 ПоДставлЯЯ в обЩее Решение найДенные знгпгениЯ хг г х2 пРи 1 = 2 = — ег получим систему относительно неизвестных постоянных 3 262 7. ПРИНЦИП МАКСИМУМА Как и выше, составляем систему относительно неизвестных постоянных С~ и Сз. 7 — ъ~З 1 Л =--С, — — С,-1, 2 2 2 З З вЂ” 1 З 2 2 2 Решая ее, находим С~ = О, Ся = 1 — З~ГЗ. Таким образом, последний участок траектории описывается системой х1(1) = (1 — ЗЛ) я|и~ — 1., хгф = (1 — Зъ~3) соя1. (7.77) Из соотношений (7,74), (7.76), (7.77) следует., что оптимальная траектория состоит из дуг трех окружностей (рис.