Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 106
Текст из файла (страница 106)
Е учетом условия х(0) =0 отсюда имеем Р = О, и тогда х(й) = С 21п г, ф (й) = 2С соз й Условие х(Т) = 0 при- водит к равенству Сз1п Т =О. Возможно, что Т 4А чй (й= 1, 2,...); тогда С = 0 и краевая задача принципа максимума будет иметь единственное решение х(Г) = — О, 2Р(г) = 0 (О < ~ < Т), а управление, подозрительное на оптимальность, равно и(~)=ф(2)/2=0 (О < ~ < Т) . Если же Т = пх, й — целое положительное число, то краевая задача принципа максимума имеет бесчисленное множество решений х(2)=Сз2п~, ф(2)=2Ссоз2, зависящих от одного параметра С, и управлений, подозрительных на оптимальность, будет бесконечно много: и (~) = С соз ~ (О < 2 < Т) . Спрашивается, будут ли найденные управления оптимальными? Оказывается, ответ на этот вопрос аависит от величины Т.
Рассмотрим случаи Т > п и 0 < Т < и. 1) Т>п. Покажем, что тогда 1п11(и)= — . Для этого возьтл л2 мем последовательность управлений и = и (г) = — соз ' — и = Т 7 л2 соответствующих им траекторий х = х (2) = т 22п — „(0( (~ (~ Т, — Т т= 1, 2, ...). Тогда з (и ) = ) (п~(~) — х' (~)) г)г = 2 ~т' Х / 2 Х~ — — 1~-~ — сс при т- . Следовательно при Т>п рас(тз ) сматриваемая задача оптимального управления не имеет реше- )гл. о ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА 448 ния. В то же время краевая задача принципа максимума разрешима, причем для ТФЯ)е ()о=1, 2, ...) она имеет единственное решение, при Т = п)о (й = 1, 2, ...) — бесконечно много решений.
2) 0<Т~П. Тогда для любых кусочно-непрерывных Р(1), для которых существует решение х(г) задача х(г)=Р(т) (0~ ~1 ( Т), х(0) = х(Т) = О, имеем т т у (Р) = ~ (Ро — х') гп = ~ (Ро + х' с1до е — х' з1п-о Г) 1е о о т т = ) (Ро + х' осло ~ — 2хх оси Е) Й = ) (Р (е) — х (1) с1и Е)' Ю ) О. о о Заметим, что проделанные преобразования законны, так как все подынтегральные функции, встретившиеся при зтих преобразоВаяпял, ОГраНИЧЕНЫ И )ПВ Ха(1) Стд е = О, а В СЛуЧаЕ Т = П ьо еще и )пп хо(е)с181= — О.
Итак, У(Р)>0, а на управлениях е т-о и(Е)=— 0 при Т( я и и(1)= свозе при Т= и будем иметь У(и)= =О. Таким образом, при Т(п рассматриваемая задача оптимального управления имеет единственное решение, при Т = и— бесчисленное множество решений, причем все решения найдены с помощью принципа максимума. т ) Г Пример 3.
Минимизировать функцию У(и) = — 2 ) (х'(г) + + из(е)) е)Е при условиях х(Е) = — ах(е)+ и(Е), х(0) =х,. Здесь хе и > О, Т > 0 — заданные постоянные, е' = Е', правый конец траектории свободный. Составим функцию Гамильтона— Понтрягина Н = — а,(х'+ ие)/2+ е(~( — ах+ и) и выпишем сопряженную систему ф= — Н„=ах+ась 0<С(Т, Из условия (26) трансверсальности для свободного правого конца тРаектоРии имеем ГР(Т) = О, ае = 1. ТогДа фУнкЦиЯ Н = = — (х'+Не)~2+~(~( — ах+и) достигает своей верхней грани по и на ее=Е' при и =ф, и краевая задача принципа максимума запишется в виде х = — ах+ ф ф = а1г+ х, х(0) = хе, ор(Т) = О.
Отсюда следует, что подозрительным на оптимальность является управление еы жт -ьт и(1) = ор(Ю) = х, ',„, Оа Е<Т, Л= Уа'+ 1. (Л вЂ” а) + (Л + а) ео"т П р и м е р 4. Пусть точка движется по оси Ох по закону х(1)= и(Ц (Г~ 0). Требуется найти кусочно-непрерывное уп- 44б Фовмулнеовкв пРинципА мАкснъхуыА а н равление и(Х), (и(Х) ! < 1 (О - Х - Т), такое, чтобы точка, вый- дя из начального положения х(0)= 1 с нулевой скоростью, при- шла в начало координат с нулевой скоростью за минимальное время Т. Положим, что х' = х, х- = х — фазовые координаты точки. Тогда задачу мовхно переформулировать так: быстрейшим обра- зом перевостя фазовую точку (х', х') из состояния (1, 0) в со- стояние (О, 0), считая, что движение подчиняется уравнениям х'(Х)=х'(Х), х'(Х)= — и(Х) (Х~О).
Здесь г'=(и~Е'. 1и~ -1), Х'=— 1,~ =О. Составим функцию О = — а, + ~,х'+ фи и выпишем сопря- женную систему ф, = — и„, = О, 'Рз — — Н„. = — С „Х) О. Отсюда имеем ф(Х)= С, ф(Х)= — СХ+Р, где С, Р— постоянные. Отметим, что ф(Х) Ф О, так как в противном случае С = Р -О, а тогда ф (Х) — = 0 и равенство О~,=т = — а, = О, вытекахощсе из (43), приводит к противоречию с условием (23). Из условия шах хх следует и(Х) = в1яп ~(Ъ(Х) = зал( — СХ+ Р) (Х ~ 0). Та- 1мвг ким образом, оптимальное управление (если оно существует) является кусочно-постоянной функцией, принимающей значения +1, — 1 и имеющей не более одной точки переключения Х„при переходе через которую и(Х) меняет знак.
Нетрудно убедиться, что траектория, выходящая из точки (1, 0) и соответствующая управлению и (Х) = +1 при Х > О, или и(Х) = — — 1 при Х ~ О, или и(Х) = — +1 (О < Х < Х,), и(Х) = — 1 (Х > Х,), никогда не будет проходить через точку (О, 0). Остается рассмотреть управление и (Х) = — 1 (О < Х < Х,), и (Х) = +1 (Х ~ Х,) . Этому управлению соответствует траектория (х,(Х), х,(Х)): )1 — Хз/2, 0(Х(Х„ (Х'Х2 — 2Х,Х + Х1+ 1, Х) Х„ — О<Х:Х„ (Х вЂ” 2Хп Х)Х,, Из условия х' (Т) =- х-'(Т) = 0 находим Х = 1, Т = 2.
Тогда 2 2 2 1 — Х2, О<Х<1, ~ — Х, О<Х<1, (Х вЂ” 2)-','2, 1 - Х 2, Х вЂ” 2, 1 Х<2. В качестве величин а„4ч, ф„участвующих в формулировке принципа максимума, могут служить а, =О, ф(Х) = — 1, 4ч(Х) = = Х вЂ” 1 (О < Х < 2). Можно показать, что полученные управлоние н траектория в самом деле являются решением поставленной задачи быстродействия об етом см. пример 7.4.4.
Пример 5. Требуется перевести точку х=(х', х') пз состояния х,=(2, — 2) на множество Я,.=(х~вЕ': д'(х)=х'=0) !гл. е пгипцзш максимума понтгяпшл 450 быстрейшим образом, предполагая, что движение точки подчиняется уравнениям х'(З)= х'(1), х'(1)= и(1), причем ням К =— = (и ~н Е': ! и! < 1). Как и в предыдущем примере, здесь Н = — а, + Зьх'+ ~,л, сопряженная система имеет вид: з., =О, ~, = — ~ро откуда следует $,(т) С, ~,(~)= -Ст+ Р, С, Н = сопя~. Условия трансверсальности (30), (43) здесь дают ф (Т) = — ае Ъ~, (Т) = О, — а, + ф(Т) Х' (Т) + ЗН (Т) и (Т) = Н ~ с-г = О. Следовательно, з~,(Ф) = С(Т вЂ” Е) (О < й < Т).
Заметим, что здесь С Ф О, так как при С = 0 получим ф(й) = з~,(Е) — = 0 (О < г < Т), а тогда а, = О, из условия Н~',=,=0 вытекает а, = 0 — противоречие с условием (32). Итак, СФ О, ч)(й)= С(Т вЂ” й)ФО при 0 < < г < Т. Из условия зпр Н тогда имеем ~и~~1 и(г) = з18п ф,(~) = з1ип С, 0 < 1 < Т. Значит, подозрительными на оптимальность здесь могут быть лишь управления и(г) 1 или и(й)— = — 1 (О - т < Т). Если и(г)= 1, то из краевой задачи х'=х', х'=1, 0<Ф<Т; х'(0)=2, х'(0)= — 2, х'(Т)=0 получим Т 2, х' (й) = (г — 2) '/2, х' (1) = 1 — 2 (О < й < 2) .
Если и(Ц=-1, то из х'=х', х* — 1, 0<С<Т; х (0)=2, х (0)= — 2; х (Т)=0 будем иметь Т = У8 — 2, х'(Е)= 4 — (й+ 2)'/2, х'(Е) = — Š— 2, 0 < т< у8 — 2. Таким образом, краевая задача принципа максимума здесь дает два решения.
Однако лишь управление и(й)= — 1 (0<1< < Т = У8 — 2) может претендовать на оптимальность, так как Т = 2 > У8 — 2, а управление и(г) = 1 (О < г < Т) заведомо неоптимальпо. Пример 6. Рассмотрим задачу минимизации функции 1 з'(и) = ~ ((ит(З))' + (и'(1))з) сИ+ хз (1)+х (1) (45) 1 при условиях х'(т)=п'(1), х'(т)= и'(з), 0<т<1, х'(0) = О, х'(0) = О, х' (1) < О, (х'(1) )' — х' (Ф) < О, где и = и(~) = (и'(й), из(З)) ен Х.~ (О, 1). Эта задача является частным случаем задачи (1), (2), (4), (29) прн С,=О, Т=1, ( а г) ~е(х р) р~+ уа ~((х у) уа,я(х у) у~+(уй)з ФОРМУЛИ1'ОВКА ПРИНЦИПА МАКСИМУМА 452 2 21 т,=2,=2; левый конец траектории закреплен.
Из (46) видно, что правый конец любой допустимой траектории этой задачи удовлетворяет равенствам: х'(1) = О, х'(1) = О. 'Гогда Х(п) = 1 = ) ) п(1) ~~о1 )О для всех допустимых управлений. Поскольку о к =и(2)= О допустимое управление и У(0)-О, то Уч = О, и(1)= — 0 — единственное оптимальное управление задачи (45), (46). Функция Гамильтояа — Понтрягина Н = — а,((и')'+(и')') + + 1',и'+ 1р1и1 по зависит от х, поэтому сопряягеппая система пмоег вид 1р,=О, 1р1=0 (0=2(1).
Следовательно, 1Р,(2)=с„ 1):,(2) = с1, с„с, — постоянные. Условие (30), (32) здесь дают — ф(1)=а, 1+а, 1+а1(-1)=а,+а,— ап — 1Р1(1) = а, ° 1+ а, ° О+ а1 2х'(1) = ан (47) аз~+ а1+ аз ~=1, а„)0, а1)0, аз~)0. Покажем, что в этой задаче а, =О. В самом деле, если а,) О, то можем воспользоваться условием нормировки а, = 1. 'Гогда функция Н= — )иВ+ 11Р, иУ достигает своего максимума на Р = = Е' в точке и =1Р1'2 = с/2, с =(с„с,). Соответствую1цая траектория х(2)= 2с/2 условию х(1)=0 может удовлетворять ли1пь при с, =С,=О. Таким образом, 1р(2) — 0 (0<2<1).
Из второго условия (47) тогда следует, что а, = О, что противоречит равенству а, = 1. Следовательно, а, = О. Ио тогда линейная функция Н=11р, и) на Е' может иметь конечный максимум (который, кстати, должен достигаться яа оптимальном управлении и(2)=0) липгь при 1р=1р(2)— = с=О. Из условий (47), учитывая, что а,=0, получаем а, = а1) О. Таким образом, краевая задача принципа максимума здесь дает а =(а„=О, а, =а, а1 = =а), а> О, 1Р(1)= О, 0 (1~1. Как внпнм, условие (23) в этой задаче нс вьтполкяется, функция Н вЂ” О, н условие максимума (9) пе позволяет определить оптимальное управление и = = и(2) О.
Говорят, что оптимальное управление и() является особым на отрезке (а, Я~=(Юн Т), если Н(х(1), и, 2, 1Р(2), а,) при Юж 'я ~а, 6) не зависит от и. В этом случае для набора (х =-х(1), 2, 1г=12(1), ао) при 11в[а, р) условие (14) не дает никакой полезной информации об оптимальном управлении, функпия (13) становится неопределенной и пользоваться формулой (20) невозможно. В частности, когда паруптается условие (23), т. е. а~ О, 1р(2)~ 0 (г, ~ 2--.
7), то имеем дело с одним кз типичных случаев появления особого управления. 'Гак случилось в только что рассмотренном примере 6. Разумеется, условие (23) само по себе не исключает возможность появления особого управления, но тем ке менее полезно подчеркивать случаи, когда оно выполняется. пРинцип ыАкспз1уъ!А понтРЯГинА !ГЛ, З 452 А(п) (хг(Т))г+(хг(7))г (48) при условиях Х'(1)= Хг(1), Хг(г)= — З1ПХ1(г) — рХ'(г)+ и(г), 0 < й < Т, х (0) = х„ (49) и (1) ~ гг = (и ы Е'1 (и( < 1), (50) где х = (х', х') — фазовые координаты, х„= (хг, хг) — заданная г1 11 точка, Т) 0 — заданный момент времени. В втой задаче правый конец траектории свободен, (г — = О, л'(у)=(у')'+(у')'.
Выпишем функцию Гамильтона — Понтрягина Н (х, и, г)г) = ф,х~ + г(гг ( — згп хг — гкх~ + и) п сопряженную систему ~>1 = — Н, = г(гг сов х', г)гг = — Н 1 = — 1(11 + ()гр„О(~ ~ ~ (Т. (о1) Из условий (26) имеем г(11 (Т) = — з,",1 (х(Т» = — 2х'(Т), 41 (Т) = д" г (х(Т» -= —,.'- (Т). (52) И:1 УСЛОВПЯ Игал Н СЛЕДУЕТ и = Згян г("г ТОГДа КРаЕВаЯ ЗаДаЧа Зи3ч1 К сожалению, условие а = (а„..., а,) Ф 0 иа (8) само по себе пе всегда приводит к условию (23). Например, в задаче (1), (2), (4), (29), как показывает пример 6, в общем случае (23) пе выполняется и приходится довольствоваться условием а= = (аг, ..., аг ) ФО и вытекающим из него условием нормировки (32).