Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 107
Текст из файла (страница 107)
Для того чтобы в задаче (1), (2), (4), (29) из азАО следовало условие (23), можно дополнительно потребовать, например, чтобы градиенты ~1(х(Т», ..., д,",(х(Т» были линейно независимы. Ъ'огда либо агФО, либо а,=О, но согласно (30) ~~(Т) Ф 0 и однородная система (6) будет иметь нетривиальное решение г(г(~) (~„<1 -- Т). Аналогичные требования, гарантирующие условие (23), можно сформулировать и для задачи (1), (2), (4), (29), (34) п других задач оптимального управления, рассмотренных вьппе.
Оо особых управлениях читатель может прочесть, например, в (68, 98, 205). В следующих примерак покажем, как выписывается краевая задача принципа максимума для пекоторыт задач оптимального управления движением математического маятника (см. Пример 11). Пример 7. Пусть требуется минимизировать функциго ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА зг1 455 принципа максимума запишется в виде х' = х', х' = — еш х' — рх'+ з)йп ф, (53) ф,=ассах', ф= — ф+Щ, 0(1(Т, х(0) = х„ф(Т) — 2х'(Т), ф(Т) = — 2х'(Т). (54) Если краевая задача (53), (54) имеет решение (х(г), ф(г)) (0 1( Т), причем ф(г) обращается в нуль в конечном числе точек, то функция и(г)= з19пф,(г) будет управлением, подозри- тельным на оптимальность в задаче (48) — (50). Заметим, что если для некоторого управления Р= Р( ) из (50) решение х(, Р) задачи Коши (49) таково, что х(Т, и)= О, то У(Р)= О.
Это значит, что Р(.) — оптимальное управление в задаче (48) — (50). Любопытно, что зто управление является особым — его нельзя получить из принципа максимума. В самом деле, при х(Т, Р) = О из (51), (52) следует Ф(г, Р) = О (О ~ ~г(Т), а тогда Н(х(г и), и, Ф(г, Р))=0 (0 <1< Т), при всех иж Р и условие зпр Н не суживает исходное множество ьчсо управлений, подозрительных на оптимальность. П р и м е р 8.
Пусть требуется минимизировать функцию У (и) = ) иг(г) дг при условиях (49) и закрепленном правом и конце х (Т) = 0; Т ) 0 — задано. Здесь У' = Е', Н = — а и'+ $х*+ ф( — ьбпх'+ 5х*+ и), сопря- женная система имеет вид (51). В случае а,=О функция Н может достигать своей верхней грани на Е' лишь при ф = О. По если ~р,(г) = 0 (О ~ г ~ Т), то из второго уравнения (51) получим ф,(1)=0, что противоречит условию (23). Таким об- разом, можем считать а, = 1.
Тогда из условия шах Н получим иев' и= ~,/2. Краеван задача принципа максимума будет иметь вид х' = х', х' = — зш х' — 5х'+ ф/2, ф~ = фа соз х', ф, = — ф+ ~ф, 0 < 1~ Т, х(0) = х„х(Т) = О. Пример 9. Рассмотрим задачу быстрейшего перевода точки х=(х', х') из состояния х,чьО в начало координат (О, 0), предполагая, что движение точки подчиняется условиям (49), (50). Эта задача является частным случаем задачи (37) — (40).
Если 7' = — 1, д' — = 0; функция Гамильтона — Понтрягина имеет вид Н= — а, + ф,х'+ ~ъ( — зшх' — рх'+ и). (55) Отсюда ясно, что сопряженная система будет иметь вид (51), пгиш~ип мАксимумА понтРягинА 454 [ГЛ, З а условие шах Н выделит функцию и=э1дпф. Краевая задача Вдз1 принципа максимума в этом случае будет состоять из системы (53), граничных условий х(0)=х„х(Т)= О, условия трансверсальности Н!,, = — а, + 1Р,(Т) и(Т) = О, вытекающего из (43), и условия (23).
Отметим, что в этой задаче 1р1(1)эз О. В самом деле, если бы 1р1(1)= О, то из (51) будем иметь 1р,(8)=0, а из Н),; = 0 получим а, = О, что противоречит (23). Пример 10. Пусть требуется быстрейшим образом перевести точку х=(х', х') из состояния х, в начальный момент 1,=0 в состояние, удаленное от точки (О, 0) на расстояние, равное е) О, предполагая, что дэнн<ение точки подчиняется условиям (49), (50). Зто значит, что правый конец траектории является подвижным и удовлетворяет условиям !х(Т) !'= =(х'(Т))'+(х*(Т))*= е'. Здесь функция Н имеет тот же вид (55), сопряженная система — вид (51), условие шах Н дает и = Эвз1 = э13п 1!~1.
Иэ условия трансверсальности (30), (43) имеем 1р(Т)= — 2а,х(Т), Н(х(Т), и(Т), Т, ь|~(Т), а,)=0. (56) Оказывается, здесь а, чьО. В самом деле, если а, =О, то из (56) будем иметь 1)~(Т) = О, а из (51) будет следовать 1~(С)= 0; тогда иэ (55), (56) получим а =О, что противоречит условию (32). Итак, а,чьО; тогда условие нормировки (32) можем заменить на равенство !а,! =1. Таким образом, краевая задача принципа максимума в рассматриваемой задаче состоит из системы (53), граничных условий х(0) =х,, 1р(Т) = ~2х(Т), )х(Т) !' = э', Н! =О, из которых нужно определить функции х(1), 1Р(э), параметры ае Т.
Отметим, что здесь 1Р,(1)Ф О. В самом деле, если 1р1(1)'— = О, то в силу (51) 1р,(1)=0, а тогда х(Т)=0, что противоречит равенству !х(Т)!' = е' ) О. Пример 11. В задаче из примера 10 условие )х(Т) ! =е' па правом конце траектории заменим неравенством )х(Т) Р ( е', считая, что !х(1,) ! ~ э'. Тогда функция Н, сопряженная система (51), условия (56) останутся беэ изменений; здесь также выполняется условие дополняющей нежесткости а,()х(Т) Р— — э')= О. Оказывается, и в этой задаче можно показать, что а,ФО.
В самом деле, если а,=О, то в силу (56) 1р(Т)=0, из (51) будет следовать 1Р(1)= О, а из Н!,=,=0 получаем а, = =О, что противоречит условию (32). Итак, а,тьО. О учетом а, ) 0 можем принять а, = 1. Таким образом, краевая задача принципа максимума будет состоять иэ системы (53), условий х(0)=х„1)~(Т)= — 2х(Т), )х(Т) Р = э*, Н!,=,= О. Как и в предыдущем примере можно показать, что 1р,(~) эь О. Предлагаем читателю самостоятельно выписать краевую задачу принципа максимума для задач из примеров 10, 11 с заменой условий на правом конце одним иэ условий х'(Т) = О, ! х'(Т) Р ( е*, )х'(Т) Р = э', где 1 = 1 или 2.
ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 2 21 6. При формулировке принципа максимума было оговорено, что условие максимума (9) имеет место для всех точек непрерывности кусочно-непрерывного оптимального управления и(2). Возникает вопрос: как истолковать условие (9) в точках разрыва и(2)? Нельзя ли определить оптимальное управление и(2) в точках разрыва так, чтобы равенство (9) выполнялось во всех точках отрезка [2,, Т)7 Представляется естественным доопределить и(2) в точках разрыва предельным значением слева или справа, приняв и(2) = и (2 + О) = 11ш и (т) или и(2) = и (г — О) = т- о+о Пш и(т) при 2о(2(Т, а на концах отрезка [зо, Т) взяв «- о-о и(Т)=и(Т вЂ” О), и(о,)=и(Ьо+О).
Сразу же отметим, что значения кусочно-непрерывного управления и( ) в точках разрыва не влияют на решение уравнения (2) (см. определение 11), на значение интеграла в (1) и, следовательно, на задачу (1)— (4). Покажем, что способ доопределения управления и(2) в точках разрыва не оказывает существенного влияния и на условие (9).
Те о р е м а 3. Пусть в задаче (1) — (4) выполнены все условия теоремы 1, множество у' замкнуто, пусть и( ) — оптимальное кусочно-непрерывное управление, х( ) — оптимальная траектория, функция ор( ) и параметры а,, ..., а, определены согласно теореме 1. Тогда функция Н(з) = зпрН(х(2), и, г, яР(з), а,), 2о(2(Т, (57) «ФУ непрерывна во всех точках отрезка [з„Т), причем верхняя грань в (57) достигается как при и=и(2+0)~ 1т, так и при и= =и(2 — О) для всех 2ю[2„Т). Если в дополнение к условиям теоремы 1 функции 7«(х, и, 2) (1 О, 1, ..., и), имеют частные производные Д(х, и, 2), непрерывные по совокупности аргументов (х, и, 2)онЕ" ХЕ" Х[2, Т), то функция (57) имеет левую и правую производные во всех точках сю [2н Т), причем Н(2~0)=Н,(х, и, 2, ор, ао) [„= пь =«о«око=вон 2,< 2~ Т, (58) еде Но(х, и, 2, р,ао) = — а«77(х, и, 2) + (ч, Уо(х, и, 2)) — частная производная функции Н по переменной 2; производная Н(2) существует и непрерывна во всех точках непрерывности оптималь ного управления.
Доказательство. Пусть т„..., т, — точки разрыва оптимального управления и(2); тогда А = [2н Т)~(то ..., тн)— множество точек непрерывности и(2). Для краткости положим Н(2, ю)=Н(х(2), и, 2, ~У(г), ао). Согласно (57) Н(2) = = впр Н(2, ю). Точку из 1т, в которой достигается верхняя грань ВФУ ПРИНЦИП МАКСЗП1УМА ПОНТРЯГИНА )ГЛ. З 4ВВ в (57), обозначим через Р(й). Заметим, что верхняя грань может достигаться в нескольких точках, поэтому точка и(й) определяется неоднозначно. В частности, согласно (9) можно взять Р(й) и(й) при всех йжА; существование Р(й) при й ФА для простоты излолсения будем предполагать. Зафиксируем произвольную точку й ~н [йе Т]. Пусть )пй! >0 столь мало, что полу- интервалы [й — )Лй], й), (й, й+ )Лй)]~НА (если й й0 или й=Т, то, конечно, принадлежность А требуется лишь для одного нз этих полуинтервалов).