XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 34
Текст из файла (страница 34)
7.14). Рис. 7.14 На первом участке О < ~ < -я оптимальная фазовая кривая 2 3 описывается уравнением (х1+ 1) + хз —— 1, 263 Хя. Понятие особого управления 2 на втором участке — и < 2 < —.т — уравнением 3 3 (х1 — 2) +ж2 2= 10 — Зъ'3, на третьем участке — я < 1 < 2я — уравнением 4 Движение по дугам фазовой кривой осуществляется согласно направлению вектора фазовой скорости, т.е.
по часовой стрелке. 7.8. Понятие особого управления Принцип максимума Понтрягина не позволяет однозначно выделить оптимальное управление, если максимум функции Понтрягина Н по управлению достигается более чем в одной точке на целом промежутке времени. В большинстве случаев подобная ситуация говорит о наличии особых управлений.
На практике нередко встречаются зада~и оптимального управления, в которых функция Понтрягина линейно зависит от всех управлений или хотя бы от некоторых из них. Таковы, например, линейные задачи оптимального быстродействия. В примерах линейных задач, рассмотренных выше (см. 7.5), коэффициент при управлении зависел только от решения сопрялсенной системы и мог обращаться в нуль лишь в изолированные моменты времени. Благодаря этому оптимальное управление однозначно определялось из условия максимума функпии Понтрягина.
Эта ситуация типична для линейных задач оптимального упрааяения. Однако в нелинейных задачах оптимального управления 1например, если функция Понтрягина является нелинейной по одной или нескольким фазовым переменным) возможна ситуация, когда на оптимальной траектории коэффициент при одной из компонент вектора управления и обращается в нуль 264 7.
ПРИНЦИП МАКСИМУМА Пример 7.5. Рассмотрим задачу оптимального управления с законом движения < Х1 = Х2~ т2 =и, (7.78) целевым функционалом 1[х,и) = (Х2) д2., краевыми условиями Х1(~1) = х'„х2(~1) = Х21, Х1(12) = Х2[ь2) = О (7.79) и ограничением на управление. [и[ ( 1. Начальный момент времени 21 считаем фиксированным. Поставленная задача отличается от рассмотренной в 7.5 лишь целевым функционалом. Посмотрим., к чему это приводит. Составляем функцию Понтрягина Й = 1ов(Х2) + Ф122 + Фзи и записываем сопряженную систему (7.80) В каждой точке 1, в которой ф2(2) ф О, функция Понтрягина имеет по управлению единственную точку максимума, и в этом случае и'(1) = ей пу2(1), т.е. ситуация здесь такая же, как и в задаче оптимального быстродействия 1см. 7.5).
Значит, на на целом промежутке времени, и тогда условие максимума функции Н по управлениям не позволяет однозначно опреде- лить оптимальное управление. 265 Х8. Понятие особого управления интервалах времени., на которых фг(1) у. -О, оптимальные фазоеые кривые являются дугами парабол вида (7.50) или (7.51). Однако возможна ситуация, когда фг® = 0 на некотором отРезке [1', 1Я] С [1м бе]. Покажем это. Из первых двух уравнений системы (7.80) имоем фе(1) = = Се = сопв$, ф~(г) = С1 = сопв$.
Подставляем найденные функции в третье уравнение: фэ = — С1 — 2Соиэ. (7.81) Предположим, что принципу максимума удовлетворяет траектория в*(т), на которой лэ1т') = 0 для некоторого момента времени с' Е [1м Я. Такую траекторию можно построить из дуг парабол семейств (7.50) и (7.51). Если этой траектории соответствует вектор сопряженных переменных Ф(с') с ф~ (с') = = С1 = 0 и ф~(б~) = О, то в точке ~' выполнены соотношения [УП1]: фг(б) =О, фг(1') =О. Это и может означать существование некоторого отрезка [т', ся], на котором 1рэ(1) = О. 'ф Ситуация, описанная в примере, получила название особого релеи.иа. Опишем такую ситуацию в общем случае. рассмотрим автономную задачу оптимального управления (7.1) - (7.4), в которой функция Понтрягина Н линейна по части компонент управляющего вектора. Выделим из этих компонент группу из г1 управлений и обозначим ее через и, а остальные гг = и — г~ управлений соберем в вектор и, он может включать и часть управлений, по которым функция Н линейна.
Удобство такого разделения управлений будет видно ниже при формулировании определений. При таких обозначениях закон движения системы можно записать в следующем виде: 266 7, ПРИНПИП МАКСИМ МЛ а функцию Понтрягина — в виде Н(Ф,х,и,и) = Яа,(Ф,х,и)и„+ао(Ф.,х,и). Так как дН = а,(Ф,х,и), ди, то, вводя обозначение (7.82) г =1,гб запишем функцию Н в виде дН Н= и+ао. ди дН вЂ” в=О,и, дх;' (7.83) удовлетворяет принципу максимума и при этом во всех точках некоторого промежутка ~1', г") С ~1м 1.1 выполняется равенство (ФП),х(~),и(1)) =О, (7.84) или, учитывая (7.82), а(Ф(~).,х(~),и(~)) =О, (7.85) где а = (ам ..., а„,), В этом случае вектор управлений и(1) называют особым уиравлеииеи в промежутке ~~', ~"), процесс Предположим, что область управления задачи есть декартово произведение Г х Г, где У С ~"' область допустимых значений вектора и, а Г Е Уг" область допустимых значений вектора и.
Пусть процесс (х(7), и(7), е(~) ) совместно с решением Ф(~) = = (фе(1), ..., ф,(1)) сопряженной системы 267 7.8. Попятив особого уприялоиия Н(Ф(1),х(1),и,е) = Н(Ф(1),х(г)си), т.е. функция Понтрягина не зависит от и и условие максимума по и не дает никакой информации о конкретных значениях управлений в этом векторе. Поскольку на участке особого режима верно тождество дН (7.84), то — как вектор-функция времени тождественно равна ди нулю, а потому равна нулю и ее производная по времени.
Значит, вектор-функции Ф(~), ж(8), и(~) могут принимать только такие значения, которые удовлетворяют соотношению я (яя) (7.86) в котором производнал по времени есть полная производная в силу систем (7.1) и (7.83). Если левая часть этого равенства не зависит от и, то для определения особого управления можно взять следующую производную и приравнять нулю: и т.д.
Эти соотношения совместно с условием (7.84) позволяют выделить все особые режимы. Пример 7.6. Продолжим обсуждение задачи из примера 7.5 и найдем в этой задаче особые режимы. Так как Н(~р,а,и) = 40.'С1+ 41иэ + ~2и, дП то — = фя, и производные по времени этой функции в силу дв систем (7.78) и (7.80) равны — = — ф~ — 2Фюиг, ~э, = — 2я"юи. (ж(1), и(1), е(1)) — особым режимом, траекторию хЯ— траекторией особого режима, а промежуток времени ~1', со)— учасгпном особого управления (режима). Из формулы (7.85) вытекает, что на участке особого режи- ма ?. ПРИНЦИП МАКСИМУМА Поэтому на участке особого режима должны выполняться ра- венства у2(1) = О., — ф~(~) — 2ую(~)хз(1) = О, — 2фю(1)и(~) = О, или, с учетом ую(1) = Сю, у1(~) ь— ч См что следует из сопряженной системы, ~2(1) =О, С1+2Сюхз(1) =О, и(1) =О.
(7.87) Согласно условию 2' теоремы 7.1, п1ахН(Ф(1),х®,и) = М(ФЯ,х(1)) = О, 1 Е [1м 1з1 (и) 1 Значит, на участке особого режима выполняется равенство фю(1)хз(~) + ф~ (~)х„(~) = О, или, с учетом у ю(1) = Сю, ф1(1) = См Сюлз(~)+ С1лз(~) = О. (7.88) Из условия Ф(~) ф О следует, что Сю и С1 одновременно не обращаются в нуль. Тогда, согласно (7.87) и (7.88), на участке особого режима С1 = О, хг(~) = О.
(7.89) Из системы (7.78) выгекает, что х1(1) = О. Поэтому и1(~) = = сопв$, 1 Е [1, 1 '). Итак, на участке особого управления обе фазовые координаты остаются постоянными. Фазовзя точка на таком участке., попадая на ось Охм остается на этой оси неподвижной на весь период особого режима. Фазовой траектории особого режима соответствует единственная точка на указанной оси. Обратим внимание, что такое „стояние" в точке оси не влияет на значение целевого функционала., так как в течение всего времени особого режима подынтегральная функция а~ ~целевого функционала равна нулю. 269 Х8.
Понятие особого управления Теперь мы можем полностью описать все допустимые процессы, удовлетворяк1щие принципу максимума. Оптимальное управление может принимать лишь значения 1 и — 1 на обычных (неособых) участках., а также значение 0 на участке особого режима. Если, двигаясь по оптимальной траектории, мы достигнем оси Ох1 (тогда хз = 0), то в достигнутой точке можем устроить стоянку, причем любой длительности, так как участок особого режима может быть произвольным. Эта стоянка и ее длительность не отразятся на значении целевого функционала. Для описанного процесса существует ненулевой сопряженный вектор Ф(1), удовлетворяющий принципу максимума.
Выясним, сколько нулей может иметь функция фз(~), для чего используем второе соотношение в условии 2' теоремы 7.1. Согласно этому соотношению, фб < 0 и, значит, Сб < О. Из равенств Х2 = и = вбил(1), ф2 = — С1 — 2СОив вытекает, что (7.90) фя+2С1~вЩпфя = О. Покажем, что при Сб < 0 решение такого уравнения может менять знак при 1 Е (11, 1з] не более одного раза. Предположим, что фз(г) обращается в нуль в точках 1', со. Умножим уравнение (7.90) на фз®, учтем, что и проинтегрируем уравнение (7.90) на отрезке (1', 1о]: 1о (7.