XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 31
Текст из файла (страница 31)
Из совпадения управлений и равенства (7.44) следуот, что 7, Г (Ф(т), Ви(т)) йт = О, и или (7.47) Рассмотрим равенство Р(Ф(й)) = О. Выполнение этого равенства, как отмечено выше, означает, что при фиксированном 1 функция Г(1,и) тождественно равна нулю. Если предположить, что равенство Р(Ф(~)) = О выполняется на некотором бесконечном множестве значений 1, то, как и в доказательстве теоремы 7.3, можно показать, что аналитическая функция Ф(~) тождественно равна нулю. А это противоречит принципу максимума. Поэтому указанное равенство может быть верным лишь для конечного числа зна ~ений 1. Но тогда равенство (7.47) при условии (7.45) может выполняться только при 1з = 1з. ~ До сих пор мы пользовались только условием 1' теоремы 7.2.
Покажем., что в рамках предположений теоремы 7.5 условие 2' теоремы 7.2 выполняется автоматически: Л4(~(~2) в(~з)) = Н(~р(~2) ~~А) м(~2)) = = (Ф(~з), Аа(~з)) + (Ф(~з), Ви(~~)) = Р(Ф(~я)) > О, так как ж(1з) = я~ = О. В заключение сформулируем теорему существования для линейных систем оптимального быстродействия (условие общности положения многогранника У считается выполненным). 7.5. Задача синтеза управления Теорема 7.6*. Если существует хотя бы одно управление., переводящее фаювука точку системы (7.30) из положения х' в положение х, то существует и оптимальное по быстродействию управление, также переводящее фазовую точку из х в х~.
Задача управления состоит в построении допустпамово управления, реализующего цель. В рамках сформулированной теоремы целью является состояние х". Поэтому теорему 7.6 можно было бы сформулировать так: если для линейной системы решена задача управления, то для нее можно построить управление, оптимальное по быстродействию. Итак, теорема 7.6 утверждает, что оптимальное решение в линейной задаче быстродействия существует.,Любое оптимальное решение является экстремальным,. а по теореме 7.5 экстремальное управление единственно. Следовательно, в рамках теоремы 7.5 существует единственное экстремальное управление, которое является оптимальным.
В этом случае принцип максимума является не только необходимым условием оптимальности, но и достаточным. С его помощью линейная задача быстродействия может быть решена полностью. 7.5. Задача синтеза управления Выше, применяя принцип мансиаулев, мы отыскивали оптимальное управление в виде функции времени ~. Такое управление называют прозраммным управлением. Однако во многих случаях удобнее управление рассматривать как функцию текущего состояния системы, т.с.
как функцию фазовых координопь Это позволяет при построении управления учитывать возмущенное движение. Отклонение состояния системы от расчетного фиксируется и учитывается в последующем управлении. *Докааачелъство теоремы см. а книге: Бонтрявин Л.С., Болтянский В.Г., Гаакреяидзе Р.В., Мащенко Е. со. 240 т. принцип ыАкси1киА Можно представить некоторый технический объект, который снабжен прибором, фиксирующим его текущее состояние путем измерения фазовых координат, и исполнительным механизмом, который по текущим фазовым координатам х реализует управление и(х).
В этой ситуации мы имеем систему с обратной связью с1х — = Ах+ Ви(х). ау Фазовая траектпорня такого управляемого обьентпа зависит от выбора функции и(х), которую называют синтпезируютцей функцией (или обратпной связью). Определение синтезирующей функции, позволяющей реализовывать цель управления, называют синтпезом управления.
Синтез оптимального управления в линейных системах осуществлялся задолго до появления принципа максимума. Одним из первых среди советских ученых результаты в этой области получил А.А. Фельдбаум, который ввел общее понятие оптимального процесса в и-мерном фазовом пространстве*. Впоследствии А.А. Фельдбаум разработал метод фазового пространства, с помощьк> которого была решена задача синтеза управления для линейных систем второго порядка с одним управляющим параметром и с действительными собственными значениями матрицы системы*'. Позже эта задача была решена для систем второго порядка с комплексными собственными значениями.
Появление принципа максимума упростило процедуру решения задачи. Использование этого принципа позволило решить задачу для систем второго порядка с двумя управляющими параметрами. Отметим, что сама постановка задачи синтеза и методы ее решения характерны для теории оптимального управления и гораздо хуже согласуются с методами вариационного исчисления. В этом разделе мы обсудим некоторые задачи, относящиеся к задачам синтеза. *Смс Фельдбаум А.А. (1953 г.) *Смс Фельдбвум А.А.
(1955 г.) 241 7.5. Задача синтеза управления д2, — = и. д42 В качестве области управления возьмем Г = 1и: ~и~ ( Ц. Преобразуем уравнение движения второго порядка введением дополнительных координат в систему дифференциальных уравнений первого порядка: < х1 =х2 х2 =и~ (7.48) ГДЕ Х1=Х, Х2 =Х. Мы имеем дело с задачей быстрейшего попадания в начало т координат хг = (О, О) из заданного начального сосупояния х1 = = (х~1, х2~) .
Функция, понтрягина Й для этой задачи имеет вид Й = уцх2+ 4~2и. Учитывая ограничение ~и~ ( 1 на управление, получаем п1зхй(Ф,х,и) = 1у1х2+фгв18п~2. )и)(1 Согласно теореме 7.3, экстремальное управление и'(1) имеет вид и (с) = в18пф2(1).
(7.49) Из сопряженной системы Быстрейшая остановка движущейся точки в заданном месте. Пусть материальная точка движется по инерции вдоль прямой. Задача состоит в том, чтобы наискорейшим образом остановить движение этой точки в заданном месте, которое мы примем за начало координат на прямой, с помощью ограниченной по величине силы. Закон движения рассматриваемой системы имеет вид 242 7.
ПРИНЦИП МАКСИМУМА и*Я = в18п42Я = в1яп(С2 — С1 7) является кусочно постоянной функцией с двумя значениями 1 и — 1) имеющей не более одного переключения, так как линейная функция С1 — С21 на отрезке [гп 721 меняет знак не более одного раза (это полностью согласуется с теоремой 7.3).
Для интервала времени,на котором и = 1,имеем Х1 = Х2) Х2 =1. Записав систему в симметричной форме [ЧП1] дХ1 бХ2 =Ж) хх 1 получаем уравнение с разделяющимися переменными )1х1 = = ххдх2. Его интегрирование дает х, х1= — +Я. '2 2 (7.50) Аналогично поступаем в случае и = — 1.
Система в симметрич- ной форме имеет вид дХ1 дХ2 а) х2 — 1 откуда Х2 , 2 Х1= — — +Я. 2 (7.51) Семейство фазовых кривых для рассмотренных случаев показано на рис. 7.8, а (и = 1) и рис. 7.8, б (и = — 1). Так как для первой системы 1й = дх2, то движение по параболам в случае находим )р1(1) = С1, )1)2(1) = С2 — С11, где С1, С2 — постоянные интегрирования. Значит, экстремальное управление 7.6. Задача еиитеза управления Рис.
7.8 и = 1 снизу вверх. Для второй системы 11т = — Ыжз и движение по параболам при и = — 1 сверху вниз. Нас интересуют те дуги парабол, которые приводят в начало координат. Учитывая направление движения, заключаем, 1 2 что такими дугами могут быть дуга ОА параболы и1 = — х2 ~(см. 2 рис. 7.8, и) либо дуга ОВ параболы х1 = — — х~ ~(см.
рис. 7.8, б). 1 2 Управление и*'11) имеет не более одного переключения и максимум два интервала постоянства. На первом интервале постоянства нужно выбрать такое из двух значений 1 или — 1, которое привело бы фазовую шпику из начального положения ю~ на одну из дуг ОА или ОВ. На дугу ОА, соответствующую управлению и = 1, можно попасть по траекториям с и = — 1, т.е. двигаясь сверху вниз. Л на дугу ОВ можно попасть лишь при движении снизу вверх (рис. 7.9).
Таким образом, плоскость разделяется на две области. Если и расположена выше В 2 кривой АОВ, то, двигаясь х' "- сверху вниз по кривым семейства 17.51), мы выходим О х на дугу ОА и по зтой дуге после переключения попадаем в и=1 начало координат. Если же А ж расположена ниже кривой АОВ, то начальное движение Рис. 7.9 7. ПРИНЦИП МАКСИМУМА снизу вверх по кривой семейства (7.50) выводит фазовую точку на дугу ОВ, по которой после переключения фвзовая точка попадает в начало координат.
Наконец, отметим, ситуацию, когда начальное положение х' оказыватся на кривой АОВ. В этом случае переход в начало координат не требует переключения. Как видим, для любого начального состояния х1 существует ровно одна экстремальная траектория, ведущая в начало координат (что согласуется с теоремой 7.5). Если оптимальная траектория существует, то она совпадает с экстремальной, т.е.
построенная нами траектория обеспечит наименьшее время движения. Существование оптимальной траектории вытекает из теоремы 7.6. Эта теорема показывает, что в рассматриваемой задаче при любых начальных условиях х1 оптимальная траектория существует, так как существует хотя бы одно управление, реализующее цель. Итак, найденные траектории оптимальны по быстродействию и других оптимальных траекторий, ведущих в начало координат, нет. Как построить в решенной задаче синтезирующукь функцию7 Поскольку для оптимального движения в каждый момент времени нужно выбирать между двумя значениями 1 и — 1, то оптимальное по бь~етро1ействию управление равно: 1, (хм ха) ниже АОВ или на ОА; и (хмхя) = — 1, .(хм ха) выше АОВ или на ОВ. Тогда система с х1= ха, х2 = и (х1,х2) при любых начальных условиях в качестве решения дает оптимальную траекторию.
Нам удалось решить задачу синтеза для рассматриваемой системы. Отметим, что кривую АОВ называют линией переключений. 245 7.6. Задача синтеза управления Приведение маятника в верхнее положение равновесия. Применим принцип максимума к задаче о приведении математического маятника в верхнее положение равновесия (см. 6.1). Эта задача сводится к задаче наискорейшего перехода в начало координат с законом движения < Х1 — Х2~ х2 =ш х1+и, 2 начальными условиями х = (ре, 1р11) и ограничением на управление (и~ < 7е.
Для упрощения выкладок будем считать, что ш =1~ го =1. Запишем функцию О: Й(Ф,х,и) = 1д1хг+зрг(х1 +и). Сопряженная система имеет вид Несложно найти ее общее решение ~УП1]: фс(с) = — С1е'+Сге ~, зргЯ = С1е'+Сге ~, где С1, С2 — постоянные интегрирования, не равные нулю одновременно (Ф не должно быть тривиальным решением). Из условия максимума для функции Й находим управление: 1с) = я1нп'т21с) ° Управление оказывается кусочно постоянной функцией, а так как функция ф2(1) имеет не более одного нуля, то управление имеет лишь одно переключение и два интервала постоянства значения.
Для интервала, на котором и = 1, имеем систему х1 х2~ хг = х1 + 1., 246 7. ПРИНЦИП МЛ КСИ1ИУМЛ из которой получаем уравнение с разделяющимися переменными (х~ + 1) дх1 = хз Ыхз. После интегРиРованиЯ полУчаем (х1+ 1) х2 ~1~ где Я1 — произвольная постоянная. Это семейство гипербол с единым центром в точке ( — 1, 0) .
Так как сМ = дх /хя, движение по гиперболам будет слева направо в верхней полуплоскости хз ) 0 и справа налево в нижней (рис. 7.10, а). Для интервала времени., на котором и = — 1, поступаем аналогично и приходим к другому семейству гипербол с центром в точке (1, 0): (х1 — 1) — хз з= Яз. Движение по этим гиперболам будет слева направо в верхней полуплоскости и справа налево в нижней (рис. 7.10, 6). Рис. 7.10 Как и ранее., нас интересуют дуги тех гипербол, которые приводят в начало координат. Это дуга ОА гиперболы (х~ + 1)з — х~ ~— — 1 и дуга ОВ гиперболы (х1 — 1) — х~ ~= 1.
'Так как управление кусочно постоянно и имеет не более одного переключения, то оно имеет не более двух интервалов постоянства, а соответствующая фазовая траектория имеет не более 7.5. Задача синтеза управления 247 двух дуг гипербол, причем вторая дуга (может быть., единственная) есть часть дуги ОА, если переключение с — 1 на 1, или часть дуги ОВ, если переключение с 1 на — 1. Первая дуга траектории допжна привести фазовую точку из на шльного положения равновесия на дугу ОА при управлении и = — 1 или на дугу ОВ при управлении и = 1. Состыкованная из двух дуг траектория будет оптимальной. Анализ изображений на рис.