XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 27
Текст из файла (страница 27)
Поэтому для них естественно ожидать выполнения уравнений Эйлера., даже если управяяюсцие воздействия достигают ограничений и претерпевакат разрывы. В последнем случае координаты могут иметь угловые точки, а уравнения Эйлера должны выполняться на каждой из дуг зкетремаяи. Сходство уравнений для фазовых координат не распространяется на управления. В вариационной задаче (задаче Лагранжа) управления не ограничиваются и описывакатся непрерывными функциями.
Поэтому гамияыпонова система (6.32) до полной расширяется системой (6.33), которая также является Эйлеровой. Уравнения (6.33) представяяют собой необходимые условия максимума для функции Понтрягина Н. В задачах 211 7.2. Обсуждение принципа максимума оптимального управления функции ц1(1), вообще говоря., разрывны и могут достигать ограничений на управления. Поэтому уравнения Эйлера (6.33) не применимы. Однако условие максимума функции Понтрягина как необходимое условие оптимальности сохраняется и в этом случае.
При этом условие 2' теоремы 7.1 согласуется с условием (7.13) на правом конце, которое получено вариационными методами. Таким образом, условие максимизации функции Понтрягина в принципе максимума является более общим по сравнению с уравнениями Эйлера. Очевидно, что в случае, когда область управления с7 есть открытое множество (тогда условие (6.33) необходимо для максимума функции Н)., из принципа максимума следуют условия оптимальности (6.32) (6.33), полученные методами классического вариационного исчисления.
Итак, принцип максимума выглядит, по крайней мере, достаточно закономерной гипотезой, непосредственно вытекающей из задач вариационного исчисления. Однако, несмотря на то что эта гипотеза почти очевидна, она долгое время не была обоснована. Дело в том, что при выводе необходимых условий принципа максимума в соответствии с определением опгпи ипльноео процесса приходится сравнивать не только близкие одно к другому управления.
В этом отличие этих условий от условий классического вариационного исчисления, в этом их сила и сложность в обосновании. Коснемся основной идеи доказательства*. Сначала принцип максимума был доказан для линейных систем. Идея этого доказательства следующая. Пусть некоторое оптимальное управление переводит точку х' в точку хз.
Если вместо оптимального управления взять другое допустимое управление на том же отрезке [ем 12), то точка х' перейдет в некоторую точку х(г2). В силу свойства линейности совокупность всех построенных таким образом точек х(12) образует *11олное доказательство принципа максимума см. в книге: Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Миигеико Б.Ф. 212 7.
ПРИНЦИП МАКСИМУМА выпуклое множество М. Из оптимальности исходного управления вытекает, что точка х лежит на границе этого множества. Через любую граничную точку, в том числе и через точку ,в, выпуклого множества М можно провести так называемую 2 опорную гиперплоскость, т.е. гиперплоскость, которая проходит через зту граничную точку так, что множество М целиком лежит по одну сторону от этой гиперплоскости. Вектор Ф, ортогональный к этой плоскости и направленный во внешнюю сторону множества М, и является тем вектором., который используется при построении функции 22'.
Для нелинейной системы множество всех точек х(~2), получаемых с помощью всевозможных допустимых управлений, не является выпуклым. Использование линеаризации невозможно, так как она позволяет сравнивать лишь близкие управления, а это не соответствует характеру задач оптимального управления. Успех определил выбор класса управлений для сравнения с оптимальным. При построении этого класса использовались так называемые вариации Макшейна (игольчатые вариации). При таких вариациях управление изменяется на небольшом промежутке времени.
В пределе этот промежуток стягивается в точку, но изменение управления остается конечным. Таким образом, с игольчатыми вариациями в рассмотрение вводятся управления с разрывами первого рода. С помощью нескольких игольчатых вариаций строится допустимое управление, отклоняющееся от оптимального лишь на конечном числе малых интервалов времени. Несмотря на конечность изменения управления в каждом таком интервале, общее изменение функционала будет мало,так как малб время изменения управления. Если такое изменение берется относительно оптимального управления, приращение целевого функционала будет неотрицательным. Таким образом, хотя множество точек ,в(12), получаемых по всевозможным управлениям, и не является выпуклым, некоторое его подмножество выпукло, так что возникает возможность построения опорной гиперплоскости и ортогонального к ней вектора.
7.3. Задача быстродействия 7.3. Задача быстродействия ! (х, и| = Ж = !г — 1!, (7,14) который приводит к задаче оптимального бысгпродейстеия. Здесь 7~(!, х, и) = 1, и функция Х имеет вид Так как первое слагаемое не зависит от и, максимум функции Н по и реализуется одновременно с максимумом функции и Й(глч, х, и) = ~ ~у!о )' (х, и), о=! где гл' = (фг, ..., г)ги). Отбрасывая первые уравнения систем (7.8), соответствующие г = О (йо = 7"~(х,и), г!гб = О), перепишем гамильтоноеу систему в виде сгхг р~ чгг гЦ; ду г =1гой (7.15) г = 1, и. так как Й = и — гРбг то м(гу,х) = впРЙ(Ф,хг~) = м(Ргх) — йгб. иве! Знгигит, из условий г)гб < О и М(Ф, х) = О следует, что М(яч, х) > > О.
Предположим теперь, что функции ф!(в), ..., уг„*(у), существование которых утверждает теорема 7.1, в некоторый Частным случаем функционала вида (7.4) является функци- онал 7. ПРИНЦИП МАКСИМУМА Теорема 7.2. Если (х*(1), и'(1)), 1Е [8~.,12], оптимальный процесс, то найдется ненулевое частное решение Ф*(г) сопрллеенной системы ~4 «1 «Уа)~ (х~ (й) «(1) ) ~ (1) а=1 такое,что: 1' при каждом значении й Е [11«12] функция Н (Ф*(1), х* [й). и) переменного и достигает в точке и = и*(е) максимума: Й(Ф*(г),х*11),и'11)) = м(Ф*Я,х*(1)); 2' в конечный момент времени ~2 выполняется соотношение М(Ф'[12),х'112)) > О.
Замечание 7.2. Как и в случае теоремы 7.1, проверку условия 2' можно проводить в любой момент времени е Е [11, 12]. Пример 7.1. Рассмотрим задачу оптимального быстродействия для системы < х1 х2+ 1« Х2 = — Х1+ и (7.16) момент времени 1 обращаются в нуль: Ф" (1) = О. Тогда Й1Ф*(1),х"(й)«и*(1)) = О и, значит., Н(Ф*®,х*(е),и*(е)) = = ~о(1). Из условий М(Ф*«х') = О и М(Ф*(1),х*®) = сопле (см. замечание 7.1) получаем у«е(1) = О.
А это противоречит теореме 7.1«так как Ф'(Х) = О и, следовательно, функция Ф*(1) тождественно равна нулю как решение линейной системы дифференциальных уравнений с нулевыми начальными условиями. Значит, и вектор-функция Ф*® = (ф~(1), ..., ф„'11))«и вектор- функция Ф*(1) = Я (1) «Ф*(й) ) не обращаются в нуль ни в одной точке отрезка [11, 12]. Итак, из теоремы 7.1 вытекают следующие необходимые условия оптимальности по быстродействию.
215 7.а. Задача быстродействия с областьк~ управления Г=1иЕК: ]и](Ц, (7.17) начальным состоянием (7.18) и конечным состоянием х,(1я) =О, х,(1а) = -4. (7.19) Запишем для поставленной задачи функцию Й: Й(Ф,х,и) =~~ 11 ~ (х,и) =у11(х2+1)+1ез( — х~+и). (720) (7.21) Согласно принципу максимума, оптимальное управление и"(1) должно доставлять максимум функции Й. Из (7.20) с учетом (7.17) имеем М1Ф',х') = шакЙ(Ф",х*,и) = ~~ (ха+ 1) — фзх1 + ф~ яяпФ2, и причем и*1ь) = ядам~(1). Найдем ф~(1). Из (7.21) получаем фя + фя = О. Интегрирование этого уравнения дает [ЧП1] ~* = С в1п(1 — Сз), (7.22) где С~ > О, С1 - постоянные интегрирования.
Значит, оптимальное управление имеет вид и*(е) = я8пуй(х) = я8пяп(1 — Сг). (7.23) Для сопряженных переменных у11 и фз с учетом (7.8) получаем систему 216 7. ПРИНЦИП М.4КСИМУМА < х1 = х2+ 1~ 22 х1+ 1. (7. 24) Из представления (7.23) вытекает следующее: 1) при оптимальном процессе управление в любой момент времени принимает одно из своих предельных значений: 1 или — 1; 2) переход от одного значения к другому, или, как говорят, переключение, происходит через интервал времени, равный л. Исключение может составлять только первый участок движения: первое переключение определяется значением постоянной С2 и может произойти через интервал времени, меньший я.
Эти выводы фактически исчерпывают ту информацию, которую можно получить о структуре оптимального управления из принципа максимума. Для полного решения задачи необходимо найти постоянные С1 и С2, а для этого нужны, например, начальные условия для функции Ф(1). Но эти условия не могут задаваться произвольно, так как однозначно определяют функцию у12(1) „следовательно, управление и(1) = в18пф2(1) и у1азоеую траекторию х(1). Но процесс (х(1), п(1)) должен удовлетворять краевым условиям задачи, которые еще не были учтены.
Таким образом, начальные условия для Ф(1) должны вытекать из краевых условий задачи. Завершить решение задачи можно следу1ощим образом. Найдем совокупность траекторий, соответствующих постоянным управлениям, равным предельным значениям ~1. Очевидно, что искомая траектория состоит из дуг траекторий, соответствующих этим постоянным управлениям. При этом дуги траекторий стыкуются так,чтобы удовлетворялись краевые условия (7.18), (7.19).
Тогда все параметры оптимального процесса будут полностью определены. Итак, найдем траектории, соответствующие управлению и = 1. Для этого в систему (7.16) подставим и = 1: 217 7.3. Задача Оыстродвйотаия Полученную систему записываем в симметричной форме [УПЦ: ~1х1 ~1хг х2+ 1 х1 + 1- или ( — х1+1)дх1 = (хг+1)дхг. Интегрируя, приходим к урав- нениям окружностей с центром в точке 01(1, — 1): (х1 — 1)2-е (х2+1) = Л . (7.
25) Движение фаэовой точки вдоль любой из этих окружностей происходит по часовой стрелке, так как по часовой стрелке направлен вектор фазовой скорости (тп хг) = (хг+1, — х1+1). При этом движение происходит с постоянной угловой скоростью, равной единице, так как угловая скорость ш и линейная скорость о при движении по окружности радиуса Л связаны соотношением и /гхг + хг Л Л Значит, полный оборот по окружности совершается за время 2к, а за время к фазовая точка пройдет половину окружности. Аналогичным образом выглядит семейство интегральных кривых системы (7.16) при и = — 1. Это окружности с центром в точке 02( — 1, — 1): (х1+1) +(хг+1) =Л .