XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 21
Текст из файла (страница 21)
Однако требуется не просто решить задачу Коши с заданными начальными условиями, а подобрать вид правой части уравнения так, чтобы решение соответствующей задачи Коши в некоторый конечный момент времени проходило через положение равновесия. При этом выбор правой части должен удовлетворять ограничениям (кусочная непрерывностью(1) и неравенство ~Р®~ < Ре). Пусть такая функция существует (что, конечно, совсем неочевидно), причем не единственная.
Тогда возникает задача оптимального выбора, т.е. выбора такой функции, которая обеспечивает наименьшее время перехода из начального состояния в положение равновесия. Используем ранее введенные обозначения. В каждый момент времени 1 состояние маятника описывается двумя параметрами (фазовыми координатами): углом отклонения х1 = ~р и скоростью р = и2. Значит, фазовое пространство рассматриваемого объекта является двумерным (представяяст собой фазовую плоскость).
Ограничение на фазовые координаты имеет вид 167 6.2. Задача Лаграяжа в форме Понтрягина Уравнение (6.8) в принятых обозначениях сводится к системе дифференциальных уравнений < т1 л2~ й2 =ш и1+и, (6.11) (6.12) а цель управления состоит из единственной точки на фазовой плоскости, соответствующей положению равновесия: (6.13) За критерий качества 1 берем, как условились, время. Нужно выяснить, какое допустимое управление переводит объект, описываемый системой (6.11),из начального состояния (6.12) в нужное состояние (6.Р3) за наименьшее время. Решение поставленной задачи оптимального управления дано в 7.5 при дополнительных предположениях ш = 1, Д = 1, которые несущественны, но упрощают выкладки.
Вопрос о применимости линейной модели для описания реального объекта (маятника), т.е. вопрос об описании области (6.9), не обсуждается. 6.2. Задача Лагранжа в форме Понтрягина Из предыдущего параграфа ясно, что зада са опьчижального упраеленнл очень близка в своей постановке задаче Лагранжи (см. 4). Поэтому мы начнем с обсуждения вариационных методов решения этой задачи. которая относится к законам движения управляемого объекта вида (6.3). Предполагаем, что в начальный момент времени 1 = ~1 = 0 задано начальное состояние объекта б. НАРИАЦИОННЫЕ МЕТОДЫ Для задачи Лагранжа (см. 4.1) 1[Х] — 1 (1~ Х~ Х) Й$ + 1Шп~ Х вЂ” (Х11 х2> ° ° ° 1 хт)~ дз (1, х, х) = О, 1 = 1, и (и ( лп), (6.14) рассмотрим частный случай, когда дифференциальные уравнения (6.14) разрешены относительно производных: 1 х1=1 (гпх1,...,х„,х„,1,...,х ), (6.15) йп Л И~ Х1 ° ° ~ Хп ~ Хп-~-1: ° Хы) ° Переменные х1, ..., х, соответствук1щие производным в левой части системы (6.15), можно рассматривать как фазовые пе- РЕМЕННЫЕ, а ОСтаЛЬНЫЕ ХпЛ1, ..., Хп1 -- КаК уПраВЛЕНия.
ДЛя управлений введем обозначения ид, у = 1., 1', где т = т — и. В таких задачах принято независимую переменную обозначать буквой 1 (она ассоциируется с временем), а не х как в классическом вариационном исчислении. Введенное деление переменных на фазовые переменные и управления позволяет записать дифд1еренциальные связи (6.15) в виде х = Т(1,х,и)., где Х = (х1, ..., хп);и = (и1, ..., и„); Т = (,11,...,Т") ;Х = х',.
Будем рассматривать задачи, в которых целевой функционал с учетом введенных обозначений имеет вид Сл 1[х,и] = 1 (1,х,и)а1. Заметим, что он является 11ырохеденным функционалом, так как его инппеерант 1~(1, х,и) не зависит от производных искомых функций. Предполагается, что отрезок [11, ~я] фиксирован 169 6.2. Задача Лвгрввжв в форме Понтрягина и на его концах поставлены следующие краевые условия: Ф(х(11)) = О, 0(х(~~)) = О, (6.18) где лр = (4 ", ..., ф'), 0 = (д', ..., д1), в, 1 < и. Задачу (6.16) — (6.18) называют задачей Лагранхса в форме Понтпрягина. Предполагаем, что все функции 1' (1 = О, и)., а также функции Ф, 0 дважды непрерывно дифференцируемы, х(1) Е С ((11,12),яг'), и(й) Е С([1п121,К'). В такой постановке задача Лагранжа отличается от задач оптимального управления только классом допустимых функций (в задачах оптимального управления фазовые траектории х(1) кусочно гладкие, а управления и(й) кусочно непрерывньн'.), а также отсутствием ограничений на фазовые координаты и управления.
Для решения задачи (6.16) (6.18) применим подход Лагранжа, основанный на введении множителей Лагранжа и уже использовавшийся ранее (см. 4.2). Составим вспомогательный функциона,л задачи (6.16) — (6.18): н 1*(х,и) = йй+ля Ф(х(11))+вл 0(х(12)).
(6.19) Здесь в Ц1, х, х, и) = 2 (1, х, а) + ~~~ Л, (1) (хл — ~'(1, х, и) ) = 1=1 в+Л (х — ~) (6,20) лагронжион задачи; Л(г) =(Л1(1).," ~Лв(е)) ~ рл — (р1, Рг;"',Ря) ~ т 1г = (о1, ..., о1) — множители Лагранжа. Множители Л;(У) учитывают дифференциальные связи (6.16) (как и в 4.2), а множители р,, о, ограничения вида (6.18).
Теорему 4.1 можно обобщить на случай краевых условий вида (6.18). Такое обобщение означает, что зкстргмали задачи Ла 1ранжа (6.16) .(6.18) являют1я зкстргмалями вспомогательного функционала 1' (х, и1. Чтобы найти экстремали задачи Ла- 170 6. ВАРИАЦИОННЫЕ гЪ|ЕТОДЫ ! г — Š— Е =0 г=1,п. в, т, (6.21) или для данного вида лагранжиана (6.20) (6.22) ( г е ) ~ т г 0 у 1 т (6.23) т где у" = (7'г, 7'г, ..., 7'") . Уравнения (6.23) алгебраические., так как производные и не входят в лагранжиан. К системе (6.22), (6.23) нужно добавить ггсяовня трансверсаяьноспггг на левом и правом концах (см. замечание 4.2): т гг Ф ' г=г, Ь' ** г,=г, г= 1,п; т ггг ггги ' г=г, (6.24) — гг О т т ' г=-г, бl ** г=гг г=1,п; т — гг О ' г=гг' ' г=гг гранжа, нужно из экстремалей вспомогательного функционала выбрать тс, которые удовлетворяют краевым условиям (6.18) и дифференциальным связям (6.16).
Иначе говоря, экстремали вспомогательного функционала, удовлетворяющие краевым условиям и дифференциальным связям, являются экстремаяями задачи Лагранжа. Выпишем, имея в виду сказанное, уравнения для экстремалей задачи (6.16)-(6.18). Уравнения Эйлера вспомогательного функционала, с учетом разделения переменных на фазовые переменные и управления, имеют вид 6.2. Задача Лагранжа в форме Понтрягина 171 из которых лишь первая и третья группы уравнений не явля- ются тривиальными.
Они дают соотношения Лс(1с) = сл сР' (х(1)), с =1, н, (6.25) с=сс ' Л,;(Хз) = — сг 0', (х(1)), с =1,п. с —.с, (6.26) В~х,и] = 1~(с,х,и)с1т+Т[х(тс)]+Т~х(йз)]. Эту задачу часто также называют задачей, Лагранжа в форме Понтрягина. Вспомогательный функционал для нее будет иметь вид В*сх,и] = Бс1с+ си Ф(х(1с)) + се 0(х(1э)) +Т~х(1с)] + Т~х(12)] с, с тем же лагранжианом., что и в предыдущей задаче. Поэтому уравнения Эйлера будут такими же, как и в предыдущей задаче, Чтобы определить экстремали задачи Лагранжа (6.16) — (6.18) в форме Понтрягина, нужно к системе уравнений (6.22) — (6.26) добавить уравнения дифференциальных связей (6.16) и краевые условия (6.18). В результате получим систему 2и+ т уравнений, среди которых 2 се уравнений - дифференциальные первого порядка (уравнения (6.16) и (6.22) ) и г уравнений - алгебраические (уравнения (6.23) ). Решение этой системы зависит от 2п постоянных интегрирования и в + 1 неопределенных множителей Лагранжа ссс и ро Для определения всех 2и+ в+1 неизвестных имеются 2и условий трансверсальности (6.25), (6.26) и в+1 краевых условий (6.18).
Рассмотрим другую задачу, заменив в задаче (6.16)--(6.18) интегральный функционал (6.17) смешанным целевым функци- оналом 172 б. НАРИАЦИОННЫЕ МЕТОДЫ т.е, будут иметь вид (6.22), (6.23). Условия трансверсальности изменятся за счет терминальных слагаемых функционала В[х, и]: А,(11) = (1л Ф'„(х(б))+Т' [х(б)]), 1=1,п, Л;(1з) = — (и Й (х(1))+Т [х(1)]), г =1.,п. Если же ограничений (6.18) нет, то получаем задачу (6.16), (6.21) со свободными концамц -- третью формулировку задачи Лагранжа в форме Понтрягина. Условия трансверсальности в этой задаче имеют вид Аг(12) = — Х~ [х(1)], 1 = 1., гь ~=ч, Мы рассмотрели три задачи, в которых отрезок [1д, 12] фиксирован.
Однако подход Лагранжа позволяет получить необходимые условия в задаче Лагранжа в форме Понтрягина и в случае переменных концов 11 и ~ю Рассмотрим это на примере первой из ранее сформулированных задач задачи (6.16) (6.18). Оказывается, что и при изменяющихся концах ~1 и ~з экстремали задачи Лагранжа являются экстремалями вспомогательного функционала (6.19). Но при этом вспомогательный функционал (6.19) зависит не только от функций х(1) и и(1), но и от переменных 11 и 1Ю т.е.