Ким Д.П. Сборник задач по теории автоматического управления (2008) (1151995), страница 33
Текст из файла (страница 33)
Принцип максимума Понтрягина Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет Ю4 Гл. 8. Мевюды теории оптимального управления определить число и местоположения точек разрыва, и поэтому в этих случаях он не эффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина. Задача с закрепленными концами и фиксированным временем. При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следуюшую задачу Лагранжа: х; = Л(х, ьь 1), 1 = 1, 2, ..., и; ц~(Гсвг хг(го) =хо, хг(1Г) =х,, 1= 1,2, ..., п; У гг ,У = Уо(х, ц,г)йг - ппп(шЕ).
(8.8а) (8.8б) (8.8в) (8.8г) (8.9) которую также называют функцией Гамильтона или гамильтонианом. Но она отличается от одноименной функции классического варнационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения и Е 1Г. В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства. Гамильтониан (8.9), который не включает Функции Гг (1 = О,1, ..., п) непрерывны по совокупности переменных хп ..., х„, ип ..., и„, 1 и непрерывно дифференцируемы по хп ..., х„, 1. Эта задача отличается от задачи оптимального управления классического типа тем, что ограничение задается на управление в виде включения ц Е У, где У вЂ” допустимое множество значений управления.
Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций Д (1 = О,1, ...,и) по и. В данной задаче долустимыми управлениями считаются управления и(1), принадлежащие к классу кусочно-непрерывных функций и принимающие значения из допустимого множества У. Фазовая траектория х(1) называется допустимой, если она является кусочно- гладкой. При допустимом управлении фазовая траектория задачи (8.8) является кусочно-гладкой: координаты хг(Г) (1 = 1,2, ..., п) непрерывны всюду на интервале [Го,гг[, их производные могут иметь разрывы 1-го рода в точках разрыва управления.
Пара (ц(1),х(1)) называется допустимой для задачи (8.8), если ц(1) и х(1) являются допустимыми управлением и траекторией и х(1) при ц = ц(1) удовлетворяет уравнениям объекта и краевым условиям этой задачи. Рассмотрим функцию 8.8. П нцип максимума Понтрягина ограничение на управление, в отличие от гамнльтоннана, включаюшего ограничение на управленне, называют также функцией Понтрягина. Уравнения ф;=- —, 1=1,2,...,« (8.10а) дх называются сопряженной системой. Принцип максимума прн закрепленных концах н фн кон рован нам времени. Для того чтобы допустимая для задачи (8.8) пара (х'(1), «'(1)) была ее решением, необходимо, чтобы существовали такие не обращающиеся одновременно в нуль константа фо < 0 и решение Ф* = (фы ..., ф„') сопряженной системы (8.10а) лри х = х'(1) и « = «'(1), что при любом 1 Е '1ць 1~), кроме точек разрыва «'(1), функция Й(«) = Н(х',«,ту',1) лри « = «*(1) достигает максимума, т.е.
выполняется соотношение п1ахН(х*,«,ф',1) =Н(х*,«*,ф*,1). (8.106) ьви Задача с подвнжнымн концами н нефикснрованным временем. Рассмотрим задачу Больца х;=Ях,«1), 1=1,2, ...,и; «Е(7СЯ"; дз(х(то),х(17),1о,11) = 0,,1 = 1,2, ..., д < 2«; .7 = дз(х(Фд),х(1~),СзМ + Уо(х, «,1)й1 -+ пйп. (8.11в) Прннцнп макснмума прн подвижных концах н нефиксированном времени. Для того чтобы допустимая для задачи (8.11) пара (х'(1), «*(С)) была ее решением, необходимо: 1) существование таких не обращающиеся одновременно в нуль константы фе < 0 и решения ф' = (ф', ..., ф„*)т сопряженной системы (8ЗОа) при х = х'(Ф) и « = «'(1~, что лри любом 1 Е (1з,17), кроме квочек разрыва «'(1), функция Н(«) = Н(х', «, ф*, 1) при « = «*(1) достигает максимума, т.е.
выполняется соотношение (8.10б); 2) выполнение условия трансверсальности (8.7) дС д0 ф;(ге) = —, ф;(17) =, 1= 1,2, ..., гц дхс(те) дхг(17) ' д0 дС Рассмотрим, какова связь между принципом максимума н методом множителей Лагранжа. Как отмечалось, функция Понтрягнна отличается от гамнльтоннана, рассматриваемого в методе множите- 206 Гл. 8. Методы теории оаеиьиольиого управления лей Лагранжа, тем, что в нее не включено ограничение на управление. Сопряженные уравнения (8.10а) совпадают с уравнениями Эйлера-Лагранжа (8.5а), если отсутствует фазовое ограничение: функция уь определяющая ограничение на управление н фазовые координаты, не зависит от фазовых координат. Но онн не включают условия стационарности гамильтоннана (уравнения (8.5б)). Их заменяет условие максимума (8.10б).
Если ограничение на управление задается в виде равенств, то, используя метод неопределенных множителей Лагранжа нахождения экстремума функции, нз (8.10б) получим недостающие уравнения Эйлера — Лагранжа. Пример 8.7. Определить оптимальное управление в следующей задаче оптимального управления; х~ =ха, ха=и; ~и~ <а, хз(0) = хз(0) = О, хт(10) = О, .7 = -х~(10) — 1п!п . Решение. Запишем функцию Понтрягина н сопряженные уравнения. Н = 181хз + фзц; дН дН ф,=- — =о, дх, = дх, Терминант и условия трансверсальности имеют вид С = ьэйв = — х~(10), бЧ(Т) = = — 1. до дх1 (10) Решив сопряженные уравнения и учитывая условия трвнсверсальности, находим р1 = -1 рз = Ст -1 В Условии шзхН = тз~хз + швхфтм максимУм достигаетсЯ, когда ~и!~и )и)<а управление принимает граничные значения н его знак совпадает со знаком функции фт, т.е.
при и = аяйп18т. Так как знак линейной функции может измениться только один раз, то оптимальным может быть управление а, 0<1<1п ~ — а, О<1<ты а= илии= — а, 11 <1<10, 1 а, 1~ <1<10, где 11 — момент изменения знака функции 18з. В частности, если 1~ = 1О, то это значит, что функция фз на интервале [0,10< не меняет знак и управление не переключается. Выбор из двух управлений можно сделать исходя из того, какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на основании физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить 8.3.Приниин максимума Поня!рягина за заданное время.
Поэтому оптимальным может быть только первое из двух приведенных управлений. Остается определить только момент 1! переключения управления. Проинтегрируем уравнения объекта при первом управлении с уче- том начальных условий: х 2 ~ ~ ~ ~ ~ ~ ~ ~ | | | ат, 0<1 <1!, Ст — ат, 1! <1< 1О. Используя непрерывность хз(1), т. е, равенство ат! = Ст — а1!, находим Сз = 2а1!. Поэтому последнее соотношение можно записать в виде ~ ~ Х 2 ~~ ~ ~ ~ | | | ~ ~ !~ а$, 0 <1<1!, хт = а(21, 1) 1, <1< 10. Из краевого условия на правом конце траектории имеем: хт(10) = = а(21! — 10) = О.
Откуда для момента переключения находим с! = 5. Таким образом, оптимальное управление имеет вид а, 0<1<5, — а, 5 <1<!О. Задача максимального быстродгйсиггия. Теорема об зэ ин!наэ- оалах. Рассмотрим задачу максимального быстродействия, когда объ- ект является линейным: ь ь х! = ~ ~'аихь+~~~ 'Ь!1иу, ! = 1,2, ..., ЯК ь=! 1=! а! < и! < Д, а! < О, Д > О, ! = 1,2, ..., г; (8.126) хг(то) = хо, х!(ту) = О, ! = 1, 2, ..., гн (8.12в) ,7 = ту — то — пзш .
(8.12г) Эта задача называется линейной задачей максимального быся!ро- дгйсяггия. В векторной форме уравнения объекта принимают вид х = Ах+Вы. Предполагается, что эти уравнения являются уравнениями в отклонениях, и поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (х(ту) = 0). Функция Понтрягина имеет вид ь; ь г я= ![л -,-ь )=~Ь(~~,*,-:-у;ь,,), ь=! г=! где !р~ = (!р! !ут " !р„) подчиняется сопряженному уравнению т дгт Ф дх 208 Гл.
В. Методы теории оптимального у аления Согласно принципу максимума, оптимальное управление определяется нз условия п и и пьахН = Сф, ) о!ьхь+и!ах~~ !(з~ йгуизь г=! ь=! г=! у=! где Н = (ц: а < и < )Уу, т' = 1, 2, ..., г). Если выполняется так называемое условие нормальности (см. ниже), то сумма 2," ! Ььф! обращается в нуль только в изолированных точках.
В этом случае из последнего тождества следует, что координаты и*. Ц = 1, ..., г) оптимального управления и'(1) кусочно-постоянны и принимают крайние значения а или Д: п аз, ~~1 6!ф! < О, иге= и ,! =!.2, ..., г. !Уу, ~ Ь;1 Р; > О, г=! В частном случае, когда ду = — аг, имеем, п и' =131з(дпЯВ!г!Р» 1 = 1,2, ..., г. !=! Для линейных задач максимального быстродействия при выполнении так называемого условия нормальности принцип максимума является не только необходимым, но и достаточным условием оптимальности.
Для определения этого понятия введем в рассмотрение (и х и)-матрицы ФЦ] = ]В!(АВ)1 ". (А" !В)1], где Вг, (АВ)г, ..., (А" 'В)' — гче столбцы матриц В, АВ, ..., А" 'В соответственно. Условие нормальности. Говорят, что для объекта х = = Ах+ Ви выполнено условие нормальности или условие общности положения, если матрицы ФЯ не еырождены: бесам(1] ф О (,~'= 1,2, .... !').