Ким Д.П. Сборник задач по теории автоматического управления (2008) (1151994), страница 33
Текст из файла (страница 33)
ПРн меча нне. хо = (хо хохозхло), хУ = ф хгУ ховал), о, Ь, и — совой; 1у — тат. 6.16. Определить оптнмальное программное управленне и*(Ф) н оп- тнмальную траекторию х*(Ф) в следуюпгнк задачах оптнмального управления: а) х~ =хм хо=и, х(0) =О, х1(10) =10, хз(10) =О, ю ,7 = и Из -+ ппп о аЗ. Принцип максимума Понтрягина ю ,У= изй- шш; о ю .7= итй- шш; о 10, хт(!0) = О, б) х1 =хз, хт=п, х(0) =О, х~(10) = Ю, в) х1 = хж хт = и, х(0) = О, хт(10) = 10, г) х1 = хт, хз = и — 1, х(0) = О, х~(10) = ю У 2й о д) х1 =хз, хз = и — 1, х(0) =О, х1(10) = ю ,У = итй -+ шш; о е) х~ = хт хт = и — 1, х(0) = О, хт(10) = ю У 2й б о ж) х1 =хм хт=и, х~(0) =5, хз(0) =О, ю хт(10) =О, .У= итй- ппп; о з) х|=хт, хт=и, х1(0)=0, хт(0) =5, ю хз(0) = О, .7 = зРй — + ппп; о и) х~ =хт, хз=и-1, х|(0) =5, х2(0) = ю хт(10) = О, .У = тРй -+ шш; о к) хю = х2, хт = и — 1, х|(0) = О, х2(0) = ю хт(10) = О,,У = аРй -+ шш о 1О, 10, х1(10) = 10, хр(10) = 10, О, х1(10) = Ю, 5, х~(10) = 10, 8.3.
Принцип максимума Понтрягина Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет Ю4 Гл. 8. Мевюды теории оптимального управления определить число и местоположения точек разрыва, и поэтому в этих случаях он не эффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.
Задача с закрепленными концами и фиксированным временем. При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следуюшую задачу Лагранжа: х; = Л(х, ьь 1), 1 = 1, 2, ..., и; ц~(Гсвг хг(го) =хо, хг(1Г) =х,, 1= 1,2, ..., п; У гг ,У = Уо(х, ц,г)йг - ппп(шЕ). (8.8а) (8.8б) (8.8в) (8.8г) (8.9) которую также называют функцией Гамильтона или гамильтонианом. Но она отличается от одноименной функции классического варнационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения и Е 1Г.
В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства. Гамильтониан (8.9), который не включает Функции Гг (1 = О,1, ..., п) непрерывны по совокупности переменных хп ..., х„, ип ..., и„, 1 и непрерывно дифференцируемы по хп ..., х„, 1. Эта задача отличается от задачи оптимального управления классического типа тем, что ограничение задается на управление в виде включения ц Е У, где У вЂ” допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций Д (1 = О,1, ...,и) по и.
В данной задаче долустимыми управлениями считаются управления и(1), принадлежащие к классу кусочно-непрерывных функций и принимающие значения из допустимого множества У. Фазовая траектория х(1) называется допустимой, если она является кусочно- гладкой. При допустимом управлении фазовая траектория задачи (8.8) является кусочно-гладкой: координаты хг(Г) (1 = 1,2, ..., п) непрерывны всюду на интервале [Го,гг[, их производные могут иметь разрывы 1-го рода в точках разрыва управления.
Пара (ц(1),х(1)) называется допустимой для задачи (8.8), если ц(1) и х(1) являются допустимыми управлением и траекторией и х(1) при ц = ц(1) удовлетворяет уравнениям объекта и краевым условиям этой задачи. Рассмотрим функцию 8.8. П нцип максимума Понтрягина ограничение на управление, в отличие от гамнльтоннана, включаюшего ограничение на управленне, называют также функцией Понтрягина. Уравнения ф;=- —, 1=1,2,...,« (8.10а) дх называются сопряженной системой. Принцип максимума прн закрепленных концах н фн кон рован нам времени. Для того чтобы допустимая для задачи (8.8) пара (х'(1), «'(1)) была ее решением, необходимо, чтобы существовали такие не обращающиеся одновременно в нуль константа фо < 0 и решение Ф* = (фы ..., ф„') сопряженной системы (8.10а) лри х = х'(1) и « = «'(1), что при любом 1 Е '1ць 1~), кроме точек разрыва «'(1), функция Й(«) = Н(х',«,ту',1) лри « = «*(1) достигает максимума, т.е.
выполняется соотношение п1ахН(х*,«,ф',1) =Н(х*,«*,ф*,1). (8.106) ьви Задача с подвнжнымн концами н нефикснрованным временем. Рассмотрим задачу Больца х;=Ях,«1), 1=1,2, ...,и; «Е(7СЯ"; дз(х(то),х(17),1о,11) = 0,,1 = 1,2, ..., д < 2«; .7 = дз(х(Фд),х(1~),СзМ + Уо(х, «,1)й1 -+ пйп. (8.11в) Прннцнп макснмума прн подвижных концах н нефиксированном времени. Для того чтобы допустимая для задачи (8.11) пара (х'(1), «*(С)) была ее решением, необходимо: 1) существование таких не обращающиеся одновременно в нуль константы фе < 0 и решения ф' = (ф', ..., ф„*)т сопряженной системы (8ЗОа) при х = х'(Ф) и « = «'(1~, что лри любом 1 Е (1з,17), кроме квочек разрыва «'(1), функция Н(«) = Н(х', «, ф*, 1) при « = «*(1) достигает максимума, т.е.
выполняется соотношение (8.10б); 2) выполнение условия трансверсальности (8.7) дС д0 ф;(ге) = —, ф;(17) =, 1= 1,2, ..., гц дхс(те) дхг(17) ' д0 дС Рассмотрим, какова связь между принципом максимума н методом множителей Лагранжа. Как отмечалось, функция Понтрягнна отличается от гамнльтоннана, рассматриваемого в методе множите- 206 Гл. 8. Методы теории оаеиьиольиого управления лей Лагранжа, тем, что в нее не включено ограничение на управление. Сопряженные уравнения (8.10а) совпадают с уравнениями Эйлера-Лагранжа (8.5а), если отсутствует фазовое ограничение: функция уь определяющая ограничение на управление н фазовые координаты, не зависит от фазовых координат.
Но онн не включают условия стационарности гамильтоннана (уравнения (8.5б)). Их заменяет условие максимума (8.10б). Если ограничение на управление задается в виде равенств, то, используя метод неопределенных множителей Лагранжа нахождения экстремума функции, нз (8.10б) получим недостающие уравнения Эйлера — Лагранжа. Пример 8.7. Определить оптимальное управление в следующей задаче оптимального управления; х~ =ха, ха=и; ~и~ <а, хз(0) = хз(0) = О, хт(10) = О, .7 = -х~(10) — 1п!п .
Решение. Запишем функцию Понтрягина н сопряженные уравнения. Н = 181хз + фзц; дН дН ф,=- — =о, дх, = дх, Терминант и условия трансверсальности имеют вид С = ьэйв = — х~(10), бЧ(Т) = = — 1. до дх1 (10) Решив сопряженные уравнения и учитывая условия трвнсверсальности, находим р1 = -1 рз = Ст -1 В Условии шзхН = тз~хз + швхфтм максимУм достигаетсЯ, когда ~и!~и )и)<а управление принимает граничные значения н его знак совпадает со знаком функции фт, т.е. при и = аяйп18т. Так как знак линейной функции может измениться только один раз, то оптимальным может быть управление а, 0<1<1п ~ — а, О<1<ты а= илии= — а, 11 <1<10, 1 а, 1~ <1<10, где 11 — момент изменения знака функции 18з.
В частности, если 1~ = 1О, то это значит, что функция фз на интервале [0,10< не меняет знак и управление не переключается. Выбор из двух управлений можно сделать исходя из того, какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на основании физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить 8.3.Приниин максимума Поня!рягина за заданное время. Поэтому оптимальным может быть только первое из двух приведенных управлений.
Остается определить только момент 1! переключения управления. Проинтегрируем уравнения объекта при первом управлении с уче- том начальных условий: х 2 ~ ~ ~ ~ ~ ~ ~ ~ | | | ат, 0<1 <1!, Ст — ат, 1! <1< 1О. Используя непрерывность хз(1), т. е, равенство ат! = Ст — а1!, находим Сз = 2а1!. Поэтому последнее соотношение можно записать в виде ~ ~ Х 2 ~~ ~ ~ ~ | | | ~ ~ !~ а$, 0 <1<1!, хт = а(21, 1) 1, <1< 10. Из краевого условия на правом конце траектории имеем: хт(10) = = а(21! — 10) = О.
Откуда для момента переключения находим с! = 5. Таким образом, оптимальное управление имеет вид а, 0<1<5, — а, 5 <1<!О. Задача максимального быстродгйсиггия. Теорема об зэ ин!наэ- оалах. Рассмотрим задачу максимального быстродействия, когда объ- ект является линейным: ь ь х! = ~ ~'аихь+~~~ 'Ь!1иу, ! = 1,2, ..., ЯК ь=! 1=! а! < и! < Д, а! < О, Д > О, ! = 1,2, ..., г; (8.126) хг(то) = хо, х!(ту) = О, ! = 1, 2, ..., гн (8.12в) ,7 = ту — то — пзш . (8.12г) Эта задача называется линейной задачей максимального быся!ро- дгйсяггия. В векторной форме уравнения объекта принимают вид х = Ах+Вы. Предполагается, что эти уравнения являются уравнениями в отклонениях, и поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (х(ту) = 0).
Функция Понтрягина имеет вид ь; ь г я= ![л -,-ь )=~Ь(~~,*,-:-у;ь,,), ь=! г=! где !р~ = (!р! !ут " !р„) подчиняется сопряженному уравнению т дгт Ф дх 208 Гл. В. Методы теории оптимального у аления Согласно принципу максимума, оптимальное управление определяется нз условия п и и пьахН = Сф, ) о!ьхь+и!ах~~ !(з~ йгуизь г=! ь=! г=! у=! где Н = (ц: а < и < )Уу, т' = 1, 2, ..., г). Если выполняется так называемое условие нормальности (см.
ниже), то сумма 2," ! Ььф! обращается в нуль только в изолированных точках. В этом случае из последнего тождества следует, что координаты и*. Ц = 1, ..., г) оптимального управления и'(1) кусочно-постоянны и принимают крайние значения а или Д: п аз, ~~1 6!ф! < О, иге= и ,! =!.2, ..., г. !Уу, ~ Ь;1 Р; > О, г=! В частном случае, когда ду = — аг, имеем, п и' =131з(дпЯВ!г!Р» 1 = 1,2, ..., г.