Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 51
Текст из файла (страница 51)
(9.30) д0 аа аа,(с ) ' * 0,(ег) ' Отдельные координаты граничных точек могут быть фиксированы. Соотношения, определяющие эти координаты, в выражение для терминанта С не включаются, и так как при определении необходимых условий они не варьируются, в условия трансверсальности не нужно включать соотношения, содержащие частные производные по этим координатам. В частности, если начальная точка закреплена, т.е. заданы все координаты точки х(оо), то в условии (9.30) все первые соотношения с частными производными по х,(1о) должны быть исключены.
Правило множителей Лагранжа (с подвижными концами и фиксированным временем). Если допустимая пара (п(1),х(1)) являегпся решением задачи оптимального управления (9.29), то найдутся такие не равные одновременно нулю множшпели Лагранжа, что этпа пара удовлетворяет уравнениям Эйлера-Лагранжа (9.25), (9.27) и условиям трансверсальности (9.30). Коли управление терпит разрыв, то решение (п(ь),х(1)) должно удовлетворять уравнениям Эйлера-.Лагранжа в точках непрерывности управления.
В угловых точках (в точках разрыва управления) должны выполнятся условия Вейерштрасса-Эрдмана. 294 Гл. у. Методы теории опепимального управления Н = — и + г(ге ха + феи, дН дН дН = О, г(г = — = — фг, — — 2и+ г)гз = О. дхг ' дхг ' ди Решением уравнений Эйлера — Лагранжа является — Сге+ Сг п= 2 фг = Сг фз = — Сг1+ Сг., В данном случае С = 0 и нефиксированным является только координата хз(10). Поэтому условие трансверсальности принимает вид фз(10) = = О. дС дхг(10) Исходя из этого условия находим фз(10) = — Сг10 + Сз = О, или Сз = = 10Сь Соответственно для управления получаем и = Се(10 — 1)г2.
Подставив это выражение в уравнение объекта и проинтегрировав, получим хз = — (201 — 1 ) + Сз: хг = — ( 10 1 — †) + Сз1 + Сл. Сг С г 3) Учитывая краевые условия хг(0) = Сл = 0~ хз(0) = Сз = 0) хг(10) = — Сг = 1, 500 и (1) = 0.003(10 — е),. х*(Х) = 0,0005(30 е~ — 1~), х'(1) = 0,0015(20 Х вЂ” 1~). 9.2.5.
Правило множителей Лагранжа для задач оптимального управления с нефиксированным временем. Задача оптимального управления с подвижными концами и нефиксированным временем формулируется следующим образом; х; = (;(х,п,г), г = 1,2,...,и; уь(х,п,1) = О, й = 1,.2,...,1; Чтобы получить решение задачи (9.29), нужно решить уравнения (9.29а), (9.29б) совместно с уравнениями Эйлера — Лагранжа (9.27) при краевых условиях (9.29в) и условиях трансверсальности (9.30). Пример 9.2.
Решить задачу поворота вала двигателя на угол 1 рад. без последующей остановки за 10 с при минимальном расходе энергии без учета момента сопротивления (и, = 0): хг = хз, хз = гл; хг(0) = хз(0) = О, го хг (10) = 1,,7 = / и е1е -+ шш о Решение. Эта задача отличается от задачи, рассмотренной в примере 9.1,. только краевым условием на правом конце траектории. Как было получено, гамильтониан и уравнения Эйлера — Лагранжа имеют вид 293 длй Метод множителеа Лагранжа д,[х(1о),х(1е) го,1е] = 0 .у = 1,2,....,д ( 2п+ 2; (9.31в) д = до[х(1о), .х(11), со, Ху) + ~Хо(х, п, Х) сЫ -ь шш (9.31г) фг(11) =, 1 = 1,2,...,и; (9.32а) дС дх,(11) ' (9.32б) Условия (9.32а) совпадают с условиями (9.30). Дополнительными являются соотношения (9.326).
Если начальный момент 1о или конечный момент 11 фиксирован, то соответственно первое или второе условие из (9.32б) исключается. Задачи с подвижными концами и нефиксированным временем являются наиболее общими. Из них как частные случаи получаются задачи с фиксированным временем и закрепленными концами. Правило множителей Лагранжа (для задачи с подвижными концами и нефиксированным временем). Юля того чтобы допустимая пара, (п(Х),х(1)) была решением задачи оптимального управления (9.31), необходимо, чтобы существовали такие не равные одновременно нулю множители Лагранжа, чпгв эта пара удовлетворяет уравнениям Эйлера-Лагранжа (9.25). (9.27) вв всех точках непрерывности управления и условиям трансверсальнвсти (9.32). В точках разрыва управления (если гпакввые сущесгпвуют) вытюлняются условия Вейерщгпрасса Эрдмана. Пример 9.3.
Определить оптимальное управление в задаче максимального быстродействия дС чп(1о) =— /и~д1 = Ь, о хг — — хг, хг = и; хг(0) = хг(0) = О, хг(су) = Н, хг(11) = О, о' = 1е †> гпщ Р е ш е н и е. Преобразуем изопериметрическое ограничение: хз = и, хз(0) = О, хз(11) = Ь. В данном случае имеем до = 11 и С = подо = — 11. Так как граничные точки траектории закреплены и начальный момент задан (фиксиро- Очевидно, если допустимая пара (п*(ь), х'(1)) является решением задачи (9.31) при 1 Е [1о,1*), то она будет решением этой же задачи при фиксированном времени: 1о — — Я и 1л =1~. Поэтому решение задачи (9.31) должно удовлетворять уравнениям Эйлера.
Лагранжа и условиям трансверсальности, причем условия трансверсальности дополняются соотношениями, обусловленными вариацией начального или конечного моментов времени или того и другого и принимают вид 296 Гл. у. Методы теории оптпималвного управлении ван), то условия трансверсальности принимают вид Гамильтониан и уравнения Эйлера Лагранжа имеют вид Н = фзхг + фги + фзиг; до дн фз = — — =О; фг = — — = — фы фз дх! ' дхг = — — =О, дН дхз дН вЂ” = фг + 2 фзи = О. да. Из последних уравнений имеем Сг 4 — Сг ф, = С„ф, = -Сз Ь+ Сг, фз = Сз, и = 2Сз или хг = — СзЬ вЂ” СгЬ + Сз г 2 хз = — С44 — Сге + С41 + С 3 1 г 6 2 з~ хз = — С,'Ь вЂ” СзСгЬ + Сгз+ Св.
3 Из граничных условий имеем хз(0) = Сз — — О, хг(0) = С4 = 0 хз(0) = Св = 0; г 1 г СгЬл = Н, хг~Ьу) = — С411 — Сг42 = О, г 3 г г 3 — Сз Ьу — СзСгау + б г1у = Ь. хз(Фу) = — СгЬ 1 — з 1 6 г 2 хз(Ьу) = Отсюда находим Ь Сз = — —, Оптимальное управление имеет вид Ь зг3Ь и' = СзЬ вЂ” Сг = — — Ь+ )/ —. Ы \/ 2д Здесь, как и в примерах 9.1 и 9.2, из физических соображений предполагается, что решение задачи существует. Поэтому единственное управление, удовлетворяющее правилу множителей Лагранжа, будет оптимальным.
В данном примере условия трансверсальности при нахождении оптимального управления не использовались. Они потребовались бы, если бы было нужно определить множители Лагранжа. Сз Сг и=С41 — Сг, Сз —— , Сг= 2Сз ' 2Сз Подставив последнее выражение для управления в уравнение объекта и в дополнительное уравнение, получим 297 9Л. Принцип максимума Понтрягина 9.3. Принцип максимума Понтрягина Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет определить число и местоположения точек разрыва, и поэтому в этих случаях он неэффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.
Принпип максимума, сформулированный Л. С. Понтрягиным в 1953 г. как необходимое условие экстремума для задач оптимального управления, был доказан и развит им, его учениками и сотрудниками [3, 12, 51]. 9.3.1. Задача с закрепленными концами и фиксированным временем. При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следующую задачу Лагранжа: и Е У С Л', (9.33а) 1 = 1, 2,..., и; (9.33б) и и А = 4010 + Х ууа — х ) = Н вЂ” Х гу й; й, = (г(х, п,1), 1 = 1, 2,..., и, тг(10) — хг т~(11) — т~ 0 ,7 = / Д(х, и, 1) й1 — ~ шш (шЕ). (9.33в) м Функции г", (1 = 0,1,...,и) непрерывны по совокупности переменных яы..., .я„, иы..., и,,1 и непрерывно дифференцируемы по ям ..,, я„, й Эта задача отличается от задачи оптимального управления классического типа (9.24) тем, что ограничение задается только на управление и в виде включения и Е У, где à — допустимое множество значений управления.
Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций Л (1 = О, 1,..., п) по и. В данной задаче допуспшдкиии управлениями счи~аются управления п(1), принадлежащие к классу кусочно непрерывных функций и принимающие значения из допустимого множества Г. Фазовая траектория х(1) называется допустимой, если она является кусочно гладкой. При допустимом управлении фазовая траектория задачи (9.33) является кусо*шо гладкой: координаты и,(1) (1 = 1, 2,..., и) непрерывны всюду на интервале 1е, 1г], их производные могут иметь разрывы 1-го рода в точках разрыва управления.
Пара (й(1),х(1)) называется допустимой для задачи (9.33), осли й(1) и х(1) являются допустимыми управлением и траекторией и х(1) при и = й(1) удовлетворяет уравнениям объекта и краевым условиям этой задачи. Применим к задаче (9.33) прием Лагранжа [3]. Составим функцию 298 Гл. у. Методы теории опгпималвного управления где (9.34) е.=о Здесь функции А и Н также называют функцией Лагранлеа и гамильтонианоле.
Но они отличаются от одноименных функций классического вариационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения ц 6 У. В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства. Гамильтониан (9.34), который не включает ограничение на управление, в отличие от гамильтониана, включающего ограничение на управление, называют также функцией Понтрягини В соответствии с приемом Лагранжа задача (9.33) сводится к задаче Х= / А(х,х, ц,ф,1) Ю вЂ” в шах; поп (9.35а) Хз = ~Цх,х,п*,вР,1) й1 — ~ шах, л,о ео х,(1о) = х,, х,(11) = х,, 1=1,2,...,п; М лз = / Ь(х,х, ц,уу, 1) его -+ епйх, поп или и Х=) ~во,,в.)-Ее.,:,~« хе» ~а 1=1 х,(Уе) = хо, х,,Я) = х~, 1=1,2,...,п; и А = йв "...