Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 50
Текст из файла (страница 50)
Вернемся теперь к задаче оптимального управления с фиксированными концами и фиксированным временем. Приведем ее., видоизменив несколько запись уравнений объекта: 1,(х,п,1) — й; = О, 1 = 1,2,,п; (9. 24а) (9. 24б) (9.24в) увь(х,п,1) = О, 1е = 1,2,...,1; тЯо) = ты т'(11) = т~, 1 = 1, 2,..., и; Π— 1о(х,п,1) е11 — г шш ев Эта задача оптимального управления представляет собой рассмотренную выше задачу Лагранжа. Составим функцию Лагранжа: 1 = 4>оУо+ ~~' Ф.Ж вЂ” й ')+~~',Льувь (9.25б) Здесь роль аргумента я играет вектор (х,.п). И так как в функцию Лагранжа не входит производная п, уравнения Эйлера — Лагранжа имеют вид и' (9.25а) 289 0,2.
Метод множителеа Лагранжа Уравнения Эйлера-Лагранжа записывают также с помощью функции гг Н=~ 'фУ;+~Л,р„ (9.26) которая называется функцией Гамильпзона или гамильгпонааном. Так как гамильтониан связан с функцией Лагранжа соотношением п Ь = Н вЂ” ~~ фито г=1 то уравнения Эйлера — Лагранжа (9.25) принимают вид дН (9.27а) ди, дН =О, в=1,2,...,г. ди.
(9.276) зй =фг Н =Ни, (9. 28) 19 Д.П. Ким Уравнения (9.27б) называют условием стационарностиг так как они представляют собой условие экстремума гамильтониана при каждом фиксированном 1 б [уо, у ]. Как увидим дальше при рассмотрении принципа максимума, оказывается, что действительно на оптимальной траектории гамильтониан как функция от управления достигает максимума при оптимальном управлении.
Сформулируем основной результат. Правило множителей Лагранжа (с закрепленными концами и фиксированным временем). Если допустимая нара (п(г), х(1)) является решением задачи оптимального управления (9.24), то найдугася такие не равньге одновременно нулю многи:интли Лагран; жа, что эта пара удовлеглворяет уравнениям Эйлера — Лагранжа (9.25), (9.27). В соответствии с этим правилом, чтобы найти оптимальное управление и оптимальную траекторию, надо решить совместно уравнения (9.24а), (9.24б) и (9.27) при краевых условиях (9.24в). Условия Вейерилтпрасса- Эрдмана.
Уравнения Эйлера Лагранжа получены при предположении, что управление и(г) является непрерывной функцией, а траектория х(1) гладкая на интервале [го, ~й]. Однако правило множителей Лагранжа остается справедливым и в том случае, когда п(г) принадлежит классу кусочно непрерывных функций, а х(г) - классу кусочно гладких функций. Если оптимальное управление п(1) имеет разрыв первого рода в каких- либо точках, то оно само и соответствующая ему траектория х(1) должны удовлетворять указанным выше уравнениям лишь в точках непрерывности управления. В точках разрыва управления, которыс называются угловыми, должны выполняться условия [3] 290 Гл.
о. Методы теории опгпимального упраеленил Эта система имеет решение — С11 -~- Сг фг — — Сг узг = — Сг1+ Сг, и = для управления в уравнения объек- Подставив полученное выражение та и решив их, получим СПг Сге хг = — + — +Сз 4 2 Из краевых условий имеем С 13 С Ег — + + Сзг+ С4. О, хг(10) = — 25 Сг + 5 Сг = О, Сг + 25 Сг = 1. хг(0) = Сз = О хг(0) = Сл = 250 х1(10) = —— 3 где индексы — и + обозначают левый и правый пределы соответствующих функций. Условия (9.28) называются условиями Веберштрасса — Эрдмана. Множители Лагранжа определяются с точностью до постоянного множителя. Действительно, они входят в уравнения Эйлера — Лагранжа линейно и однородно, и эти уравнения не изменятся, если все множители умножить на одно и то же постоянное число.
Условимся в неособом случае (фо ф 0) принимать еро = — 1. Дальше, если особо не оговаривается, будет подразумеваться, что имеет место неособый случай. Как отмечалось, уравнения Эйлер — Лагранжа являются необходимым условием: любое решение задачи оптимального управления (9.24) является экстремалью, т.е.
удовлетворяет уравнениям Эйлера — Лагранжа, но не лк>бая экстремаль, удовлетворяюшая граничным условиям, является решением задачи (9.24). По если решение задачи существует и экстремаль, удовлетворяюгдая граничным условиям, единственна, то, очевидно, эта экстремаль и будет решением. Пример 9.1. Решить задачу поворота вала двигателя на угол 1 рвд, с последующей остановкой за 10 с при минимальном расходе энергии без учета момента сопротивления (ие = 0).
Эта задача математически формулируется следующим образом; хг = хг, хг = 'и, хг(0) = хг(0) = О, 1а хг(10) = 1, хг(10) = 0:, л' — ~и~с(1 — > ш1п. о Решение. Ясно, что зада га имеет физический смысл, т.е. имеет место неособый случай. Поэтому, как мы условились, полагаем его —— = — 1. Составим гамильтониан (см. (9.26)): + 4'1хг + 'Фг и. Уравнения Эйлера — Лагранжа (9.27) принимают вид дН дН дН чч — — — —— О, фг = — = — еч, — = — 2 и+ уЗг — — О. дх1 ' дхг ' ди у.д. Метод иножителед Лаеранжа 291 Отсюда находим С» = 3/125, Са = З,е25, Сз = О, .С» = О. Оптимальное управление и оптимальная траектория имеют вид и*(е) = — ( — —.1+ — ), т~(1) = — ( — — 1 + 31 ), Если требуется, чтобы после поворота вала двигателя на угол 1 рад.
он не вращался, нужно положить и = 0 при 1 > 10. 9.2.4. Правило множителей Лагранжа для задач оптимального управления с подвижными концами. Рассмотрим задачу оптимального управления с подвижными концами и фиксированным временем классического типа. Эта задача отличается от рассмотренной выше задачи (9.24) тем, что изменяются краевые условия, и критерий оптимальности может иметь любой из указанных при классификации видов, т.е. в этом случае задача оптимального управления может быть вариационной задачей Лагранжа, Больна и Майера. Когда концы закреплены и время фиксировано, задача оптимального управления может быть только задачей Лагранжа. Получим необходимое условие. Начнем с простейшей вариационной задачи с подвижными концами и фиксированным временем ое а' = до[у(1о),д(1»)[+ ~~о(у, у,1) й -» ех1г. оо ФУнкции до и 1о непРеРывны и диффеРендиРУемы по всем своим аргументам.
Порядок вывода необходимых условий такой же, как и в случае задачи с закрепленными концами. Некоторые особенности появляются из-за того, что в силу подвижности граничных точек их также нужно варьировать, чтобы найти оптимальные граничные точки.
Опять все выкладки будем выполнять, предполагая, что д(о) принадлежит к классу гладких функций. Пусть экстремум достигается на функции у*(1). При произвольной фиксированной функции д(1) функционал д = до[у*(го) + еу(1о), д*(11) + ед(1»)[+ О + ГХо(д" + е д(1)о и+ е д(1), Х) й = Ф(е) оо является функцией от числового аргумента е. Эта функция достигает экстремума при е = О.
Поэтому согласно необходимому условию экстремума функции имеем дФ(е) дуо — дуо у(ео) + у(гу) + + 1У,'„(д',д',1) д(1) + (од(1»*,д',1) д[й = О. ео 292 Гл. д. Методы теории опгаимального управления Интегрируя второе слагаемое под интегралом по частям, получим еур(е) ддо -( ) ддо е1е е=о ду(го) ду(С е) О +Ходу ~,,'+~Ко(у':у*,1) — ~— ,Х~д(у',у*,1)) уд1=О (9.29а) й;=Д(х,ц,1), 1=1,2,...,п; ьгь(х,ц,1) = О, й = 1,2,...,1; д (х(1о),х(1Д = О, у = 1,2,...,д ( 2п; (9.296) (9.29в) Пусть оптимальные граничные точки у*(1о) и у*(ьу) найдены. Функция у (1) должна доставлять экстремум функционалу при фиксированных граничных точках у(1о) = у'(го) и у(17) = у*(11).
Поэтому она должна удовлетворять уравнению Эйлера го (у:у '1) 3 гоь(у 'у '") О' С учетом этого уравнения имеем ло(ду(1)Ход)У(о)(ду(е)+Ход!)У(~7) В силу произвольности и независимости у(го) и у(17) отсюда получаем ддо '~ ~ ддо у О еь ду(ео) ои О ее ду(1 е) Эти соотношения называются условиями трансверсальности. В случае, когда у является вектором: у = (уз уз ... ур), условия транст версальности принимают вид Уравнения Эйлера в скалярной форме имеют вид (9.21). Итак, решение вариационной задачи с подвижными концами, кроме уравнений Эйлера, должно удовлетворять условиям трансверсальности. Уравнения Эйлера-Лагранжа. имеют такой же вид, что и в случае задачи с закрепленными концами.
Заметим, что дифференциальные уравнения объекта (9.24а) и уравнения Эйлера "Лагранжа (9.27а) имеют порядок п. Поэтому при их решении будем иметь 2п постоянных интегрирования. При закрепленных концах граничные условия представляют собой 2п соотношений, которые позволяют определить все постоянные интегрирования. Однако при подвижных концах траектории граничных условий недостаточно, чтобы можно было их определить. Недостающие соотношения как раз и доставляют условия трансверсальности. Получим необходимые условия оптимальности для задачи оптимального управления с подвижными концами; У.г.
Метод иножитпелей Лагранжа 0 д = до(х(1о), х(17)] + ~ 1о(х, п,1) д1 — ~ шш. (9.29г) м Граничные условия (9.29в) предполагаются независимыми, функции (Д(х(1о),х(17)] О = 1,2,...,д) --. непрерывными и дифференцируемыми по всем своим аргументам.
На остальные функции накладываются такие же требования, как и в случае задачи с закрепленными концами. Используя прием Лагранжа, преобразуем задачу (9.29) в простсйпзую задачу Больна 0 ,У = С(х(1о),х(1у),м]+ /Ь(х(1),х(1), п(1),ф(1),Л, 1) й -ь ппп, где Ч С = ~ Рсуе Ро = фо~ и и Е = фоло+ ~~,ф Ц вЂ” т,;)+ ~Аьоь = Н вЂ” ~фгй* ~=1 ь=г ~=1 Функцию С называют терминантом (3]. На основании полученных выше результатов можно показать, что уравнения Эйлера — Лагранжа совпадает с уравнениями (9.25) и (9.27). Продифференцировав функцию Лагранжа по т„получим Ас = — фь Поэтому условия трансверсальности можно записать в виде А*(1о) = —, ф*(1у) =, 1=1,2,...,п.