Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 49
Текст из файла (страница 49)
По критерию оптимальности различают: а) задачу Больца --- критерий оптимальности имеет вид д = до(х(1о),х(Ц),1о,17] -1- /,7о(х.,ц,1) д1; м б) задачу Лагранжа критерий оптимальности имеет вид еа в) задачу Майера -- критерий оптимальности имеет вид д = до(х(1о), х(17), 1о,17] Задача Майера в частном случае, когда функционал имеет вид д = до(х(17), уе] (т.е. зависит только от конечного состояния и, быть может, от конечного момента времени), называется задачей терминального управления, а когда функционал имеет вид д = (еу — 1о) называется задачей максимального быстродействия. Среди рассмотренных выше задач задача 7 является задачей Лагранжа, остальные задачи являются задачами Майера, причем задачи 1, 2, 5 и 6 являются задачами максимального быстродействия. Задачи Больца., Лагранжа и Майера эквивалентны в том смысле, что путем преобразования переменных каждую из задач можно преобразовать в любую другую задачу.
286 0.2. Метод множителей Лагранжа 9.2. Метод множителей Лагранжа (методы классического вариационного исчисления) Если концы закреплены и время фиксировано, то задачу оптимального управления классического типа можно сформулировать как следующую задачу Лагранжа классического вариационного исчисления: х, =1,(х,п,с), 1=1,2,...,п: ~рь(х,п,с) = О, к = 1,2,...,1:, х1(го) = х,, хд(Ц) = х,, 1 = 1, 2,...,п; ч д = ~ус(х, и, 1) д1 -+ гшп. м Предполагается, что функции уг(х,п,1) (1 = 0,1,,п) и ооя(х, п,1) (к = 1,2,...,1) являются непрерывными и дифференцируемыми по всем своим аргументам, управление п(г) принадлежит классу кусочно непрерывных функций, а траектории х(1) "- классу кусочно гладких функций. Напомним, что функция п(1) называется кусочно непрерывной на интервале [1о, 11], если она (т.
е. каждая его координата) непрерывна всюду на [1о, 11], за исключением конечного числа точек, где она имеет разрыв первого рода (существуют конечные прецелы слева и справа). Функция х(1) называется кусочно гладкой на [1о,11], если на [1о,11] она сама непрерывна, а ее производная кусочно непрерывна. Управление п(1) из класса кусочно непрерывных функций называют допустимым управлением, а траекторию х(1) из класса кусочно гладких функций допустимой траекгпорией.
Пару (п(1), х(1)) называют допустимой, если допустимыми являются п(1) и х(1). В каждой конкретной задаче на допустимые управления и траектории могут быть наложены дополнительные ограничения. Поэтому при рассмотрении определенного класса задач эти понятия могут уточняться. 9.2.1. Уравнения Эйлера. Рассмотрим сначала простейшую задачу классического вариационного исчисления б д(у) = /Уо(у, у,1) Ж вЂ” г ехог, (9.16) м у(1о) = у ~ у(11) = у . (9.17) Пока для простоты будем считать, что у(1) является скалярной функцией и принадлежит классу С ([1о,11]) непрерывно дифференцируемых функций на интервале [1о,11].
Экстремум ищется среди функций указанного класса, удовлетворяя>щих заданным краевым условиям. Такие функции будем называть допустимыми. 286 Гл. у. Методы теории он>надольного управление Пусть экстремум достигается на допустимой функции у*[1).
Функция у[>) = у" (>) + ву(1) (е — — число) будет допустимой, если у(1) Е Е С'([>о,17)) и выполняются краевые условия у[1,) =О, д[1,) =О. [9.18) При каждом фиксированной у(г) получаем функцию от числового аргумента >> Ф[в) = Я[у'+ суй) = ~~о[у + еу, .у* + еу, >) г>>, которая достигает экстремума при е = О. Поэтому согласно необходимому условии> экстремума производная этой функции по е в точке е = 0 обращается в нуль: >> = ~У' „[у", У, 1) у Я + Й„[у': у*, 1) у) й1 = О. Интегрируя второе слагаемое по частям и учитывая краевые усло- вия (9.18), получим >> / = /Ион[у у* 1) ~оу(у:у Е)[уЖ = О.
[9.19) Согласно основной лемме вариационного исчисления, при произвольной функции у(1) Е С>([1о,11)) последнее равенство возможно, если только Д„,(у, у, й) Д,„[у, у,1) — О. [9.20) Это уравнение называется уравнением Эйлера. Таким образом, если функция у*® доставляет экстремум функционалу (9.16), она удовлетворяет уравнению Эйлера. Лопустимая функция, удовлетворяющая уравнению Эйлера, называется экстремалью или стационарной точкой задачи [9Л6), [9.17). Следовательно, решения задачи (9.16), (9.17) являются экстремалями.
В общем случае обратное неверно: не всякая экстремаль будет решением рассматриваемой задачи. Выкладки при выводе уравнения [9.19) не изменятся и в случае, когда у[1) - векторная функция. Покажем, как в случае векторной функции у[1) из уравнения (9.19) получить векторное уравнение Эйлера [9.20). По определению производные скалярной функции уо по векторным переменным у = (у> уз ... ур)~ и у = (у> уз ... ур)~ являются вектор-строками [см. параграф 1.9): Уох = Уои Уои ' ' ' Уои„) Уоу = Уоич Уор ' ' ' 1оя„)' у,е. Метод множигаелей Лагранжа 287 Умножив эти вектор-строки на вектор-столбец у = (уз уз ...
у„)т, соотношение (9.19) можно представить в виде =/ ~ (,(,'„— —,У,',„)уед1=0. Го Это равенство должно выполнятся при произвольной функции у(1) 6 б С ((1о, $1))., и, в частности, когда все ее компоненты, кроме одной, равны нулю: у ~ 0 и у, = 0 при всех 1 ~ у1 Полагая, что у пробегает все значения от 1 до р, из последнего уравнения получим (9.21) Эта система представляет собой скалярную форму записи векторного уравнения (9.20).
9.2.2. Уравнения Эйлера — Лагранжа. Рассмотрим задачу Лаг- Ф;(к,к,1) = О, 1 = 1,2,...,р; (9. 22а) оее(к,1) = О, й = 1, 2,..., 1; (9.22б) к(1о) = х, к(1у) = к~; (9.22в) О д = /Фо(х,х,1)й — > ехуг, (9.22г) ео Здесь к вектор-столбец размера е; Ф, (1 = 0,1,...,р), Зея (Й = = 1, 2,..., 1) -- дифференцируемые по всем своим аргументам функции. Эта задача отличается от простейшей вариационной задачи тем, что на аргументы функционала помимо краевых условий наложены дополнительные ограничения (связи (9.22а) и (9.226)).
Для получения необходимого условия воспользуемся приемом Лагранжа, который преобразует задачу на условный экстремум в задачу на безусловный экстремум. Составим функцию Р 1(х,х,ер, Л,1) = ~ ~йЧФе+ ~ ~Леээе + 4~оФо, е=1 я=1 где ф, (1 = 1,2,...,р) функции времени, Ля (й = 1,2,... Л) и 1ео константы. Функция Ь(х, к,ер,Л,1) называется функцией Лагранжа,. функции ф, (1= 1,2,...,р) и константы Ля (й = 1,2,...Л) и 1ео (неопределенными) множителями Лагранжа. Прием Лагранжа состоит в том, что он преобразует задачу (9.22) в простейшую задачу вариационного исчисления О Х= ~у(х,к,ф,Л,1) е1е — э ехог, к(1о) = к, х(11) = к~. ее Здесь 1У = (фо фе ... 9г)т, Л = (Лд Лз ...
Ле)т. 288 Гл. у. Методы теории опгпимальноео управления Последняя задача имеет смысл, если множители Лагранжа не равны одновременно нулю. Под равенством нулю множителей йп (1 = = 1, 2,..., р), являющихся функциями, понимается их тождественное обращение в нуль. Кроме того, если вдо = О, то функционал,1 и соответственно решение не зависят от исходного функционала. Это возможно, если задача физически поставлена не совсем корректно, т. е.
не имеет физического смысла. Этот случай назовем особым. Интерес представляет неособый случай фо ~ О. В преобразованной задаче роль независимого аргумента играет вектор у = (я 15 А ), а роль подынтегральной функции функт т тт пня Лагранжа.
С учетом того, что функция Лагранжа не зависит от производных уг и Л, уравнения Эйлера принимают вид (см. (9.21)) (9.23а) Ао = О, у = 1,2,...,р; Ц„= О, у = 1,2,...,1. (9.23б) Уравнения (9.236) совпадают с уравнениями (9.22а) и (9.22б). Позтому достаточно ограничиться уравнениями (9.23а) и решать их совместно с уравнениями (9.22а) и (9.22б) при краевых условиях (9.22в). Уравнения (9.23а) называют уравнениями Эйлера Лагранжа. 9.2.3. Правило множителей Лагранжа для задач оптимального управления с фиксированными концами.