М.И. Зеликин - Однородные пространства и уравнение Риккати в вариационном исчислении (1998) (1155773), страница 13
Текст из файла (страница 13)
Мы рассматриваем функционал ,7 = У(й, х(й)! *'(й)) йй, (2.1) где х Е К", а 7: К' х К" х К"-+ К! — Заданная гладкая функцИЯ 1 в я от аргументов, принадлежащих области Й с К х К х К, в которой будут проводиться все последующие рассмотрения. Требуется найти функцию х( ): К -+ К класса С, удовлетворяющую ! и 1 фиксированным граничным условиям х(й )=а, х(й,)= Ь, (2.2) 1 на которой функционал (2.1) достигает С -минимума. Для нахождения точек минимума функционала 7 надо приравнять нулю первую вариацию, т. е. первую производную этого функционала по х(.): й(~ )=О, Ь(2,)=О.
(2.4) тттт (С+ Итт) 4-!(Ст+ Ит~) !1 (тт,( )Ь Ь) Итт (2.6) 78 глАВА К УРАВНЕНИЕ РИККАТИ В ЗАРИАЦИОННОм иСчИСЯЕНИИ Предположим, что решение уравнения (2.3) с граничными условиями (2.2) существует. Обозначим это решение через х(2). Для того чтобы х( ) действительно реализовывало минимум функционала (2.1), необходимо, чтобы вторая вариация рассматриваемого функционала в точке х(.) была неотрицательной квадРатичной фоРмой на пРостРанстве Со(1то, 2!]), т.
е. на пространстве функций Ь(-), имеющих непрерывную производную на (Фо, Ф,] и удовлетворяющих граничным условиям Напомним, что вторая вариация исходного функционала определяется формулой т! 6~.7ен(й(.)) = Ф(2, Ь, Ь) т( т = ь 1 ! = — ~](А(1)й, Ь)+2(С(2)Ь, й)+(В(2)й, й)]с(2, (2.5) где А(2), В(2) и С(2) — матрицы размера их и с элементами и . соответственно. Угловые скобки в (2.5) означают скалярное произведение.
Заметим, что матрицы А и В симметричны. Мы будем предполагать, что выполнено усиленное условие Лежандра, т. е. что матрица А положительно определена. Как было показано в гл. 1, сильная положительность второй вариации является достаточным условием минимума. Уравнение Риккати связано с изучением квадратичной формы 6~.7. В частности, одним из главных предназначений уравнения Риккати в классическом вариационном исчислении является его использование для доказательства положительной определенности второй вариации. Как и в гл. 1, преобразуем (2.5), прибавив к подыитегральному выражению полную производную от некоторой квадратичной формы от Ь с переменными коэффициентами $ ! . УРАВНЕНИЕ РИККАТИ ХАК УСЛОВИЕ ПОЛОЖИТЕЛЬНОСТИ ВАРИАЦИИ 79 Коэффициенты этой формы мы подберем позднее.
Прибавление выражения (2.6) не меняет самого интеграла (2.5) в силу граничных условий (2.4). Прибавление к подынтегральному выражению (2.5) полной производной (2.6) преобразует (2.5) к виду т, 1( Ц(т)й, Ь)+2(С(2)Ь, Ь)+ (В(2)й, Ь)]+ + (Итй, Ь) + 2(ИГЬ, й)] т(т. (2.7) Подберем коэффициенты квадратичной формы И' таким образом, чтобы подынтегральное выражение (2.7) было полным скалярным квадратом некоторого вектора. Получаем уравнение Ит =(С+ Ит)А !(С + Ит) — В, (2.8) которое называется (матпричным) дифференциальным уравнением Риххатпи. Лемма 2.1.
Если в хачестпве начального условия уравнения Рикхатпи взятпа симметприческая матприца Ит(~ ), тпо решение уравнения Риххатпи будетп силтметпричесхим при всех значениях т. Доказательство. Рассмотрим уравнение которое получено транспонированием уравнения (2.8). Тогда если Ит(т) — решение (2.8), то Ит~(2) — также решение этого уравнения. Эти решения имеют одинаковые начальные условия и по теореме о единственности решения Ит(Ф) = Ит (2) при всех 2. С1 Подведем итог вышеприведенных рассуждений в виде следующей теоремы. Т е о р е м а 2.1. Если сущестпвуетп симметпричесхое решение И'(2) уравнения (2.8), определенное на всем интервале (Ес, Т!], тпо функционал (2,5) полозтитпельно определен на простпранстпве С,(]те, т!]). 80 глАВА к уРАВнение РиккАТН В ВАРНАционном исчислении з к у Авнеиие Риккати для зхдхчи с диеее енцихльными связями 81 р 2.
Уравнение Риккати для задачи с дифференциальными связями Второй подход к изучению уравнения Риккати связан с уравнением Гамильтона — Якоби для функционала (2.5). Напомним, что уравнение Гамильтона — Якоби — это уравнение в частных производных относительно неизвестной функции Б(т, Ь). Функция Я(т, Ь) определяется как минимальное значение функционала (2.5) (в котором надо положить г, = т), принимаемое на гладких функциях Ь(г), с граничными условиями Ь(Го) = 0 и Ь(т) = Ь. Как было показано в гл.
1, функция 3(т, Ь) является решением уравнения дд / до 1 =-Н~.,Ь,— (, дт 1. ' ' дЬ,Г'' (2 9) где Н(Г, Ь, р) — гамильтониан функционала (2.5), т. е. преобразование Лежандра от подынтегральной функции (2.5) по переменным Ь. В рассматриваемом случае преобразование Лежандра устроено следующим образом. Введем импульс р= —. =АЬ+ С Ь.
дФ т (2.10) дЬ Определитель матрицы А не равен нулю в силу усиленного условия Лежандра. Поэтому из формулы (2.10) величину Ь можно выразить как функцию от Ь и р: Ь= А-'р А-'СтЬ. После этого гамильтониан определяется следующим образом: Н(т, Ь, р) = -Ф+ <р, Ь) = 1 = — — 1<А(г)Ь, Ь>+2(С(а)Ь, Ь>+ <В(г)Ь, Ь>1+ <р, Ь> Подставляя А 'р — А 'СГЬ вместо Ь, получаем гамильтониан функционала (2.5) 1 Н(т Ь р) [<р СтЬ А-1р А-1СтЬ)+ 2(С(А-1р А-1Ст)Ь Ь) + (ВЬ Ь> 2<у А-1р А-1СГЬ) 1 =- [(А 1р,р) — (ВЬ,Ь>+(СА 'СГЬ,Ь) — 2(р,А 'СГЬ)~. (2,11) Гамильтониан (2.11) квадратично зависит от переменных р, Ь, поэтому решения уравнения Гамильтона †Яко можно искать в виде квадратичной формы д = †(ИГ(Г)Ь, Ь>/2, где мад8 трица И~ симметрическая.
Так как — = — И'Ь, то дЬ дд 1 — — = — (ИГЬ, Ь) = дт 2 1 2 = — (А 'И'Ь,И'Ь)+ (А 'СГЬ, ИГЬ)+ — ((СА 'С вЂ” В)Ь, Ь), Симметризуя матрицу квадратичной формы, стоящей в правой части, мы получаем для матрицы И' уравнение Риккати (2.8). Задача с дифференциальными связями. Используя этот подход, уравнение Риккати можно получить и дяя более общих вариационных задач, в частности для задачи с дифференциальными связями. В вариационном исчислении эта задача называется задачей Лагранжа.
В простейшем виде она формулируется следующим образом. Минимизировать интегральный функционал ч Х =,Г(г, х(г), х(г)) Иг и на кривых х(1) ~ С', удовлетворяющих граничным условиям х(го) = ° х(г~) = Ь и системе обыкновенных дифференциальных уравнений Ф(г, х(г), х(1)) = О, (2.12) где хай", Г": й'хй"хй" — ~й', Ф: й'хй"хй" — й — заданные гладкие функции от аргументов, принадлежащих области й с с й' х й" х й". Для того чтобы задача Лагранжа не оказалась вырожденной, следует предположить, что т < и. В противном случае минимизировать придется по дискретному (или даже по пустому) множеству траекторий.
Задача оптимального управлении. Задачу Лагранжа можно несколько преобразовать к более удобной для дальнейшего исследования форме. Временно зафиксировав значения переменных 8 и х, рассмотрим дифференциальные связи (2.12) как 82 ГЛАВА 2. УРАВНЕНИЕ РИККАти В ВАРИАЦИОННОМ ИСЧиСлении уравнения относительно х. В силу условия т< гь эта система определяет в гь-мерном пространстве переменных х некоторое (в общем случае (гт — т)-мерное) многообразие Я.
В окрестности неособой точки многообразия ВТ') можно ввести координаты и, изменяющиеся в области сг' Е ак" "', которые параметризуют многообразие РТ в рассматриваемой окрестности. В этих координатах система (2.12) эквивалента системе х= у(2, х,и), (2.13) где и б сТ. Подставив формулу (2.13) в функционал (2.1), получим я .7 = Р(2, х(2), и(2)) г12. (2.14) го Задача оптимального управления формулируется следующим образом. Пусть и(1) — произвольная измеримая функция, принимающая значения в множестве 0', х(2) — абсолютно непрерывная функция, являющаяся решением уравнения (2.13) с выбранным и(г).
На решениях системы обыкновенных дифференциальных уравнений (2.! 3), с граничными условиями х(Го)=а, х(2,)=Ь, требуется минимизировать функционал (2.14). Переменная и называется угьравлеьгиелс. Этот термин, название которого происходит из прикладных экстремальных задач, в данной ситуации оправдывается тем, что функция н(2) может быть выбрана произвольно. После того как такой выбор сделан, решение управляемой системы (2.13) при фиксированном начальном значении х(го) определяется однозначно. Ситуация, изучающаяся в теории оптимального управления, отличается от классической постановки задачи Лагранжа тем, что в теории оптимального управления область изменения управления с,г может быть произвольной. Чаще всего она замкнута, в типичных ситуациях значения оптимального управления лежат на границе множества СТ.
В классической же задаче Лагранжа эти значения принадлежат открытому множеству. дФ ') То есть в окрестности такого значении х, что матрица Якоби —, имеет максимальный ранг равный т. $2, уРАВнение РиккАТН для зАЛАчи с диФФерегяпталышми сВязями 83 Линейно квадратичная задача. Методы теории оптимального управления можно применять для решения классических задач вариацнонного исчисления. Рассмотрим, например, с этой точки зрения задачу Лагранжа. Необходимым условием оптимальности для задачи Лагранжа является неотрицательность второй вариации функционала (2.1) на решениях уравнения в вариациях для дифференциальных уравнений связи (2.12). Как и в классическом Вариацнонном исчислении, это необходимое условие связано со следующей гг)гмсоедитьетгтаот1 линейно квадратичной задачей. На решениях лннеййой системы дифференциальных уравнений ,Ц2)Ь(2)+М(2)Ь(2) =О (2.15) с граничными условиями Ь(2о) = Ь(2,) = О минимизировать функционал 1 б~.~<)(Ь())= Ф(2, Ь, )ь) Ы= ч [(А(2)Ь, Ь)+2(С(2)Ь, Ь>+(В(2)Ь, Ь>) И2.
Через А[2), В(2) и С(2) — обозначены пх тьматрицы с элементами ~ . . ~, ~ ~ и ~ †. ~ соответственно, а через ~дхгдх,.)' ~дхадх,.~ ~дхгд*,.~ дФ .Т(2) и )кг(к) обозначейы матрицы частных производных —. и дх дФ дх' Необходимое условие минимума в задаче Лагранжа можно переформулировать как утверждение о том, что минимум в присоединенной задаче равен нулю. Так же, как и задача Лагранжа, присоединенная задача допускает переформулировку в терминах теории оптимального управления. Допустим, что один из миноров порядка т матрицы а.(2) не обращается в нуль при 2 е [го, г,].
Без ограничения общности можно считать, что этот минор соответствует первым т компонентам вектора Ь. 84 ГЛАВА З. УРАВНЕНИЕ РИККАТИ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ 4 к УРАВНЕНИЕ РИКЕАти дпя ЗАДАчн С ДнафЕРЕНциАЛЬНЫМИ СВязямИ 88 Тогда систему (2.15) можно разрешить относительно переменных Ь. Последние и — т компонент вектора Ь обозначим через и: (2.16) Тогда система (2.15) принимает вид Ь = а(Ф)Ь+ Ь(Г)и, (2.17) где а и Ь вЂ” матрицы размера и х и и и х (и- т) соответственно. Заметим, что последние и — т уравнений системы (2.17) в соответствии с обозначениями (2.16) имеют вид Ь4=и, й=т+1,...,п.
Подставив (2.17) в функционал (2.5), получим и Х(Ь) = — ~ [(Р(4)и, и) +2(4~(4)Ь, и) + (Л(Г)й, Ь)[с1Г, (2.18) 1 Г где Р(г) — ((и — т) х (и — т))-матрица, Л(Ф) — (и х п)-матрица и Я(е) — ((и — т) х п)-матрица. Заметим, что в формуле (2.18) угловые скобки для первых двух слагаемых подынтегральиого выражения обозначают скалярное произведение в К", в то время как последняя угловая скобка †скалярн произведение в Ж". Линейно квадратичная задача оптимального управления состоит в том, чтобы минимизировать функционал (2.18) с граничными условиями Ь(зо) = Ьо, Ь(Г,) = Ь, (2.19) на решениях системы (2.17).