Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 105
Текст из файла (страница 105)
2 2 с(х (, Их,) с(х (4.57) Уравнение (4.57) представляет собой уравнение в частных производных относительно неизвестной функции 5(х) . Решение уравнения (4.55) будем искать в виде положительно определенной квадратичной формы, т.е, положим о(х) = — х Кх, т 2 где К вЂ” симметрическая матрица. По правилу дифференцирования квадратичной формы Ж5 т — =х К.
ох (4.58) Подставим (4.58) в (4.57): — х~Ях- — х КВК 'В Ктх+хтКАх=О. (4.59) 2 2 Равенство (4.59) можно переписать в виде -х ~9-КВК 'В К +2КА|х=О. (4.60) 2 В левой части равенства (4.60) стоит квадратичная форма. Квадратичная форма обычно задается с помощью симметрической матрицы. Матрица 14 является симметрической. Покажем, что матрица КВК 'В К также является симметрической.
Действительно, в соответствии с известным матричным т равенством (С М) = М Ст, можно записать (КВК 'В К ) =(В К ) (КВК ') = КВ(К ') (КВ) = КВК 'В Кт. Запишем в равенстве (4.60) квадратичную форму хтКАх' с помощью симметрической матрицы. Для этого представим указанную квадратичную форму в виде ,,т Так как К вЂ” симметрическая матрица, то (К 1) = К 1. Поэтому можно записать хт и=-К В ~ — ! т ( по (4.56) Ых Управление (4.56) минимизирует правую часть уравнения (4.53). Действительно, т 1 т 1 ~гт — ~ — х Ох+ — ц Кц+ — (Ах+ Вп)~ = — ~~в К ) = К, ,1нз ~2 2 ах ~Й т.к. К вЂ” положительно определенная матрица. Таким образом, равенство (4.56) задает оптимальное управление.
Подставим оптимальное управление в уравнение (4.53). Получим уравнение 552 Методы тео ии оптимального п авления. Часть 1П х КАх =х ~ — КА+ — А К ~х, т т(1 1 т т) (,2 2 1 тг — х ~Я вЂ” КВВ В К +КА+А К 1=0. (4.61) 2 В левой части равенства (4.61) стоит квадратичная форма. Эта квадратичная форма может равняться нулю только в том случае, если ее матрица равняется нулю. Таким образом, получим равенство Я-КВВ 'В К +КА+А К =О.
(4.62) Уравнение (4.62) называется матричным уравнением Риккати. Матричное уравнение (4.62) позволяет определить искомую матрицу К. Оно эквивалентно системе из п уравнений. Матричное уравнение (4.62) имеет не единственное решение. Из решений уравнения (4.62) необходимо выбрать такое, которое задает определенно положительную матрицу К. Такая матрица определяется однозначным образом. Пусть К вЂ” положительно определенная матрица, являющаяся решением уравнения (4.62). В соответствии с (4.56), оптимальное управление задается равенством ц=-В'В К х. (4.63) Равенство (4.63) задает линейный закон управления, и, следовательно, оптимальная система (4.51), (4.63) является линейной. Покажем, что дяя системы (4.51), (4.63) функция 5(х) = — х Кх т 2 является функцией Ляпунова.
В самом деле, Я(х) — положительно определенная функция. Ее полная производная по времени, вычисленная в силу уравнений (4.51), имеет вид — Я(х)= — (Ахч-Вп]=х КАх — х КВК В К х. Ж тт-~тт Й Ых Из уравнения (4.60) следует, что хтКАх=-х ~КВК 'В К -()1х. тг 2 Подставив (4.65) в (4.64), получим — о(х) = — х Ох--х КВВ В К х. т 1т -~т т й 2 2 Принимая во внимание (4.63), равенство (4.66) можно переписать в виде 1т 1т — о (х) = - — х Ях - — ц Ви. аг 2 2 Поскольку х 9х и ц Вц являются положительно определенными квадратичными формами, то, следовательно, (4.65) — а(х)<0 е( аг лля всех х а О.
В силу теоремы Ляпунова решение х(1) = 0 системы (4.51), (4.63) является асимптотически устойчивым. т т где — КА+ — А К вЂ” симметрическая матрица. Тогда равенство (4.60) принимает 2 2 вид Методытео ииоптимального и авления. Часть!11 554 4.4.2. НЕАВТОНОМНАЯ СИСТЕМА Пусть движение системы описывается уравнением Ых — = А(г) х+ В(г) в, Й здесь А(г) и В(г) — матрицы порядка лхи и пкт, х — и-мерный вектор состояния, в — т-мерный вектор управления. Как и выше, будем полагать, что на вектор в не наложены никакие ограничения.
Качество процесса управления будем оценивать функционалом т .У = — ) (х х!(г)я+в~К(г)в) й, 2, (4.7 1) где Ц(г) — неотрицательно определенная матрица, а К(г) — положительно опреде- ленная матрица. Требуется определить оптимальную стратегию в(х,г), минимизи- рующую функционал (4.7 !). Прн решении задачи оптимизации будем полагать, что конечный момент времени Т фиксирован. Заданными считаются также начальное условие х(гс) и начальный момент времени ге. Однако, в соответствии со спецификой динамического програм- мирования, начальные значения гс н х(0) хотя н полагаются заданными, но могут быть любыми (х(0)нХ, ге >Т). Будем, далее, полагать, что правый конец опти- мальной траектории свободен, т.е.
на значение вектора х в момент времени Т не на- кладываются никакие условия. Для рассматриваемой задачи оптимального управления функциональное уравне- ние Беллмана задается равенством (4.49), которое принимает вид — (-. ч(~ +- к~с + — !~(ь в(>)1. до .~1 т ! т д5 (4.72) дг а ~2 2 дх Для определения минимума продифференцируем правую часть уравнения (4.72) по вектору в. В результате получим уравнение втй(г)+ — В(г) = О, дх из которого следует вт =- — В(г)й '(г), дх или д5 =-(а '()! в'!! ( — ) . (4.73) у'т в= — й '(г)В (г) — ) .
(, дх (4.74) Так как вторая производная от правой части равенства (4.72) равна й(г), а К(г)— положительно определенная матрица, то управление (4.74) доставляет минимум пра- вой части уравнения (4.72). Как и выше, здесь матрицы О(г) н й(г) полагаются симметрическими. Но тогда й ~(г) также является симметрической матрицей. Поэтому уравнение (4.73) можно переписать в виде Глава 4.
Динамическое и о амми ование Подставив управление (4.74) в уравнение Беллмана, получим ;т -д5=1 тО(1) +1д5В(1)В '(1)В(1)В '(1)В'(1) (~~ + дг 2 2 дх (дх д5'чт ) + — А(1)х — В(1)й (1)В (1) дх( 1, дх После преобразования подобных членов это уравнение принимает вид — — = — х Я(1)х- — В(1)В (1)В (1) — ~ + — А(1)х. д5 1 т 1д5 -~ т (д51 д5 (4.75) д1 2 2 дх дх Решение уравнеция (4.75), очевидно, должно удовлетворять граничному условию 5(х(Т),Т) = О. (4.76) Решение уравнения (4.75) будем искать в виде положительно определенной квадратичной формы 5(х,1) = — х К(1)х, (4.77) 2 где К(1) — симметрическая матрица размерности и к и .
Из (4.77) следует, что д5 1 т йК т д5 т — = — х — х „— =х К(1). дг 2 а1 д1 аК Отметим, что матрица,— состоит из производных элементов матрицы К(1) и так- Й же является симметрической. Уравнение (4.75) тогда принимает вид хт х кто(1) х хтК(1) В(1) В-~ (1) Вт (1) Кт (1) х+ хтК (1) А(1) т (4 78) 2 сй 2 2 Перепишем уравнение (4.78) в виде — х Я(1)-К(1)В(1)В '(1)В (1)К (1)+2К(1)А(1)+ — х=О. 2 й3 Квадратичная форма равняется нулю для любого вектора х лишь в том случае, если равна нулю образующая ее матрица.
Таким образом, получили матричное уравнение — =К(1)В(1)В (1)В (1)К (1)-Я(1) — К(1)А(1) — А (1)К (1). (479) сй В уравнении (4.79), как и выше, для получения решения в виде симметрической мат- рицы К(1) выполнено преобразование гК(1) А(1) = К(1) А(1) ~ А'(1) К'(1). Уравнение (4 79) представляет собой матричное уравнение типа Риккати. Его необходимо дополнить граничным условием К(Т) =О, которое следует из условия (4.76). В соответствии с (4.74), оптимальное управление в (х,г) = -В ' (1) В (1) К (1) х.
Оптимальное управление является линейной функцией х, т.е. оптимизация управ- ления линейным неавтономным обьектом (4.70) по критерию (4.71) приводит к не- автономной линейной системе уравнений — = ~ А (1) - В (1 ) В ' (1) В (1) К (1) Д х, 55б Методы тес ии оптимального п авления. Часть 1П 4.6. СВЯЗЬ МЕЖДУ ПРИНЦИПОМ МАКСИМУМА И ДИНАМИЧЕСКИМ ПРОГРАММИРОВАНИЕМ (4.81) 33О 0 = щах ~-Д (х, н ) - — ((х, н) неУ ( ,Й и дЯ 0 = щах -!е(х,н)-~ — г; (х,н) . ееу ~ !дх (4.83) Пусть и(!) — оптимальное управление. Тогда из (4.83) следует уравнение П -!е(х,н)- ) — ~' (х,н)=0. ,ыд, ' Продифференцируем уравнение (4 84) по х (! = 1, л ) .
Получим равенства дГе(х,п) " дзд " дд д~' (х,н) В силу уравнения (4.80) (4.84) (4.85) и аз с с! д5 ) — (' (х,н) = —, ,,дх дх, Ы! дх, н поэтому равенство (4.83) можно переписать в виде 3( д5 дул(х,н) " дд дГ (х,ц) Й дх, дх,,дх дх, !=1,ж (4.86) Установим связь между принципом максимума н динамическим программирова- нием. Пусть движение объекта задается векторным уравнением — =3(х,н), 3!Х (4.80) 33! здесь х н 3 — л-мерные векторы, н — и-мерный вектор управления. Вектор н может принимать свои значения из некоторого заданного множества (!. Рассмотрим двухто- чечную задачу оптимального управления. Будем полагать, что в фазовом пространст- ве Хсистемы заданы начальная х и конечная х' точки.
Требуется среди допустио мых управлений и(!) н (! (время движения не фиксировано), переводящих фазовую точку х из заданного начального положения х в заданное конечное положение х', о найти такое, которое доставляет минимум функционалу !3 .! =) уе(х,п) !!.
33 Соответствующая задача оптимального управления была рассмотрена в пара- графе 4.3. Основное функциональное уравнение Беллмана имеет вид 0 = ппп Те (х, и ) + — 3 (х, и) . 33О (4.82) 33еУ 33Х Будем предполагать, что функция о(х) дважды непрерывно дифференцируема. Так как минимум любой функции д(и) переходит в максимум функции — 8(и), то управление (4.82) можно записать в виде Глава4. инамическоеп о амми ование 557 дЯ Обозначим у, = — и положим уе = -1. Тогда из (4.8б) следуют равенства д», — =О, оЧ'о Ы1 д7' (х,в) ага Именно такими уравнениями определяются вспомогательные переменные в принци- пе максимума (см. уравнение (2.4)).
Далее, соотношение (4.83) можно переписать в виде шах Н(у,х,н) =О. (4.87) и Из равенства (4.87) следует, что оптимальное управление доставляет в каждый мо- мент времени 1 функции Гамильтона максимум и что.функция М(зу(г),х(г))=О. Таким образом, получены (с учетом сделанных выше предположений) все условия теоремы 2.1. 558 Методы тео ии оптимального п авления.
Часть!П ГЛАВА 5. МЕТОДЫ МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ И МОМЕНТОВ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПРОГРАММ И ОПТИМАЛЬНЫХ ПРОГРАММНЫХ УПРАВЛЕНИЙ. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Как указывалось во введении к части 111, построение аналитических решений разнообразных задач оптимального управления возможно лишь в крайне простых случаях. Часто такие задачи могут быть сформулированы лишь благодаря далеко идущей идеализации, когда фактически вместо поставленной задачи решается совсем иная. Основным же подходом к решению реальных задач является приближенная численная оптимизация, методы которой подробно рассмотрены в (44, 47).
Здесь мы ограничимся лишь методами нелинейного программирования для случая, когда используется конечномерная проекционная аппроксимация объектов управления 139). 6.1. АЛГОРИТМ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПРОГРАММНЫХ УПРАВЛЕНИЙ И ОПТИМАЛЬНЫХ ПРОГРАММ МЕТОДАМИ МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ МАТРИЧНОГО ПРЕДСТАВЛЕНИЯ ОПЕРАТОРОВ В ОРТОГОНАЛЬНЫХ БАЗИСАХ Изложенные в восьмой главе первого тома учебника положения можно рассматривать как подходы к решению задачи параметризации всех соотношений, которые используются при построении оптимальных программных управлений н оптимальных программ (редукция задачи оптимального управления к задаче математического программирования). Основной является параметризация математической модели объекта управления.