Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 57
Текст из файла (страница 57)
Построить наблюдатели полного и пониженного порядков для управляемой системы а1 тг тг и У т1 Решение. В данном случае имеем 0 0' В 1' С (10)' Как следует из (9.60)., наблюдатель полного порядка имеет вид + и+ „1 (у — т1), или, в скалярной форме, т1 = тг + Й1 (У вЂ” т1) тг = п + Йг(У вЂ” т1). Для построения наблюдателя пониженного порядка необходимо определить матрицы С', В1, Вг. Матрица С' должна быть такой, 326 Гл.
у. Методы теории опгпимальпого управления (С) чтобы квадратная матрица ~, ~ была невырожденной. В остальном она может быть произвольной. Условию невырожденности указанной выше квадратной матрицы удовлетворяет матрица С' = 10 1). Из соотношения (9.64), которое в данном случае принимает вид С' О 1 О 1 находим Ьз — — (1 О)т, Вг — — (О 1)т.
Подставив выражения для А, В, С, С', Вз и Вя в (9.67) и (9.68), получим у = — йд — йг+ и, х = д+ у. Напомним, что матрица К или, в случае наблюдателя понижен ного порядка, скалярная величина й выбирается из условия устойчи- вости и требований к качеству наблюдателя. 9.6. Синтез оптимальных систем управления Как отмечалось, методы множителей Лагранжа и принцип максимума, как правило, позволяют находить программное оптимальное управление, т.е. оптимальное управление как функцию времени. Метод динамического программирования позволяет находить оптимальное управление с обратной связью, .но при этом приходится решать нелинейные уравнения в частных производных.
В этом параграфе будут рассмотрены методы решения некоторых задач синтеза оптимальных систем управления с обратной связью. 9.6.1. Метод фазовой плоскости синтеза оптимальной по быстродействию системы. Пусть задана вполне управляемая линейная стационарная система х = Ах+ Ви, ~и~ < 1, х й Л", и е Л. все корни характеристического уравнения которой действительны. ',5аметим, что ограничения более общего вида о < и < (з, где а < 0 и 13 ) О., введением нового переменного и = 2и — (а + Д/(аД) всегда приводится к приведенному выше виду (и~ < 1. Рассмотрим задачу синтеза оптимального по быстродействию регулятора, обеспечивающего перевод системы из произвольной начальной точки в начало координат.
Так как управление скалярное, условие нормальности совпадает с условием управляемости, поэтому выполняются все условия теоремы об и интервалах. В соответствии с этой теоремой оптимальное управление, имея не более и интервалов постоянства, принимает только крайние значения: — 1 или 1. Если представить его как функцию 9.6. Синтез опв1амальнмх систем управления 327 фазовых координат а' = а*(х), то ясно, что все фазовое пространство разбивается на два подпространства: подпространство, в котором и* = — 1, и подпространство, в котором и* = 1. Гиперповерхность (при и = 2 кривая, при и = 3 поверхность), которая делит фазовое пространство на указанные подпространства,.называют гаперповерхностаю (кривой, поверхностью) переключения. Если записать уравнение гиперповерхности а(х) = О, то (при соответствующем выборе о(х)) а(х) ) 0 по одну сторону от гиперповерхности и о(х) ( 0 по другую.
Всегда можно выбрать функцию о(х) так, чтобы она была отрицательна в подпространстве, где и* = — 1, и положительна в подпространстве, где и' = 1. Тогда, очевидно, оптимальным управлением будет и* = щп о(х). Поэтому нахождение оптимального управления с обратной связью сводится к определению функции о(х), которая называется у1ункиией переключения. При п = 2 для нахождения функции переклк1чения можно воспользоваться методом фазовой плоскости. На фазовой плоскости строятся семейства фазовых траекторий, соответствующих управлениям и* = — 1 и и' = 1. Оптимальная траектория представляет собой часть траектории или соединение частей двух траекторий из построенных семейств.
В силу граничного условия на правом конце траектории х(1у) = 0 она должна оканчиваться в начале координат. Используя эти свойства оптимальных траекторий, нетрудно определить кривую переключения. Проиллюстрируем изложенное на простейшем примере. Пример 9.12. Определить оптимальнь1й по быстродействию закон управления двигателем, описываемым уравнениями х1=хз, ха=и, ~и(<1, х(0)=х, х(11)=0. Р е ш е н и е. Характеристическое уравнение имеет кратный нулевой корень. Выполняются все условия теоремы об и интервалах. Оптимальное управление может принимать значения — 1 или 1.
Найдем соответствующие им фазовые траектории. Разделив второе уравнение на первое, получим йх2 и 421 Х2 или х2 1"х2 и ах1 Проинтегрировав последнее уравнение при и = — 1 и и = 1, соответственно получим ,2 1 2 ' 2 — х. = -х1 + С1, — х, -= х1 + С.. На рис. 9.4, а представлены оба семейства траекторий. Оптимальная траектория должна состоять из участка траектории одного семейства, проходящей через начальную точку, и участка траектории другого семейства, проходящей через начало координат.
Из сказанного следует, что переключение должно происходить на полутраектори- 328 Гл. 9. Методы теории оптимального рироеленип Рис. 9.4. Построение фазового портрета оптимальной системы ях АО и ОВ (рис. 9.4, а). Если вначале изображающая точка движется по траектории, соответствующей и' = — 1, то переключение должно произойти на полутраектории ВО, которая описывается уравнением з2 2тз = О.
И если вначале изображающая точка движется по траектории, соответствующей и* = 1, то переключение должно произойти на полу- траектории ОА, которая описывается уравнением ,,'+2, =О. Фазовый портрет оптимальной системы представлен на рис. 9.4, 6. Уравнение линии переключения АОВ, основываясь на уравнениях полутраекторий АО и ОВ, можно записать так: п(х) = — (тг + 2тз а8п та) з18п тз = О. Функция п(х) отрицательна справа от линии переключения, где и' = — 1., и положительна слева, где и* = 1. Поэтому имеем и' = я8п о (х) = — яяп ~(тз ~+ 2тз я8зз тг) ябп тг).
Заметим, что кривая АОВ может быть описана уравнением й(х) = — (та + 2тз з18птя) = О. Однако знак функции й(х) слева и справа от кривой АОВ меняется при переходе с верхней полуплоскости в нижнюю полуплоскость. Поэтому эта функция не может быть функцией переключения. Как следует из фазового портрета, переходный процесс оптимальной системы является апериодическим. Однако из-за неидеальности переключающего устройства, неточности математической модели объекта и других возмущений реальный переходный процесс может оказаться колебательным.
9.0.2 Синтез оптимальной по интегральному квадратичному критерию нестационарной линейной системы управления. Постановка задачи. Пусть объект описывается уравнением х = А(1)х+ В(1)и+ Ь11) (9.71а) 9.6. Синтез оптпималъных систем управления 329 и критерий оптимальности имеет вид д = х~(17)Ех(ъу) + / [хт(1)®(1)х(1)+пт(1)Л(1)п(1)] да (9.71б) ео ~ т()Л() оо является интегральной квадратической ошибкой и характеризует качество управления на всем интервале [1о,су]. Последнее слагаемое О /п (1)Л(1)п(1) сМ оо есть взвешенная «энергия» управления, и оно ограничивает управление. Требуемое ограничение на управление, которое в явной форме не учтено в постановке задачи., может быть обеспечено соответствующим выбором матричной функции Л(1).
Утверждение 9.1. Решение задачи (9.71) синтеза оптимального нсстационарного линстеого регулятора существует, единственно и оптимальное управлснис имеет вад п" = — [Л В Кх+ — Л В~р), 1 2 (9. 72а) где симметрическая (и х п)-,матрица К и и-всктор р определяются из уравнений К вЂ” КА АТК + КВЛ вЂ” 'ВТК гз р = КВВ-'Втр — Атр — 2К1~ (9. 72б) (9.72в) при ~раничных условиях К(1,) = Р, р(1,) = О. (9.72г) Здесь Ь(г) известная функция времени; Р положительно полу- определенная матрица; Я(1), Л(1) положительно определенные матрицы (хткх > О, х~Ях > О и хтвх > О и хтЛх > О при всех х у: О и 1 Е [1о,1е]); функции А(1), В(1), 6(1), 1„1(1) и Л(1) являются непрерывными на интервале [1о,11]; начальный и конечный моменты времени 1о и 17 фиксированы.
Требуется найти управление с обратной связью, при котором при произвольном начальном условии х(1о) = х критерий оптимальности принимает минимальное значение. Эту задачу называют задачей синпъвза нсспшционарного линт1- ного регулятора состояния. В критерии оптимальности (9.71б) первое слагаемое, представляющее терминальную квадратичную ошибку, включается, если необходимо обеспечить максимальную близость состояния системы в конечный момент времени к желаемому состоянию.
Слагаемое 33О Гл. 9. Методы теории оптаимального управлении Пля любого Х б [8о, 11[ справедливо равенставо х (й)К(й)х(1) + р (й)х(й) + дЯ = = х (Су)Ех(йу) + ( [х"~(йЯ(1)х*(1) + п*т(й)Л(Х)п*(Х)) й, (9.73а) где у(~) -- скалярная функция, которая определяетси из уравнения т) = — ртВЛ 'Втр — ртЬ. д(бт) = О.
(9.736) При Ь(~) = О оитаимальное управление имеет вид и'= — Л 'В Кх, (9.74) гдг симмгтприческая (п, х тт)-матлрттцтз К определяется из уравнения К = КА — АтК+ КВЛ 'ВтК вЂ” Я, К(11) = Г. (9.75) Лля любого 1 Е [то, 11) справедливо равенставо тт х (1)К(1)х(8) = х (11)Рх(11) + / [х* (1)Я(4)х" (1) + + и'~(~)Лфп*ф[ сП. (9.76) Уравнение (9.72б) (и соответственно (9.75)) называют матричным уравнением Виккати. Д о к а з а т е л ь с т в о. Воспользуемся методом динамического программирования. Уравнение Беллмана (9.46) и граничное условие (9.47) принимают вид тпш[х Ях+ и Лп+ — (Ах+ Вп+ Ь)] = — —, т т до 1 дд и дг дт ' я(ХМ, ~1) = ятях(~1). (9.77) В уравнении Беллмана выражение в квадратных скобках представляет квадратный трехчлон относительно векторного управления, и так как нет ограничения на управление, то минимум достигается в стационарной точке. Поэтому уравнение Беллмана можно представить в виде системы х Ох+и Лп+ — (Ах+ Вп+Ь) = — —,.
(9.78) т т дЯ дх дт' 2птЛ+ — В = О. дх Из последнего уравнения имеем 1дд и = — — — ВЛ 2 дх или,после транспонирования, (9.79) 9.6. Синтез опгпимавьнмх систем управвения 331 Подставим эти выражения для управления в (9.78): х Ях — — — ВЛ В ( — ) + — (Ах+ Ь) = — —. (9.80) т 1 дЯ вЂ” 1 тСОЯ~т дЯ дЯ 4 дх дх дх д1 Решение последнего уравнения будем искать в виде квадратичного трехчлена Я(х,1) = х К(1)х+ рт(4)х+ а(1), (9.81) где К(с) симметрическая (п х п)-матрица, р(с) вектор-функция размерности п, д(с) скалярная функция. После подстановки (9.81) в уравнение (9.80) его можно преобразовать к виду хт(КА + АтК вЂ” КВИ.
'В К+ Я)х— т т(КВд, 'Втр — Атр — 2КЬ) — — р ВЯ 1В р+ ртЬ = 4 = — (х Кх + х р -~- ф). Приравняв в обеих частях полученного соотношения выражения при одинаковых степенях х, получим уравнения (9.72б), (9.72в) и (9.73б). Подставив квадратный трехчлен (9.81) в (9.79), получим оптимальный закон управления (9.72а); подставив его в (9.77), получим граничные условия (9.72г) и у(17) = О. Квадратный трехчлен (9.81), если функции К(1), р(1) и у(1) определяются из уравнений (9.726), (9.72в), (9.73б) при граничных условиях (9.72г) и у(17) = О, является функцией Беллмана, причем эта функция является гладкой.