Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 59
Текст из файла (страница 59)
Методы теории оитаимальиого управленим Критерии) Сильвестра положительной определенности матрицы К удовлетворяет решение у =е = ', е =)))еее 2), ь,=Е)ее2 7. Оптимальный закон управления имеет вид и* = — — зе'Г х1 + г(Ц + 2 ч'г ) хг) . Пример 9.14. Определить, при каких значениях параметра а задача оптимального управления х1 = х1 + и хг = ахг, д = / (х + х + и ) 41 -+ п)ш а имеет решение. Решение. В данной задаче имеем А=, В=, Я=, В=1. В соответствии с (9.85а) и (9.85б) оптимальный закон управления имеет вид и* = — (1 0)~ ~ '( / = — (йых1+ йггхг) 111 й12 х1 й21 й22 Х2 где й; определяются из уравнения й21 йгг 0 а 0 о й21 йгг е)~" или из системы — 2йп + й11 — 1 = О, — 2ай12 + йы й12 = О, 2 — 2йгг + й12 — 1 = О.
г Эта система имеет решения 1 й11 1 ~ Л, йгг йм — О, йгг 2о Критерий Сильвестра положительной определенности матрицы К будет выполнен, если йп > 0 и йгг > О. Второе неравенство будет выполнено и задача будет иметь решение, если о ( О. При о > 0 задача не имоет решения. Это обусловлено тем, при этих значениях параметра объект нс стабилизуем. 9.6.4.
Синтез оптимального линейного регулитора выхода. Пусть задана управляемая система х=Ах+Вп+Ь, у =Сх (9.90а) 9.6. Синтез опп/ималеных систем управленин 337 и критерий оптимальности ,1 = х~(1 )Рх(1 ) + /(у~яу+ пт/еп) Ю (9.90б) х/ = хз хз = и, у = х/ Решение. В данной задаче имеем А= „, В=, С= (1 О), 22 Д.П. Ким Здесь Ь ..
известная функция времени, Г - положительно полуопределенная матрица, Ц и Л положительно определенные матрицы, зависящие в общем случае от времени. Матрицы А, В, С, Ц, В как функции от времени предполагаются непрерывными на интервале (1в,11). Требуется определить управление с обратной связью, при котором критерий оптимальности при произвольной фиксированной начальной точке принимает минимальное значение. Эту задачу называют задачей синтеза оптимального линейного регулятора выхода. Если объект или критерий нестационарен (хотя бы одна из матриц А, В, С, Я, Л зависит от времени) или 11 конечен, задачу называют нестаиионарной, а если объект и критерий стационарны и 1у = оо, задачу называют стационарной задачей синтеза линейного регулятора выхода.
Задача синтеза оптимального линейного регулятора выхода отличается от рассмотренной задачи синтеза оптимального регулятора состояния только тем, что в критерий оптимальности вместо вектора состояния входит выходной вектор и условие задачи дополняется уравнением наблюдения. Подставив выражение для выходного вектора из (9.90а) в критерий оптимальности (9.906), получим // ,1 = х~ (гу)Гх(Фу) + ~(х С~ЦСх+ п~йп) дй (9.91) /о Таким образом, задача синтеза оптимального линейного регулятора выхода свелась к рассмотренной задаче синтеза оптимального линейного регулятора состояния. Отличие задачи синтеза (9.90а), (9.91) от задачи синтеза (9.71) состоит в том, что здесь роль матрицы /,) играет произведение С~с,)С.
При этом может оказаться, что, хотя матрица Я является положительно определенной, произведение этим свойством не обладает: оно может быть положительно полуопределенным. Произведение СЯС будет положительно определенным, если у = О в том и только том случае, когда, х = О. Пример 9.15. Определить оптимальный закон управления в следующей задаче оптимального управления: 338 Гл. у. Методы теория оптимального управления т ~О О~ В соответствии с (9.85а) и (9.85б) оптимальный закон управления имеет вид И = — (О 1)~ ~(т1 тг ) = — (Й21т1 + Йггтг), ~ Й11 й1 1 Й21 Й22 где ЙО определяются из уравнения йм йгг О О 1 О Йн Йаг „")( )~о ь)~„" или из равносильной ему системы й„-1= О, — Йы + Йггйгг = О, — 2йгг+ Йгг = О. Эта система имеет решения Йгг = Йгг = 1, й„= ~Л, й„= ~Л.
Критерию Сильвестра положительной определенности матрицы Л удовлетворяет решение Йгг = Йгч = 1, Йгг = зг2, Йы = 'и 2. Следовательно, оптимальный закон управления имеет вид 'и = — (т1 + зг2кг). 9.6.5. Синтез оптимальной системы по критерию обобщенной работы. Как мы видели выше, при решении задач синтеза оптимальных систем угеравления по интегральному квадратичному критерию мы сталкиваемся с необходимостью решать нелинейные дифферепциалы1ые уравпелия Риккати в случае пестационарной зада чи и нелинейные алгебраические уравнения Риккати в случае стационарной задачи. А.
А. Красовский ввел критерий оптимальности, который он назвал крипгериеле '1функционалом) обобгценной работы, при котором удается избавиться от необходимости решать нелинейные уравнения. Суть метода синтеза оптимальной системы по критерию обобщенной работы состоит в том, что интегральный квадратичный критерий выбирают так, чтобы уравнение Беллмана получилось линейным. Пусть объект описывается уравнением х = А(х,1) + В(х,1)п 9.6. Синтез оптимальных систем управления 339 и критерий оптимальности имеет вид 1 = дв(х(ер), Су) + / (ее(х, ~) + птЛп+ йтЛйМ, (9 926) где й = й(х, е) функция, которую выбирают так, чтобы уравнение Беллмана, получилось линейным.
Так как ограничений на управления нет, .то уравнение Беллмана в данной задаче можно представить в виде (см. (9А8)) Я(х,С)) + птЛп+ йрЛй+ — (А(х,г) + В(х,г)п) = — —, (9.93а) 2п~Л+ — В(х, С) = О. (9.936) дх Из уравнения (9.93б) находим дд т п* = — -Л В (х,е)( — ) (9.94) Подставив это выражение для управления в уравнение (9.93а), получим (?(х,.й) — — — В(х,ЦЛ В (х,Е)( — ) +й Лй+ — А(х.,е) = — —.
1 дЯ вЂ” з т /дЯ~т -т — ддд дЯ 4 дх дх дх ' де Нелинейным относительно функции Беллмана является второе сла- гаемое. Чтобы избавится от него, нужно выбрать й = п' = — — Л В (х, 1) ( — ) При подстановке этого выражения в последнее уравнение получим Я(х, Х) + — А(х, С) = — —, Я(х(йу), Су) = дв(х(йу), 17). (9.95) дЯ дЯ (9.96а) 1 = х~(Су)гх(гд) + /(х~Цх+ птЛп+ йтЛй) Ф, (996б) где р' — постоянная положительно полуопределенная матрица, Щ Л положительно определенные матрицы, которые могут зависеть от времени. Утверждение 9.3. В задаче (9.96) оптимальный зинин управления имеет вид п*= — Л 'В Кх, (9.97а) 22' Синтез линейной оптимальной системы но критерию обобщенной работы. Рассмотрим задачу синтеза оптимальной линейной системы, когда уравнения управляемой системы и критерий оптимальности имеют вид х=Ах ~ Вп., 340 Гл.
у. Методы теории опгнимального управления где положительно определенная снмметрическия матрица К опре- деляется из линейного дифференциального уравнения К= КА АтК О К(17) =К (9.976) если система являегася нестационарной. Оптимильный зикон управления имеет вид и'= — В 'В Кх, (9.98а) где положительно определенная симметрическая матрнца К определяется из линейного алгебрацческого уравнения КА+ АтК+ О = 0 (9.986) если система является стационарной (все матрицы являются постоянными и Су = со).
Показательство. В случае задачи (9.96) уравнение Беллмана и граничное условие (9.95) принимают вид х Ох+ — Ах = — —, К(17) = Р. дх д$' Решение уравнения будем искать в виде квадратичной формы Я = = х~Кх. Подставив ее в уравнение Беллмана, получим х~(О+ 2КА)х = — х Кх. Учитывая тождество хт2КАх = хт(КА + АтК)х, последнее уравнение можно записать в виде хт(О + К.4+ АтК)х = — хтКх.
Отсюда получаем уравнение (9.976). То, что матрица К должна быть положительно определенной, следует из определения функции Бсллмана. Подставив функцию Беллмена (квадратичную форму) в (9.94), получим (9.97а). Оптимальный закон управления (9.98) в случае стационарной задачи получается точно так же, как и в случае нестационарной задачи. Только в этом случае в квадратичной форме В = х Кх матрица К принимается постоянной. Пример 9.1б. Определить оптимальный закон управления по критерию обобщенной работы при условии, что уравнения объекта и критерий оптимальности имеют вид хз = хг хг = -х1 — ха+ и, д = ~(х1+ хе+ и + й ) дй о Решение.
В данной звдаче имеем А=, В=, О= 0 1, В=1. 9.6. Синтез опгаимальнмз систем управления 341 В соответствии с 19.98) оптимальный закон управления имеет вид и = — (О 1) ~ ~ ~ ) = (11221л1 + йгглг), ~ й„й121/л1 з( К21 922 Лг где Й,з опРеделЯ(отса из УРавнениЯ 921 йгг — 1 — 1 1 — 1 121 922 О 1 или из системы -й„— к21+ 1 = О,. йы — Й12 — йгг = О, й21 — йгг + Й12 — йгг + 1 = О, йы = йг1. Эта система имеет следующее решение: 1 н12 — н21 2' 3 нгг — 1 н11 2 Это решение удовлетворяет критерию Сильвестра. Оптимальный за- кон управления имеет виц 1'1 и = — 1 — У1+У2) ° 12 — ау(е Оу(е,(( О е я"(з') 1( т 2 ~ (в Здесь для удобства в качестве критерия оптимальности принят интегральный квадратичный функционал, поделенный на 2. Это нс скажется на решении задачи.
Составим гамильтониан 1принимасм (рв — — — 1); Н = — — 1х~Цх+ п~Вп) +21( (Ах+ Вп). 2 Запишем уравнения Эйлера — Лагранжа: 211 = — (1 — ) = Ях — А 21(, — = — и В+21( В = О. !дН'(т т дН т т дх дп 9.6.6. Метод прогонки решения задачи синтеза оптимальной линейной системы. Выше задача синтеза оптимальной линейной системы методом динамического программирования была сведена к решению матричного уравнения 1зиккати. Здесь рассматривается еще один метод решения атой задачи, основанный на вариационном методе и прогонке (переносе) граничных условий из одного конца на другой.
Этот метод иногда позволяет получить аналитическое выражение для оптимального закона управления и в том случае, когда матричное уравнение Риккати аналитически не удается решить. Рассмотрим следующую задачу оптимального управления: х = Ах + Вц, х11в) = хв,. 342 Гл. у. Методы теории оптпималвного управлении Из последнего уравнения имеем 11 — г Втф (9.99) Подставим это выражение в уравнение объекта: х = Ах + ВЛ 'ВтгУ. Запишем это уравнение совместно с первым уравнением Эйлера— Лагранжа; или (9.100) где х А ВВ 'Вт Условие трансверсальности принимает вид ф(1у) = -Кх(1у) (9.101) Запишем решение уравнения (9.100), используя нормированную фундаментальную матрицу Е(1, 1а); Е(»,1) = 1 при любом 1 из рассматриваемого интервала времени. Согласно формуле (1.9) решение однородного уравнения (9.100), если за начальный момент принять Ф~ Е (1а, Фу], примет вид в(1) = л(1,г')г(е').
(9.102) Представим фундаментальную матрицу в соответствии со структурой уравнения (9.100) в виде Яы(1,В) Я1 (е,р) г(1,1') = г„(1,В) г,г(1,В) ' где Я,у матрицы размерности и, х п. Используя это представление и положив 1' = 1у, решение (9.102) можно записать в виде х(1) 211(1~1у)х(1у) + Ягг(1,1у)е)г(1у), ф(Е) = Щ(Е, гу)х(1у) + Ягг(Е, 1у)ф(1у), или,после подстановки (9.101), х(1) = (И„(1, 1,) — И„(1, 1,)й']х(1,), 4(1) = (огг(1 1Х) — тгг(1,1у)Р]х(1у). Исключим из полученной системы уравнений х(гу): Ф(1) = (г„(1, 1,) — г„(1, 1,)Г](Иы(1., 1,) — г„(1, 1,)й]-'х(1).