Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 58
Текст из файла (страница 58)
Как легко проверить, выполнянвтся все условия, при которых уравнение Беллмана является достаточным условием оптимальности. Поэтому соотношения (9.72) действительно определяют оптимальный закон управления. Существование и единственность решения задачи синтеза оптимального нестационарного линейного регулятора следуют из существования и единственности решения уравнений (9.72б), (9.72в) при граничных условиях (9.72г). При этом в этой задаче не требуется, чтобы объект был вполне управляем. Решение существует и единственно и в том случае, когда объект является частично (не полностью) управляемым.
Это обусловлено тем, что управляемый процесс рассматривается на конечном интервале времени и вклад неуправляемых фазовых координат в значение критерия оптимальности является конечным, даже если они расходятся. Равенство (9.73а) получается из определения функции Беллмана Я(х,1) = шш ~хт(1у)Рх(17) + / (хт(1)Я(1)х(1) + и(сд с<1 <О 1 м + ц~(1)Л®п(1)) Ф .
(9.82) 332 Гл. у. Методы теории оптпимального управления При Ь(ь) = О уравнения (9.72в) и (9.736) становятся однородными, и их решениями при нулевых начальных условиях являются р(г) = 0 и у(г) = О. Поэтому в этом случае оптимальное управление определяется соотношениями (9.74) и (9.75), равенство (9.73а) принимает вид (9.76). Решение матричного ураонения Риккати. Матричное уравнение Риккати является нелинейным. Его можно решить на аналоговой или цифровой машине в обратном времени, начиная с момента гу.
При этом вводится новая переменная (обратное время) т = гу — ~, и уравнение и граничное условие (9.75) преобразуются к виду К=КА+А К вЂ” КВЛ 'В К+ф 0<т<уу — ув, К(0)=Р, (9.83) К(т) = К(Уу — т), А(т) = А(Уу — т), 9.6.3. Синтез оптимальной по интегральному квадратичному критерию стационарной линейной системы управления. Постановка задачи. Пусть объект описывается уравнением х = Ах+ Вп (9.84а) и критерий оптимальности имеет вид 1 = / (х (у)~дх(у) + п~фЛп(у)) сМ.
(9.84б) в Здесь ьу и Л вЂ” положительно определенные матрицы; все матрицы А, В, ьу и Л являются постоянными, объект стабилизируем. Требуется найти оптимальное управление с обратной связью, переводящее систему из произвольной начальной точки х(0) = х в конечную точку х(оо) = 0 и обеспечивающее минимум функционалу (9.84б). Эту задачу называют задачей синтеза стационарного линейного регулятора состояния. Утверждение 9.2.
Задача (9.84) имеет решение тогда и только тогда, когда объект (9.84а) стабилизируем и оптимальное управление имеет вид п"= — Л 'В Кх, (9.85а) где К "- постоянная пололсительно определенная симметрическая (и х п)-матрица, определяемая из уравнения КА АтК+ КВЛ вЂ” тВтК Я 0 (9.8об) называемого алгебраическим уравнением Риккати. 27ля любого ~ ) 0 справедливо равенство х (У)Кх(~) = / (хт(т)ц)х(т)+в*~(т)Лп*(т)]дт. (9.86) у.б.
Синтез оитимавьнмх систем управления ззз Доказательство. Соотношения (9.85) и (9.86) получаются точно так же, как и аналогичные соотношения при решении нестационарной задачи. Только в данном случае функция Беллмана отыскивается в виде квадратичной формы Я(х) = х Кх, где К постоянная положительно определенная симметрическая (и х п)-матрица. Следует иметь в виду, что если 17 является конечным фиксированным числом, то и в том случае, когда матрицы А, В, Я и Л являются постоянными, матрица К в оптимальном законе управления зависит от времени и находится из дифференциального уравнения Риккати. Покажем, что стабилизируемость является необходимым и достаточным условием существования решения задачи синтеза оптимального стационарного линейного регулятора.
Необходимость очевидна. Действительно, стабилизируемость означает, что неуправляемая составляющая хт — в О при 1 — в оо. Если это условие не выполняется, то фазовый вектор замкнутой системы при хт ~ О не будет с течением времени стремиться к нулю, так как управление и соответственно присоединение регулятора к объекту никакого влияния на неуправляемую составляющую х г не оказывают. Чтобы доказать достаточность, нужно показать, что существует положительно определенная матрица, удовлетворяющая алгебраическому уравнению Риккати и что замкнутая система асимптотически устойчива. Представим критерий оптимальности в виде У = 11ш / [х (1)Ях(1) + п~(1)Лп(1)[й.
О-вес я о При конечном 17 и Л = О из (9.76) и (9.82) имеем О В(х,1; 17) = х (г)К(г)х(г) = / [х~Ях+ и*~Ли'[ й = /и о*+ вне~[. (987) орде<с<О 1 Функция Беллмана В(х,с; 17) при фиксированных я и 1 является функцией от Гу, причем функцией монотонно неубывающей. Действительно, если 1~7~ ) 1~7, то В(х 1; 1~) = / [х~Ях+ п тЛп ] й+ ~[хгЯх+ п тЛп*[й ) ) / [х~Ях+ и*~Ли*[ й = Я(х,1; Г~), так как под интегралом стоит неотрицательное выражение. 334 Гл. у. Методы теории оигаимального управления Покажем, что эта функция ограничена сверху. Так как объект стабилизируем, существует управление с обратной связью, при котором замкнутая система асимптотически устойчива. При таком управлении выражение под знаком минимума в (9.87) сходится к конечному пределу при 17 -э оо.
Этот предел является верхней границей функции Я(х,11 17). Таким образом, Я(х,1; 17) как функция от 17 является монотонно неубываюгцей и ограниченной сверху. Следовательно, существует предел этой функции при 17 -э оо. Из равенства о(х,1; 1у) = хт(е)К(1)х(1), где справа, от 17 зависит только К(1), следует, что существует предел функции К(1) при 17 — э оо, и этот предел, который обозначим К„, не зависит от Р, т.е, от граничного условия К(еу) = Р. Пействительно, имеем х (1)К„х(1) = 1ш1 / [х~(1Ях(1) + п'т(1)йп*(1)]е11 = =,1 „("Р,)е")и)+()")во*в)+.'Р)е."Фг~] = — / (» (1)Ях(1) + п'~(1)Вп'(1)] )11, (9.88) так как х(гу) — э 0 при 17 — э оо.
Из этого равенства также следует, что матрица К„, являющаяся единственным установившимся решением дифференциального уравнения Риккати, положительно определена, так как матрицы Ц и В положительно определены. Из (9.86) и (9.88) имеем х~(1)К„х(1) = х~(1)Кх(1), откуда К = К„. Таким образом, К является единственной положительно определенной матрицей, удовлетворяющей алгебраическому уравнению Риккати. Подставив управление (9.85а) в уравнение объекта, получим уравнение замкнутой системы х = (А — В — 'ВтК)х (9.89) Покажем, что функция Беллмана является функцией Ляпунова для синтезированной оптимальной системы (9.89).
Функция Я(т) = хтКх, как было показано, является положительно определенной функцией. Ее полная производная по времени в силу уравнения (9.89) имеет вид Ж вЂ” = хтКх+ хтКх = хт(АтК+ КА — 2КВЯ 1ВтК)х, или, с учетом алгебраического уравнения Риккати, — = — х (КВВВ 'ВтК+ фх. де 9.6. Сннтпев опгпнмавьнмх систем упрввнення 335 Квадратичная форма х~УВЛ 1ВтКх положительно полуопределена, так как матрица Л и соответственно обратная матрица Л ' положительно определены и, следовательно, кто ги > О, где в = Втйх. Матрица Ц положительно определена по условию.
Следовательно, производная сИ/Й отрицательно определена. Метод решения алгебраического уравнения Риккати. Алгебраическое уравнение Риккати является нелинейным, и в общем случао аналитически решить его не удается. Как было показано выше, искомое решение этого уравнения совпадает с установившимся решением дифференциального матричного уравнения Риккати. Поэтому один из возможных способов его решения основан на нахождении установившегося решения матричного уравнения Риккати (9.83), записанного в обратном времени, при начальном условии К(0) = Е, где Г --- произвольная положительно полуопределенная симметрическая матрица. П р и м е р 9.
13. Определить оптимальное управление с обратной связью в следующей задаче оптимального управления: йг=тг, йг=и, 1=~(х1+дтг+си)д1 — «пз«п, д>0, т>0. в Решение. В данной задаче имеем А=~ ~, В=(), в= В соответствии с (9.85а) и (9.85б) оптимальный закон управления имеет вид и = — — (О 1) «( = — — с«)сг«т1 + йггяг), 1 ~)си Й121«гт1 1 1 1с21 нгг тг где Й1 определяются нз уравнения йю 1сгг 0 0 1 0 к21 йгг + В и 1 10 1)а й 0 О О или из равносильной ему системы нгг 1 й«гйгг йгг г — — 1 = О, — 111+ = 0 — 2112 -~- — д = 0 г Эта система имеет решения н12 — ~Ъ«г~ нгг — ~ 1 (Ч «2н12) к11 1е1гнгг г 336 Гль у.