Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 55
Текст из файла (страница 55)
~о Из этого неравенства и соотношения (9.49) следует, что при п = = п*(х,1) критерий оптимальности принимает минимальное значение,. т. е. это управление является оптимальнь|м. 316 1'л. 9. Методы теории оптаимального управления 9.5. Наблюдаемость и восстанавливаемость При синтезе оптимальных систем с обратной связью управления получаются как функции от фазовых координат. В общем случае фазовые координаты не могут быть измерены непосредственно.
Доступны измерению (наблюдению) координаты вектора у = = (у> уз ... ур), который называется выходным ввтпором, выходом или вектором выходных переменных, асами координаты.-- выходными переменными или выходными, величинами. Выходные переменные функционально связаны с фазовыми координатами, и для реализации управлений с обратной связью необходимо определить фазовые координаты по измеренным значениям выходных переменных. В связи с этим возникают проблемы наблюдасмости и восстанавливаемости, заключающиеся в установлении возможности определения состояния объекта (фазового вектора) по изморенным значениям выходного вектора на некотором интервале времени. Пусть объект описывается уравнением х = ~(х, п,1), х Е Л', п 6 В", (9.50а) и выходной вектор связан с фазовым вектором соотноп>енисм у = 9(х, п,1), у Е Вл, (9.506) которое называется уравнением наблюдения или уравнением выхода.
Управляемая система (9.50) называется наблюдаемой или вполне наблюдаемой, если существует такое 1> (1 < 1> < оо), что по данным измерения выходного вектора у>,т) и управления п(т) на интервале 1 < т < 1> можно определить состояние х11). Паблюдаемость или полная наблюдаемость означает, что имеется возможность определить фазовый вектор х11) по будущим значениям выходного вектора. Однако в задачах управления текущее состояние объекта должно определяться по прошлым значениям выходного вектора, так как по текущим значениям фазового вектора формируется управление с обратной связью.
Поэтому более важным с точки зрения управления является понятие восстанавливаемости определяемое следующим образом [29). Управляемая система (9.50) назьшестся восстанавливаемой или вполне восстанавливаемой, если существует такое 1> ( — оо < 1> < 1), что по данным измерения выходного вектора у>,т) и управления п(т) на интервале 1> < т < 1 можно определить состояние х11). Для стационарных систем из полной наблк>даемости следует полная восстанавливасмость и наоборот, поэтому в таких случаях эти понятия можно не различать. 9.5.1.
Наблюдаемость линейных стационарных систем. Рассмотрим линейнук> стационарнук> управляемук> систему х=Ах-~-Вп, хеЛ", пей", (9.51а) у = Сх+ Рп, у Е Я~ (9.51б) 317 9.5. ЕЕпблюдаемость и еосслпанавливаемосгпь Введем в рассмотрение матрицу Н = (Ст АгСт ... (Ат)"' 'Ст], (9.52а) которая называется матриией наблюдаемости. Эта матрица состоит из столбцов матрицы Ст и столбцов произведений матриц АтСт, (Ат)зСт', ..., (Ат)ь зСт и имеет размерность и х рп.
Наряду с матрицей наблюдаемости рассмотрим транспонированную матрицу наблюдаемости С Вт СА (9.52б) СА" ' которая имеет такой же ранг, что и исходная матрица Н. Критерий наблюдаемости. Управляемпя система (9.51) вполне наблюдаема (восстанавливаема) тогда и только тогда, когда ранг матрицы наблюдаемости (9.52а), или, что то же, ранг трапспонированной магприиы (9.526), равен и,. Необходимость. Пусть ранг матрицы Нт меньше и. Тогда размерность пространства Ян, порожденного строками матрицы ЕХ т меньше и, т.е.
Ян является собственным подпространством пространства ЕЕп. Поэтому существует ненулевой вектор хт б ЕЕп, ортогональный всем вектор-строкам матрицы Н (таким вектором является любой вектор из Е1п, не принадлежащий подпространству Ян): Сх =О, САхт =О, ..., СА" 'хг =О. (9.53) Как было показано, основываясь на теореме Гамильтона — Кели (см. (1.15)), матрицы АЯ при й ) п можно линейно выразить через Е,А,...,А" ',. поэтому из (9.53) получаем., что СА'хт = О при всех 1 = О, 1, 2,... Следовательно, имеем Се~~х ь = С~ Е + А1+ — А~1~ +...)х с = О.
(9.54) Пусть некоторому начальному условию х(св) = хц1 соответствует выходной вектор у1 ~1(1) . В силу соотношения (9.54) всем начальным значениям фазового вектора вида хц1 + хт соответствует один и тот же выходной вектор уц1(1): у(1) = Сх(1) + Рп = Сель(хбб+ хт) + С(Еелб "1В(т)п(т) дт + Рц = ~о = Семхб1+ С~с 1 1В(т)п(т) дт+ Рп = уц1(1).
Это и доказывает невозможность определения состояния х(1с) по значениям выходного вектора, если ранг матрицы наблюдаемости меньше и. 318 Гл. э. Методы тлеориа оптпимального управления Лостаточность. Пусть ранг матрицынаблюдаемостиравен п. В силу стационарности управляемой системы достаточно показать возможность определения состояния л(0) по известным значениям выходного вектора и управления на некотором интервале (О, сг) . Имеем у(1) = Семх(0) + С / елр ~В(т)и(т) йт + Вц, или Ьу(г) = у(е) — С / е 0 '~В(т)ц(т) Йт — Вп = Селех(0).
и Так как у(1) и п(1) доступны измерению, а матрицы С, В, В и А заданы, то функция Ьу(е) и ее производные любого порядка являются известными функциями времени. Из последнего соотношения при 1 = 0 находим Ьу(0) = Сх(0), езу(0) = САх(0), ..., Ьу~" 0(0) = СА" 'х(0), или Лу(0) Ьу(0) С СА х(0) = Н х(0). Ьу ~(0) СА" ' Полученное векторное уравнение с п неизвестными л;(0) (1 = = 1,2,...,п) равносильно системе из пр уравнений.
Так как ранг матрицы Н равен и, то среди уравнений этой системы имеется ровно и, независимых уравнений. Выделив эти уравнения и решив их, определим искомый вектор х(0). Критерий полностью доказан. Наблюдаемость (восстанавливаемость) управляемой системы (9.51) полностью определяется матрицами А и С. Наряду с наблюдаемостью управляемой системы используется понятие наблюдаемости пары (А, С). Пара (А, С), где А " (и х п) матрица и С - (р х и) матрица, называется наблюдаемой или полностью наблюдаемой (еосстанаелпваемой), если матрица наблюдаемости, составленная из этой пары, имеет ранг и, или, что то же, управляемая система (9.51) вполне наблюдаема.
Наблюдаемость управляемой системы, как и управляемость, является внутренним свойством системы: она не зависит от того, в какой системе координат записаны уравнения управляемой системы. Пока.жем это. При неособом преобразовании х = Тх, бе1 Т ф О, 319 9.5. Набвюдаемосспь и воссгпапаввиваемостпь уравнения управляемой системы (9.51) принимают вид х = Ах+ Вп, у = Сх+ Вп, А=Т 'АТ, В=Т 'В, С=СТ. Как легко проверить, транспонированная матрица наблюдаемости преобразованной системы имеет вид Йт— Т=НТТ, САп — з Так как матрица Т неособая и се ранг равен п, ранг матрицы наблюдаемости Н совпадает с рангом матрицы Нт.
П р и м е р 9.9. Исследовать наблюдаемость управляемой системы и' -~-1 Ир+1)а Р е дзен не. Преобразуем данное уравнение в нормальную форму: 1 1 и' "-1 р(, +1)' или (р~+2р +р)иь =и, у= (р +1)ты откуда получаем йь = тз, йз = тз, йз = †— 2тз + и, у = из+из. Матрицы А, С и их произведения имеют вид О 1 О А= О О 1, С= [1 О 1~, Π— 1 — 2 СА= 10 Π— 2], СА'= (О 2 4~. Отсюда для транспонированной матрицы наблюдаемости получаем Н = ΠΠ— 2 Ранг этой матрицы равен 3, так как с1е1 Нт = 4 ~ О. Следовательно, рассматриваемая система вполне наблюдаема. С СА С СА 320 Тл. У. Методы теории оптимального управления 9.5.2. Каноническая форма наблюдаемости. Обнаруживаемость.
Пусть ранг матрицы наблюдаемости управляемой системы (8.51) равен 1 (1 < и). Если ранг 1 не равен нулю, но меньше и, (О < 1 < п), то будем говорить., что управляемая система (9.51) часпшчно ноблюдаемю Подпрострвнство, порождаемое 1 независимыми строками транспонированной матрицы наблюдаемости, обозначим Л„и будем называть подпросцгранством наблюдоемости. Если управляемая система частично наблюдаема, то ее подпространство наблюдаемости будет собственным подпространством пространства Л". Сформируем матрицу Т преобразования х = Тх в виде =(::) где строки матрицы Тг образуют базис 1-мерного надпространства наблюдаемости, а строки матрицы Тг подбираются так, чтобы матрица Т была неособой (г1е1 Т ~ 0). В частности, в качестве строк матрицы Т, можно взять 1 независимых строк транспонированной матрицы наблюдаемости.
При таком преобразовании уравнения управляемой системы примут вид так называемой канонической формы наблюдас- ,мости (29) х = — — х+ — п, у = (С( 0) х+ Вп, (Аы 0 1 (В(1 Агг Агг В иди О( х = Амх(0 — Вгп, х = Аггх(0 + Аггх(~( + Вгп, (9.55) у = С х( ( + Вп, где х(О --. 1-вектор, х(г( -- (и — 1)-вектор, Аы, Агы Агг, .Вы Вг, Сг -- матрицы соответствующей размерности, причем пара (Ам, С,) вполне наблюдаема.
Из структуры системы уравнений (9.55) видно, что вектор хг никакого влияния на выходной вектор ни непосредственно, ни через фазовый вектор х(О не оказывает. Поэтому его координаты не могут быть определены по набзпк>пениям выходного вектора у(1). Эти координаты называются ненаблюдаемыми или невоссгпанавливавмыми. Проекция фазового вектора на подпространство наблюдения Л, определяемая равенством х(г( = 0 и имеющая вид х = со1(хр(,0), вполне наблюдаема.