Г.К. Гудвин - Проектирование систем управления (1054010), страница 116
Текст из файла (страница 116)
0.5 приложения. ППП 22.10.3. Дискретный оптимальный квадратичный фильтр х[й+ 1] = Ах[й]+ Ви[й]+ ш[й] у[й] = С[й] + и[й] (22.10.59) (22.10.60) Так же как мы делали в разд. 22.7 для задачи управления, можно разработать дискретные формы для оптимального фильтра. Как в разд.
22.7, мы просто приведем результат, эквивалентный непрерывному случаю. Рассмотрим дискретную систему, имеющую следующее описание пространства состояний: 710 Глава 22. Проектирование через методы оптимального управления (22.10.61) (22.10.62) где (~ Е 1кпнп — симметричная неотрицательно-определенная матрица и В. б И " — симметричная положительно-определенная матрица. Рассмотрим теперь следующий наблюдатель для оценки состояния системы: х[й+1]=Ах[й]+Ви[й]+Л [й](у[й] — Сх[й]) (22.10.63) Кроме того, предположим, что начальное состояние х[0] удовлетворяет условию Е((х[0] — х[0]их[0] — х[0]) ) = Р (22.10.64) Тогда оптимальный выбор (в квадратичном смысле) для Л [й] определяется формулой зо[й] = АР[й]Ст(В+ СР[й]Ст) (22.10.65) где Р[й] удовлетворяет следующему дискретному динамическому урав- нению Риккати: Р[й+Ц А(Р[й] Р[й]Ст(В+СР[й]Ст)- СР[й])А +Сг (22 10 66) которое может быть решено для последующих моментов при условии Р[0] =Р (22.10.67) Замечание 22.5.
Заметим снова, что А,С,Сг,В. и т. д. для общего случая фильтра могут изменягпься во времени. Однако когда мы обсуждаем фильтр установивитегося состояния, обычно требуетпся, чтпобы задача была сгпационарной во времени (или, по крайней мере, изменяемая в таком виде, как имеет место для периодических систем). Установившееся состояние (й -+ оо) усиления фильтра удовлетворяет дискретному алгебраическому уравнению Риккати, имеющему вид А[Р Р Ст(В + СР Ст) - СР т1Ат+ С1 Р (22 10 68) где то[й] Е Р' и о[й] Е Мт — некоррелированные стационарные случайные процессы с ковариацией, данной выражениями 22.10.
Линейные олтимальные Фильтры 711 Вышеупомянутые результаты показывают, что соответствие между оптимальными регуляторами и оптимальными фильтрами также справедливо и для дискретных систем. 22.10.4. Вероятностные модели шумов (22.10.73) (22.10.74) где х(й) = [х(й), х'(й) ] а(й) = [0,~(й)т) (22.10.75) (22.10.76) А= 0 в- [О~; с=]с ю] (22.10.77) 22.10.5.
Оптимальное упреждение В случае гауссовского шума фильтр Калмана фактически производит среднее значение условного распределения для х(й), определяемое В предыдущих разработках мы просто представляли шум как последовательность белого шума (1]н(й))) н как последовательность белого шума измерения (1о(й))). Фактически, зто более общий случай, чем может показаться на первый взгляд. Например, он может включать цветной шум, имеющий произвольный рациональный спектр.
Основная идея — смоделировать этот шум как выход линейной системы (т. е. фильтра), управляемой белым шумом. Таким образом, пусть система описана уравнениями х(й+ 1) = Ах(й) + Ви(й) + ы,(й) (22.10.69) у(й) = Сх(й) + о(й) (22.10.70) где (ю,(й)) представляет цвешной шум, который получается из белого шума, пропущенного через фильтр. Тогда мы можем добавить к описанию дополнительную модель шума ((22.10.69), (22.10.70)). Например, пусть фильтр шума будет х'(й+ 1) = А'х(й) +ы(й) (22.10.71) ы,(й) = С'х'(й) (22.10.72) где (ы(й)) — последовательность белого шума. Сочетание (22.10.69) — (22.10.72) дает составную систему, которая управляется белым шумом и имеет вид х(й + 1) = Ах(й) + Ви(й) + й(й) у(й) = Сх(й) + о(й) 712 Глава 22.
Проектирование через методы оптимального управления предыдущими данными: (у(в),и(Р); К = О,...,й — 2,й — 1). Это может быть записано как х(й) =Е(х(й)/у(в),и(в); К=О,...,й — Ц = х(й~й — 1) (22.10.78) Непредсказуемость белого шума приводит к тому, что оптимальное упреждение будущих состояний получается простой итерацией модели с последующим набором белого шума, равным его математическому ожиданию, которое равно нулю. Итак, рассмотрим составную модель ((22.10.73), (22.10.740; тогда для известного входа (и(й)) предсказанные будущие состояния удовлетворяют условию х(т'+ 1) = Ах(у) + Ви(т); у = й, й + 1, й + 2,... (22.10.79) с начальными условиями х(й) = х(й~й — 1).
Заметим, что х(т) можно также записать следующим образом: х(у) = Е(хУУу(Е),и(Е); Е = О,...,й — 1); у > й а,и,й 1),>й (22.10.80) 22.10.6. Оценка состояния с непрерывнымн моделямн н квантованнымн наблюденнямн Задача, которая часто встречается на практике, является результатом того, что у непрерывной системы данные берутся в дискретные моменты квантования. Действительно, моменты квантования в некоторых прило- жениях могут быть неравномерно распределены. Это все еще подпадает под общую дискретную нестационарную задачу фильтрации.
Все, что мы должны сделать — это аппроксимировать непрерывную систему между моментами квантования, а затем скорректировать в моменты квантования, используя соответствующую дискретную модель. В качестве иллюстрации пусть система описывается (формвльно) урав- нениями (22.10.5) и (22.10.6): х = Ах+от (22.10.81) у' = Сх+0 (22.10.82) где от и б имеют спектральную плотность Я и К соответственно.
Прежде чем мы сможем использовать квантованную величину у', ее сначала следует передать через соответствующий сглаживающий фильтр. Один такой фильтр — так называемый иитегрирующит1 и усред- мяющиб фильтр. В этом случае й-я квантованная величина имеет вид ги у[й] = ~ у'(1)й (22.10.83) ~ь-Са, „(и, 22.11. Обратная связь по оценке состояния 713 где 1а обозначает время й-го такта квантования. Дискретное наблюдение у[й] может быть связано с дискретной моделью пространства состояний вида У[А+ Ц = АеЩх[й] + ьЯ у[1с] = Со[1с]з,[й]+ 0[тс] (22.10.84) (22.10.85) Интегрируя модель ((22.10.81), (22.10.82)), можно заметить, что Дискретная модель может затем использоваться, чтобы получить оценки состояния в моменты квантования. Непрерывное же состояние может быть интерполировано между моментами квантования, используя модель разомкнутого контура (22.10.90) (22.10.91) с начальными условиями х($а) = х[к] Наконец, мы можем объединить оценку состояния, выполняемую с помощью (22.9.2), с обратной связью по переменным состояния, чтобы обеспечить следующий закон управления с обратной связью по восстановленному состоянию: и(1) = — Кх(1) + г(1) (22.11.1) Заметим, что теорема 18.1 также может быть здесь применена; полюсы замкнутого контура, получаемые при использовании (22.11.1), представляют собой объединение собственных значений, которые получаются при использовании обратной связи по состоянию, и собственных значений, связанных с наблюдателем.
Заметим, на всякий случай, что доказательство теоремы 18.1 не зависит от скалярного характера задачи. А Щ =еАОь+~-ть) 1+А(1ь+т — 1ь) 1 Гт'+' ' Св[й]= / Се~тйт=С (1а+ -1ь) l„ Е(ЮЩЫ[1с]~) = С3 — ЩФь 1 — $ь) Цб[1,]0[1,]т) К. (1а+1 — 1ь) зс(Ф) = Ах(й); для 1фь1ьы] 22.11. Обратная связь по оценке состояния (22.10.86) (22.10.87) (22.10.88) (22.10.89) 714 Глава 22.
Проектирование через методы оптимального управлении 22.12. Интерпретация с помощью передаточной функции Как и в разд. 18.5, описанный выше закон обратной связи по оценке состояния можно интерпретировать с помощью полиномов. В частности, лемма 18.5 справедлива и для наблюдателя в установившемся состоянии, т. е. Х(з) можно выразить в виде Х(з) = (з1 — Ао+ ЛС ) ~(ВоУ(з) + ЛУ(з)) = Тт (в)У(з)+ Тз(з)У(в) (22.12.1) где Тг(з) и Тг(з) — две устойчивые матрицы передаточных функций, имеющие вцц (22.12.5) (22.12.7) Тт(з) = (в1 — Ао+ ЛСо) Во (22.12.2) Тг(в) = (в1 — А + ЛС ) тЛ (22.12.3) Таким образом, закон управления, использующий обратную связь по оценке состояния, имеет вид У(в) = — КХ(з) — В(в) (22.12.4) = — КТ ( )Г7( ) — КТ ( )У( )+Л( ) Это можно записать в эквивалентной форме Стэ(в)Цв) = — Свт(в)У(в) + В(з) где Стэ(з) и Стч(в) — устойчивые матрицы вида Ср (в) = 1+ К[з1 — Ао + ЛСо] Во = (22 12 6) Е(з) С1ч(в) =К[з1 — А +ЛСо] 'Л = Е(в) где Мстэ(в) и 1ь1стч(з) — матрицы полиномов, а Е(з) — полином наблюдателя, имеющий вид Е(з) = т1ет(в1 — А, + ЛС,) (22.12.8) Из (22.12.5), мы видим, что С(в) ='[Стт(з)] тСтч(в) является левым матричным дробным описанием регулятора (см.
разд. 20.3.3). Кроме того, этот регулятор удовлетворяет следующей лемме. Лемма 22.3. Рассмотрим регулятор С(з) = [Стт(з)] тСы(з) с Стт(в) и Стч(з), определенными в (22.12.6) и (22.12.7) соответственно. Тогда реализация в простпранстве состояний для этпого регулятпора даетпся 4-мя компонентами — (Ао — ЛСо — В К,Л,К,О): С(з) = К[з1 — Ао+ ЛСо+ ВоК] Л (22 12 9) 22.12. Интерпретация с помощью передаточной функции 715 Доказательство Сначала применим лемму об инверсии матрицы, чтобы получить [Стт(з)] = 1 К[в1 Ао+ЛСо+ВоК] Во (22 12 10) Далее формируем произведение [Ср(в)] тСьт(в) и используем (22.12.10) и (22.12.7), в результатпе чего после некоторых прямых матричных преобразований получим требуемое.