Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 66
Текст из файла (страница 66)
10.4. Фильтры Калмана — Бьюси При получении фильтра Винера предполагалось, что оценка получается на основе наблюдения на бесконечном отрезке времени, что является ограничительным условием применительно к задачам управления. Фильтр Калмана -Быоси, который будет рассмотрен в этом параграфе, позволяет получать оценку фазовых координат на основе наблюдения выхода системы на конечном интервале времени [1о,с). 10.4.1.
Задача оптимальной фильтрации при белых гпумах. Постанаека заг)ачи. Дана управляемая система х = Ах+ Вп+ Ъ'о(1), х(1о) = х'г (10.34а) у = Сх+ гг„(г), (10.34б) 378 Гл. 10. Анализ систем и синтез оптимальиыс систем управления где А, В, С в общем случае являются функциями времени, х случайная величина и йо(1), зг'„(1) белые шумы с вероятностными характеристиками М[х'] = х, М[(хо — )(хо — х )т = Рш М[Ко(1)] = О, М[Ко(1)~го (б)] = Юо(1)д(1 — 1 ), М[зг„(л)] = О, М[ьг„(1)1г~(б)] = Во(ь)б(ь — б), М[Чо(1)Ч„'(б)] = Ео(1)б(1 — б); Язо, Ро положительно полуопределенные матрицы; 11о положительно определенная матрица, :случайная величина х" не коррелирована с шумами 1г'о(1) и 'Ч„(1).
Требуется на основе наблюдения выхода 1г(1) на интервале [со, 1] определить несмещенную линейную оценку х(л) фазового вектора х(л), обеспечивающую минимум среднего квадрата ошибки: д = М[(х(1) — х(1)) (х(1) — х(л))] — ь ппп. (10.34в) иггг Напомним: глценка х(л) называется несмещенной, если М[х(1)] = = М[х(1)]. Условие положительной определенности матрицы Во (матрицы интенсивности шума наблюдения) означает, что ни одна компонента выхода у(й) не измеряется точно. И в этом случае задача оценивания называется несингулярной (невырозкденной) [29].
Таким образом, задача (10.34) является несингулярной задачей оптимального оценивания (фильтрации). Уравнение (10.34а) называют уравнением объекта, уравнение (10.346) — — уравнением нглблюдеиия. Шум Ъо(1) называют илумом объекта, шум Ъ'„(1)... шума,м наблюдения. Теорема 10.2. Если шумы объекта и наблюдения ие коррслированы (Яо(г) = О), то оценки х(л) является несмещенной и оптимальной в том случае, когда она находится из уравнения х = Ах + Вп + К (у — Сх), х(1о) = х, с мшприцей козугйГициеигглов усиления Ко РСт — л о (10.356) где Р определяется из уравнения Р = АР+ РАт — РГтЛ лСР+ Л,)о, Р(1о) = Ро.
(10.35в) Матрица Р является дисперсионной матрицей ошибки е = х(1)— — х(1): Р = М[е(1)ел (1)]; уравнение (10.35в),которому она удовлетворяет, называется диспер- сионныи уравнением. 10.4. Фильтпрьь Каплана — Бычьи 379 Теорема 10.3. Если тумы объсюта а наблюдения корреларованы (оо(1) ф 0), спо оценка х(ь) является несмещенной и оппгамальной в том случае, когда она находится из уравнения (10.35а) с матрицей коэффициентов усиления К =(РС +Я~)Л ' (10.36а) где дисперсионная матрица Р определяется из уравнены Р = (А — ЯоВо 'С)Р+ Р(А — Боло 'С) — РС~Й„'СР+ 1)о — ЯоЛо 'Я,",, Р()о) = Ро.
(10.366) Несингулярная задача оптимальной фильтрации (10.34) при некоррелированных шумах впервые была решена Р. Калманом и Р. Бьюси. Поэтому фильтры (10.35) и (10.35а)., (10.36), а также другие фильтры, которые будут рассмотрены в этом параграфе, называют фильтрами ( наблюдателями) Калм она- Вью си.
Сравнивая уравнения фильтра Кальмана-Бьюси (10.35а) и уравнение объекта (10.34а), замечаем, что они отличаются последними слагаемыми: в уравнении фильтра вместо шума объекта появляется слагаемое, пропорциональное разности у — Сх. Эта разность между текущим значением выхода и его оценкой у = Сх называется невязкой. Структурная схема фильтра Калмана Бьюси полностью включает структурную схему объекта.
Заметим, фильтр Калмана— Бьюси имеет такую же структуру, что и наблюдатель полного порядка (9.60) в детерминированном случае. Отличие состоит только в том, что, когда случайные воздействия не учитываются (т.е. в детерминированном случае), матрица коэффициентов усиления выбирается произвольно, а когда случайные воздействия учитываются, эта матрица определяется однозначно. Показательство теоремы 10.2 приведем после рассмотрения примера.
П р и м г р 10.7. Определить оптимальную оценку постоянной величины х по наблюдениям за у = х + еи(1), где 1и(1) — белый шум с интенсивностью го, математическим ожиданием М(х] = пь и дисперсией М](х — т)з] = ро Р еп1 ение. В паннам случае уравнение объекта имеет иид х = О, и поэтом А = О, В = 0; 1;)о = О. Фильтр Калмана — Бьюси описывается уравнением х = К" (у — х), х(ео) = т, где ко = р]го, р определяется из уравнения р = -р',)г, .р(10) = ро.
Последнее уравнение имеет решение р = рого) (го + ро)). Поэтому для коэффициента усиления получаем й = ро,)(го + ро1). Показательство теоремы 10.2 основывается на следующей лемме. 380 Гл. 10. Анализ систем и синтаеэ оптимальньье систем управления Лемма 10.1 [29). Пусть дино матаричное уртьвнение — Р = (А — КвС)Р+ Р(А — КоС)т + ьуо + КоЛКо 10.37 ) Р(уу) =Рв, ув<у<уу, где А, С, ьео, Лв --- известные матричные функции, причем ьуо-- положительно полуопределенная матрица, Ло . положитлельно определенная функция, Ро . известния симметрическая постоянная,матрица.
При произвольно заданной матрице Ко = Ко(У) (соответспьвуюшей размерности) решение Р = Р(У) уравнения (10.37) удовлетворяет неравенству х Рх ) х Рх ту Е [ув,уу), (10.38) где Р— решение уравнения Риккатап — Р = АР+ РАт РСтйв СР+ Яв, Р(Уу) = Ро (10.39) Неравенство (10.38) ойратцаетпся в равенство, если положить К =РСЛ,, (10.40) Следствие.
Диагональные элементы маттьриц Р и Р удовлетворяют следуюшим условиям; рн ~ урн, т = 1, .2,..., и, (10.41) (10.43а) тт е»= ' [)( Оль я )ь ь осе*и~\)- (ьь4я ~рм >~ р,, (10.42) ь=1 ь=1 Неравенство (10.41) получается из (10.38), если положить ац = 1 и я = 0 приу' у'. -т (ь = 1,2,...,п). Неравенство (10.42) непосредственно следует, из (10.41). Показательство леммы 10.1. Рассмотрим следующую задачу оптимального управления: х=А х+С п, х(ув)=х, ьт У =х (уу)Рох(уу)+/(х Юох+п Лоп)дт — >ппп.
(10.430) ть Как известно, оптимальное управление имеет вид (см. (9.74)) п = Ло'СРх, (10.44) где Р -- решение уравнения (10.39) (см. (9.75)). При этом (см. (9.76)) 381 10.4. Фвльпьрьь Калльана — Бьюса При управлении и = — Кдтх уравнение замкнутой системы при(Ат С тКот) (10 40) и на решениях этого уравнения интеграл (критерий оптимальности) (10.43б) на интервале [1,11) примет значение хтрх: 0 х Рх = /(х~Ядх+ и~Лом)г1т+ х (11)рдх(11), (10.47) где Р— решение уравнения (10.37).
Действительно, подставим в (10.47) выражение и = — Кдтх и продифференцируем по 1: хтрх + хтрх + хтрх = — (хт1ььх + хтКойдКотх). Подставим сюда производную х из (10.4б): хт((А КоС)Р+ Р+ Р(Ат СтКотУ» хт(С + КоД Кот)х Это равенство будет выполнено тождественно, если (А — К С) Р + Р + Р(А — С Кдт) = — (С + КдйоКдт), — Р = (А — К С)Р+ Р(А — КдС) + С+ К КоК~~. Последнее уравнение совпадает с уравнением (10.37).
Из (10.47) при 1 = 11 получаем граничное условие в соотношении (10.37). Из (10.45) и (10.47) вытекает неравенство (10.38). Если в уравнение (10.37) подставить (10.40), получим уравнение (10.39), т.е. когда К определяется соотношением (10.40), имеет место равенство Р = Р, и неравенство (10.38) обращается в равенство. Лемма доказана.
Доказательство теоремы 10.2. Сначала рассмотрим случай ц(1) = О. При этом уравнение объекта примет вид х = Ах + Ъ'о(1), х(1о) = хд. (10.48) Так как входом фильтра является наблюдаемая переменная у и оптимальный фильтр ищется в классе линейных систем, то уравнение фильтра можно представить в виде х =Рх+К у, (10.49) где Р., Ко -- матричные функции времени соответствующих размеров. При таком представлении фильтра задача сводится к определению матриц Р и Кд.
Продифференцировав соотношение для ошибки е(1) = х(1) — х(1), с учетом (10.48) и (10.49) находим е(1) = х(1) — х(1) = Ах -Ь Ъ'о — Рх — К у. 382 Гл. 1О. Анализ систем и синтез витимальньи сисеаем управления Подставим сюда выражение для у из (10.34б): е(1) = Ах + Ъ'с — Рх — К" (Сх+ Ъ'„). Используя соотношения для ошибки, исключим отсюда оценку т: е(1) = (А — К"С вЂ” Р)х+ Ве+ Ъс — КсЪ„.
(10.50) Оценка будет несмещенной, если при любом 1 > 1а имеет место раМ[хф] = М[х(1)]. Поэтому при любом 1 > рс должны выполняться равенства М[е(1)] = О, М[е(1)] = 0 вс > 1а, и из (10.50) получаем А — КвС вЂ” В = О, или В=А — К С. (10.51) Подставив это выражение в (10.49), получим х = (.4 — КоС)х -ь Коу е = (А КоС)е+ Ъсо — КоЪ (10. 53) Подставив это выражение в уравнение Р = М[е(с)ет(с)] + М[е(с)ет(с)] найдем Р = (А — К С)Р+ М[Ъ7а(1)е (1)] — К М[Ър„фе (1)] + + Р(А КоС)т+ М[е(1)Ъет(1)] М[е(1)Ъст(1)]Кот (РО 54) Так как е(сэ) = х(са) — х и начальное значение х(сс) не коррелированно с шумами, то М[Ъо(1)ет(ро)] = О, М[Ъ'н(1)ет(со)] = 0 (10.55) М[е(со)ЪРот(1)] = О, М[е(1о)Кт(ь)] = 0 х = Ах+ К (у — Сх).
(10.52) Это уравнение совпадает с уравнением (10.35а) (напомним, что и = 0). Из (10.51) имеем также х(1о) ™[х(1о)] = х . Так что осталось показать, что матрица Кс, доставляющая минимум среднему квадрату ошибки, определяется соотношением (10.35б). Получим уравнение для дисперсионной матрицы Р = М[е(с)е~(с)].
Используя уравнения объекта (10.48), оценки (10.52) и наблюдения (10.34б), равенство е = х — х можно преобразовать к виду 10.4. Фалья>рм Казмава — Бьюси 383 Запишем решение уравнения (10.53) по формуле Коши: е(1) = Х(Г> 1о)е(го) + ~Х(Г, т) >Ге(т) >1т — / Х(1, г)К"ЛГ„(т) >1т> >о >о (10.5б) где Х(1,1е) = Ф(1)Ф >(1е); Ф(1) фундаментальная матрица решений однородного уравнения е = (А — К С)е.