Kim D.P. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelinejnye, optimal'nye i adaptivnye sistemy. (950615), страница 68
Текст из файла (страница 68)
В данном случае 1'„1о = О, Р = -1, Во = 1, В = О. А=О, С=1, В=О, Поэтому из (10.66) и (10.67) получаем Во=1, Во=О. С=1, Из (10.70) и (10.69) находим х = — ьдх+ ( — к~~ — й~+ н~)у, х(0) = — йоу(0), Так как Во = О, то ко и Р определяются, согласно теореме 10.2, по формулам (10.356) и (10.35в): Р = -Рз, Р(0) = Р„. Как легко проверить, Ро 1со Ро 1+Рос 1+Рос Выше были рассмотрены задачи оценивания, когда цветными являются или шум объекта, или шум наблюдения.
Ясно, что, .используя оба рассмотренных способа, можно решить задачу оценивания, когда цветными являются квк шум объекта, так и шум наблюдения. 10.4. Фильтрь~ Калльана — Быдло 10.4.4. Вырожденная задача оптимального оценивании. Напомним: задача оптимального оценивания называется выролсденной или сингулярной, если матрица интенсивности шума наблюдения является вырожденной (не является положительно определенной). Вырожденные задачи возникают, когда часть компонент выходного вектора измеряются точно или когда шум наблюдения является цветным и матрица интенсивности преобразованного шума наблюдения является вырожденной.
Если задача оценивания является вырожденной. то приведенные выпье оптимальные фильтры использовать нельзя. Если шумы являются цветными, то, согласно описанным выше процедурам, исходная задача может быть преобразована в задачу с белыми шумами. Поэтому ограничимся рассмотрением только сингулярной задачи с белыми шумами. Сингулярную задачу оптимального оценивания можно сформулировать следующим образом: х = Ах+ Вп+ Ъ'о х(1о) = х (10.71а) у~0 = Сьх+ ььг„, убб = Сзх., (10.
71б) (10.71в) Здесь, как обычно, принимается, что Вь Яо — — положительно полу- определенные матрицы, Ло положитольно определенная матрица. Эта задача отличается от несингулярной задачи оценивания тем, что в ней уравнение наблюдения представлено двумя уравнениями; (10.71б) уравнением, определяющим неточно измеряемые выходные переменные, (10.71в) уравнением, определяющим точно измеряемые выходные переменные.
Оптимальная оценка определяется следующим образом: х = ьзу + ьгЧ, (10.72а) ь1 = Аь1 т Н+ Ко(у — Сц), г1(1о) = Сох, (10.72б) (10.72в) Ко = (РСт+ Яо)Ло ', у = М[(х(1) — х(1)) (х(1) — х(1))] — э ппп, (10.71г) яр) где фазовый вектор в начальный момент хо не коррелирован с шумами объекта Ъ'о и наблюдения Ч„, и они имеют следующие вероятностные характеристики: М[хо] = х, М[(х — х )(х — х ) = Ро, М[~'о] = О, М[1Го(1Жо (1')] = Юо(1)й(1 — 1'), М[Ъ„] = О, М[Ъ'„(1)Ъ~(1')] = Ло(1)й(1 — 1'), М[Ъго(1)Ъ~(1)] = БоЯ6(1 — 1'). 392 Гл. 1О. Анализ светаем и синньез оптимальном систем управление Р = (А — Бойо С)Р+Р(А Бойо С) — РС йо'СР+Оо — Бойд Бо, Р(оо) = С2РоС2 .
(10.72г) Здесь приняты следующие обозначения; В| и Вг определяются из соотношения ) ( 2 ) (10.73) где матрица С' выбирается так, чтобы (и х и)-матрица в (10.73) справа была невырождена, А = (Со+ С2А)Ь2, Й = (С,'+ С2А)тчу~ ~ + С,'Вп, (10.74а) (10.74б) где убц уц) С,Т, у(2) урб = ут~~б — (Сг т СгА)Ь~урб — С2Вп, (10.75 а) или, учитывая (10.73), х = Л2У + Ьгс1. (10.77) Очевидно, если найдем оптимальную оценку ц, то, подставив ее в (10.77), получим формулу (10.72), определяющую оптимальную оценку х.
Поэтому задача свелась к определению оптимальной оценки для с1. Продифференцировав тождество ц = С'х и учтя соотношения (10.71а) и (10.77), получим ц = (Сг + С2А)Л2Ч+ (Сг + С2А)Лгу~ ~ + С2Вп+ Сорго. Сь = Сгйг, Сг = (Сг+ Сг-А)йг; (10.75б) вероятностные характеристики преобразованных шумов имеют вид ь ~т йо Бо С2 т т т 1)о = СЯоС2, йо = т, Бо = [СгБо С21)оС2 ). (10. 7б) Получим алгоритм (10.72). Компоненты вектора у~г~ измеряются точно. Пусть размер этого вектора равен рг и матрица Сг имеет ранг рь Тогда (10.71в) представляет собой рь линейных независимых уравнений для неизвестного фазового вектора. Поэтому достаточно получить еще и — рз уравнений, которые совместно с (10.71в) позволят определить оценку х.
Введем (и — рь)-вектор о, определяемый соотношением о = С'т. Из этого соотношения и уравнения наблюдения (10.71в) имеем .= й '(".'") 10.4. Фалыпры Калмана — Бьюса Воспользовавшись обозначениями (10.74а) и положив ьго = Сз сро, последнее уравнение можно записать в виде 4 = АЧ+ П + Аго (10. 78) Преобразуем уравнение наблюдения (10.716): нужно получить уравнение, связывающее выходную переменную с Ч. Подставив выра- жение для х из (10.77) в (10.71б), получим у = С1Ч+ та, где у111 и С1 определены в (10.75). Продифференцировав второе урав- нение наблюдения (10.71в) и использовав уравнение объекта (10.71а) и представление (10.77), находим у = Сзс1+ С2 сго; где у121 и Сз определены в (10.75).
И если воспользоваться представ/ ъг„'[ лением (10.74б) и положить 17„= [с " [, то УРавнение наблюдениЯ 2 О/ можно записать в виде (10. 79) У=СЧ+Ч„. Таким образом, чтобы найти оптимальную оценку с1, нужно найти фильтр Калмана-.Вьюги для системы (10.78), (10.79). Вычислив корреляционные функции преобразованного шума объекта Фо = С! Ъ'о С' 1Ра '[ и преобразованного шума наблюдения ср„= '[ " ~), а также их 2 О/ взаимную корреляционную функцию для интенсивности сзо шума Аго, интенсивности Ао шума Ъ'„и их взаимной интенсивности Яо, получим формулы, приведенные в (10.76).
Так как взаимная корреляционная функция шумов объекта и наблюдения отлична от нуля, то оптимальная оценка Ч определяется, согласно теореме 10.8ц по формулам (10.72б), (10.72в), .(10.72г). Начальные условия Ч(10) и Р(10) определяется исходя из соотношения Ч = Сзх. Пример 10.10. Объект и наблюдение описываются уравнениями й = Х2, лз = и + 102, 91 — т1 + Ън Р2 — т2. Фазовые координаты в начальный момент не коррелированы с шумами объокта и наблюдения и имеют следующие вероятностные характеристики: Мя,(0) = О, М[т~(0)) = рос, 1 = 1,2,. М[т1(0)22(0)[ = О., М[Ъ002(1)[ = О., М[Ъ02(1)Ъ02(1)[ — 9220(г 1) М[Ъ„(г)[ = О, М[Ъ'„(1)Ъ'„(1')[ = г115(г — г'); М[Ъ02(1)Ъ'„(г')[ = О.
Требуется определить оптимальную оценку. 394 Гж 1О. Аиаевз систем в сан!вез овтимееьньи свсгием управления Решение. Задача является сингулярной. В данном случае имеем А=, В=, Сг= (1 0), Сг= (О 1), у уь! у уг! ьее — ~ ! пе = гь! !ц !г! ~0 дгг [ — е [ро! 0 ~ О рог Примем Сг — — (1 0). Тогда д = С'и = т!. Из равенства С' 1 0 1 0 получаем ! ! =, г г = Из формул (10.74) -(10.76) находим А = 0 „- = „, у10 = у, С, = 1, У~' = Уг - и, С, = О, у = "„, = . "' , С = ,' , Ое = О, 71е= О, ~в=О.
Из (10.72б)., (10.72в), (10.72г) имеем Ч = уг + кг(у! — Ч) + йг(уг — и), !7(0) = О, — р(0) =рш. T!1 !'ь! Пля искомой оценки из (10.72а) получаем и! = !1! тг = уг. 10.4.5. Линеаризованный фильтр Кацмана — Бьюси. Рас- смотрим алгоритмы оцснивания фазового вектора нелинейных систем, основанные на линеаризации. Пусть объект и наблюдение описывают- ся уравнениями вьща х = 7(х, и, г) + Ъ'е, х(се) = хе, у = в(х,1) + Ъ'„.
Случайный вектор хе и шумы объекта Ъ'е и наблюдения зГ„не корре- лированы между собой и обладают следующими характеристиками: Мхе = хе, М[(хе — хе)(хе — хе)т[ = Ре, М[ !се(с) !се (1 )[ = ь )е(!)е(с — ! ) М[~'„(г)Ч~(г')) = йе(г)4(г — г'); 10.Л, фильтры Калнина — Быоси матрицы Рв, Яс положительно полуопределены, матрица Ба положительно определена. Произведем линеаризацию относительно некоторой траекто- рии х*(1): х = Г(х*, и, 1) + ( — ) (х — х') + ьгь, у = 8(х', й) + ( — ) (х — х*) + н „, где звездочка сверху производной означает, что она вычисляется в точках х = х*.
Учитывая, что фильтр Калмана Бьюси состоит из модели системы и обратной связи по невязке,можно записать х = Г(х, п,1) + К~]у — ц(х,1)], х(1в) = х, Кс Р( ~) Бо (10.80б) '=(Й)"'(Й) -'(Й) "(Й)' '" =" (10.80в) Здесь в уравнении для оценки используется точная модель системы.
Линеаризованная модель используется при вычислении матрицы коэффициентов усиления. Теперь остановимся на выборе траектории х'(г), относительно которой производиться линеаризация. В качестве такой траектории можно принять номинальную траекторию, которая выбирается до начала процесса получения оценки на основе априорной информации о реальной траектории. Такой способ удобен тем, что производные и соответственно матрицу коэффициентов усиления можно вычислить заранее. Это важно, когда оценку нужно получить в реальном масштабе времени. Его недостаток состоит в том, что при неудачном выборе номинальной траектории (траектории х'(1) и х(1) сильно отличаются) возможны большие погрешности в оценке. А чтобы выбрать траекторию х" (г), близкую х(г), нужна большая априорная информация.
Указанного недостатка лишен расширенный фильтр Калмана.Бьюси (57]. Так называется фильтр (10.80), если линеаризаци» производите» относительно точек оценки х(1). Недостатком этого фильтра является то, что матрицу коэффициентов заранее вычислить нельзя, и возникают трудности получения оценки в реальном масштабе времени изза увеличения объема вычисления в процессе получения оценки. Еше большей точности можно добиться, если использовать итерационный фильтр Калнина — Бьюси (57]. Так называется фильтр (10.80), если после линеаризации относительно номинальной траектории и получения оценки х(1) вновь производится линеаризация относительно х(1) и получается уточненная оценка хр~.
Эта процедура продолжается до тех пор, пока изменение оценки не станет допустимым. Очевидно, 396 Гл. 10. Анализ систем и синтез аптимальнььх светаем рнраелениа Хг такой фильтр потребует большого объема вычислений, что является его недостатком. Пример 10.11. Самолет летит на постоянной высоте с постоянной скоростью и. Измеряется угол й направления на маяк (рис.
10.6) с помехой, х1 представляющий собой белый шум с интенсивностью га. Требуется определить дальность х1 и высо- тУ хг в текУ1ций момент вРемени. Решение. Составим уравнения объекта (движения самолета) и наблюдения и выпишем необходимые вероятностные характеристики: Х2 т1 — — и., хг = О, .р = 11 = агс16 — + Ъю Х1 М[х1(0)[ = Го, М[хг(0)] = йо, М[х(0)х~(0)[ = Ра, х(0) = х(0) — М[х(0)[, М[Ъ„(1)[ = О, М[Ъ„(1)Ъг„(1')[ = тай(1 — 1 ). Расширенный фильтр Калмана — Бьюси описывается следующими уравнениями: х1 = с+ Й1 (й — агсгб =.1, х1(0) = 1о, Х1)' хг = йг(а — агсгд' =1, хг(0) = Ьо~ Х1/ 10.5.
Стохастические оптимальные системы Для строго детерминированных систем управления не имеет значения, какое управление — программное или с обратной связью используется, так как знание управления и начального состояния позволяет однозначно определять состояние системы в любой момент времени. Наблюдение за текущим состоянием системы не дает новой информации. В стохастических системах управления, т. е, в системах, подверженных случайным воздействиям, по известным управлению и начальному состоянию предсказать ход протекания процесса невозможно.
И возможности качественного управления такими системами существенно зависят от той информации, которая может быть получена путем измерения (наблюдения) и обработки выходными (наблюдае- дбо. Стояастичесние оптимальные системы 39д мыми) переменными. Поэтому стохастические системы управления должны быть замкнутыми. При рассмотрении детерминированных систем управления основное внимание также уделяется замкнутым системам, так как практически все системы управления подвержены случайным или неслучайным, но заранее не прогнозируемым воздойствиям, т.