1626435586-15eceb6ba43f688400eaeb312dc6d98a (844237), страница 11
Текст из файла (страница 11)
для того чтобы, решая ДТКЗ (3.2.37) — (3.2.39), получить решение задачи идентификации по критерию максимума апостериорной вероятности, необходимо, чтобы неизвестные случайные параметры обладали гауссовской плотностью распределения с известными средними значениями и дисперсиями. При невыполнении этих условий решение ДТКЗ тем не менее гарантирует получение оценки по методу наименыпих квадратов с функцией штрафа (3.2.24). Четыре вопроса, представляющие интерес при идентификации, оказались не охваченными моделью (3.2.40)— (3.2.42): 1) задачи с неизвестной дисперсией ошибки измерений, 2) задачи, в которых хотя бы одна из помех (входной шум или шум измерений) отличается от белого шума, 3) аадачи оценки аависящих от времени параметров и 4) задачи с коррелированными шумами на входе и выходе объекта. Штрафные функции двух следующих разделов позволят нам решать задачи идентификации с неиавестными дисперсиями шума на выходе (т.
е. ошибок измерений). Задачи с отличным от белого («цветным») шумом на входе удается решить, расширяя вектор состояния таким образом, чтобы входной шум для расширенного вектора состояния был белым. В случае «цветного» шума измерений можно применить многократное дифференцирование вектора наблюдений х с тем, чтобы в результате в продифференцированном векторе наблюдений присутствовал уже белый шум. У Сейджа и Мелсы [$271 можно найти подробное обсуждение задач с «цветными» входными и выходными шумами.
Задачи с переменными параметрами можно исследовать, представляя неизвестный параметр как случайный процесс, порожденный марковской моделью а = Аа (2) + ВВ (Г), (3.2.44) где») (г) — гауссовский белый шум с известными средним значением и интенсивностью, а а (2) — неизвестный переменный параметр. Для осуществления идентификации 33 Функции штРАФА В задАчАх идвнтиФикАции [гл.з е (' ' ! (3.2.45) (3.2.46) (3.2.47) Г Ч„(й+1) У„„(й+1)1 т(й) = ~У (А+1) Ч (й+1) ! (3250) по методу максим апостериорной вероятности необходимо, чтобы ап рное распределение параметра а(9) было гауссовским вестными средним значением )9, (99) и дисперсией т, Наконец, имев целый ряд задач идентификации, подобных задаче, ма которой приведена на рис.
3.2 1, когда входной сигнал, „я)+9 искаженный дополнительной помехой, доступен наблюдению. Ясно, что в этом случае как дискретная модель (3.2.1) — (3.2.4), так и + непрерывная модель (3.2.5) — (3.2.7) сохраняют силу, с тем лишь Рис. 3.2Л. Простая задача изменением, что шум идеитифвкации. объекта (т. е. входной шум) и расширенный вектор шума наблюдений должны рассматриваться как коррелированные процессы, так что 3'(и(Ь) тт (13 = У,(й) Ьк (й — )), 8(тг(Г) У'г (т)) = 19 „(9) бв (9 — т), Ч"' „ (Е) = 11ш Т„М „ (99). 19л1 т, о В результате изменятся эквивалентные штрафные функции для задачи идентификации по максимуму апостериорной вероятности. Функция штрафа, соответствующая (3.2.33), примет вид Х = 3 9Х(780) )Ах( с 99У-1+ $ х, 99 — 1 + 2 мЕ Иу(я) 9т-Чх)+ 3 Птт(яо)ПР „(, (3.2.48) где ~ тт(Ь+ 1) ал1 МАКСИМРИ АПОСТБРИОРНОЙ ВБРОЯТНОСТИ ев Легко убедиться, что ГЕ.Ж) Е ° (7с)1 Ем (вв) ° м (вс) где Е„ (7,) = (Р„ (7 + () — Р.„(7 + 4) Ч-„'(7 + 1) Р (7 + 4))-, (3.2.52) Е„(7)= — Е„®Р „(7+()Р„-'(7+1), (3.2.53) Е„(7,) = (Р, (7 + () — У (7 + 4) унт (7 + () Р „(7 + 1))- .
(3.2.54) Для непрерывного случая функция штрафа (3.2.24) еаменится на 0 2 !!Х(га) — вхх(твИв,-т+ 2 ')!!УР)!!т-чойв (3.2.55) ввв где н (6 "() = ~зр) — Ь(хр), Ц~ Г У„р) ч„„п)1 ~ч 0) чв„р) (3.2.56) (3.2.57) Так как ГЕм(т) Е„(г)1 т ~(г) = ~Ет() и ~ в (3.2.58) где Ем И) = ( ~"н (Г) ~"нн (~) ~р'ъ (в)вЕвн (й)1 ~, (3.2.59) Ем(в) = мвв)ттн.в(в)~рй (г)в (3.2.60) Евв (в) = ( Р'ъ'(в) Р'ъ н (в) Р н (в) в4анъ (~)) ~, (3.2.6вв) штрафную функцию (3.2.55) можно ааписать в виде в~ Х = — !/Х(вО) )савв(вв) !( -1+ 2 ) (!Х(й) — ЫХ(в)вв)ив~!)+ $ 1 Г хв ',в + 2ввт (т) Еш (~) (х (й) — Ь (х (с), т) ! + !! ъ'(й) ф„~о) сМ. (3.2.62) Минимиаируя эту функцию штрафа при ограничении, аадаваемом уравнением (3.2.5), непосредственным тс ФУНКЦИИ ШТРАФА В ЗАДАЧАХ ИДВНТИФИКАЦИИ !ГЛ. З применением принципа максимума после несложных алгебраических преобразований можно получить канонические уравнения (ДТКЗ) х = 1[х (е), 8[ — 6 [х (ю), й[ (Ч"„ (й) — Ча~ (8) Ч",' (г) ЧА~„(с)) х х С [х (ю), 8[ Х (й) — 6 [х (с), е[ Ча .(г) Ча ' (8) х х (х(й) — [т [х ()), е[), (3.2.63) А = ® [„(~)' [ ~ ~(~)( (~) — й [й(~),~[) — д [~(~)'~[ Х()+ дх (О дх [О йт " + - ' Ч"т' (~) Ч"ча (О С [х (г)~ ~) ) (г)— дх О) — 'х"')) Ч „,(Ю) Ч;-„'(Ю) (х(~) — Ь [х(К), Ю[) + дх (О д(Х (1) 6 [хр), Е[ [Ч'х(Е) Ч~ач ()Ч~т (1) Чтей)[6 [х[0, ф дх О) (3.2.64) Зги канонические уравнения нужно решать при двухто- чечных граничных условиях Х(~е) =У- [х(0) — [А,(0)[, Х(ГГ) =О.
(3265) В зависимости от вычислительного метода, применяемого для решения ДТКЗ, получаемая оценка служит решением аадачи фильтрации или сглаживания состояния системы и параметров. Пример 3.2.1. Рассмотрим идентификацию параметра а и неизвестного среднего значения ошибки измерений е для системы первого порядка, показанной на рис. 3.2.1.
Модели формирования сигнала и наблюдений принимают вид в, = — ах, (г) + и>(е), $ (с) = х, (е) + Р (г) + е, а (е) = ю (ю) + Ф (ю), причем испольауются уравнения а=д=О для задания ограничений, согласно которым неизвестные случайные параметры должны быть постоянными. Слу- З.вс МАКСИМУМ АПОСтВРИОРНОЙ ВКРОЯРНОСТИ с( чайные процессы ш (С), о (С) и ов (с) — некоррелированные между собой гауссовские белые шумы с нулевыми математическими ожиданиями и известными интенсивностями.
Составные части штрафной функции МАВ (3.2.62) и канонических уравнений (3.2.63) и (3.2.64) в данном случае имеют вид х(с) = а = хв(с), г (х(с),с] = С) 6(х(с),с)= о, „(6 — (,) Гхс (с) + хв (с)1 "(с)=~ ~=~ ~, 'у„(с)=Ч (с), з(с) р„(с) О о т„()+ч„(~) ч' (')=(о 'р (с)) ч"„(с) = )в , (се) )ва У„,(Се) О О о у, о о о т,(~о) =ух(Со) = св (се) = Поучительно выписать канонические уравнения для рас- сматриваемой конкретной задачи. Они выглядят так: ч'„ (с) 'Р„ (с) ч' (с) ас = — йс(С) Юо(С) — а, +вр ) )вс(С)+ вр ( +вх ( чо(С), ю =о, йо = О, ~у 6) Й~(с) й~(с) й~(с)) + й~(с))в~(с) е Хо — — йс (с) Хо (с), ( )ео = ~ (с) Й(С) — йс(с) — Юо(С)).
Граничные условия запишутся следующим образом: ) с (Со) = р'х,((о) Ф (Со) — )сх, (Со)1, )вс (Сс) = (»* " о (Со) = Уа (Зо (Со) — (Аа)в )Оо (СС) = 6в )во (Со) = е е (хо (Со) — )се)в л,(с,) - о. 73 вкнйц[аи вгазгаэа в заДАЧАХ Йдйнтнавнаазании [ГЛ. 3 ДТКЗ явно нелинейна, и поэтому трудно надеяться на получение ее аналитического решения. Подробно выписав канонические уравнения, мы смогли понять, каким образом различные конкретные компоненты задачи, в частности параметры априорного распределения, входят в ДТКЗ. В дальнейшем большое внимание будет уделено способам, которыми характеристики этого априорного рас- ПРеделепиЯ [Ух (вв)з паз айвз )ах, (~а)з Рю )ав[ ВлиЯют на доступную для нас точность и быстроту идентификации параметров системы.
3.3. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА АпОстеРиОРнОЙ ВеРОятнОсти при неиЗВесгных ПАРАМЕТРАХ АПРИОРНЫХ РАСПРЕДЕЛЕНИЙ Если параметры априорных распределений шумов объекта и измерений или каких-либо их составляющих неизвестны, решить сформулированную ДТКЗ для идентификации системы не удается. Нередко неизвестные априори средние значения можно рассматривать как подлежащие идентификации неизвестные константы. Эти неизвестные постоянные добавляются к уравнениям объекта и наблюдений и к ДТКЗ, получаемой описанным в предыдущем разделе способом.
Альтернативный подход основан на методах данного раздела. Неизвестные априорные дисперсии, однако, приводят к значительно более существенным затруднениям, так как эти дисперсии входят в неэкспоненциальную ' часть штрафной функции МАВ (3.2.21). Для обеспечения совместимости с иденти-' фикацией по методу МАВ удобно предположить, что априорные параметры не меняются от шага к шагу и таковы, что по формуле Байеса для не зависящих от номера шага параметров априорного распределения можно написать Р[[Е (а~)! Х ()в)), )а, Ух, )а .
У4 Р[ХИ9)з)азвз тзв )азззтзз[Щз)[ — [Е(х [ Х Р )) х р [Х (й~) [ )а„, У„, )а„, У [ р [)а [ р [У,Д р [уз [ р [Ух[, (3.3. а) причем считается, что априорные параметры независимы. Снова совместная плотность р [Х (й))) не влияет на процедуру оптимиаации, поскольку она явным образом не зависит от переменных состояния Х (й) и априорных па- нвизВкстныв АПРНОРныв РАСПРВдвлвния тз раметров И„, Чпв ]ать Чт, потерью являются существенным переменными при оптимизации апостериорной плотности. Поэтому оценка МАВ может быть определена максимизацией безусловной плотности р [Х (йу), Е (йг), ]а„, Ч „, [а„, Ч„] = =Р[Е(йу)!Х(йу),]а„,Чп, Ит, Чт]Р[Х(йг)[Р Ч~ р Ч ])С Х Р []ап] Р [Чп] Р []ах] Р [Чх].
(3.3.2) Часто бывает удобно предположить, что априорные значения параметров распределены равномерно (Сейдж и Хьюза [т22]), так что априорное распределение каждой компоненты р имеет вид Р[Р Д = Р~$ша* Раашю 1 — ю рпшах~(рп~(рпаяа~ 0 в противном случае. Предполагается, что все остальные априорные параметры распределены аналогичным образом. Допуская, что оцен- ки априорных параметров таковы, что ограничения в вы- ражениях равномерной плотности не нарушаются, оценки состояния, параметров системы и параметров априорных распределений определяются максимизацией выражения р [Х (йг) ] Х (йг), [ап, Ч, )а„, Ч„] р [Х (йг) [ ]а~, Ч, ]А„, Ч ].
(3.3.4) При некоррелированных шумах объекта и измерений это выражение в точности совпадает с полученным в (3.2.24). Таким образом, необходимо выбором Х (йг), р, Ч„ максимизировать Х— Х [аа~ Чх <Ьа)]а ([аМ ГР„Гт] [ааа Ч„]~]"~ "'" Х ЕХР ( — 0,5] Х (йа) — [Ах (йа) Ц, х (ад м~ — 0,5 ~~~ ~]э(й) — [а„— [а[х(й),й]]а х— а аа+г Ра а1-г — 0,5 ч~~ ~]хт(й) — [а,~ ,1. (3.3.5) а-а, % 74 ФУНКЦИИ ШТРАФА В ЗАДАЧАХ ИДВНТИФИКАЦИИ ИГЛ. 3 Эта штрафная функция метода МАВ получается для сле- дующей модели формирования сигнала и наблюдений с гауссовскими белыми лгунами»Р (й) и ч(й): х (й + 1) = ~р (х (й), й] + Гч (й), (3.3.8) з(й) =]»]х(й),й]+у(й) (3.3.7) с (неизвестными) параметрами априорных распределений У» = Ж(»Р(й)], Ч = Уаг(»г(й)), У»„= 8(У(й)], Ч = Уаг(У(й)] (3.3.8) и (известными) параметрами априорных распределений У»и(йо) = б Ех(йи))! Ч,(йи) = чаг(х(йи)), сот (» (й), У (й)) = О, сот(х(йи),'е (Ус)] = О, соч(х(й), у(й)) = О.