1626435586-15eceb6ba43f688400eaeb312dc6d98a (844237), страница 12
Текст из файла (страница 12)
(3.3.9) иу ГЧ~ (йУ] й7) Г = ~~~~~ (х (й] й7)— У ' и-и,+» — ~р (х (Уи — 1 ] йУ), й — 1] — ГУ»,„(йУ ] йУ)) (х (й ] й7)— — р]х(й — 1]й ), й — 1] — Гу»„(й ]йу))т, Следует обратить внимание на то, что в этой формулировке неизвестные параметры, подлежащие оцениванию, образуют часть обобщенного вектора состояния Х (й). Любые компоненты ]», Ч, р и Ч„, которые известны заранее, считаются заданными и в максимизации штрафной функции (3.3.5) не участвуют.
Максимиаация (3.3.5) по параметрам априорных распределений — стандартная аадача матричного исчисления. В результате получим и! ГЙ-(й ]й) = —,~ „Х (й]й) — р]*(й — 1]й).й — 1] и=ц+» (3.3.10) абнзввстпыб лпгиогный гаспидвлвйий 75 гу р„(й [йу) = — „,Я [х(й) — Ых(й[йу), й[, (З.ЗЛ2) зу — Ьо зу Ч„(й,~й,) = — '„" [ (й) — [~[ (й[й,),й)— ь,-аз „„, и (йу [йу)) (в(й) — Ь [х(й[йу), й[ — У,„(йу [йу))~, (3.3.13) где через х (й [ йу) обозначено решение аадачи идентификации, сформулированной как задача сглаживания, получающееся путем максимизации (3.3.5) по Х (йУ) с использованием вместо параметров априорных распределений их оценок Гр.„(йу [ йу), ГЧ,„(йу [ йу) Гт, р„(йу ( йу), Ч„(йУ ~ йУ).
Приближенные решения задачи сглаживания для класса сформулированных здесь задач даны в главе 9 книги Сейджа и Мелсы [127[. К сожалению, практическая реализация алгоритмов для х (й [ йу), объединенных с алгоритмами оценки параметров (3;3.10) — (З.ЗЛЗ), может оказаться совсем не простой. Оценки параметров априорных распределений (3.3.10) — (3.3.13) будут использованы при построении алгоритмов оценивания методами градиента и стохастической аппроксимации в следующих двух главах. Обратимся теперь к формулировке задачи идентификации, для которой решение соответствующей ДТКЗ может быть получен методами квазилинеаризации и инвариантного погружения (главы 6, 7). Удобнее минимиаировать взятый с обратным знаком натуральный логарифм штрафной функции МАВ (3.3.5), что эквивалентно минимизации У = 0 5[х(йю) узы(йе)[[';г „>+ гу — з +0,5 Х [[е(й+1) — и (й+1М— з=гц — Ь[х(й+1),й+1][з д +0,5!/тг(й) — уь„(й)Ц~ д + + 0,5 1п [деФ ГЧч (й) Гт[+ 0,5 [п [бей Ч (й + 1)[).
(З.ЗЛ4) Минимизация должна быть проведена при ограничениях, накладываемых моделью формирования сигнала (3.3.6) 7е Функции штгАФА В ЗАдАчАх идйнтиФикАции !Рд. 3 и порождаемых (3.3.7) условиях постоянства параметров априорных распределений: х(7с+1) =<р[х(й),й]+ Гм(й), (3.3 15) ]с (й+1) =-]с (й). (3.3.16) Ч". (й+ 1) = Ч"„(й)', (3.3.17) ]А„(й -]- 1) = [с„(й), (3.3 18) Ч„(й+1) = Ч (й). (3.3.19) К этой задаче можно непосредственно применить дискрет- ный принцип максимума или уравнения Эйлера — Ла- гранжа.
Определим гамильтониан: Н [х (й), тт(й), 2,(й + 1), 7„ (й + 1), Е„(й+ 1),7„(й+ 1), Е (й+ 1), с (й) Ч (й) Р (й) Ч (й) й] 2 [ х (й + 1) ]с (й+ 1) — М [х (й),ч'(7с), й + 1][[с , + — [[ч7(й) — ]с„ (й)~ + — ]и (с]ес ГЧч (/с) Гт] -]- + — ]и (с[об Ч (]с + 1)] + 7, (й + 1) (ср [х (й), й] + Гст (й)] ] + Ч~ (й + 1) ]с,„(й) + Зр (Е (й + 1) ГЧ, (й) Гт] -]- + Чтт(й+ 1) ]сх(Рс)+ ЯР(Ех([с+ 1) Ч„(й+ 1)], (3 3 20) где 2, 7 и 7„— векторные, а Е и Š— матричные мно- жители Лагранжа. Канонические уравнения запишутся в виде х(й+ 1[йс) = ср[х(й] йс),7с]— (3.3.21) ах(а[ар) дх(А+ С [АС) х (з(й+ 1) — [с„(й[йс) — ]1[х(й+1]йс),й+1]], (3.3.22) 3 с1 нвиавистНЬМ АКРИОРНык Рхопгкдвквннк 77 н-к, где (Г[ (Н+1) — ус„(К+1)) ~х(Н+%) Ь[х(к+1),к+1] ГУ (Н + 1) Гт ГЧ (Н + 1) т (и) = (н+1)гт ч„(к+1) (3.3.32) (3.3.33) и (й+1[йу) = с (й[йу), (3.3.23) , 1Г аФ [*(к [Ну), Н[ ~-'1т +1[й) й[й) Гт[с„ Д ах(к[ну) ~ ) (3.3.24) ГЧ„(й+1[йу) Г' = ГЧ„(й [йу) Г', (3.325) Б„(й+1[йу) = И (й[йу) — 0,5[ГЧ„(й[йу)Г'[-с— гач [ (к[ну),н)ч-1т — 0,5ГЧч(й[йу)1 ~ ~ ) Х(й[йу))кт(й[йу) Х ах(к[ну) ~ ) Х „У ' ГУ„(й [ йу) Гт, (3.3.26) а~(н[н,> [сч(й+1[йу) = [сч(й[йу) (3.3.27) Уч(й+ 1 [йу) =- уч(й[йу) + Ч„(й [йу) (я(й+ 1) — [х„(й [йу)— — Ь [х(й+ 1 [йу), й+ 1[), (3.3.28) Чч(й+1[йу) = Уч(й[йу), (3.3.29) Еч (ус+ 1 [йу) = Яч(й [йу) +0,5Чч (й[йу) Х Х (Е(й+ 1) — [с„(й[йу) — Ь[х(й+1[йу),й+ 1[) Х Х [У.(й+1) — [с„(й[й,) — [с[ "(й+1[й,),й+1[) Х Х Ч' (й[йу) — 0,5Уч (й[йу).
(3.3.30) Для важного случая, когда шумы объекта и наблсодений коррелированы между собой, штрафная функция (3.3 14) принимает вид Х= 0,5[х(й,) — [ах(йн)[ -с +0,5[%'(йк) — )сю(йо)[ч-н + Чх сна ско ну — х -[-05 ~~~' ([у(й)[г <к>+05[п[с[еВУ(й))), (3.331) 18 Фтнкций шйзлФл в злйлчлх идвнтиеиклпин игл, з Эта функция штрафа максимиаируется при ограничениях х (й + 1) = ср[х (й), й] + Гтч (й), сс (й + 1) = сс„ (й), )с„(й+ 1) = сс„(й), т (й + 1) = т (й).
(3.3.34) х(й +1) = х (й), в которой скалярный наблюдаемый сигнал искажен гаус- совским белым шумом с нулевым средним и неиавестяой дисперсией г (й) = Н (й) х (й) + и (й), й = 1, 2, ..., йс. Другими словами, в этом примере речь идет о задаче оценки значения постоянного сигнала в присутствии адди- тивного белого шума с неизвестными средним значением и дисперсией. Мы хотим идентифицировать х и У„ мак- симизируя плотность р (Х (йс), К (йс) ~ тс,) = р (К (йс) ~ Х (йс), р,) р (Х (й И с',).
Очевидно, что 8 (с (й) ~ х (й), Р„) = Н (й) х (й), чаг(г(й))х(й), с'„) = )с„ чаг(х(й+ 1) ~х(й)) = О, Используя теорию оптимиаации, теми же методами, что и раньше, можно получить ДТКЗ. В общем случае формулы окааываются слишком громоздкими и поэтому здесь не приводятся. Для любой конкретной задачи формулировка ДТКЗ оказывается не представляющим принципиальных трудностей, но, возможно, и очень утомительным упражнением. Несколько примеров будет приведено в следующих четырех главах, где рассматриваются вычислительные методы, использующие эту ДТКЗ.
Пример 3.3.1. Рассмотрим простую систему с известным гауссовским начальным распределением 3 3) НВИЗВВСТНЫВ АПРИОРНЫВ РАСПРВДВЛВНИЯ 79 так что р[Х(ю УА)[У) = (2я) Ь(йееЧ ) Ь ехр ( — 0,5/!х(0) — )3„[3,) х "Р к) Х П, ехр ( — 0,5У,' [3 (й) — Н (й) х (Ь)Р) (2Я) Ь Уеа Эквивалентная штрафная функция, подлежащая минимизации, имеет вид Х = 0,5[ х (О) — )33~[ем + 3) + 0 5,3 Уе [3 ()3) — Н (В) х (й))3 + 0,5й) [в У,. Для удобства допустим, что У. = со.
Это эквивалентно предположению о полной априорной неопределенности относительно параметра х. Продифференцировав по каждой из неизвестных величин х (й) и У„и приравняв производные нулю, получаем 3~ е~ х(й~[й~) = — ~ф Н (й)Н(7с)1 ~~~~ Н (й)3(й), К 3 3-1 е~ У„(йу ~ 1сг) = — ~ [3 (й) — Н (й) х (Ьз [ Ь~)[3. Г 3=3 Для этого чрезвычайно простого примера оценку х удается определить без знания Уе. Затем оценка х(й) ~ )е~) используется для определения оценки У (Йг [ Йг).
Желательно получить решение в последовательной, или рекуррентной, форме. Для рассматриваемого простого примера последовательностный алгоритм идентификации можно получить по индукции. Прежде всего в соответствии с (ЗЛ.22) определим 33 М (й,) = и (й,, 0) = ',Я Н'(й) Н (й) з=з ! зс ФУНКПИИ ШТРАФА В ЗАДАЧАХ ИДЕНТИФИКАПИИ (ГЛ.
3 и затем отметим, что Ку-1 М(йу) = ~ Нт(й)Н(й)+Н'(йу)Н(йу) = = М(йу — [)+ Н'(йу) Н(йу). С помощью леммы об обращении матриц получим М- (йу) = М- (й,— [) — М- (й, — [) Н'(йу) х х [1 + Н (й,) М '(йу — ]) Н (йу)] ' Н (йу) М ' (йу — 1). Объединяя формулы для двух последовательных шагов оценивания х (йу[ йу) = М '(йу) ~~~~ Ы (й) з (й), К-1 ку х (йу — 1 ] йу — [) = М 1 (йу — 1) ~~" Нт(й) з (й), К=1 получим х(йу]й) = М '(йу)М(йу — 1) х(йу — 1[йу — 1)+ + М 1(йу) Н (йу)я(йу) Снова воспользовавшись леммой об обращении для М ' (йу), окончательно получаем следующее соотношение, в котором опущен индекс ~ и используется сокращенное обозначение х(й) = х (й [ й): - й - й 1 м1(к — $)н (к) .()=.( — )+,+ („„,(, „,,(,) ~ х [2(й) — Н(й) х(й — т)].
Точно так же можно получить последовательностную фор- му записи для оценки ]у, (й). Именно, Р (й) ( 1( 1) р (й 1 [с(К)-М(К) х(К- ~)]' 1 + (+н(к)м- (к-() нт(к) ]' Эти два алгоритма идентификации, или оценивания, реализуются совместно с эффективным в вычислительном нвиаввстныв АпгиОРныи РАспРВдвлиния 8! отношении алгоритмом для М-к (й): М '(й) = М '(й — 1) — М '(й — 1) Н (й) х Х (1+ Н (й) М-'(й) Н (й))-' Н (й) М-'(й — 1). К сожалению, для более сложных вадач, чем рассмотренная нами, не удается получить решение в последовательностной или даже непоследовательностной форме столь простым обравом, как в данном случае. Например, если априорная дисперсия х конечна, оценка (непоследовательностная), дающая решение задачи сглаживания для х, имеет вид к! «(й~~й!) =[~~~ Н (й))!,(й~~й!)Н(й)1 х к-1 к! Х [х','7А„+ ~ Н (й) )!,'(й7~й!)г(й)~ к=к и не может быть определена без предварительного нахождения оценки У,(й! ! й!), в скоко очередь зависящей от х (й! ~ й!).
Вовникающие адесь затруднения удается разрешить вычислительными методами, налагаемыми в следующих главах. В заключение примера получим ДТКЗ, возникающую из задачи минимивации 7. Итак, необходимо минимизировать 7 0,5)(х(0) — 7к,~ !+0,5й71пу„(й)+ гх к! +0,5 ~~~ ~г','(й) [г(й) — Н(й) х(й))х при ограничениях х(й+ 1) = х(й), $',(й+1) = $',(й).