1626435586-15eceb6ba43f688400eaeb312dc6d98a (Сейдж, Мелса - Идентификация систем управления), страница 10
Описание файла
DJVU-файл из архива "Сейдж, Мелса - Идентификация систем управления", который расположен в категории "". Всё это находится в предмете "основы вычислительной физики" из 7 семестр, которые можно найти в файловом архиве НГУ. Не смотря на прямую связь этого архива с НГУ, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 10 - страница
Сделанное замечание относится и к другим предельным переходам, встречающимся в дан;.ой главе. Будем обозначать последовательности х (й ), х (У«2), ..., х (У«у) и х (Й,), в (У«2), ..., х (У«у) соответственно через Х (У«у) и Е (У«у). Аналогично непрерывные реализации х (1) и з (2) на отрезке [2», «У] обозначаются через х (УУ) и е (УУ). Через р [Х (йУ) [ Е (У«У)] и р [Х (УУ) [ Е (УУ)] обозначим условные плотности вероятности Х относительно результатов измерений Е. В дальнейшем предполагается, что плотности р [х (й«)] и р [х (2«)] известны и являются нормальными со средним р и ковариационной матрицей »У„,. Наилучшая оценка обобщенного вектора состояния х на рассматриваемом интервале времени зависит, вообще говоря, от критерия, используемого для определения наилучшей оценки. В данном случае под «наилучшей оценкой» понимается оценка, определяемая путем максимизации по Х условной плотности р [Х ] Е] на всем интервале наблюдений.
Получающаяся оценка известна под названием байесовской максимально правдоподобной или оценки максимума апостериорной вероятности (Сейдж !116], Сейдж и Мелса [127]). В дальнейшем все выкладки будут проводиться для дискретного случая, а для непрерывного случая мы ограничимся лишь формулировкой окончательных результатов. Применяя формулу Байеса к р [Х(У«у) ] Е(У«у)], получим [Х(у«)[Е(у«)] — р ~ У . (3.2Л5) Р[и (Ы] Иэ (3.2.2) ясно, чтб при иавестноы х(У«) плотность Р [з (У«) ] х(У«)] является гауссовской, поскольку т (У«) — гауссовская величина.
Поэтому при данном Х (У«у) р [Е(У«,) [Х(У«у)] = 1 р[ — рр ррр — рр*рр,«рр р рррррр — ррррр ррр]1 <2л)вУ» й«С [у„(А) ]Ч' (3.2Л6) 62 ФУНКЦ КИ ШТРАФА В ЗАДАЧАХ ИДЕНТИФИКАЦИИ АНГЛ. Э Используя определение условной вероятности (3.2.17) р [а, р] = р [а ] р] р [р], можно записать Р[Х(йу)] =Р[х(й)'Х(йу — 1)]Р[х(йт — 1)]Х(й« вЂ” 2)] ... ... р [х (й,) ] х(й,)] р [х (й«)]. (3.2Л8) Так как ж(й) — гауссовская марковская последовательность, то последовательность х (й) также является марковской и р[х(й«)]Х(йу — Ц] =р[х(йу)]х(йу — 1)]. (3.2Л9) Следовательно, р [Х (йу)] образована из гауссовских компонент ««У р[Х(У«т)] =р[х(й«)] П р[х(й)]х(й — 1)] (3.2.20) ««=««а+1 (где р [х (й) ] х (й — 1)] — гауссовские плотности) и, согласно (3.2Л), имеет среднее значение «р [х (й — Ц, й — 1] и ковариационную матрицу Г [х (й — 1), й — Ц т'„ (й — 1) Г [х (й — 1), й — Ц.
р Я (йу)] не зависит от х (й), и 2 (йу) является известной величиной в процессе максимизации, который мы дол«кны провести. Поэтому р [Х (йу)] можно рассматривать по отношению к этой максимизации как нормировочную константу. После простых преобразований (3.2Л5) в обозначениях (3.2Л6) и (3.2.20) можно переписать как Р[Х(йУ)]К(йУ)] = ««« = Аехр~ — — ~ ]]з(й) — Ь[х(й), й]]' « А «с,+« ~ъ нэ АУ вЂ” —;Я ]] х (й) — «р [х (й — 1), й — Ц]]«о,<з,>— В=ае+« — ]к (йо) + ]Аз (йо) ]„«~ (3 2 21) зл1 млкснмум АпостиРяОРйой ВВРОятности бз где предполагается е), что А не зависит от х(Й) и й(Й) =Г[х(Й), Й[Ч„(Й)Г [х(Й), Й[. (3.2.22) Отсюда ясно, что максимизация (3.2.21) относительно Х (Йу) эквивалентна минимизации у=-й-[ (Й) — р.(Й.)1„-+ ка-к + — Х [ (Й+1) — Мх(Й+1),Й+1)[е,„+ кг — к + ~,Е [тт(Й)[к к . (3.2.23) к=и , Аналогично максимизация р [Х (г~) [ 2 (гу)) эквивалентна минимизации 2 Илье) [кх Ие) М -к+ 1 к о + 2 $ [[и(г) — Ь[хР), Ю) ке,„+[(тт(й) [к, )й (3.2.24) я при ограничении, задаваемом дифференциальным уравнением (3.2.5).
Соотношение (3.2.24) задает штрафную функцию метода наименьших квадратов,. которая при правильном выборе априорных дисперсий и выполнении предположений о гауссовости х (Й,), т (Й) и и (Й) эквивалентна штрафной функции максимума апостериорной вероятности. Форма уравнения (3.2.23) такова, что напрашивается применение дискретного принципа максимума или дискретных уравнений Эйлера — Лагранжа (Сейдж [116)). Гамильтониан задается формулой Н [х (Й), 'а (Й), 1, (Й + 1), Й[ = = — [п(Й+ 1) — Я [х(Й), и(Й), Й+ 1) [к к + ~ [ „(Й)~, [ 1т(Й+1),р[, (Й) Й) -[- ьт (Й -[- 1) Г [х (Й), Й) ъ (Й), (3.2.25) е) Это справедливо, если Г пе зависит от х и является само по себе полезным результатом. 34 Функции штРАФА в зАдАчак идкнтиФикАцни (гл.
3 в которой Я[х(7с), оо(й), й+1] = = Ь [ср [х (7с), й] + Г [х (й), й] ч (й), й + 1) = = Ь [х(Ус+ 1), Ус+ 1]. (3.2.26) Канонические уравнения и граничные условия имеют вид дН (й+1[й,) =,„,„ Л(йо[йо) = У: [х(7со) — ]ох(йо)[ (3.2 27) Л(Ус[йу) = — „!, Л(йу[Усс) =О, (3.2.28) дх ( ) [жо) х(о)о ) l = О. (3.2.29) ~~И) [жс) и<о> Этими каноническими уравнениями и соответствующими граничными условиями определяется нелинейная двухточечная краевая задача (ДТКЗ), решением которой является искомая оценка при фиксированном интервале сглаживания.
Довольно трудоемкие вычисления позволяют получить следующую развернутую запись канонических уравнений: х(й+1 !Усу) = ор[х(й[ЙУ), й]— — Г [х(Ус[Усу), Ус] У„, (й)Г [х(Ус[Усу), й] оР[ РЛ(й! Йс), (3.2.30) Л (Й + 1 ! 7су) = оР[ Л (й ! Ус с) + т" д (а+1[А,) —,.]о [х(й+ 1 ! Йт), й+ 1]], (3.2.31) где обозначено: ор - 7' д рт [х (Ус [ Усс), Ь] д [Г [х (Ус! УсС), Ь] % (Усит дх(д [а,) дх (д [ Усу) 1о Ус = — (с~ УсГ х Ус й, Ус]Ч" 'Л й йу).
() () [([7) (! Слагаемые в формулах для х (й + 1 ! ЙУ) и Л (й + 1 ] ЙУ) содержат квадратичные относительно Л выражения. При использовании процедуры инвариантного погружениячле- 2.2) мАксимум АпостБРиОРНОй ВБРОяте10стп 65 дН х=— дх Х(то) = ЧЯ(!) [х(го) — ]2„(2о)], Х = — —, ) (21) = О, ды дх (3.2.36) дН вЂ” =О. дч~ Проводя необходимые преобразования,, получим двухточечную краевую задачу х = 1[х (2), 2! — О [х (2), 2] ор[ (2) 6 [х (2), 1] )о(2), (3. 2.37) ) = " ' [') 2! р „-1(1) (х (2) — й [х (2), 2])— дх [1) дог[~[о) П д [ь (2) 0[о[1), 1]'р~ (1) 6 [х[1), 2!) д", [1) ( ) дх [2) (3.2.38) В э.п.
сеаххь )Ве. л,меооо ны степени выше первой по Х исчезают. Поэтому при решении методом инвариантного погружения можно пользоваться эквивалентным выражением д1Рт [х [А ! Ь1), Ь! о[с = дх [ь ! А)) Эти уравнения необходимо решить при двухточечных граничных условиях )о(йо ! йо) = — Ч-„[х (йо) — ]ох ([оо)] )о ()21 ! йу) = О (3 2 34) Двухточечную краевую задачу для непрерывного случая можно получить, устремляя к бесконечности плотность точек фиксации в уравнениях (3.2.30) и (3.2.31) илн применяя непрерывный вариант принципа максимума (Сецнж, [116]) для минимизации функции штрафа (3.2.24) при ограничении, задаваемом дифференциальным уравнением (3.2.5).
При использовании последнего подхода вводится гамильтониан П [х (2), Р (2), ) (г), 2] = 1 = †, ! х(2) — Ь [х (Е), Е! [' , + †., ]м(Е)[!' , + $ + 37 (Е) [Т [х(Ю), 2]+ Сг [х(2), 2] ч7(2)) (3.2.35) и выписываются канонические уравнения сс Функции штРАФА в 3АдАчАх идвнтиФикАции [гл.
з с начальными н конечными условиями Зо(юо) = — Ух'(й)(х(Го) )ох(зо)1 Ь(й!) =О. (3.2.39) Переменная состояния в этих формулах может и должна записываться в виде х (~ ~ ~~), чтобы подчеркнуть, что если найдено решение атой двухточечной краевой задачи, то тем самым получено решение задачи сглаживания, или оценивания, х по наблюдениям до момента г~.
В последующих четырех главах мы будем заниматься решением двухточечной краевой задачи (3.2.37) — (3.2.39) для получения решения как задачи сглаживания х (1 ! 8~), так и задачи фильтрации х(~ ~ г). Представляет интерес связать принятые вьппе модели формирования сигнала и наблюдений с задачей идентификации. Совершенно такая' же операция может быть проделана в дискретном случае. Рассмотрим обобщенную задачу оценивания и идентификации, в которой модель формирования сигнала имеет вид х = $ (х (й), а, ~) + С (х (о), Ь, Ц ч (г) + с.
(3.2.40) Модель наблюдений записывается в виде х(о) = Ь(х(о), й, г) + е+ у(Г). (3.2.4$) Здесь а, Ь, с, б и е — постоянные параметры, подлежащие идентификации. Поскольку они постоянны, справедливы дифференциальные уравнения а = О, Ь = О, с = О, й = О, е = О. (3.2.42) Эта модель является достаточно общей, чтобы охватить значительное число возникающих при идентификации ситуаций: с .может представлять неизвестное среднее значение шума на входе объекта; е — неизвестное среднее значение ошибки наблюдений; Ь можно использовать для обозначения неизвестных параметров входного шума объекта; а и б — другие неизвестные параметры моделей формирования и наблюдения сигнала. Определив обобщенный вектор состояния хт = (хт ат Ьт ст бт ет) (3.2.43 2 21 МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ 67 л~гко убедиться, что такая задача идентификации полностью укладывается в рамки модели (3.2.5) и (3.2.6).