Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 203
Текст из файла (страница 203)
Поэтому остаточный терм может быть вынесен за пределы интеграла, что приводит к получению следующего уравнения: Теперь рассматриваемый интеграл представляет собой обычный интеграл гауссова распределения по всей области его определения, который равен 1.
Таким образом, от квадратного уравнения сохраняется лишь его остаточный терм. Вторым важным этапом является преобразование, выполняемое на основе того наблюдения, что остаточный терм должен иметь квадратичную зависимость от х„' в действительности после его упрощения получаем следующее: 1((хг-~Ь) ) )г(хг) = а е Таким образом, распределение, прогнозируемое на олин этап, представляет собой гауссово распределение с тем же средним )г, и дисперсией, равной сумме первоначальной дисперсии а,' и дисперсии перехода а„'. Даже краткие размышления позволяют понять, что такое соотношение интуитивно вполне оправдано. Для завершения этапа обновления необходимо обусловить вероятность результатами наблюдения на первом временном этапе, а именно вг.
Согласно уравнению 15.16, такая операция осуществляется с помощью следующего уравнения: Р(хг(хг) = а Р(ег)хг) Гг(хг) 1 (хг — хг) ') ~~ (хг-)гг) ( .,) (...) г а г г) г~а,г+а г г) = ае Снова обьединим экспоненты и дополним квадрат (упр. 15.6), получая следующее: О ° гг г г г г аггее г+а 2 (аггее г)а г,(аог+о г+о г) в(хг) ег) = а е (15.17) Таким образом, после одного цикла обновления будет получено новое гауссово распределение для переменной состояния.
На основании гауссовой формулы, приведенной в уравнении 15.17, можно определить, что новые значения среднего и среднеквадратичного отклонения можно вычислить на основе старых значений среднего и среднеквадратичного отклонения следующим образом: 742 Часть 5(. Неопределенные знания и рассуждения в условиях неопределенности а* ъ зь 9. Кк 2 а а е г ос+1 о,'ео„'+о,' (15.18! На рис. 15.6 показан один цикл обновления для конкретных значений модели перехода и модели восприятия. 0,45 0,4 0,35 о,з тг 0*25 0,2 0,(5 О,! 0,05 0 ' 5 Положение на ое«х (О (Ъс. 15.б.
Этапы цикла обновления фильтра Калмана для случайного блуждания с априорной вероятностью, заданной параметрами ,иь = О. О и ао = 1. О, шумом перехода, виданным гт = Р. О, шумом восприятия, заданным о, = 1. О, и первым результатом наблюдения ег = Р.5 (это значение показано звездочкой на оси х). Теперь следует отметить, что под влиянием шуиа перехода предсказание Р (хг) сглаживается относительно Р (ха).
Заслуживает также внимания то, что среднее апостероорнои вероятности Р (хг(ег) находится немного левее от результата наблюдения еи поскольку зто среднее представляет собой взвешенное среднее от предсказания и наблюдения Приведенная выше пара уравнений играет точно такую же роль, как и общее уравнение фильтрации, 15.3, или уравнение фильтрации НММ, 15.10. Но в связи с особым характером гауссовых распределений эти уравнения обладают также некоторыми интересными дополнительными свойствами.
Во-первых, можно интерпретировать вычисление нового значения среднего р„, как вычисление взвешенного среднего от новых результатов наблюдения я„„и старого значения среднего йы Если результаты наблюдения являются ненадежными, то значение о,а увеличивается и мы придаем больший вес старому значению среднего, а если ненадежно старое значение среднего (велико значение о,') или процесс является в высшей степени непредсказуемым (велико значение о„'), то придаем больший вес результатам наблюдения. Во-вторых, следует отметить, что обновление для дисперсии о„,' является независимым от результатов наблюдения. Поэтому можно заранее определить путем вычисления, какой должна быть последовательность значений дисперсии.
В-третьих, последовательность значений дисперсии быстро сходится к постоянному значению, которое зависит только от о„' и о',', что способствует существенному упрощению дальнейших вычислений (см. упр. 15.7). 743 Глава 15. Вероятностные рассуждения во времени Общий случай Приведенные выше результаты анализа иллюстрируют ключевое свойство гауссовых распределений, которое обеспечивает функционирование методов калмановской фильтрации: тот факт, что экспонента находится в квадратичной форме.
Указанное свойство относится не только к одномерному случаю; полное многомерное гауссово распределение имеет следующую форму: и()з,х)(х) = а е Кроме того, произведение термов в экспоненте ясно показывает, что экспонента также является квадратичной функцией от случайных переменных хз, которые относятся к х. Как и в одномерном случае, операция обновления фильтрации сохраняет гауссов характер распределения вероятностей состояний.
Вначале определим общую временную модель, применяемую в процедуре калмановской фильтрации. И модель перехода, и модель восприятия позволяют применять линейное преобразование с дополнительным гауссовым шумом. Таким образом, получаем следующее: Р(хха(хс) = Ы(Рх„х„) (х„1) Р(я~(х„) = ьг(их~,Х,) (х~) (15.19) где Р и Մ— матрицы, описывающие линейную модель перехода и ковариацию шума перехода; н и Х, — соответствующие матрицы для модели восприятия. Теперь уравнения обновления для среднего и ковариации в их полном, ужасающе сложном виде становятся таковыми: — Рве + Кт 1(хс+1 ИРР~) т Х„, = (*-к...) (РХ,Р +Х„) (15.20) где Е„,= (РХ,Р~+Х„) Н (Н (РХ,Р'~Х ) НтэХ ) ' называется 2к калмаиовской матрицей усиления. Хотите — верьте, хотите — нет, но эти уравнения имеют определенный интуитивный смысл.
Например, рассмотрим обновление для оценки значения среднего )ь для некоторого состояния. Терм Р)(, представляет собой прогнозируемое состояние в момент времени с~1, поэтому НР)(, является прогнозируемым результатом наблюдения. Таким образом, терм я„,-нР)(, соответствует ошибке в прогнозируемых результатах наблюдений. Это значение умножается на к„, для корректировки прогнозируемого состояния, поэтому к„„представляет собой меру того, насколько важными следует считать новые результаты наблюдения применительно к предсказанию.
Как и при использовании уравнения 15.18, соблюдается такое свойство, что обновление дисперсии не зависит от результатов наблюдений. Поэтому последовательность значений Х, и к, может быть вычислена в автономном режиме, т.е, фактический объем вычислений, требуемых во время оперативного слежения, становится весьма скромным. Для иллюстрации этих уравнений в действии мы применили их к задаче слежения за объектом, движущимся на плоскости х — к Переменными состояния являются х= (х, у, х, у) т, поэтому Р, Х„, н и Х, представляют собой матрицы с размерами лхл.
На рис. 15.7, а показаны истинная траектория, рял зашумленных результатов 744 Часть тт. Неопределенные знания и рассуждения в условиях неопределенности наблюдения и траектория, оцениваемая с помощью калмановской фильтрации, наряду с ковариациями, указанными с помощью контуров единичного среднеквадратичного отклонения. Процесс фильтрации позволяет весьма успешно следить за фактическим перемещением, к тому же, как и предполагалось, дисперсия быстро достигает фиксированной точки. Двухмерная фильтрация Даухмерыае еглзжиьанле 12 12 10 ь" 9 6 8 10 12 14 16 18 20 22 24 26 х 6 8 10 12 14 16 18 20 22 24 26 Х б) а) Рис. 15.7.
Примеры применения уравнений филыпрации и сглаживания: результаты калмановской фильтрации для обьекта, движущегося по плоскости х-т, которые показывают истинную траекторию (слева направо), ряд зашумленных наблюдений и траекторию, оцениваемую с помощью килмановскои фильтрации; дисперсия в оценке позиции показана с помощью овалов (и); результаты калмановского сглаживания для той же последовательности результатов наблюдения (б) Мы можем вывести не только уравнения фильтрации с помощью линейных гауссовых моделей, но и уравнения сглаживания.
Результаты сглаживания показаны на рис. 15.7, б. Обратите внимание на то, как резко сокра!цается дисперсия в оценке позиции, за исключением концов траектории !объясните, почему), и насколько более гладкой становится оцениваемая траектория. Области применения калмановской фильтрации Методы, основанные на использовании фильтров Калмана и их модификаций, применяются в самых различных приложениях. Одним из "классических" приложений является слежение за самолетами и ракетами с помощью радаров. К такому же типу относятся приложения, в которых осуществляется слежение за подводными лодками и наземными транспортными средствами по звуку, а также визуальное слежение за транспортными средствами и людьми. К немного более узким областям применения относится использование фильтров Калмана для реконструкции траектории частиц по фотографиям, сделанным в пузырьковой камере, и океанских течений по данным измерений, выполненных на поверхности океана со спутников.
Но спектр таких приложений далеко выходит за пределы простого отслеживания движений — к ним относится любая система, характеризующаяся непрерывными переменными состояния и зашумленными результатами измерений. К числу подоб- Глава 15. Вероятностные рассуждения во времени 745 ных систем относятся целлюлозные фабрики, химические установки, ядерные реакторы, экосистемы растений и национальные экономики. Тот факт, что калмановская фильтрация может применяться к некоторой системе, не означает, что результаты этого будут действительными или полезными, поскольку используемые при этом допушения (о том, что модели перехода и модели восприятия относятся к типу линейных гауссовых) являются очень строгими.
В Ж расширенном фильтре Калмана (Ехгепдед Ка1тап Ерйег — ЕКЕ) предпринимается попытка преодолеть нелинейности моделируемой системы. Система является нелинейной, если ее модель перехода нельзя описать с помоШью матричного умножения векторов состояния, как в уравнении 15.19. Фильтр ЕКЕ действует посредством моделирования системы как локально линейной в области х,=)з„ т.е, в той области, где переменные х, равны среднему текущего распределения вероятностей состояний.
Этот фильтр хорошо действует применительно к гладким системам с устойчивым поведением и позволяет программе слежения сопровождать и обновлять гауссово распределение вероятностей состояния, которое является приемлемой аппроксимацией истинной апостериорной вероятности. А что подразумевается под системой, которая "не является гладкой" или "поведение которой неустойчиво" ? Формально под этим подразумевается, что отклик системы в области, "близкой" (согласно ковариации Х,) к текушему среднему )г„показывает существенную нелинейность.
Чтобы понять суть этого описания неформально, рассмотрим пример слежения за птицей, которая летит через джунгли. Иногда создается впечатление, что птица направляется на высокой скорости прямо на ствол дерева. Фильтр Калмана (обычный или расширенный) позволяет получить только гауссово предсказание местонахождения птицы, притом что среднее соответствуюшего гауссова распределения будет находиться напротив центра ствола, как показано на рис. ! 5.8, а. Но более приемлемая модель полета птицы, с другой стороны, должна предсказывать ее действия по уклонению от удара об ствол путем поворота в одну сторону или в другую, как показано на рис.