Главная » Просмотр файлов » Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)

Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 203

Файл №1245267 Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)) 203 страницаРассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267) страница 2032021-01-15СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 203)

Поэтому остаточный терм может быть вынесен за пределы интеграла, что приводит к получению следующего уравнения: Теперь рассматриваемый интеграл представляет собой обычный интеграл гауссова распределения по всей области его определения, который равен 1.

Таким образом, от квадратного уравнения сохраняется лишь его остаточный терм. Вторым важным этапом является преобразование, выполняемое на основе того наблюдения, что остаточный терм должен иметь квадратичную зависимость от х„' в действительности после его упрощения получаем следующее: 1((хг-~Ь) ) )г(хг) = а е Таким образом, распределение, прогнозируемое на олин этап, представляет собой гауссово распределение с тем же средним )г, и дисперсией, равной сумме первоначальной дисперсии а,' и дисперсии перехода а„'. Даже краткие размышления позволяют понять, что такое соотношение интуитивно вполне оправдано. Для завершения этапа обновления необходимо обусловить вероятность результатами наблюдения на первом временном этапе, а именно вг.

Согласно уравнению 15.16, такая операция осуществляется с помощью следующего уравнения: Р(хг(хг) = а Р(ег)хг) Гг(хг) 1 (хг — хг) ') ~~ (хг-)гг) ( .,) (...) г а г г) г~а,г+а г г) = ае Снова обьединим экспоненты и дополним квадрат (упр. 15.6), получая следующее: О ° гг г г г г аггее г+а 2 (аггее г)а г,(аог+о г+о г) в(хг) ег) = а е (15.17) Таким образом, после одного цикла обновления будет получено новое гауссово распределение для переменной состояния.

На основании гауссовой формулы, приведенной в уравнении 15.17, можно определить, что новые значения среднего и среднеквадратичного отклонения можно вычислить на основе старых значений среднего и среднеквадратичного отклонения следующим образом: 742 Часть 5(. Неопределенные знания и рассуждения в условиях неопределенности а* ъ зь 9. Кк 2 а а е г ос+1 о,'ео„'+о,' (15.18! На рис. 15.6 показан один цикл обновления для конкретных значений модели перехода и модели восприятия. 0,45 0,4 0,35 о,з тг 0*25 0,2 0,(5 О,! 0,05 0 ' 5 Положение на ое«х (О (Ъс. 15.б.

Этапы цикла обновления фильтра Калмана для случайного блуждания с априорной вероятностью, заданной параметрами ,иь = О. О и ао = 1. О, шумом перехода, виданным гт = Р. О, шумом восприятия, заданным о, = 1. О, и первым результатом наблюдения ег = Р.5 (это значение показано звездочкой на оси х). Теперь следует отметить, что под влиянием шуиа перехода предсказание Р (хг) сглаживается относительно Р (ха).

Заслуживает также внимания то, что среднее апостероорнои вероятности Р (хг(ег) находится немного левее от результата наблюдения еи поскольку зто среднее представляет собой взвешенное среднее от предсказания и наблюдения Приведенная выше пара уравнений играет точно такую же роль, как и общее уравнение фильтрации, 15.3, или уравнение фильтрации НММ, 15.10. Но в связи с особым характером гауссовых распределений эти уравнения обладают также некоторыми интересными дополнительными свойствами.

Во-первых, можно интерпретировать вычисление нового значения среднего р„, как вычисление взвешенного среднего от новых результатов наблюдения я„„и старого значения среднего йы Если результаты наблюдения являются ненадежными, то значение о,а увеличивается и мы придаем больший вес старому значению среднего, а если ненадежно старое значение среднего (велико значение о,') или процесс является в высшей степени непредсказуемым (велико значение о„'), то придаем больший вес результатам наблюдения. Во-вторых, следует отметить, что обновление для дисперсии о„,' является независимым от результатов наблюдения. Поэтому можно заранее определить путем вычисления, какой должна быть последовательность значений дисперсии.

В-третьих, последовательность значений дисперсии быстро сходится к постоянному значению, которое зависит только от о„' и о',', что способствует существенному упрощению дальнейших вычислений (см. упр. 15.7). 743 Глава 15. Вероятностные рассуждения во времени Общий случай Приведенные выше результаты анализа иллюстрируют ключевое свойство гауссовых распределений, которое обеспечивает функционирование методов калмановской фильтрации: тот факт, что экспонента находится в квадратичной форме.

Указанное свойство относится не только к одномерному случаю; полное многомерное гауссово распределение имеет следующую форму: и()з,х)(х) = а е Кроме того, произведение термов в экспоненте ясно показывает, что экспонента также является квадратичной функцией от случайных переменных хз, которые относятся к х. Как и в одномерном случае, операция обновления фильтрации сохраняет гауссов характер распределения вероятностей состояний.

Вначале определим общую временную модель, применяемую в процедуре калмановской фильтрации. И модель перехода, и модель восприятия позволяют применять линейное преобразование с дополнительным гауссовым шумом. Таким образом, получаем следующее: Р(хха(хс) = Ы(Рх„х„) (х„1) Р(я~(х„) = ьг(их~,Х,) (х~) (15.19) где Р и Մ— матрицы, описывающие линейную модель перехода и ковариацию шума перехода; н и Х, — соответствующие матрицы для модели восприятия. Теперь уравнения обновления для среднего и ковариации в их полном, ужасающе сложном виде становятся таковыми: — Рве + Кт 1(хс+1 ИРР~) т Х„, = (*-к...) (РХ,Р +Х„) (15.20) где Е„,= (РХ,Р~+Х„) Н (Н (РХ,Р'~Х ) НтэХ ) ' называется 2к калмаиовской матрицей усиления. Хотите — верьте, хотите — нет, но эти уравнения имеют определенный интуитивный смысл.

Например, рассмотрим обновление для оценки значения среднего )ь для некоторого состояния. Терм Р)(, представляет собой прогнозируемое состояние в момент времени с~1, поэтому НР)(, является прогнозируемым результатом наблюдения. Таким образом, терм я„,-нР)(, соответствует ошибке в прогнозируемых результатах наблюдений. Это значение умножается на к„, для корректировки прогнозируемого состояния, поэтому к„„представляет собой меру того, насколько важными следует считать новые результаты наблюдения применительно к предсказанию.

Как и при использовании уравнения 15.18, соблюдается такое свойство, что обновление дисперсии не зависит от результатов наблюдений. Поэтому последовательность значений Х, и к, может быть вычислена в автономном режиме, т.е, фактический объем вычислений, требуемых во время оперативного слежения, становится весьма скромным. Для иллюстрации этих уравнений в действии мы применили их к задаче слежения за объектом, движущимся на плоскости х — к Переменными состояния являются х= (х, у, х, у) т, поэтому Р, Х„, н и Х, представляют собой матрицы с размерами лхл.

На рис. 15.7, а показаны истинная траектория, рял зашумленных результатов 744 Часть тт. Неопределенные знания и рассуждения в условиях неопределенности наблюдения и траектория, оцениваемая с помощью калмановской фильтрации, наряду с ковариациями, указанными с помощью контуров единичного среднеквадратичного отклонения. Процесс фильтрации позволяет весьма успешно следить за фактическим перемещением, к тому же, как и предполагалось, дисперсия быстро достигает фиксированной точки. Двухмерная фильтрация Даухмерыае еглзжиьанле 12 12 10 ь" 9 6 8 10 12 14 16 18 20 22 24 26 х 6 8 10 12 14 16 18 20 22 24 26 Х б) а) Рис. 15.7.

Примеры применения уравнений филыпрации и сглаживания: результаты калмановской фильтрации для обьекта, движущегося по плоскости х-т, которые показывают истинную траекторию (слева направо), ряд зашумленных наблюдений и траекторию, оцениваемую с помощью килмановскои фильтрации; дисперсия в оценке позиции показана с помощью овалов (и); результаты калмановского сглаживания для той же последовательности результатов наблюдения (б) Мы можем вывести не только уравнения фильтрации с помощью линейных гауссовых моделей, но и уравнения сглаживания.

Результаты сглаживания показаны на рис. 15.7, б. Обратите внимание на то, как резко сокра!цается дисперсия в оценке позиции, за исключением концов траектории !объясните, почему), и насколько более гладкой становится оцениваемая траектория. Области применения калмановской фильтрации Методы, основанные на использовании фильтров Калмана и их модификаций, применяются в самых различных приложениях. Одним из "классических" приложений является слежение за самолетами и ракетами с помощью радаров. К такому же типу относятся приложения, в которых осуществляется слежение за подводными лодками и наземными транспортными средствами по звуку, а также визуальное слежение за транспортными средствами и людьми. К немного более узким областям применения относится использование фильтров Калмана для реконструкции траектории частиц по фотографиям, сделанным в пузырьковой камере, и океанских течений по данным измерений, выполненных на поверхности океана со спутников.

Но спектр таких приложений далеко выходит за пределы простого отслеживания движений — к ним относится любая система, характеризующаяся непрерывными переменными состояния и зашумленными результатами измерений. К числу подоб- Глава 15. Вероятностные рассуждения во времени 745 ных систем относятся целлюлозные фабрики, химические установки, ядерные реакторы, экосистемы растений и национальные экономики. Тот факт, что калмановская фильтрация может применяться к некоторой системе, не означает, что результаты этого будут действительными или полезными, поскольку используемые при этом допушения (о том, что модели перехода и модели восприятия относятся к типу линейных гауссовых) являются очень строгими.

В Ж расширенном фильтре Калмана (Ехгепдед Ка1тап Ерйег — ЕКЕ) предпринимается попытка преодолеть нелинейности моделируемой системы. Система является нелинейной, если ее модель перехода нельзя описать с помоШью матричного умножения векторов состояния, как в уравнении 15.19. Фильтр ЕКЕ действует посредством моделирования системы как локально линейной в области х,=)з„ т.е, в той области, где переменные х, равны среднему текущего распределения вероятностей состояний.

Этот фильтр хорошо действует применительно к гладким системам с устойчивым поведением и позволяет программе слежения сопровождать и обновлять гауссово распределение вероятностей состояния, которое является приемлемой аппроксимацией истинной апостериорной вероятности. А что подразумевается под системой, которая "не является гладкой" или "поведение которой неустойчиво" ? Формально под этим подразумевается, что отклик системы в области, "близкой" (согласно ковариации Х,) к текушему среднему )г„показывает существенную нелинейность.

Чтобы понять суть этого описания неформально, рассмотрим пример слежения за птицей, которая летит через джунгли. Иногда создается впечатление, что птица направляется на высокой скорости прямо на ствол дерева. Фильтр Калмана (обычный или расширенный) позволяет получить только гауссово предсказание местонахождения птицы, притом что среднее соответствуюшего гауссова распределения будет находиться напротив центра ствола, как показано на рис. ! 5.8, а. Но более приемлемая модель полета птицы, с другой стороны, должна предсказывать ее действия по уклонению от удара об ствол путем поворота в одну сторону или в другую, как показано на рис.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6476
Авторов
на СтудИзбе
304
Средний доход
с одного платного файла
Обучение Подробнее