Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 202
Текст из файла (страница 202)
двухсторонний список свидетельств от С-с( до С, первоначально пустой 1оса1 чатааЬ1ев: О, а,о„ диагональные матрицы, содержащие информацию модели восприятия добавить е, к концу списка еь-еь О, (- диагональная матрица, содержащая Р(е,]Х,) ЕЕ с>о сЬеп Е ь- Рогнагб(Е,е,) удалить е, а ь с начала списка е,ю, о, а < — диагональная матрица, содержащая Р(еь-а]хь-а) в ь- о т'вто -1 -ь е1ве В < — ВТО, <- Ст1 ЕЕ С>с) СЬеп кесцтп Ногща11ве(ЕхВ1) е1ве тесцтп пустое значение 15.4. ФИЛЪТРЫ КАЛМАНА Представьте себе, что вы внимательно следите за маленькой птицей, летящей через плотную листву джунглей в сумраке: вы замечаете краткие промежуточные этапы движения и пытаетесь угадать, где сейчас находится птица и где она появится в следующий раз, чтобы ее не потерять. Или вообразите себя на месте оператора радара во Второй мировой войне, который напряженно вглядывается в крошечный, блуждающий блик, появляющийся на экране через каждые 10 секунд.
А если вернуться в прошлое еще дальше, вообразите, что вы, как Кеплер, пытаетесь реконструировать орбиты движения планет из совокупности крайне неточных угловых измерений, полученных через нерегулярные и неточно измеренные интервалы времени. Во всех этих случаях осуществляется попытка оценить показатели состояния физической системы (например, положение и скорость) на основе зашумленных результатов на- 738 Часть У.
Неопределенные знания и рассуждения в условиях неопределенности блюдений во времени. Эту задачу можно сформулировать как вероятностный логический вывод во временной вероятностной модели, где модель перехода описывает физические основы движения, а модель восприятия описывает процесс измерения. В данном разделе рассматриваются специальные формы представления и алгоритмы вероятностного вывода, которые были разработаны для решения задач такого рода; описанный здесь метод называется 'в.
калмаиовской фильтрацией в честь его разработчика Рудольфа Э. Калмана. Очевидно, что для определения состояния этой системы требуется несколько непрерывных переменных. Например, траектория полета птицы может быть задана с помощью данных о положении (х у г) и скорости (х у д) в каждь)й момент времени. Необходимо также иметь соответствующие плотности условных вероятностей для представления модели перехода и модели восприятия; как и в главе 14, в данной главе будут использоваться линейные гауссовы распределения.
Это означает, что следующее состояние х„, должно представлять собой линейную функцию от текущего состояния х, с добавлением какого-то гауссова шума, а такое предположение, как оказалось, является весьма оправданным на практике. Рассмотрим, например, координату Х птицы, игнорируя на данный момент все другие координаты. Допустим, что интервал между наблюдениями равен Л, и предположим, что птица летит с постоянной скоростью; в таком случае данные об обновлении ее положения определяются с помощью следующего уравнения; Хс+д = Х, ч Х Ь Если мы введем в него гауссов шум, то получим линейную гауссову модель перехода: Р(х„ь-— х~,л)хс=х~,х,=х~) = И(хс+х~д,о) (хии) Структура байесовской сети для системы с переменными, описывающими поло- жение х, и скорость х„показана на рис.
15.5. Обратите внимание на то, что это— весьма специфичная форма линейной гауссовой модели; общая форма этой модели будет описана ниже в этом разделе; она охватывает колоссальный спектр приложений, выходящий за пределы простых примеров моделирования движений, приведенных в первом абзаце данного раздела. Читателю может потребоваться обратиться к приложению А для ознакомления с некоторыми математическими свойствами гауссовых распределений; для наших непосредственных целей наиболее важным из них является то, что Ъ.
многомерное гауссово распределение для с) переменных задается ()-элементным средним )ь и матрицей ковариации з, с размерами с)хс). Обновление гауссовых распределений В главе 14 было описано ключевое свойство семейства линейных гауссовых распределений: при стандартных операциях в байесовской сети оно остается замкнутым.
В этом разделе данное утверждение будет уточнено в контексте фильтрации с помощью временной вероятностной модели. Ниже перечислены требуемые свойства, соответствую)цие процессу двухэтапного вычисления результатов фильтрации с помощью уравнения 15.3. 1. Если текущее распределение в(х,)е, .) является гауссовым, а модель перехода в(Х„,)ж,) — линейной гауссовой, то распределение, прогнозируемое 739 Глава )5. Вероятностные рассуждения во времени на один этап вперед, которое задается с помощью следующего уравнения, также представляет собой гауссово распределение: в (х«,«! е««) = в (х«,д(х«) Р(х«)ео«) ах„(15.
15) х« Х, 2гь( Рис. 15.5. Структура бойесовской сети для линейной динамической системы с переменными, определяющими положение х„скороопь х, и результаты измерения позиции Х„ 2. ЕСЛИ ПРОГНОЗИРУЕМОЕ РаСПРЕДЕЛЕНИЕ В (Хьм ~ Е...) ЯВЛЯЕТСЯ ГаУССОВЫМ, а МО- дель восприятия в (еьм ~ х„,) — линейной гауссовой, то после обусловливания вероятности на основании нового свидетельства следующее обновленное распределение также является гауссовым: в(х„,(е,.„«) = о в(е„,(х„«) в(х„„(е« ° «) (15.16) Таким образом, оператор догме сс) для калмановской фильтрации принимает на входе гауссово прямое сообщение й„.„заданное с помощью среднего )ь, и матрицы ковариации м„и вырабатывает новое многомерное гауссово прямое сообщение й,,„,, заданное с помощью среднего )ь„, и матрицы ковариации г,„,.
Итак, начиная с гауссова априорного сообщения к..ь=в(х,) =д(()гь,Х,) и проводя фильтрацию с помощью линейной гауссовой модели, мы можем получить гауссово распределение вероятностей состояний для любых временных срезов. Очевидно, что этот научный результат является привлекательным и изящным, но почему он имеет такое важное значение? Причина этого состоит в том, что за исключением нескольких частных случаев, подобных рассматриваемому, оу в процессе фильтрации с помощью непрерывных или гибриднь«х (как дискретных, так и непрерывных) сетей вырабатываются распределения вероятностей состояний, размеры представления которых растут во времени без ограничения.
Это утверждение нелегко доказать, но в упр. ! 5.5 показано, что в простых примерах так и происходит. Простой одномерный пример Как было указано выше, оператор уогыахс( для фильтра Калмана отображает одно гауссово распределение на другое, новое гауссово распределение. Применение 740 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности этого оператора сводится к вычислению новых значений среднего и матрицы ковариации из предыдущих значений среднего и матрицы ковариации. Для вывода правила обновления в общем (многомерном) случае требуется большой обьем выкладок в линейной алгебре, поэтому пока остановимся на очень простом одномерном случае, а позже будут даны результаты для обгцего случая.
Но даже в одномерном случае вычисления являются довольно трудоемкими; тем не менее авторы считают, что с ними следует ознакомиться, поскольку применимость фильтра Калмана слишком тесно связана с математическими свойствами гауссовых распределений. Во временной модели, которая будет здесь рассматриваться, представлено случайное блуждание единственной непрерывной переменной состояния х„зарегистрированное с помощью зашумленных результатов наблюдения де Одним из соответствующих примеров может служить показатель "доверия потребителя", который может быть промоделирован как переменная, подвергающаяся каждый месяц случайному изменению с вероятностью, представленной с помощью гауссова распределения, и измеряемая с помощью опроса случайно выбранных потребителей, в котором также вносится гауссов шум формирования выборки. Предполагается, что распределение априорных вероятностей является гауссовым, с дисперсией и,') (хо-цо) ) Р(хо) = а е (Для упрощения в этом разделе мы будем использовать один и тот же символ а для обозначения всех констант нормализации.) В модели перехода просто добавляется гауссово возмущение постоянной дисперсии п„о к текущему состоянию; ( '.') 1 (х„«-хо) 2 2 а„о ) Р(х„«)х„) = а е Это означает, что в модели восприятия должно быть принято предположение о наличии гауссова шума с дисперсией и.') 1~(хо-хо) 2) Р(хо)хо) = а е Теперь, после получения распределения априорных вероятностей Р(Хо), мы можем вычислить распределение, прогнозируемое на один этап, с помощью уравнения! 5.15: 1~(х«-хо) ) 1((хо-~о) ) Р(х«) = ( )Р(х«(хо) Р(хо) «Ухо = а ~ е е сУхо -( 1 ао'(х,-хо)' е а„'(хо- о) ~ оо'а ' 2 = а ~ е с(хо На первый взгляд этот интеграл кажется довольно сложным.
Ключом к его упрощению может стать такое замечание, что экспонента представляет собой сумму двух выражений, которые квадратично зависят от х,, и поэтому сама экспонента квадра- 741 Глава 15. Вероятностные рассуждения во времени тично зависит от х,. Но известно, что любое квадратное уравнение ахг~ + Ьх, + с -11 может быть перезаписано как сумма терма, возведенного в квадрат, а(х,— — ) ', и 1г остаточного герма с- —, независимого от х„с помощью преобразования, называе4а' мого сь.дополнением квадрата.