Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 204
Текст из файла (страница 204)
15.8, б. Такая модель является в высшей степени нелинейной, поскольку птица принимает решение по уклонению от удара внезапно, в зависимости от того, где именно она находится по отношению к стволу. Очевидно, что для работы с примерами, подобными этому, требуется более выразительный язык представления поведения моделируемой системы. В сообществе специалистов по теории управления, для которых в таких задачах, как маневры самолета по предотврашению столкновения, возникают аналогичные сложности, разработан стандартный подход — 'в.
переключательные фильтры Калмана. В этом подходе предусмотрена одновременная эксплуатация нескольких фильтров Калмана, в каждом из которых используются разные модели систем, например, в одном из них моделируется прямой полет, в другом — резкий поворот налево, а в третьем — резкий поворот направо. При этом используется взвешенная сумма предсказаний, где вес зависит от того, насколько полно данные каждого фильтра совпадают с текушими данными. Как показано в следующем разделе, такой подход представляет собой частный случай общей модели динамической байесовской сети, созданной путем введения дискретной переменной состояния "маневра" в сеть, показанную на рис.
15.5. Переключательные фильтры Калмана рассматриваются дополнительно в упр. 15.5. 746 Часть 1. Нсопве ~емнньк ~ка~~ич и васс~.ксения вялсеия~ ""'""" "* "" "— 747 Глава 15. Вероятностные рассуждения во времени ти РВХ имеется 20 булевых переменных состояния, каждая из которых имеет три родительских переменных в предшествующем срезе. В таком случае модель перехода РВИ включает 20х2'=16 0 вероятностей, а соответствующая модель НММ имеет 2" состояний и поэтому 24' (или примерно триллион) вероятностей в матрице перехода.
Такая ситуация неприемлема по меньшей мере по трем причинам: во-первых, требуется гораздо больше пространства для самой модели НММ; во-вторых, из-за огромной матрицы перехода вероятностный вывод с помощью модели НММ становится гораздо более дорогостоящим; и, в-третьих, из-за проблем, связанных с изучением такого огромного количества параметров, чистая модель НММ становится непригодной для решения крупных задач. Связь между сетями РВХ и моделями НММ примерно аналогична связи между обычными байесовскими сетями и полностью табулированными совместными распределениями. Как уже было описано выше, каждая модель с фильтром Калмана может быть представлена в виде сети РВХ с непрерывными переменными и линейными гауссовыми распределениями условных вероятностей (см.
рис, 15.5). Согласно сведениям, приведенным в конце предыдущего раздела, должно быть очевидно, что не каждая сеть РВИ может быть представлена с помощью модели с фильтром Калмана. В фильтре Калмана текущее распределение вероятностей состояния всегда представляет собой единственное многомерное гауссово распределение, т.е. распределение с единственным "максимумом", расположенным в определенном месте. Сети РВХ, с другой стороны, позволяют моделировать произвольные распределения.
Такая гибкость является весьма существенным подспорьем для многих реальных приложений. Рассмотрим, например, текущее местонахождение ключей от дома, принадлежащих некоторому лицу. Они могут находиться в его кармане, на ночном столике, в ящике кухни или торчать в замочной скважине входной двери. Единственный гауссов максимум, который охватывает распределения вероятностей нахождения ключей во всех этих местах, назначил бы значительную вероятность тому предположению, что ключи находятся где-то в промежуточной позиции, например висят прямо в воздухе в прихожей. Таким образом, реальный мир, характеризующийся наличием целенаправленных агентов, препятствий и тупиков, приводит к созданию "нелинейности" и поэтому требует применения сочетаний дискретных и непрерывных переменных для того, чтобы можно было создавать приемлемые модели.
Процедура создания сетей РВХ Для того чтобы создать сеть РВИ, необходимо определить три вида информации: распределение априорных вероятностей по переменным состояния, Р(Х,); модель перехода, я (зг„, ! к,), и модель восприятия, я (и, ~ к,) . Чтобы задать модель перехода и модель восприятия, необходимо определить топологию связей между последовательными срезами, а также между переменными состояния и свидетельства.
Поскольку предполагается, что модели перехода и восприятия являются стационарными (одинаковыми для всех с), удобнее всего задать их для первого среза. Например, полная спецификация РВИ для мира задачи с зонтиком дана с помощью сети с тремя узлами, показанной на рис. 15.9, а. На основании этой спецификации по мере необходимости может быть создана полная (полубесконечная) сеть РВИ путем копирования первого среза. 748 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности ОВ о,'г а) б) Рис. 15.й Примеры создания сетей 1)Вйс: спецификация распределения априорных вероятностей модели перехода и модели восприятия для сети ПВМ задачи с зонтиком; предполагиется, что все последующие срезы являются копиями среза 1 (а); простая сеть 1)ВФ для моделирования движения робота на плоскости Х-т (б) Теперь рассмотрим более интересный пример: текущий контроль за роботом с аккумуляторным питанием, который движется на плоскости Х вЂ” г' (о нем впервые шла речь в разделе 15.1).
Прежде всего необходимо определить переменные состояния, в состав которых мы включим и переменную х, = (х„у,), обозначающую положение, и переменную х„= (х„, у,), обозначающую скорость. Предполагается, что для измерения координат положения используется определенный метод (возможно, фиксированная телекамера или бортовая система ОР8 (Сх!ОЬа! Роз)((оп(пй 8умеш — глобальная система позиционирования)), позволяющий получить результаты измерений я,. Положение робота в следующем временном интервале зависит от текущего положения и скорости, как и при использовании стандартной модели с фильтром Кзлмана. Скорость в следующем временном интервале зависит от текущей скорости и состояния зарядки аккумулятора. Введем переменную ВаС Сагу, для обозначения фактического уровня зарядки аккумулятора, родительскими переменными которой являются предыдущий уровень зарядки аккумулятора и скорость, а также введем переменную Вмееег„которая измеряет уровень зарядки аккумулятора.
В результате будет получена исходная модель, показанная на рис. 15.9, б. Характер модели восприятия для переменной виасег, заслуживает более глубокого анализа. Для упрощения предположим, что переменные Вас сагу, и В)бесег, могут принимать дискретные значения от О до 5, во многом аналогично измерительному прибору в типичном портативном компьютере, который применяется для контроля за аккуму)итором. Если этот прибор всегда дает точные показания, то таблица условных вероятностей р (Вргесег, ( ва с секу„) должна содержать вероятности 1. О в элементах, расположенных "вдоль диагонали", и вероятности О . О во всех других элементах.
Но в действительности в результаты измерения всегда проникает шум, поэтому при использовании непрерывных измерений вместо этих результатов 749 Глава 15. Вероятностные рассуждения во времени может использоваться гауссово распределение с небольшой дисперсией4. Применительно к дискретным переменным, рассматриваемым в данном примере, гауссово распределение можно аппроксимировать с помощью распределения, в котором снижение вероятности ошибки соответствует реальной ситуации, поэтому вероятность крупной ошибки весьма мала.
Мы будем использовать термин Ъ. гауссова модель ошибки применительно и к непрерывной, и кдискретной версиям. Те, кто имеет практический опыт работы в области робототехники, компьютеризированного управления процессами или в области применения других форм автоматического сбора информации, охотно подтвердят тот факт, что небольшие количества измерительного шума часто являются не самыми серьезными проблемами. Гораздо важнее то, что настоящие датчики отказывают, а когда датчик отказывает, он не всегда посылает сигнал с сообщением: "Между прочим, данные, которые я собираюсь вам отправить, можно считать бессмысленными".
Вместо этого он просто перелает бессмыслицу. Отказом простейшего типа является Ъ. временный отказ, при котором датчик время от времени передает бессмысленные данные. Например, может оказаться, что датчик уровня зарядки аккумулятора имеет свойство передавать нулевое значение каждый раз, когда робот ударяется о препятствие, даже если аккумулятор полностью заряжен. Рассмотрим, что произойдет при возникновении временного отказа, если используется гауссова модель ошибок, которая не приспособлена к таким отказам. Предположим, например, что робот спокойно ожидает и наблюдает за 20 последовательными показаниями датчика аккумулятора, равными 5. Затем датчик аккумулятОРа ДОПУСКаст ВРЕМЕННЫЙ СбОй И ПЕРЕДаЕт СЛЕДУЮЩЕЕ ПОКаЗаНИЕ; ВВЕССГзз=О.
К какому решению должна привести нас простая гауссова модель ошибки применительно к этому значению ва с С едузт? Согласно правилу Байеса, ответ на этот вопрос ЗаВИСИт И От МОДЕЛИ ВОСПРИЯТИЯ Р)ВМЕСЕД,з=О ~ВаССЕДУзз), И От ПРЕДСКаЗаНИЯ Р(ВаегедУзз ~ ВВееедызе) . Если веРоЯтность большой ошибки датчика ЯвлЯетсЯ значительно менее правдоподобной, чем вероятность перехода в состояние Ва сседУзз=О, даже если последнЯЯ ситУациЯ весьма непРавдоподобна, то в РаспРеделении апостериорных вероятностей будет присвоена высокая вероятность той ситуации, что аккумулятор разряжен. Если же в момент времени с=22 будет получено еше одно показание, равное нулю, то такой вывод станет почти полностью безоговорочным. А после того, как этот временный отказ исчезнет и показания вернутся к 5, начиная с момента с=23 и продолжаясь в последующие моменты, то оценка уровня зарядки аккумулятора, как по волшебству, быстро вернется к 5, Такой ход событий проиллюстрирован на верхней кривой, приведенной на рис.15.10,а, где показано ожидаемое изменение значения переменной Вассехз, во времени при использовании дискретной гауссовой модели ошибки.