Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 205
Текст из файла (страница 205)
Несмотря на последующее восстановление правильных показаний, есть такой момент времени (С=22), в котором робот получил сообщение о разрядке аккумулятора, а в такой ситуации он должен, в принципе, передать сигнал тревоги и отключиться. Итак, к сожалению, чрезмерно упрощенная модель восприятия завела робота в тупик. Как можно исправить такое положение? Рассмотрим знакомый многим 4 С~рого говоря, гауссово распределение не совсем подходит, поскольку в нем присваивается ненулевая вероятность большим отрицательным уровням зарядки аккумулятора. Иногда для переменных, область определения которых ограничена, лучше подходит бета-распределение. 750 Часть \~.
Неопределенные знания и рассуждения в условиях неопределенности пример, в котором при вождении автомобиля на резких поворотах или крутых подьемах иногда загорается сигнал "топливный бак пуст". Но, вместо того чтобы искать телефон аварийной службы, водитель вспоминает, что датчик уровня топлива иногда допускает очень большую ошибку, когда топливо плещется в баке. Мораль этой истории состоит в следующем: со- для того чтобы система правильно учитывала отказы датчика, модель восприятия должна допускить вероятность его отказа. В модели отказа простейшего вида для датчика допускается определенная вероятность того, что датчик может выдать полностью неправильное значение, независимо от истинного состояния мира. Например, если прибор на аккумуляторе на время отказывает, возвращая значение О, то можно ввести значение Р(ВМесег,=о )Ввссвгус=В1 которое, очевидно, значительно больше, чем вероятность, присваиваемая при использовании простой гауссовой модели ошибки.
Назовем соответствующую модель Ъ. моделью временного отказа. Как она может помочь, если мы столкнемся с показанием датчика, равным О? При условии, что прогнозируемая вероятность полной разрядки аккумулятора, согласно полученным до сих пор показаниям, гораздо меньше О. 03, то наилучшим объяснением причин наблюдения Вмесег„=О является то, что произошел временный отказ датчика. Интуитивно ясно, что можно рассматривать уверенность в истинности данных об уровне зарядки аккумулятора как имеющую определенную долю "инерции", которая позволяет преодолеть временные сбои в показаниях датчика. Верхняя кривая на рис. 15.10, б показывает, что модель временного отказа позволяет преодолевать временные отказы без катастрофического изменения в представлениях об истинности данных. На этом описание временных отказов оканчивается.
А что будет, если отказ датчика окажется постоянным? К сожалению, отказы такого типа встречаются слишком часто. Если датчик возвратит 20 показаний со значением 5, за которыми последует 20 показаний со значением О, то применение модели временного отказа датчика, описанной в предыдущем абзаце, приведет к тому, что робот постепенно придет к выводу, что его аккумулятор разряжен, тогда как в действительности мог произойти отказ датчика. Нижняя кривая, приведенная на рис. 15.10, б, показывает "траекторию" изменения уверенности в истинности показаний датчика для этого случая.
Ко времени с=25 (после получения пяти показаний датчика, равных 0) робот приходит к выводу, что его аккумулятор разряжен. Ьезусловно, мы предпочли бы, чтобы робот приобрел уверенность в том, что неисправен прибор на его аккумуляторе (если такая ситуация действительно является гораздо более вероятной). Нет ничего удивительного в том, что для учета постоянных отказов требуется оь модель постоянного отказа, которая описывает, как датчик ведет себя при нормальных условиях и после отказа.
Для этого необходимо дополнить скрытое состояние системы дополнительной переменной, скажем, Вмвгойеп, которая описывает состояние прибора аккумулятора. Постоянство отказа может быть промоделировано дугой, связывающей переменные ВмВгойеп, и ВмВго)сеп,. Такая ск дуга постоянства имеет таблицу условных вероятностей, которая задает на каждом временном интервале малую вероятность отказа, допустим О. 001, но определяет, что датчик после выхода из строя остается неисправным.
Если датчик исправен, то модель восприятия для переменной Вме с ег идентична модели временного отказа, а после того Глава 15. Вероятностные рассуждения во времени 751 3 1 3 1 -1 15 20 25 30 15 20 25 30 Время г Времяг я) б) Рис. 15.10. Пример применения модели временного отказа: верхняя кривая — траектория ожидаемого значения переменнои вассехуе для последовательносгпи ниблюдений, состоящей из всех значений 5, кроме показаний, равных О, в моменты времени 0=22 и с=22, если используется простая гауссова модель ошибки; нижняя кривая — траектория, при которой результаты наблюдения остаются на уровне О, начиная с момента времени 0=22 (а12 токаи же эксперимент, проведенный с использованием модели временного откиза (б1) обратите внимание на то, что временный отказ преодолевается успешно, а постоянный приводит к излишне пессимистическому поведению Модель постоянного отказа для датчика аккумулятора показана на рис.
15.11, а. Показатели ее производительности при двух последовательностях данных 1временный сбой и постоянный отказ) приведены на рис. 15.11, б. В отношении этих кривых необходимо сделать несколько замечаний. Прежде всего, в случае временного сбоя вероятность того, что датчик вышел из строя, существенно повышается после второго показания со значением О, но немедленно падает вновь до нуля после получения результатов наблюдения 5. Далее, в случае постоянного отказа вероятность того, что датчик неисправен, быстро повышается почти до 2 и остается на этом уровне.
Наконец, как только становится известно, что датчик стал неисправным, робот может лишь руководствоваться предположением, что его аккумулятор разряжается с "обычной" скоростью, как показывает постепенно снижаюшийся уровень ~( ва с секу, ~ ... ) . В приведенном выше описании мы лишь слегка коснулись поверхности проблемы представления сложных процессов. Применяемое на практике разнообразие моделей перехода является буквально огромным и охватьгвает такие разные направления, как моделирование эндокринной системы человека и моделирование потока, состоящего из большого количества автомобилей, движушихся по скоростному шоссе. Создание моделей восприятия также представляет собой обширную самостоятельную область, но практика показала, что динамические байесовские сети позволяют явно представить даже такие тонкие феномены, как дрейф датчика, внезапная раскалибровка и влияние на показания датчика внешних условий 1таких как погода).
как датчик становится неисправным, эта модель указывает, что значение В)Чесс г всегда равно О, независимо от фактической зарядки аккумулятора. 752 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности Вь РГВ,) ),ооо о,оо! о $2 ВМе)ег! ! 0 -! Валегу! 5.) !5 20 25 30 Вреьля с б) а) Рис. )5.) й Промер применения модели постоянного отказа: фрагмент сети РВМ, в котором показаны переменные состояния датчика, необходимые для моделирования постоянного отказа датчика аккумулятора (а); верхние кривые — траектории ожидаемого значения переменнои пассосу, для последовательностей наблюдений, характерных для "временного отказа' и "постоянного отказа"; низкние кривые — траектории вероятностей для переменной вивхокеп при наличии двух указанных последовательностей наблюдений (б) Точный вероятностный вывод в сетях РВХ Кратко рассмотрев некоторые идеи, касающиеся представления сложных процессов в виде сетей РВ)л), перейдем теперь к вопросу вероятностного вывода.
В определенном смысле на этот вопрос уже был получен ответ: динамические байесовские сети прежде всего представляют собой байесовские сети, а мы уже имеем алгоритмы для осуществления вероятностного вывода в байесовских сетях. При наличии последовательности наблюдений может быть создано представление сети РВ)л) в виде полной байесовской сети путем повторения временных срезов до тех пор, пока сеть не станет достаточно большой, чтобы в ней можно было учесть все наблюдения, как показано на рис. 15.12. Такой метод называется 2зл развертыванием.
(С формальной точки зрения сеть РВИ эквивалентна полубесконечной сети, полученной путем развертывания в одну сторону до бесконечности. Но временные срезы, вводимые за пределами последнего наблюдения, не оказывают влияния на вероятностные выводы в пределах периода наблюдения и поэтому могуг быть исключены.) После того как сеть РВ)ч) развернута, в ней может использоваться любой из алгоритмов вероятностного вывода (алгоритм с устранением переменной, методы соединенного дерева и т.д.), описанные в главе 14. К сожалению, непродуманное применение развертывания не всегда оказывается достаточно эффективным. В частности, если требуется выполнение фильтрации или сглаживания с использованием длинной последовательности наблюдений е,,„то для развернутой сети потребуется пространство 01 0), а рост ее по мере добавления новых результатов наблюдений будет происходить неограниченно.
Более того, если после кюкдого добавления новых результатов наблюдения будет просто вновь вызываться на выполнение алгоритм вероятностного вывода, то затраты времени на вероятностный вывод в расчете на каждое обновление также будут расти пропорционально о( с) . 754 Часть ч'. Неопределенные знания и рассуждения в условиях неопределенности ними, не существует ваэмамснасти эффективно и тачна формировать вероятностные рассуждения аб этих праиессах.
Сама модель РВИ, которая представляет априорное совместное распределение по всем переменным, может быть разложена на составляющие ее таблицы условных вероятностей, но обусловленное последовательностью наблюдений апостериорное совместное распределение (т.е. прямое сообщение), как правило, не поддается разбиению на факторы. До сих пор еще никому не удалось найти способа решения этой проблемы, несмотря на то, что многие важные области науки и техники получили бы огромную выгоду благодаря такому решению. Поэтому нам приходится обращаться к приближенным методам.