Главная » Просмотр файлов » Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)

Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 198

Файл №1245267 Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)) 198 страницаРассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267) страница 1982021-01-15СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 198)

Является ли такое предположение обоснованным, зависит от самой проблемной области. Марковское предположение первого порядка указывает, что переменные состояния содержат всю Глава 15. Вероятностные рассуждения во времени 723 информацию, необходимую для описания распределения вероятностей для следующего временного среза. Иногда такое предположение полностью соответствует истине; например, если некоторая частица совершает 'ж случайное блуждание вдоль оси х, изменяя свою позицию на величину ч 1 в каждый интервал времени, то применение в качестве состояния координаты х позволяет определить марковский процесс первого порядка.

Иногда такое предположение является лишь приблизительным, как и в случае предсказания дождя лишь на основании того, был ли дождь в предыдущие сутки. Как описано ниже, существуют два возможных метода корректировки, если такое приближение оказывается слишком неточным. 1. Повышение порядка модели марковского процесса. Например, можно перейти к использованию модели второго порядка, введя переменную Яадп,, в качестве родительской по отношению к дауд„ что позволит получить немного более точные предсказания (например, в Пало-Альто дождь очень редко идет больше двух дней подряд). 2.

Расширение множества переменных состояния. Например, можно ввести переменную с обозначением времени года деалоп„чтобы иметь возможность включить хронологические данные о дождливых временах года, или ввести переменные для температуры тегарела гиле„влажности нитЫдеу, и атмосферного давления рлельиле„чтобы иметь возможность использовать физическую модель условий, способствующих возникновению дождя. В упр. 15.1 предлагается показать, что первое решение (увеличение порядка молели) можно всегда переформулировать как расширение множества переменных состояния, при сохранении фиксированного порядка.

Следует отметить, что введение дополнительных переменных состояния может увеличить прогностическую мощь системы, но вместе с тем повысить требования к прогнозированию, поскольку при этом придется также прогнозировать значения новых переменных. Поэтому обычно исследователи стараются найти "самодостаточное" множество переменных, а это фактически означает, что прежде всего они стремятся понять "физику" моделируемого процесса.

Очевидно, что требования к точному моделированию процесса можно ослабить, если есть возможность ввести новые результаты восприятия (например, результаты измерения температуры и атмосферного давления), которые непосредственно предоставляют информацию о новых переменных состояния. Рассмотрим, например, задачу слежения за роботом, блуждающим случайным образом на плоскости Х вЂ” У. Можно было бы предложить, что достаточно воспользоваться таким множеством переменных состояния, как положение и скорость, — ведь для вычисления нового положения можно просто использовать законы Ньютона, а скорость будет изменяться непредсказуемо.

Но если робот получает питание электрической энергией от аккумулятора, то разрядка аккумулятора будет оказывать систематическое влияние на изменение скорости. А поскольку само это влияние зависит от того, сколько электроэнергии было израсходовано во всех предыдуших маневрах, то свойство принадлежности марковской цепи к модели определенного порядка (или просто марковосгль) нарушается. Марковость цепи можно восстановить, включив уровень зарядки аккумулятора даееетз, в состав переменных состояния, которые входят в множество х,.

Это позволит лучше предсказывать движения робота, но, в свою очередь, потребует создания модели для предсказания значе- 724 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности ния Вас селу, на основании значения ва с еегу,, и скорости. В некоторых случаях такое моделирование может быть выполнено достаточно надежно, а повышения точности можно будет добиться, введя для измерения уровня заряда аккумулятора новый датчик. 15.2. ВЕРОЯТНОСТНЫЙ ВЫВОД ВО ВРЕМЕННБ7Х МОДЕЛЯХ После определения структуры универсальной временной модели мы получаем возможность сформулировать основные задачи вероятностного вывода, которые должны быть решены с помощью этой модели, как описано ниже.

° ск Фильтрация, или 'в. текущий контроль. В этом состоит задача вычисления Ъ. доверительного состояния — распределения апостериорных вероятностей переменных, относящихся к текущему состоянию, при наличии всех полученных к данному моменту свидетельств. Это означает, что требуется вычислить значение Р (Х,) е„,,), при условии, что фактические свидетельства поступают в виде непрерывного потока, начиная со времени г=).. В примере с зонтиком это может означать вычисление вероятности дождя сегодня, если даны все результаты наблюдений о носителе зонтика, полученные до сих пор. А фильглралией называется та операция, которую должен выполнять рациональный агент в ходе слежения за текущим состоянием так, чтобы иметь возможность принимать рациональные решения (см.

главу 17). Как оказалось, почти идентичные расчеты должны осуществляться в процессе определения правдоподобия последовательности свидетельств, (е...). ° Ж Предсказание. В этом состоит задача вычисления распределения апостериорных вероятностей значений переменных в будущем состоянии, если даны все свидетельства, полученные к данному моменту. Это означает, что может потребоваться вычислить в (х„„) е„,,) для некоторого )с>0.

В примере с зонтиком такое вычисление может сводиться к определению вероятности дождя через три дня от нынешнего, если даны все результаты наблюдений за носителем зонтика, полученные до сих пор. Предсказание является полезным для оценки возможных стратегий. ° ек Сглаживание, или ск ретроспективный анализ. В этом состоит задача вычисления распределения апостериорных вероятностей значений переменных, относящихся к прошлому состоянию, если даны все свидетельства вплоть до нынешнего состояния. Это означает, что может потребоваться вычислить значение в (х„) е...) для некоторого )с, такого, что 0<я< с. В примере с зонтиком это может означать вероятность того, что дождь шел в прошлую среду, если даны все результаты наблюдений за носителем зонтика, полученные до сих пор. Ретроспективный анализ обеспечивает лучшую оценку информации о состоянии, которая была доступна к тому времени (поскольку включает больше свидетельств).

° Наиболее правдоподобное обаяснеиие. Если дан ряд результатов наблюдений, то может потребоваться найти последовательность состояний, которые с наибольшей вероятностью стали причиной получения результатов 725 Глава 15. Вероятностные рассуждения во времени наблюдений.

Это означает, что может потребоваться вычислить значение акулах„ р(хм.)ем,). Например, если директор приходил с зонтиком в каждый из первых трех дней, а на четвертый пришел без зонтика, то наиболее вероятным объяснением становится наличие дождя в первые три дня и отсутствие в четвертый. Алгоритмы решения такой задачи являются полезными во многих приложениях, включая распознавание речи (целью которого является поиск наиболее вероятной последовательности слов, если дан ряд звуков) и реконструкцию цепочек битов, передаваемых по зашумленному каналу. Кроме этих задач, необходимы методы для создания с помощью обучения моделей перехода и моделей восприятия на основании наблюдений. Также как и в случае статических байесовских сетей, обучение в динамических байесовских сетях может осуществляться в виде получения побочного результата от вероятностного вывода.

Вероятностный вывод предоставляет оценку того, какие переходы между состояниями фактически происходили и какие состояния привели к получению данных результатов восприятия, а эти оценки могут использоваться для обновления моделей. Обновленные модели предоставляют новые оценки, и в этом процессе происходят итерации до тех пор, пока все вычисления не сходятся.

Весь этот процесс представляет собой пример применения алгоритма "ожидания — максимизации", нли алгоритма ЕМ (Ехрес(абоп — Мах)гп)ха((оп) (см. раздел 20.3). Важно отметить, что для обучения требуется вероятностный вывод с полным сглаживанием, а не с фильтрацией, поскольку он предоставляет лучшие оценки состояний процесса. Обучение с фильтрацией может не позволить добиться правильной сходимости; рассмотрим, например, задачу обучения раскрытию убийств: чтобы узнать из наблюдаемых переменных с помощью вероятностного вывода, что скорее всего произошло на месте убийства, всегда требуется ретроспективный анализ. Алгоритмы для решения четырех задач вероятностного вывода, перечисленных в начале данного раздела, можно прежде всего описать на общем уровне, независимо от конкретного типа применяемой модели.

Усовершенствования этих алгоритмов, относящиеся к каждой модели, будут описаны в соответствующих разделах. Фильтрация и предсказание Начнем с фильтрации. Мы покажем, что эту задачу можно решить простым рекурсивным способом: если есть результаты фильтрации вплоть до момента с, можно легко вычислить результат для с+1 из нового свидетельства е„,. Это означает, что для некоторой функции Г имеет место следующее: Р(Хь,1)е~, 1) = Г(е„мР(Х,(ем,) ) Такой процесс часто называют 'ск рекурсивной оценкой. Соответствующее вычисление может рассматриваться как фактически состоящее из двух частей; прежде всего распределение вероятностей для текущего состояния проектируется вперед от с к се1, затем оно обновляется с использованием нового свидетельства е„„.

Такое двухэтапное протекание процесса можно выразить формально весьма просто: Р(Х, )еи„1) = Р(Х, 1(е1 ь,еьм) (Разделение саидетельстаа) ц Р(еь,г)хм1,еь ь)Р(Хь 1(ег ь) (Прмменение прааила Байеса) = а Р(еь,~~Хьм)Р(хь 1~е1 ь) (Преобразование в соответствии со свойством маркоаости свидетельства) 726 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности Здесь и далее в данной главе а представляет собой нормализуюшую константу, используемую для того, чтобы вероятности в сумме составляли 1.

Второй терм, Р (х„, ~ е,,), представляет одношаговое предсказание следующего состояния, а первый терм обновляет его новым свидетельством; обратите внимание на то, что значение Р (е„, ~ Х„, ) можно получить непосредственно из модели восприятия. Теперь определим одношаговое предсказание для текущего состояния путем обусловливания вероятностей значений переменных для текущего состояния х,: Р(х,.;)е..е) = а Р(е...)х.е) ~) Р(х„Пиь,е,,) Р(х-.(еи,) = а Р(е„,)Х,,) ~ Р(Хье)х )Р(иь)еи,) ее (Преобразование в соответствии со свойством марковости) (15.3) В операциях суммирования первым множителем является модель перехода, а вторым — распределение вероятностей для текущего состояния.

Поэтому получена требуемая рекурсивная формулировка. Отфильтрованная оценка Р (х, ~ е,,) может рассматриваться как "сообщение" ди „которое распространяется в прямом направлении вдоль последовательности состояний, будучи модифицируемым при каждом переходе и обновляемым при получении каждого нового результата наблюдения. Этот процесс можно представить следующим образом: Ви с+1 = а Роь наса ( лис, еь,1) где функция рохыагс( реализует обновление, описанное в уравнении 15.3. Если все переменные состояния являются дискретными, то затраты времени на каждое обновление остаются постоянными (т.е.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6476
Авторов
на СтудИзбе
304
Средний доход
с одного платного файла
Обучение Подробнее