Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 212
Текст из файла (страница 212)
Вначале рассчитайте вероятность р(к,„,[ у,, (г,) для )с=1...20 и нанесите результаты на график. Вы должны обнаружить, что эта вероятность сходится в фиксированной точке. Рассчитайте точное значение для этой фиксированной точки. 15.3. В данном упражнении разрабатывается вариант прямого — обратного алгоритма, приведенного в листинге 15.1, характеризующийся эффективным использованием пространства.
Требуется вычислить значение в (х, ~ е,,) для 8=1, ., С. Такую задачу можно решить с помощью подхода по принципу "разделяй и властвуй". а) Для упрощения примем предположение, что значение С является нечетным, и допустим, что промежуточная точка определяется выражением )з= (С+1) 72. Покажите, что значение Р(Х,~е,,) можнО ВЫЧИСЛИТЬ дпя )с=1, ..., )з, если даны лишь первоначальное прямое сообщение Е..., обратное сообщение Ь„„,, и свидетельство е,.
„. б) Покажите аналогичный результат для второй половины последовательности. Глава ! 5. Вероятностные рассуждения во времени 775 в) Если даны результаты выполнения заданий 15.3, а и 15.3, б, рекурсивный алгоритм "разделяй и властвуй" можно сформировать, вначале выполнив прогон в прямом направлении вдоль последовательности, а затем в обратном направлении от ее конца, сохранив лишь необходимые сообщения в середине и в концах. Затем алгоритм вызывается на каждой половине последовательности.
Составьте подробный листинг этого алгоритма. г) Определите временную и пространственную сложность алгоритма как функцию от с, длины последовательности. Как изменятся эти результаты, если входные данные будут разделены больше чем на две части? 15.4. На с. 732 была кратко описана ошибочная процедура определения наиболее вероятной последовательности состояний, в которой используется последовательность наблюдений. В этой процедуре предусматривается поиск в каждом временном интервале наиболее вероятного состояния, применение операции сглаживания и возврат последовательности, в которой собраны эти состояния. Покажите, что при использовании некоторых временных вероятностных моделей и последовательностей наблюдений эта процелура возвращает невозможную последовательность состояний (т.е.
такую последовательность, что ее апостериорная вероятность равна нулю). 15.5. Часто возникает необходимость осуществлять текущий контроль за системой с непрерывным состоянием, поведение которой переключается непредсказуемым образом с одного режима на другой в множестве из 1с различных режимов. Например, самолет, пьпающийся избежать поражения ракетой, может выполнить ряд различных маневров, которые попытается отследить система управления ракетой. Представление такой модели переключательного фильтра Калмаиа в виде байесовской сети показано на рис.
15.17. Рис. 75. 77. Представление переключательного фильтра Калмана в виде байесовской сети. Переключательная переменная э, представляет собой дискрегпную переменную состояния, значение которой определяет модель перехода для непрерывных переменных состояния х„. Для любого дискретного со- стоаниЯ 1 модель пеРехода Р1яею 1я„яь=11 пРедставлает собой линеиную гиуссову модель, так зке кик и в обычном филыпре Калмана. Модель перехода для дискретного состояния, р1э,.з !Бьд мозкет рассматриваться как матрица, по аналогии со скрытой марковской моделью 776 Часть х'. Неопределенные знания и рассуждения в условиях неопределенности а) Допустим, что дискретное состояние ~, имеет?г возможных значений и что априорная непрерывная оценка состояния в (х,) представляет собой многомерное гауссово распределение. Покажите, что предсказание Р1х, ) представляет собой сочетание гауссовых распределений, т.е. такую взвешенную сумму гауссовых распределений, что веса в сумме составляют 1.
б) Покажите, что если текущая оценка непрерывного состояния в (х, ! в„,Н представляет собой сочетание и гауссовых распределений, то в общем случае обновленная оценка состояния в(х„,~е,...,) булет представлять собой сочетание ?ол гауссовых распределений. в) Какой аспект временного процесса представляют веса в сочетании сауссовых распределений? Результаты выполнения заданий 15.5, а и 15.5, б, вместе взятые, показывают, что объем этого представления апостериорных вероятностей беспредельно возрастает даже при использовании переключательных фильтров Калмана, которые являются простейшими гибридными динамическими моделями.
Дополните недостающий этап вывода уравнения 15.17 — первый этап обновления для одномерного фильтра Калмана. Рассмотрим ход выполнения операции обновления дисперсии в уравнении 15.18. 15.6. 15.7. Нанесите на график значения выражения а,' как функции от с при на- личии различных значений для и„' и и,'. Покажите, что эта операция обновления имеет фиксированную точку, такую, что и'и,' — ~п', по мере того как с — г, и рассчитайте значение а'. Дайте качественное объяснение того, что происходит по мере того, как о„'->О и и,'->О. а) б) в) 15.8.
Покажите, как представить модель НММ в виде рекурсивной реляционной вероятностной модели в соответствии с предложением, приведенным в разде- ле 14.6. В этом упражнении более подробно анализируется устойчивая к отказам модель для датчика аккумулятора, показанная на рис. 15.11, а. а) График на рис. 15.11, 6 обрывается при с=З2. Дайте качественное описание того, что лолжно произойти по мере стремления с к бесконечности, с — >, если датчик продолжает выдавать показания О.
6) Предположим, что температура окружающей среды влияет на датчик аккумулятора таким образом, что по мере возрастания температуры временные отказы становятся все более вероятными. Покажите, как дополнить с учетом этого структуру сети РВИ, приведенную на рис. 15.11, а, и обьясните, какие изменения потребуется внести в таблицы условных вероятностей. в) После определения новой структуры этой сети, может ли робот использовать показания датчика аккумулятора для вероятностного вывода данных о текущей температуре? 15.9. 15.10. Рассмотрите задачу применения алгоритма устранения переменной к сети 1)В1Ч лля задачи с зонтиком, развернутую на три временных среза, в которой Глава ! 5. Вероятностные рассуждения во времени 777 используется запрос в (и,) гг„ гг,, и,).
Покажите, что сложность этого алгоритма (размер наибольшего фактора) является одинаковой, независимо от того, устраняются ли переменные, касающиеся дождя, в прямом или обратном порядке. 15.11. В модели произношения слова "гоша)о**, привеленной на рис. 15.15, допускается коартикуляция с первой гласной, поскольку даны две возможные фонемы.
Альтернативный подход состоит в использовании трехфонемной модели, в которой фонема ) оы(С, т) ) автоматически включает изменение в гласном звуке. Составьте полную трехфонемную модель для слова "1огпаго*', включая вариант, касающийся диалекта. 15.12.
Вычислите наиболее вероятный путь через модель НММ, приведенную на рис. 15.16, лля выходной последовательности [С,, С,, С,, С,, С,, С,, С,] . Кроме того, приведите значение его вероятности. В этой главе показано, как должен принимать решения агент, чтобы получать то, что ему требуется, по крайней мере в среднем количестве случаев. В данной главе мы вернемся к идее теории полезности, которая была представлена в главе ! 3, и покажем, как можно объединить эту теорию с теорией вероятностей, чтобы создать агента, действуюшего на основе теории решений, т.е.
агента, способного принимать рациональные решения с учетом того, в чем он убежден и к чему стремится. Такой агент может принимать решения в таких ситуациях, когда из-за неопределенности и конфликтуюших целей логический агент остается неспособным что-либо решить. По сушеству, агент, основанный на цели, может лишь проводить бинарное различие межлу хорошими (целевыми) и плохими (нецелевыми) состояниями, тогда как агент, основанный на теории решений, пользуется непрерывными показателями качества состояния. В разделе 16.1 изложен основной принцип теории решений — максимизация ожидаемой полезности. В разделе 16.2 показано, что поведение любого рационального агента можно понять, определив функцию полезности, которую он максимизирует.
В разделе 16.3 более подробно обсуждаются характерные особенности функций полезности и, в частности, то, как они связаны с отдельными величинами, такими как деньги. В разделе 16.4 показано, как обращаться с функциями полезности, которые зависят от нескольких величин.
В разделе 16.5 описана реализация систем принятия решений. В частности, в этом разделе описан формальный подход, называемый сетями принятия решений (известный также под названием диаграмм влияния); такие сети являются дополнением байесовских сетей, в которое включены лействия и показатели полезности.
В оставшейся части этой главы рассматриваются проблемы, связанные с применением теории решений в экспертных системах. 16.1. СОВМЕСТНЫЙ УЧЕТ УБЕЖДЕНИЙ И ЖЕЛАНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ В книге Рог!-йоуа!! оя(с (" Логика Пор-Ройяль" ), написанной в 1662 году, французский философ Арно изложил следующую мысль. Глава !б. Принятие простых решений 779 ЕП(А)Е) = ~) Г(яе хе,(А) )Пс(А),Е) П(де зе„(А) ) ь (16.1) Принцип 'сь максимальной ожидаемой полезности (Махппшп Ехрес(ес) ()(й(у— МЕ()) гласит, что рациональный агент должен выбирать действие, которое максимизирует ожидаемую полезность для агента. А если бы с помощью этого уравнения потребовалось выбрать наилучшую последовательность действий, то пришлось бы перенумеровать все последовательности действий и выбрать наилучшую; очевидно, что такой подход при наличии длинных последовательностей действий становится неосуществимым.