Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 221
Текст из файла (страница 221)
Анализ чувствительности особенно важен, поскольку одно из основных критических замечаний в адрес вероятностных подходов к созданию экспертных систем состоит в том, что трудно оценить необходимые числовые значения вероятностей. Анализ чувствительности часто показывает, что достаточно задать многие числовые данные только очень приблизительно.
Например, мы можем не знать, каково значение априорной вероятности р1 сас)зусатс)за), но после опробования многих разных значений этой вероятности и получения в каждом случае одинакового рекомендованного действия по диаграмме влияния можно меньше беспокоиться о том, что отсутствует соответствующая достоверная информация. 16.8. РЕЗЮМЕ В данной главе показано, как объединить теорию полезности с теорией вероятностей, чтобы дать возможность агенту выбрать действия, которые максимизируют его ожидаемую производительность. Теория вероятностей описывает, в чем должен быть уверен агент согласно полученному свидетельству, теория полезности показывает, к чему должен стремиться агент, а теория принятия решений позволяет объединить подходы этих двух теорий для определения того, что должен делать агент.
Теория принятия решений может использоваться для создания систем, которые принимают решения, рассматривая все возможные действия и выбирая из 808 Часть |Г. Неопределенные знания и рассуждения в условиях неопределенности них именно то, которое приводит к наилучшему ожидаемому результату. Такая система известна под названием рационального агента. ° Теория полезностей показывает, что агент, руководствующийся отношениями предпочтения между лотереями, совместимыми с множеством простых аксиом, может быть описан как обладающий функцией полезности; кроме того, агент выбирает действия так, чтобы можно было максимизировать его ожидаемую полезность.
° Теория многоатрибупгой полезности посвящена изучению полезности, которая зависит от нескольких разных атрибутов состояний. Стохастическое доминирование представляет собой особенно удобный метод принятия непротиворечивых решений даже при отсутствии точных значений полезности для атрибутов. ° Сети принятия решений представляют собой простую формальную систему для описания и решения задач принятия решений. Они являются естественным расширением байесовских сетей и, кроме узлов жеребьевки, содержат узлы решения и узлы полезности.
° Иногда для решения задачи приходится заниматься поиском дополнительной информации, прежде чем принимать решение. Стоимость информации определена как ожидаемое повышение полезности по сравнению с принятием решений без этой информации. ° Экспертные системы, в которых предусматривается использование информации о полезности, обладают дополнительными возможностями по сравнению с системами, в которых применяется исключительно вероятностный вывод.
Они не только обладают способностью вырабатывать решения, но и могут использовать стоимость информации для определения того, следует ли стремиться к ее получению, а также способны рассчитать чувствительность своих решений к небольшим изменениям в оценках вероятности и полезности. БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ Одним из первых примеров применения принципа максимальной ожидаемой полезности (хотя и не совсем правильным, поскольку в нем использовались бесконечные значения полезности) был рассказ о пари Паскаля, впервые опубликованный в книге Рогыйоуа( 6ох(с [40[. Даниил Бернулли [111[, исследовавший санктпетербургский паралокс (см. упр.
16.3), был первым, кто понял важность измерения предпочтений в отношении лотерей и написал такие слова; "Стоимость любого предмета должна быть основана не на его цене, а на той пользе, которую он может принести" (курсив Бернулли). Джереми Бентам [!00) предложил гедонистическое исчисление для взвешивания "удовольствий" и "неприятностей", доказывая, что все решения (а не только касающиеся денег) можно свести к сравнению полезностей.
Определение числовых значений полезности на основе предпочтений было впервые выполнено Рамзеем [1265[; аксиомы предпочтений, приведенные в настоящей книге, ближе всего по своей форме тем, которые были вновь открыты в книге 2леогу оГОатез алг( Есопот'с Вейагьаг [1546]. Хорошее описание этих аксиом в рамках дискуссии о предпочтении риска приведено в [693[. Рамзей предложил способ вычисле- Глава 16.
Принятие простых решений 809 ния субъективных вероятностей [а не только полезностей) на основе предпочтений агента; Сэведж [1354] и Джеффри [727] предложили более современные вычислительные конструкции такого рода. В [1547] изложены современные перспективы анализа проблемы принятия решений и показана ее связь со структурами предпочтений людей. Такая мера полезности, как микрошанс смерти, обсуждается в [694]. В обзоре, опубликованном журналом Есопотиг в 1994 году, указано, что стоимость жизни находится в пределах от 750 000 долларов и до 2,6 миллиона долларов. Однако Ричард Талер [1503] обнаружил нерациональные отклонения в оценках той денежной суммы, которую люди готовы заплатить, чтобы избежать риска смерти, в сравнении с суммой, которую они готовы получить, чтобы принять на себя этот риск.
С вероятностью 1/1000 его респонденты не заплатили бы больше 200 долларов, чтобы исключить риск, но не были согласны получить даже 50 000 долларов, чтобы подвергнуться риску. В принятии решений, касающихся политики в области здравоохранения и социального обеспечения, гораздо более широкое распространение находит такой показатель, как ОА[.У, а не микрошанс смерти; типичный пример обоснования одного из крупных изменений политики в области общественного здравоохранения на основе повышения ожидаемой полезности, измеряемого в единицах ОА!Х, приведен в [1320]. Книга 7)естот мгЬ Ми)гф(е ОЬ|есг]геес РгеГегеясш алг[ Уа1ие 7гаг)ео]]з [788] содержит исчерпывающее введение в теорию многоатрибутной полезности [Мц[ГАппбше 1)гйгу Тйеогу — МАОТ). В ней описаны первые компьютерные реализации методов выявления необходимых параметров для многоатрибутной функции полезности и приведены исчерпывающие отчеты о результатах практического применения этой теории.
В области искусственного интеллекта основным источником сведений отеории многоатрибутной полезности является статья Уэллмана [1572], которая включает описание системы г)КР (1)1111!у Кеазоп]пй Рас]гайе), позволяющей использовать коллекцию высказываний о независимости предпочтений и условной независимости для анализа структуры задач принятия решений. Результаты обширного исследования в области использования понятия стохастического доминирования в сочетании с качественными вероятностными моделями приведены в [1573], [1574]. В [1578] изложен предварительный набросок подхода к созданию метода, с помощью которого можно использовать сложный набор отношений независимости полезностей для создания структурированной модели функции полезности, во многом аналогично тому, как байесовские сети позволяют создавать структурированные модели совместных распределений вероятностей.
В [52», [53] и [876] приведены дальнейшие результаты, полученные в данном научном направлении. Теория принятия решений является стандартным инструментальным средством в экономике, финансах и науке управления с 1950-х годов. До 1980-х голов основным средством, применяемым для представления простых задач принятия решений, были деревья решений. В [1438] приведен обзор методологии анализа проблемы принятия решений. Сети принятия решений, или диаграммы влияния, были разработаны Говардом и Матесоном [695] на основе одной из ранних работ, выполненной группой специалистов [включая Говарда и Матесона) в институте 8К! [1051].
Метод Говарда и Матесона обеспечивает формирование дерева решений на основе сети принятия решений, но в общем случае сформированное дерево имеет экспоненциальные размеры. Шахтер [1383] разработал метод принятия решений, основанный исключительно на использовании сети принятия решений, без создания промежу- 8!О Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности точного дерева решений. Этот алгоритм оказался также одним из первых алгоритмов, который обеспечивает полный вероятностный вывод в многосвязных байесовских сетях. В недавно опубликованной работе Нильссона и Лауритцена [1139) показано, какое отношение имеют алгоритмы для сетей принятия решений к продолжающимся разработкам в области создания алгоритмов кластеризации для байесовских сетей.
В сборнике статей [ ! 155) приведен целый ряд полезных статей по сетям принятия решений, как и в специальном выпуске журнала )уепюг)Ь, который вышел в 1990 году. Кроме того, статьи по сетям принятия решений и моделированию полезностей регулярно публикуются в журнале Мапахетелг Бсуелсе. Теория стоимости информации бьша впервые проанализирована Роном Говардом [692]. Его статья оканчивается замечанием; "Если теория стоимости информации и связанные с ней структуры теории принятия решений не составят в будущем значительную часть образования инженеров, то люди с инженерными профессиями уступят свою традиционную роль в управлении научными и экономическими ресурсами в пользу людей, посвятивших себя другим профессиям".
До настоящего времени предсказанная им революция в области методов управления егде не наступила, но такое может случиться после того, как получат более широкое распространение методы исполыования теории стоимости информации в байесовских экспертных системах. Как это ни удивительно, но лишь немногие исследователи в области искусственного интеллекта приняли на вооружение инструментальные средства теории принятия решений после появления самых первых приложений принятия решений в медицине, которые описаны в главе 13.
Одним из немногих исключений стал Джерри Фельдман, который применил теорию принятия решений в задачах машинного зрения [461] и планирования [460). После возрождения интереса к вероятностным методам в искусственном интеллекте в 1980-х годах получили широко распространение экспертные системы на основе теории принятия решений [686]. Фактически начиная с 1991 года и до настоящего времени на обложке журнала АггуЧс(а! 7лгей(8елсе изображается сеть принятия решений, хотя и создается впечатление, что автор рисунка этой сети позволил себе некоторые художественные вольности при выборе направления стрелок.
УПРАЖНЕНИЯ 16.1. (Адатлировано из книги Дзвида Хекермана.) Это упражнение касается содержания игры АЬпапас бате (игра на знание фактов из справочника), которая используется аналитиками решений для калибровки числовых оценок. На каждый из приведенных ниже вопросов дайте наилучший предполагаемый вами ответ, т.е.