Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 218
Текст из файла (страница 218)
797 Глава 16. Принятие простых решений полезности связано описание полезности агента как функции от родительских атрибутов. Это описание может представлять собой табуляцию функции или может быть выражено в виде параметризованной аддитнвной или мультилинейной функции. Кроме того, во многих случаях применяется также упрощенная форма. Используемая при этом система обозначений остается неизменной, но исключаются узлы жеребьевки, описывающие результирующее состояние. Вместо этого узел полезности связывается непосредственно с узлами текущего состояния и с узлом принятия решений.
В данном случае вместо представления функции полезности от состояний узел полезности представляет ожидаемую полезность, связанную с каждым действием, как было определено в уравнении 16.1. Поэтому такие таблицы авторы настоящей книги называют 'ск таблицами "действие — полезность". На рис. 16.6 показано представление задачи с аэропортом в форме "действие — полезность". Рис. !б.б.
Упрощенное представление задачи выбора площадки для строотельства аэропорта. Исключены узлы жеребьевки, соответствующие резулыпирующим состояниям Обратите внимание на то, что узлы жеребьевки дгозае, гэеаШз и Созе, показанные на рис. 16.5, ссылаются на будущее состояние, поэтому их значения ни в коем случае не должны определяться в виде переменных свидетельства. Таким образом, упрощенную версию, в которой исключены эти узлы, можно использовать во всех тех случаях, когда допустимо использование более общей формы. Олнако, несмотря на то, что в упрощенной форме содержится меньше узлов, исключение явного описания результатов решения по выбору площадки означает, что такая сеть является менее гибкой по отношению к возможным изменениям обстоятельств. Например, на рис.
16.5 изменение допустимых уровней шума самолета можно отразить в виде изменения в таблице условных вероятностей, связанной с узлом дгоуое, тогда как изменение веса, касающегося компонента с описанием шумового загрязнения в функции полезности, может быть отражено с помощью изменения в таблице полезности. С другой стороны, в схеме "действие — полезность", приведенной на рис. 16.6, все такие изменения должны быть отражены в виде изменений в таблице 798 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности "лействие — полезность".
По сути формулировка на основе "действия — полезности" представляет собой откомпилированную версию первоначальной формулировки. Вычисления с помощью сетей принятия решений Действия выбираются путем проведения с помощью сети принятия решений соответствующих вычислений для каждого возможного ряда значений узла принятия решений. После того как определено значение узла принятия решений, он ведет себя полностью аналогично узлу жеребьевки, которому были присвоены значения по такому же принципу, как переменной свидетельства. Алгоритм проведения вычислений в сетях принятия решений описан ниже.
1. Определить значения переменных свидетельствадля текущего состояния. 2. Для каждого возможного значения узла принятия решений: а) ввести это значение в узел принятия решений; б) вычислить апостериорные вероятности для родительских узлов узла полезности, используя стандартный алгоритм вероятностного вывода; в) вычислить результирующее значение полезности для данного действия. 3. Возвратить действие с самым высоким значением полезности. Этот алгоритм представляет собой непосредственное расширение алгоритма вычислений в байесовской сети и может быть внедрен непосредственно в проект агента, приведенный в листинге !3.!. Как будет показано в главе !7, эта задача становится намного более интересной, когда существует возможность последовательного выполнения нескольких действий.
16.6. Стоимость информАции В приведенном выше анализе предполагалось, что агенту, прежде чем он приступает к принятию решения, предоставляется вся относящаяся к делу информация или, по меньшей мере, вся доступная информация. Но на практике такая ситуация возникает чрезвычайно редко. оу- Одной из наиболее важных составляющих процесса принятия решений лвллюглсл знания о злом, какие вопросы следует задавать. Например, врач не может рассчитывать на то, что ему будут предоставлены результаты всех возможных диагностических тестов и опросов к тому времени, как пациент впервые войдет в его кабинет'. Медицинские тесты часто являются дорогостоящими, а иногда даже опасными (такая опасность может возникать, во-первых, непосредственно, а во-вторых, из-за связанных с ними задержек).
Важность проведения медицинских тестов зависит от двух факторов: от того, в какой степени получение результатов этих тестов приведут к разработке значительно лучшего плана решения, а также от того, насколько велика вероятность различных результатов тестов. В настоящем разделе описана 'в. теория стоимости информации, которая позволяет любому агенту решить, какую информацию он должен приобрести. Получение з В США единственным вопросом, который всегда задают заранее, лвляетсл то, есть ли у пациента страховка. Глава 16. Принятие простых решений 799 информации осуществляется с помощью действий по восприятию (см.
главу ) 2). Поскольку функция полезности агента редко ссылается на содержимое внутреннего состояния агента, притом что общее назначение действий по восприятию сводится к оказанию влияния на это внутреннее состояние, мы должны оценивать качество действий по восприятию на основании того, какое влияние они оказывают на послелующие "реальные" действия агента. Таким образом, теория стоимости информации связана с определенной формой последовательного принятия решений. Простой пример Предположим, что нефтедобывающая компания надеется приобрести лицензию на один из и равнозначных по своей перспективности участков океанского шельфа лля проведения разведочных работ. Кроме того, примем дополнительное предположение, что точно один и только один из этих участков обладает запасами нефти стоимостью Сдолларов и что цена каждого участка равна С7пдолларов.
Если эта компания нейтрально относится к риску, то она должна быть безразлична к выбору между покупкой лицензии на один из участков и отказом от такой покупки. А теперь допустим, что некий сейсмолог доложил руководству этой компании результаты проведенного исследования участка номер 3, которые определенно показывают, что на этом участке имеется нефть. Какую сумму должна быть готова компания заплатить за эту информацию? Один из способов получения ответа на этот вопрос состоит в том, чтобы проверить, какие действия предприняла бы компания, обладая указанной информацией, как описано ниже. ° С вероятностью 1/и исследование покажет наличие нефти на участке 3.
В этом случае компания купит участок 3 за С!и долларов и получит прибыль в С-Суп= (и-1) С/и долларов. ° С вероятностью (и-1) /и исследование покажет, что участок не содержит нефти, и в этом случае компания должна купить другой участок. Теперь вероятность обнаружения нефти на одном из других участков измеряется значением от 1/и до 1/(п-1), поэтому компания получит ожидаемую прибыль С/ (и-1) -Сlп=с/п(п-1) долларов. Теперь мы можем рассчитать ожидаемую прибыль при наличии информации о результатах исследования: 1 (и-1) С и-1 С и — х э — х и и п(п-1) с! п Поэтому компания должна быть готова заплатить сейсмологу за эту информацию вплоть до С/и долларов, поскольку данная информация стоит столько же, сколько и сам участок.
Стоимость информации определяется тем фактом, что при наличии такой информации можно изменить собственную стратегию таким образом, чтобы она соответствовала действительной ситуации. Наличие информации позволяет выявить отличительные особенности рассматриваемой ситуации, а без этой информации в лучшем случае можно лишь найти среднее значение по всем возможным ситуациям. Вообще говоря, стоимость данного конкретного фрагмента информации опре- 801 Глава 16.
Принятие простых решений очевидно, что предпочтительным является действие А,, поскольку весьма вероятно, что второй маршрут может быть заблокирован из-за лавин, и вместе с тем весьма маловероятно, что первый маршрут заблокирован из-за интенсивного трафика. Поэтому очевидно, что полезность У, выше по сравнению с У,. Но возможно, что результаты наблюдений со спутника кз, касающиеся фактического состояния каждой дороги, приведут к получению новых оценок двух путей через горный хребет, и, ' и и, '.