Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 171
Текст из файла (страница 171)
теория вероятностей, в которой каждому высказыванию присваивается числовое значение степени уверенности от 0 до 1. (Некоторые альтернативные методы формирования рассуждений в условиях неопределенности описаны в разделе 14,7.) гд- Вероятггости преДоставляют сггособ суммарного учета неоггределенности, возникающей гго причинам зкономии усилий и отсупктвия знаний.
Мы не можем знать со всей уверенностью, что беспокоит данного конкретного пациента, но можем быть уверенны- 625 Глава 13. Неопределенность ми в том, что, скажем, в 80 случаях из 100 (т.е. с вероятностью 0,8) у пациента в зубе имеется дупло, если он испытывает зубную боль. Это означает, что из числа всех ситуаций, неотличимых от текущей ситуации в рамках тех знаний, которыми обладает агент, пациент в 80% этих ситуаций должен иметь дупло в зубе. Такая уверенность может быть основана на статистических данных (о том, что у 80% пациентов с зубной болью, наблюдавшихся до сих пор, было обнаружено дупло в зубе), или на основе некоторых общих правил, или с использованием определенной комбинации сведений, полученных из разных источников.
В этих 80% дана сводная информация обо всех случаях, в которых присутствовали все факторы, необходимые для того, чтобы дупло вызывало зубную боль, и о других случаях, в которых у пациента были и дупло, и зубная боль, но эти два обстоятельства оказались несвязанными, Эти недостающие 20% подытоживают все другие возможные причины зубной боли, для подтверждения или отрицания которых мы либо затратили слишком мало усилий, либо не имели достаточно знаний. Присваивание вероятности 0 данному конкретному высказыванию соответствует безусловной уверенности в том, что это высказывание ложно, а присваивание вероятности! соответствует безусловной уверенности, что высказывание истинно.
Значения вероятности между 0 и 1 соответствуют промежуточным степеням уверенности в истинности высказывания. В действительности само высказывание может быть либо истинным, либо ложным независимо от этого. Важно отметить, что степень уверенности отличается от степени истинности. Вероятность 0,8 не означает "истинно на 80%", а просто указывает на 80%-ную степень уверенности, т.е.
надовольно обоснованные ожидания. Таким образом, теория вероятностей вносит такой же онтологический вклад, как и логика, т.е. позволяет указать, являются ли некоторые факты действительными в этом мире. Степени истинности, в отличие от степеней уверенности, являются предметом нечеткой логики, которая рассматривается в разделе 14.7.
В логике такое высказывание, как "У пациента в зубе имеется дупло", является истинным или ложным в зависимости от интерпретации и от мира; оно истинно именно тогда, когда имеет место факт, на который оно ссылается. С другой стороны, в теории вероятностей такое высказывание, как "Вероятность того, что у данного пациент в зубе имеется дупло, равна 0,8", касается степени уверенности агента, а не относится непосредственно к самому миру. Эта степень уверенности зависит от результатов восприятия, полученных агентом до сих пор.
Сами результаты восприятия представляют собой ж свидетельство, на котором основаны вероятностные утверждения. Например, предположим, что агент вытянул карту из растасованной колоды. Прежде чем посмотреть на эту карту, агент может присвоить значение вероятности 1гг52 такому событию, что карта окажется тузом пик, а после взгляда на вынутую из колоды карту соответствующая вероятность для того же высказывания примет значение 0 или !. Таким образом, присваивание значения вероятности некоторому высказыванию аналогично утверждению о том, что данное конкретное логическое высказывание (или его отрицание) следует из базы знаний, а не о том, является ли оно истинным или ложным.
Разумеется, оценка того, следует ли высказывание из базы знаний, может изменяться по мере добавления в базу знаний новых высказываний; и, по аналогии с этим, вероятности могут изменяться после получения дополнительных свидетельств'. ' Эта ситуация полностью отличается от той, в которой некоторсс высказывание становится истинным или ложным по мере того, как изменяется мир. Зля учета изменений в мире с помощью вероятностей требуются механизмы такого же рола (ситуации, интервалы н собьпия), которые использовались в главе ! Опля логических представлений. Зги механизмы рассматривакпся в главе ! 5. 626 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности Поэтому во всех вероятностных утверждениях должно быть указано свидетельство, с учетом которого оценивалась данная вероятность.
По мере получения агентом новых результатов восприятия его вероятностные оценки обновляются таким образом, чтобы в них отражались новые свидетельства. Вероятности, оцениваемые до получения свидетельства, называются априорными, или безусловными, вероятностями, а вероятности, оцениваемые после получения свидетельства, называются апостериорными, или условными, вероятностями. В большинстве случаев агент должен получать определенные свидетельства из результатов своих восприятий; после этого ему необходимо вычислять апостериорные вероятности результатов, которые его интересуют.
Неопределенность и рациональные решения Из-за наличия неопределенности способ принятия решений агентом изменяется коренным образом. В обычных условиях логический агент ставит перед собой цель и выполняет любой план, который гарантирует ее достижение. Действие в этом плане может быть выбрано или отвергнуто с учетом того, способствует ли оно достижению цели, независимо от наличия или отсутствия каких-либо иных действий, способствующих ее достижению. А если в ситуацию вмешивается неопределенность, такой подход становится неосуществимым. Снова рассмотрим план прибытия в аэропорт, А9м Предположим, что этот план имеет 95%-ные шансы на успех.
Означает ли это, что решение по выбору данного плана является рациональным? Не обязательно: могут существовать другие планы, такие как А„„с большими вероятностями успеха. Если для пассажира жизненно важно успеть на самолет, то стоит рискнуть тем, что ему придется дольше ждать в аэропорту. А что можно сказать о плане дынь который предусматривает заблаговременный выезд из дома за 24 часа до отправления самолета? В большинстве обстоятельств это — не лучший выбор, поскольку он предусматривает невыносимо долгое ожидание, даже несмотря на то, что почти полностью гарантирует своевременное прибытие в аэропорт. Чтобы иметь возможность выбирать среди подобных вариантов, агент должен вначале получить информацию о Ж предпочтениях между различными возможными 'сь результатами разных планов.
Каждый конкретный результат представляет собой полностью определенное состояние, включая такие факторы, как своевременное прибытие агента и продолжительность ожидания в аэропорту. Для представления и формирования рассуждений с учетом предпочтений мы будем использовать Ъ. теорию полезности. (Термин "полезность" имеет англоязычный эквивалент "иг(йгу", который в данном контексте обозначает "свойство быть полезным", а не электростанцию или предприятие, предоставляющее коммунальные услуги.) Теория полезности указывает, что каждое состояние имеет определенную степень полезности (или просто полезность) для агента и что агент предпочитает состояние с более высокой полезностью.
Полезность состояния является относительной для агента, предпочтения которого должна описывать функция полезности. Например, функции вознаграждения для игр, описанные в главе 6, представляют собой функции полезности. Полезность состояния, в котором белые могут победить в ходе какой-то шахматной партии, безусловно, высока для агента, играющего белыми, но низка для агента, играющего черными. Еще один пример состоит в том, что некоторые игроки (включая авторов Глава 13. Неопределенность 627 этой книги) будут счастливы, сыграв вничью против чемпиона мира, а о других игроках (включая бывшего чемпиона мира) этого сказать нельзя.
При этом не учитываются личные вкусы нли предпочтения: читатель может подумать, что агент, который предпочитает шоколадным чипсам мороженое "Халапеньо" с добавлением компонентов жевательной резинки, — странный илн даже бестолковый тип, но не сможет утверждать, что этот агент нерационален. В функции полезности может быть даже учтена польза от альтруистического поведения просто путем включения оценки благополучия других как одного из факторов, которые вносят вклад в полезность для самого агента. Предпочтения, будучи выраженными в виде полезности, комбинируются с вероятностямн в обшей теории рациональных решений, называемой 'т.
теорией решений, следуюшим образом: Теория решений = Теория вероятностей ч Теория полезности Фундаментальная идея теории решений состоит в том, что бр- любой агент является рациональным п1агг)а и только тогда, когда он выбирает действие, позволяющее достичь наибольшей ожидаемой полезности, усредненной па всем возможным резулыпатам данного действия. Это — так называемый принцип максимальной ожидаемой полезности (Махппшп Ехресгед ПВ1пу — МЕ0). Мы наблюдали этот принцип в действии в главе 6, когда кратко рассматривали оптимальные решения в нардах, а ниже булет показано, что это — действительно полностью общий принцип.