Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 175
Текст из файла (страница 175)
Но в случае вероятностей, с другой стороны, утверждения относятся не непосредственно к самому миру, а к собственному состоянию знаний агента. В таком случае, почему агент не мог бы иметь приведенное ниже множество убеждений, которое явно нарушает аксиому 3? р(а) = 0.4 р(а л Ы = 0.0 Р~Ь) = 0.3 Р(а ч Ь) = 0.8 Такого рода вопрос был предметом яростных дебатов, продолжавшихся в течение нескольких десятилетий, между теми, кто отстаивал допустимость использования вероятностей как единственной обоснованной формы оценки степеней уверенности, и теми, кто отстаивал альтернативные подходы.
В данном разделе мы приведем один довод в пользу аксиом вероятностей, впервые сформулированный в! 931 году в работах Бруно де Финетти (Вгнпо де Р(пе((1). Ключом к этому доводу де Финетти является связь мехду степенью уверенности и действиями. Идея состоит в том, что если агент имеет некоторую степень уверенности в истинности высказывания а, то агент должен быть способен сформулировать оценку того, в какой степени он безразличен к ставке за или против высказывания гь Рассмотрим эту ситуацию как игру между двумя агентами: агент 1 утверждает "моя степень уверенности в истинности события а равна 0,4". Затем агент 2 вправе выбрать, будет ли он делать ставку за или против высказывания а, применяя суммы, которые совместимы с заявленной степенью уверенности. Это означает, что агент 2 может решить сделать ставку на то, что событие а произойдет, поставив 4 доллара против 6 долларов агента 1. С другой стороны, агент 2 может поставить 6 долларов против 4, что А не произойдет'.
Если степень уверенности агента не точно отражает состояние мира, можно вполне рассчитывать на то, что в долговременной перспективе он будет проигрывать деньги агенту-противнику, убеждения которого более точно отражают состояние мира. Но де Финетти доказал гораздо более сильное утверждение: гв- если агент 1 руководствуется мнозкеством степеней уверенности, которое нарушаегл аксиомы теории вероятностей, та существует такая комбинация ставок агента 2, которая гарантирует, что агент 1 будет терять деньги при каждой ставке. Поэтому, если вы придерживаетесь той идеи, что агент должен стремиться "ставить свои деньги на те события, вероятности которых выше", то должны также признать, что нерационально иметь такие убеждения, которые нарушают аксиомы вероятностей.
' Можно бьшо бы возразить, что предпочтения агента применительно к балансам разных стааок являются таковыми, что возможность потерять 1 доллар не уравновешивается равной возможностью выиграть 1 доллар Один из возможных ответов на это возражение состоит а том, по суммы ставок должны быть достаточно малыми для того, 'побы можно бьшо избежать данной проблемы. Анализ, проведенный Оэвелжем 1!3541, позволяет полностью исключить из рассмотрения эту проблему.
638 Часть У. Неопределенные знания и рассуждения в условиях неопределенности На первый взгляд может показаться, что эта игра со ставками довольно надумана. Например, что было бы, если один из агентов отказался бы делать ставки? Закончился бы на этом спор? Ответ на данный вопрос состоит в том, что эта игра со ставками представляет собой абстрактную модель для ситуации принятия решений, в которую любой агент неизбежно вовлечен в любой момент своего существования. Каждое действие (включая бездействие) — это своего рода ставка, а каждый результат может рассматриваться как положительное или отрицательное вознаграждение за эту ставку.
Отказ делать ставку аналогичен решению предоставить все естественному течению событий. Мы не будем доказывать представленную выше теорему де Финетти, а приведем один пример. Предположим, что агент 1 руководствуется множеством степеней уверенности, приведенным в уравнении !3.3. В табл. !3.1 показано, что если агент 2 решит делать ставки 4 доллара на событие а, 3 доллара — на событие Ь и 2 доллара на событие !а ч Ь), то агент ! будет всегда терять деньги, независимо от результатов а и Ь.
Таблица 13.1. Пример того, что при наличии у агента 1 несогласованных убеждений агент 2 получает возможности составить множество ставок, которое гарантирует потери для агента 1, независимо от результатов а и Ь Результат для Агента ! Агент 1 Агент 2 Высказы- Степень Ставка Сумма а л Ь е л Ь а л Ь о л Ь ванне уверен- ставки ности 0.4 а 4-6 — б — б 4 0.З Ь 3 — 7 — 7 3 -7 з 0.8 (е ч Ь! 2 — 8 2 2 2 — 8 ачЬ В пользу применения вероятностей были выдвинуты и другие весомые философские аргументы; к числу наиболее широко известных из них относятся сформулированные Коксом !304! и Карнапом [225!.
Но лгир таков, каким он является, и практические свидетельства иногда становятся более весомыми, чем доказательства. Успех систем формирования рассуждений, основанных на теории вероятностей, оказался гораздо более привлекательным стимулом, который вызвал пересмотр многих взглялов. В следуюгцем разделе будет показано, как описанные выше аксиомы могут быть применены для составления логических выводов. 13.4. ЛОГИЧЕСКИЙ ВЫВОД С ИСПОЛЬЗОВАНИЕМ ПОЛНЫХ СОВМЕСТНЫХ РАСПРЕДЕЛЕНИЙ В данном разделе будет описан простой метод 'в. вероятностного вывода, т.е. вычисления апостериорных вероятностей для высказываний, заданных в виде запросов, на основании наблюдаемых свидетельств. Мы будем использовать полное совместное распределение как своего рода "базу знаний'*, из которой могут быть выве- б39 Глава 13.
Неопределенность Таблица 13.2. Полное совместное распределение для мира тоосьасве, саех су, свесь Соослас)те Сосс)зесле сеСсп сассй саесп са Ссп саихсу сао1Су 0.108 О. 016 0.012 0.064 0.072 0.144 О.ОО8 0.576 Обратите внимание на то, что вероятности в этом совместном распределении в сумме составляют 1, как и требуется согласно аксиомам вероятностей.
Следует также отметить, что уравнение 13.2 предоставляет нам прямой способ вычисления вероятности любого высказывания, простого или сложного: мы должны определить те атомарные события, в которых данное высказывание является истинным, и сложить их вероятности. Например, имеется шесть атомарных событий, в которых истинным является высказывание сауйеу о Соое)тас)те: Р(сао1 Су м Ссос)час)зе) = О.
108 + О. 012 + О. 072 + О. 008 + О. 016 0.064 = 0.28 Одна из задач, которая встречается особенно часто, состоит в том, чтобы извлечь из подобной таблицы распределение вероятностей по некоторому подмножеству переменных или по одной переменной. Например, складывая элементы первого ряда табл. 13.2, получим безусловную, или сх маргинальную, вероятность" события сатт1 Су Р(сао1су) = О 108 + О 012 + О 072 + 0.008 = О 2 Такой процесс называется Ъ. маргинализацией, или исключением из суммы, поскольку из суммы вероятностей исключаются прочие переменные, кроме Сау1Су.
Можно записать следуюгцее общее правило маргинализации для любых множеств переменных х и вк Р(Х) = ~~) Р(Х,а) (13.4) Это означает, что распределение вероятностей по т может быть получено путем исключения из суммы вероятностей всех прочих переменных, относящихся к любому совместному распределению вероятностей, содержащему х. В одном из вариантов этого правила учитываются условные вероятности, а не совместные вероятности с использованием правила произведения: з Эта вероятность получила такое название, поскольку страховщики имеют общую привычку записывать суммы наблюдаемых частот собьпий на полях (татшп) таблиц страхования.
лены ответы на все вопросы. В ходе этого мы также представим несколько полезных методов манипулирования уравнениями, в которых учитываются вероятности. Начнем с очень простого примера — с описания проблемной области, состоящей только из трех булевых переменных, тоос)зас)те, Сатхсу и Сасс)7 (неприятные ощущения от захвата зуба стальными клешами дантиста все еще свежи в памяти автора). Полное совместное распределение представляет собой таблицу с размерами 2х2 х2 (табл.
13.2). 640 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности (х) = ~) Р(х! )щ ) Это правило называется правилом ахобусловливания. Как оказалось, правила маргинализации и обусловливания являются очень полезными правилами для всех видов логических выводов, в которых применяются вероятностные выражения. В большинстве случаев нас будет интересовать задача вычисления условных вероятностей некоторых переменных при наличии свидетельств, касающихся других переменных, Условные вероятности можно найти, вначале воспользовавшись уравнением ]3.1 для получения выражения в терминах безусловных вероятностей, а затем рассчитав это выражение на основании полного совместного распределения.
Например, можно вычислить вероятность наличия дупла после получения свидетельства о том, что пациент страдает от зубной боли, следующим образом; Р(сатхс а Еоос)засае) Р(саи1су]ссасаасле) Р(ссосаас)зе) 0.108 + 0.012 0.108 ч 0.012 + 0.016 ь 0.064 Просто для проверки мы можем также рассчитать вероятность того, что у пациента нет дупла, если у него наблюдается зубная боль: Р! са >хсу а Есасдасде) Р( са>4су] Есосдаспе) Р( Еаасласпе) 0.016<0.064 0.108 а 0.012 . 0.016 е 0.064 Обратите внимание на то, что в этих двух примерах вычисления вероятности терм 16 Р( еооШас)зе) остается постоянным, независимо от того, какое значение Саму еу вычисляется.
Фактически этот терм может рассматриваться как константа 'ж нормализации для распределения Р(сау1еу( евое)зас)зе), гарантирующая, что полученные вероятности в сумме составят 1. Во всех главах этой книги, где речь идет о вероятностях, для обозначения подобных констант будем использовать символ 01 С помощью такого обозначения можно записать лва приведенных выше уравнения в виде олного: Р(са>хеу] ссаеьасде) = и Р(саНеу, ееее)заеме) ) — а (Р(са>хеу, есаеаасле, саеса) ь Р(сачхеу, ееаеаасае, саеса) ] и (<0.108,0.016> + <0.012,0.064>] = а <0.12,0.08> = <0.6,0.4> Как оказалось, нормализация является полезным сокращением во многих вероятностных вычислениях.