Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 178
Текст из файла (страница 178)
С концептуальной точки зрения переменная сао1су'т. разделяет переменные тоос]заспе и Сасо]з, поскольку наличие дупла является прямой причиной и зубной боли, и наложения инструмента на зуб. Разработка методов декомпозиции крупных вероятностных областей определения на слабо связанные подмножества с помощью свойства условной независимости стало одним из наиболее важных достижений в новейшей истории искусственного интеллекта. Приведенный выше пример из области стоматологии может служить проявлением часто встречаюцгейся ситуации, в которой одна причина непосредственно влияет на целый ряд результатов, причем все эти результаты являются условно независимыми, если дана эта причина. Полное совместное распределение может быть записано следующим образом: Р(саине, есеесс;, ..., ясгесс,] = Р(саине] Д я(ясгесс,[саиве) Указанное распределение вероятностей называется 'а.
наивной байесовской моделью. Такая модель называется "наивной*', поскольку часто используется (как упрошаюшее допущение) в тех случаях, когда переменные "результата" не являются условно независимыми, если дана переменная причины. (Наивную байесовскую модель иногда называют байесовским классификатором, а это не совсем корректное применение термина побудило настоящих специалистов в области байесовских моделей называть ее не наивной, а сь идиотской байесовской моделью.) На практике наивные байесовские системы могут действовать удивительно успешно, лаже если предположение о независимости не является истинным. В ~лаве 20 описаны методы изучения наивных байесовских распределений по данным наблюдений. 13.7.
ЕЩЕ ОДНО ВОЗВРАЩЕНИЕ В МИР ВАМПУСА Теперь мы можем применить многие идеи, изложенные в этой главе, для решения задач в мире вампуса, требующих использования вероятностных рассуждений (полное описание мира вампуса приведено в главе 7). Неопределенность в мире вампуса возникает из-за того, что датчики агента сообщают только частичную, локальную информацию об этом мире. Например, на рис.!3.2 показана ситуация, в которой каждый из трех достижимых квадратов ([1, 3], [2,2) и [3, 1]) может содержать яму. Чисто логический вывод не позволяет прийти к каким-либо заключениям о том, какой квадрат с наибольшей вероятностью окажется безопасным, поэтому логический агент может быть вынужден выбирать среди них случайным образом. В этом разделе будет показано, что вероятностный агент может действовать гораздо успешнее, чем логический агент.
650 Часть Н. Неопределенные знания и рассуждения в условиях неопределенности ляется априорная вероятность конфигурации расположения ям. Каждый квадрат может содержать яму с вероятностью 0,2, независимо от других квадратов, поэтому имеет место следующее: Р(Рц4 ... Р4 4) 4) Р(Р4 З) (13.
15) 1,)=1 1 Для конфигурации с п ямами это значение равно О . 2 "хО . 844 ". В ситуации, показанной на рис. 13.2, а, свидетельство состоит из наблюдаемого ветерка (или его отсутствия) в каждом посещенном квадрате, в сочетании с тем фактом, что каждый такой квадрат не содержит ямы. Эти факты можно сокрашенно пРелставить как Ь= —,Ь,, л Ь в л Ьв „и ]спо44П= — Р 4 л -Ч)4 в л — Ч74 ь Мы заинтересованы в получении ответов на такие запросы, как Р(Р,, ~ )гпо4гп, Ь): насколько велика вероятность того, что квадрат [1, 3] содержит яму, если даны результаты всех наблюдений, сделанных до сих пор? Для получения ответа на этот запрос можно воспользоваться стандартным подходом, основанном на уравнении 13.6 и реализованном в алгоритме еццв4егагеОоупь-дв)с, а именно просуммировать элементы из таблицы полного совместного распределения.
Допустим, что (гп)споьт [Неизвестное) — составная переменная, которая состоит из переменных Р„, для квадратов, отличных от квадратов кпоьл и квадрата запроса [1, 31. В таком случае с помошью уравнения 13.6 получаем следуюшее: Р(Рц4!)гпо44п,Ь) = и,) )Р(Р, 4, ип)гцоь444,)гпо44л, Ь) 4444ХПО4444 Полное совместное распределение вероятностей уже было задано, поэтому задача решена, точнее, осталось только выполнить вычисления. Количество неизвестных квадратов равно 12, поэтому требуемая сумма состоит из 2"=4096 термов. Вооб(це говоря, количество термов в этой сумме растет экспоненциально в зависимости от количества квадратов. Но интуиция подсказывает, что здесь есть какое-то упушение.
Безусловно, напрашивается вопрос, не являются ли другие квадраты не относяшимися к делу? Ведь содержимое квадрата [4, 4] не влияет на то, имеется ли яма в квадрате [1, 3]! И действительно, эта догадка является правильной. Пользуясь ею, предположим, что РР1пце — переменные (отличные от переменной запроса), которые описывают свойства квадратов, соседних по отношению к посе)ценным квадратам; в данном случае таковыми являются только [2,2] и [3,1]. Кроме того, допустим, что ОеЬеР— ЭтО ПеремЕННые, КОтОрыЕ ОтНоСЯтся К другиМ НЕиЗВЕстНЫм квадратам; в данном случае количество других квадратов равно 10, как показано на рис. 13.2, б.
Ключевая идея состоит в том, что данные о наблюдаемом ветерке являются условно независимыми от других переменных, если даны условные переменные, переменные периферии и переменная запроса. После этой догадки остается лишь, так сказать, дело техники — выполнить несколько алгебраических операций. Чтобы воспользоваться этой идеей, необходимо преобразовать формулу запроса в такую форму, в которой данные о наличии ветерка становятся условно зависимыми Глава 13.
Неопределенность 651 от всех других переменных, а затем упростить полученное выражение с использованием утверждения об условной независимости, как показано ниже. Р (Р з(японо Ь) = а,) Р (Ь( Рз,з, )СПОНП, ил)СПОНП) Р (Р»,„)СПОНП, ил)СПОНП) (СОГЛаСНО ипкпонп правилу произведения) а ~ ~ Р(Ь()споил, Р»,з, Етхпде, огЛет)Р(Р» з,)споил, Егхпде,оедет) Ег»пде осьег = а ,) ,) Р (Ь( Лпонп, Р»,, Егзпде) Р(Р»,з,(спонп, Етхпде, оедег) Ег»пде осьег В этом преобразовании на конечном этапе используется утверждение об условной независимости. Теперь первый терм в выражении не зависит от других переменных, поэтому можно переместить операцию суммирования внутрь выражения, следующим образом: Р (Р», з (3спонп, Ь) = а ~~ Р(Ь))споил, Р, з, Е»хпде) ~ Р(Р, з,)споил, Ег»пде, отлет) Ег»пде о»пег Согласно утверждению о независимости, соответствующему приведенному вуравнении !3.15, терм априорной вероятности может быть факторизован, после чего все эти термы могут быть переупорядочены следующим образом: Р ( Р., з ~ )спонп, Ь) = а,) Р(Ь()»поел Р».з Етхпде),~ Р(Р»,з)Р()споил)Р(Егзпде)Р(осдег) (г»пде о»Лег = а Р()спожз)Р(Р»,з) ~~ Р(Ь()споил Рз,з Етзпде) Р(Ет1пде) ) Р(ослет) Ег»пде отлет Сс' Р(Р»п) ) Р (Ь! )споил, Р»п, Егзпде) Р(Егхпде) Егз пде В этом преобразовании на последнем этапе постоянный терм Р()споюп) вводится в нормализующую константу и используется тот факт, что выражение ~оСЛетР(огЛет) равно 1.
Теперь в сумме по периферийным переменным Р,п и ., „осталось только четыре терма. Использование свойств независимости и условной независимости позволило полностью исключить из рассмотрения другие квадраты. Обратите внимание на то, что выражение Р(Ь~ 'кнопп, Р,, Етзпде) равно 1, если периферия совместима с данными наблюдений о наличии ветерка, а в противном случае равно О. Поэтому лля получения каждого значения Р,, проводится суммирование по логическим моделям для периферийных переменных, которые согласованы с известными фактами (это можно сравнить с тем, как осуществлялся перебор моделей на М2 '1:~с:ь 1 Нсолгслслснньк знания и о~сс~ьлспия в .слоших 653 Глава 13. Неопределенность ° К основным типам вероятностных утверждений относятся утверждения, касающиеся априорных вероятностей и условных вероятностей простых и сложи ых вы сказы ва ний.
° Полное совместное распределение вероятностей задает вероятность каждого полного присваивания значений случайным переменным. Это распределение обычно слишком велико для того, чтобы его можно было создать или использовать в явной форме. ° Аксиомы вероятностей регламентируют возможные присваивания вероятностей высказываниям. Агент, не учитываюший в своих действиях эти аксиомы, ведет себя в некоторых обстоятельствах нерационально.
° Если полное совместное распределение доступно, оно может использоваться для получения ответов на запросы п>тем суммирования элементов с данными об атомарных событиях, соответствуюших высказываниям запроса. ° Наличие свойства абсолютной независимости между подмножествами сл>чайных переменных позволяет факторизовать полное совместное распрелеленне на меньшие совместные распределения. Это дает возможность значительно уменьшить сложность, но редко встречается на практике. ° Правило Байеса позволяет вычислять неизвестные вероятности из известных условных вероятностей, обычно в причинном направлении.
При наличии многочисленных свидетельств применение правила Байеса, как правило, приводит к возникновению таких же проблем масштабирования, которые возникают при использовании полного совместного распределения. ° Свойство условной независимости, вызванное наличием прямых причинных связей в рассматриваемой проблемной области, может обеспечить факторизацию полного совместного распределения на меньшие условные распределения. В наивной байесовской модели предполагается наличие условной независимости всех переменных действия, если задана одна переменная причины; размеры этой модели увеличиваются линейно, в зависимости от количесгва результатов.