Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 183
Текст из файла (страница 183)
Пример того, что структура сети зависит от порядка введения вершин. з) каясдой из сетеи, показанных на этом ршунке, вершины вводились в порядке сверху вниз ° Введение вершины МахуСа11а — родительские вершины отсутствуют. ° Введение вершины то)зпСа11а — если звонит Мэри, это, по-видимому, озна- чает, что раздался тревожный сигнал, а вероятность такого события, очевид- 668 Часть 'ьг. Неопределенные знания и рассуждения в условиях неопределенности но, будет выше, если позвонит также и Джон. Поэтому для вершины ТойпСа11я необходимо использовать в качестве родительской вершину ЬтасуСа11я. ° Введение вершины А1агтв — безусловно, если позвонили оба соседа, вероятность того, что раздался тревожный сигнал, больше, чем лишь при одном звонкс или вообще без звонков, поэтому в качестве родительских необходимо включить обе вершины, и иагуСа11я, и топпСа11я.
° Введение вершины Вцсд1асу — если известно состояние тревожного сигнала, то звонок от Джона или Мэри может дать жильцу охраняемого дома информацию о том, что звонил его телефон или Мэри слушала музыку, но не о взломе: и(яигд1агу~л1асм,ооипса11»,иагуса11я) = я~вигд1асу~А1агт) Поэтому для использования в качестве родительской вершины требуется только А1агзп. ° Введение вершины ВасСЛдца)се — если раздался тревожный сигнал, то возможно также, что было землетрясение (эта тревожная сигнализация является к тому же своего рода детектором землетрясения).
Но известно, что если был взлом, то тревожный сигнал объясняется именно этим, а вероятность землетрясения должна быть лишь ненамного выше нормальной. Поэтому в качестве родительских вершин лля этой вершины необходимо иметь и А1азтп, и Вцсд1асу. Результирующая сеть имеет на два ребра больше по сравнению с первоначальной сетью, показанной на рис.
! 4. 2, а также требует указания трех дополнительных вероятностей. Но что еше хуже, некоторые из ее связей представляют надуманные отношения, которые требуют формирования сложных и неестественных суждений о вероятностях, таких как оценки вероятности Вассйсзца)се, если даны Висд1асу и А1аззп. Такой феномен является весьма распространенным и связан с различием между причинными и диагностическими моделями, которые были представлены в главе 8. Если мы попытаемся построить диагностическую модель со связями от симптомов к причинам (как, например, от гтагуСа11я к А1аст или от А1азтп к Вцсд1асу), то в конечном итоге будем вынуждены задавать дополнительные зависимости между причинами, которые во всем остальном являются независимыми (а часто даже между отдельно возникающими симптомами). св Если же мы будем придерживатьс» причинно» модели, то в конечном итоге нам придетс» задавать меньше чисел и сали эти числа, скорее всего, можно будет легче определить.
Например, Тверский и Канеман [1523) для проблемной области медицинской диагностики показали, что опытные врачи предпочитают составлять вероятностные суждения дпя причинных, а не диагностических правил. На рис. 14.3, б показано еше худшее упорядочение вершин: масуса11я, ,топпса11я, Васс)зсрза)са, Висд1асу, А1агт. Ддя этой сети требуется задать 31 отдельную вероятность — точно такое же количество, как и при использовании полного совместного распределения. Однако важно понять, что любая из этих трех сетей может представлять точно такое же совместное распределение, как и другие.
Просто в последних двух версиях не удалось успешно вьивить все отношения условной независимости и поэтому вместо них пришлось ввести много ненужных чисел. 669 Глава 14. Вероятностные рассуждения Отношения условной независимости в байесовских сетях В предьшушем разделе была определена "числовая" семантика для байесовских сетей в терминах представления полного совместного распределения, как в уравнении 14.1. Используя эту семантику для вывода метода составления байесовских сетей, мы пришли к заключению, что вершина является условно независимой от ее предшественников, если заданы ее родительские вершины. Как оказалось, можно также двигаться в другом направлении.
Мы можем начать с "топологической" семантики, которая задает отношения условной независимости, закодированные в структуре графа, а из этой информации вывести "числовую" семантику. Топологическая семантика задается любой из приведенных ниже спецификаций, которые являются эквивалентными'. 1. Вершина является условно независимой от вершин, не являюшихся ее ;з. потомками, если даны ее родительские вершины. Например, на рис. 14.2 вершина Ло2пэСа11п независима от Вигд1агу и Еагспг2иаке, ЕСЛИ ДаНО значение А1пгт. 2. Вершина является условно независимой от всех других вершин в сети, если даны ее родительские вершины, дочерние вершины и родительские вершины дочерних вершин, т.е. дано ее 1з. марковское покрытие (Маг1гон Ыапкег).
Например, вершина Виго1агу независима от .То1апСа11в и МагуСа11э, если даны А1агт и еагг1зггиайе. Примеры применения этих спецификаций показаны на рис. 14.4. На основании привеленных утверждений об условной независимости и таблиц СРТ можно реконструировать полное совместное распределение; таким образом, "числовая" семантика и "топологическая" семантика являются эквивалентными. 14.3. ЭФФЕКТИВНОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ Даже если максимальное количество родительских вершин 1г невелико, для заполнения таблицы СРТ, относящейся к некоторой вершине, необходимо будет задать вплоть до о12х) чисел, а также, возможно, потребуется значительный опыт оценки всех возможных обусловливающих случаев.
К тому же на практике иногда встречается наихудшая ситуация, в которой связь между родительскими вершинами и дочерней вершиной является полностью произвольной. Обычно такие отношения можно описать с помощью Ж канонического распределения, которое соответствует некоторому стандартному образцу. В таких случаях всю таблицу можно задать, указав тип распределения и, возможно, введя несколько параметров, что намного проще по сравнению с определением экспоненциального количества параметров.
' Существует также общий топопогический критерий, называемый й-отлааепием, дяя принятия решения о том, является лп множество вершин х независимым от другого множества х, если задано третье множество к. Этот критерий является довольно сложным и пе требуется для разработки алгоритмов, приведенных а данной главе, поэтому мы его пе описываем. Подробные сведения об этом критерии можно найти а (11911 ипп 113281, а в 11384] описан более интуитивно понятный метод проверки выполнения условий и'-отделения.
671 Глава 14. Вероятностные рассуждения пациент бывает простужен, но у него не обнаруживается жар. В этой модели приняты два предположения. Во-первых, в ней предполагается, что учтены все возможные причины. (Это — не такое строгое требование, как кажется на первый взгляд, поскольку всегда есть возможность ввести так называемую сь вершину утечки (!еа)( поде), которая покрывает "прочие причины".) Во-вторых, предполагается, что блокирование каждой родительской вершины не зависит от блокирования любых других родительских вершин, например, та причина, которая блокирует возникновение жара под влиянием действия вершины Р(а2асза, НЕ Зависит От тех причин, которыЕ блокируют возникновение жара под действием вершины Р2и. С учетом этих предположений значение вершины Ре)гех ЯВЛЯЕтсЯ ложНым тОгда и тОЛьКО тОгда, когда заблокированы все ее родительские вершины, имеющие истинное значение, а вероятность такой ситуации представляет собой произведение вероятностей блокировки каждой родительской вершины.
Предположим, что такие отдельные вероятности блокировки выражаются следующим образом: Р( Еееег)согс), — Его,-еаа1агха) = О.б Р( Ееоег) согс),Е1о, та1агха) = 0.2 Р( Еееег)- со1(),-~Его,л(а1агха) = О. 1 В таком случае появляется возможность составить всю таблицу СРТ на основании этой информации и предположений модели зашумленного ОК. Пример вычисления значений соответствую)цих элементов показан в табл. 14.). Таблнаа 14.1.
Пример вычислении значений таблицы СРТ Сага Рги Ма1ааха Р(ив% вг) Р( Рвч вс) 1. 0 о.о 0.9 О.1. 0.2 0.8 О. 98 0.02 = 0.2 х 0.1 0.4 0.6 0.94 О.Об = О.б х О. 1 О.12 = О.б х О.г О 012 = О б х О 2 х О 1 0.988 Вообще говоря, зашумленные логические отношения, в которых некоторая переменная зависит от )г родительских переменных, могут быть описаны с использованием 0()с) параметров вместо 0(2") параметров, которые требуются для полной таблицы условных вероятностей, Благодаря этому задачи присваивания значений и обучения намного упро(цаются. Например, распределения зашумленного ОК и зашумленного МАХ успешно использовались в сети СРСБ [!232) для моделирования отношений между заболеваниями и симптомами в диагностике внутренних органов.
При наличии 448 вершин и 90б связей в этой сети потребовалось только 8254 значения вместо 133 931 430 значений для сети с полными таблицами СРТ. Байесовские сети с непрерывными переменными Для решения многих реальных задач требуется учитывать непрерывные количества, такие как уровень, масса, температура и сумма денежных средств; в действи- 672 Часть "и'.
Неопределенные знания и рассуждения в условиях неопределенности тельности большая часть такого научного направления, как статистика, посвягцена исследованию случайных переменных, области определения которых являются непрерывными. По определению непрерывные переменные имеют бесконечное количество возможных значений, поэтому невозможно явно задать условные вероятности для каждого значения.
Один из возможных способов обработки непрерывных переменных состоит в избавлении от них с помощью 'в. дискретизации, т.е, разделения всех возможных значений на постоянное множество интервалов. Например, температуры могут быть разделены на интервалы (<О'С), (О С вЂ” !00'С) и (>100'С). Иногда дискретизация становится вполне адекватным решением, но часто приводит к значительной потере точности и появлению очень больших таблиц СРТ. Еще одно решение состоит в определении стандартных семейств функций плотности вероятностей (см. приложение А), которые задаются с помощью конечного количества 'в.
параметров. Например, гауссово (или нормальное) распределение н()ь, о') (х) имеет в качестве параметров среднее )ь и дисперсию а'. Сеть, в которой имеются и дискретные, и непрерывные переменные, называется ск гибридной байесовской сетью. Для составления гибридной сети необходимо определить два новых типа распределений: условное распределение для непрерывной переменной, если даны дискретные или непрерывные родительские переменные, и условное распределение для дискретной переменной, если даны непрерывные родительские переменные. Рассмотрим простой пример, приведенный на рис.
14.5, в котором клиент покупает какие-то фрукты в зависимости от их стоимости, которая, в свою очередь, зависит от размера урожая и от того, применяется ли правительственная программа субсидий. Переменная Сояс (Стоимость) является непрерывной и имеет непрерывные и дискретные родительские переменные; переменная ниуя (покупает) является дискретной и имеет непрерывную родительскую переменную. Рис.