Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 190
Текст из файла (страница 190)
Это позволяет исключить один из источников бесконечных ветвлений. Значение простой функции, применяемое к конкретному объекту, может быть наблюдаемым или неизвестным; для нашего представления эти значения будут служить значениями основных случайных переменных". Допускается также использование 'з.сложных функций, которые отображают объекты на другие объекты. Например, значением функции лс)ггбяог(,топея) (Консультант Джонса) может быть РхоЕБтхс)з. Каждая сложная функция имеет заданную область определения и диапазон значений, которые являются классами. Например, областью определения функции лс)с 1яох является Бсис)ел с, а диапазоном значений — РхоЕеяяох.
Функции применяются только к объектам соответствующего им класса; например, значение консультанта Ас)тгбяог для РхоЕБюус)з не определено. Сложные функции могут вкладываться, например значением выражения оерстгеас) (лс)цхяох(допея) ) может быть Рхоймоохе. На данный момент предполагается, что для всех константных символов значения всех сложных функций известны. Поскольку база знаний является конечной, из этого следует, что кажлая цепочка применений сложных функций приводит к получению олного объекта из конечного множества объектов'.
з Эти значения играют роль, во многом аналогичную роли базовых атомарных высказываний, формируемых в процессе пропозиционвлизвции, который описан в разделе 9.!. з Это ограничение означает, что нс могут использоваться такие сложные функции, как гаснег и мосъет, приводящие к созданию потенциально бесконечных цепочек, которые могли бы оканчиватьсл формированием неизвестного объекта. Указанное ограничение будет пересмотрено позднее. 696 Часть Ч.
Неопределенные знания и рассуждения в условиях неопределенности Последним необходимым нам элементом является вероятностная информация. Зля каждой простой функции задается множество родительских объектов, так же, как и в байесовских сетях. Родительскими объектами могут быть другие простые функции от того же объекта; например, финансирование (Рипддпд) некоторого профессора (Рсобеяяох) может зависеть от его известности (Ееэпе). Кроме того, родительские объекты могут быть простыми функциями от связанных объектов, например, успех (Яиссеяя) студента может зависеть от его интеллекта (1пее111депсе) и от известности (Раме) консультанта этого студента.
По сути подобные высказывания представляют собой утвержления о родительских объектах всех объектов в классе с квантором всеобщности. Таким образом, можно записать следующее; Чх х Е яеидепе Рахеп Ся (яиссеяя (х) ) = (1п Се11хдепсе (х), Гете (Ади1яох (х) ) ) (При менее формальном подходе можно нарисовать диаграммы, подобные приведенной на рис. 14.10, и.) Теперь определим распределение условных вероятностей для дочернего объекта, если даны значения его родительских объектов. Например, можно сформулировать следующее утверждение: Чх х Е яеидепе ~ Р(яиссеяя(х) =Ехие~ 1пее11хдепсе(х) 4дд,ртпе (Адихяох(х) )рохие) = 0 . 95 Рю/Моею Рю/Бм(Я лантг 1опех В(ох(и Хиссехх(В(овкх) Виссеи((опех) Рис.
14 10. Примеры диаграмм: модель ЯРМ с описанием двух классов — ухобеяеох и яеидепе. Имеются два профессора и два студента, причем вхогяюхси является консультантов обоих студентов (а); байесовская сеть, эквивалентная модели ЯРМ, приведенной на рис. !4 10, а (б) Как и в семантических сетях, распределение условных вероятностей можно закрепить за самим классом так, чтобы его экземпляры наследовали зависимости и условные вероятности от этого класса. В семантике для языка КРМ подразумевается, что каждый константный символ ссылается на отдельный объект; в этом состоит предположение об уникальности имен, описанное в главе 1О.
С учетом этого определения и ограничений, перечисленных выше, можно показать, что каждая модель ххРМ вырабатывает фиксированное конечное множество случайных переменных, причем каждая из них является результатом применения простой функции к константному символу. Таким образом, при условии, что родительско-дочерние зависимости являются ациклическими, можно составить эквивалентную байесовскую сеть. Это означает, что модель КРМ и Глава 14. Вероятностные рассуждения 697 байесовская сеть задают идентичные вероятности для каждого возможного мира. Нарис.!4.10, б показана байесовская сеть, соответствующая модели ГкРМ, приведенной на рис.
14.10, а. Обратите внимание на то, что связи лс)об эог, имеющиеся в модели КРМ, в байесовской сети отсутствуют. Это связано с тем, что такие связи являются фиксированными и известными. Однако они присутствуют в топологии сети неявно, например, объект Биссеээ (,топеа) имеет в качестве родительского объект Рате(ргогБтзг)з), поскольку значением функции Ас)ис вог(сопел) является РгогБтзг)з. Вообгде говоря, отношения, которые имеют место между объектами, определяют характер зависимостей между свойствами этих объектов. Для повышения выразительной мощи моделей КРМ применяется несколько способов. В частности, могут быть разрешены 'сь рекурсивные зависимости между переменными, позволяющие представить несколько типов зависимостей, которые ссылаются сами на себя, Например, предположим, что склонность к питанию всухомятку вызвана фактором мсСепе.
В таком случае для любого х истинность выражения мсСепе (х) зависит отмссепе(рад)зег(х) ) и мссепе(мог)зег(х) ), которые, в свою очередь, зависят от МсСеп е ( Ра С)з ег ( Ра С)з ег ( х ) ) ), Мс Селе ( Мо Г)зег ( Ра Шег ( х ) ) ), и т д. Даже несмотря на то, что такие базы знаний соответствуют байесовским сетям с бесконечно большим количеством случайных переменных, иногда решения могут быть получены на основе уравнений с неподвижной точкой (йхеь)-ро)п( ес)цапоп).
Например, равновесное распределение вероятностей для генетического фактора МсСепе можно рассчитать на основе условной вероятности наследования этого фактора. Еще одно очень важное семейство рекурсивных баз знаний состоит из времеш(ььх вероятностных моделей, которые описаны в главе 15. В этих моделях свойства рассматриваемого состояния во время с зависят от свойств этого состояния во время г-1 и т.л. Молели КРМ могут быть также расширены, чтобы в них можно было представить Жреляционную неопределенность, т.е. неопределенность, касающуюся значений сложных функций.
Например, в базе знаний может отсутствовать информация о том, кто является консультантом Джонса, лс)идиог( Сопел). В таком случае Ас)Ыэог(топеэ) становится случайной переменной с возможными значениями рго РБтд с)з и Ргогмооге. Соответствующая сеть показана на рис. 14 11. Рис. !4.П.
Чаонь байесовской сети, соответствующая одной из моделей КРМ, в которой значение Лд»йзох (допев) неизвестно, но им может быть либо Вгойзтъе)ь, либо Вгойиоохеь Выбор студентом консультанта зависит от того, какой объем финансирования имеет каждый нрофессор. Обратите внимание на то, что теперь успех Джонса, Боссано (допев), зависит от известностщ вате, обоих нрофессоров, хотя тот факт, какой из этих нрофессоров окажет влияние на уснех Джон со, фактически зависит от значения переменной Адийв ог (допев ! б98 Часть'4г. Неопределенные знания и рассуждения в условиях неопределенности Модели КРМ позволяют также представить такое свойство, как 'а.
неопределенносп идентичности (Ыепг(гу ипсепа(пгу); например, в базе знаний может отсутствовать информация о том, что 1чаху и РкойБтз с)з — одно и то же лицо. При наличии свойства неопределенности идентичности количество объектов и высказываний в разных возможных мирах может изменяться.
В мире, где магу и Рхогьтй ЕЛ вЂ” одно н то же лицо, количество объектов меньше, чем в том мире, где они считаются разными людьми. В результате этого процесс вероятностного вывода усложняется, но основные принципы, установленные в уравнении 14.12, все еше соблюдаются: вероятность любого высказывания вполне определена и может быть рассчитана. Свойство неопределенности идентичности является особенно важным для роботов и встроенных систем датчиков, которые должны следить за многими объектами. Мы вернемся к описанию этой проблемы в главе 15.
Теперь рассмотрим проблему вероятностного вывода. Очевидно, что такой вывод может осуществляться в эквивалентной байесовской сети при условии, что язык КРМ будет ограничен таким образом, чтобы эквивалентная сеть была конечной и имела фиксированную структуру. Такой подход аналогичен способу, с помошью которого логический вывод в логике первого порядка может быть выполнен посредством логического вывода в пропозициональной логике по эквивалентной пропозиционаньной базе знаний (см.