Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 127
Текст из файла (страница 127)
Мы должны также следить за ()Кй, связанным с этой страницей: Ке1еиапСОЯЯег(раде, иг1, диегу) е> Ле1еиапг(раде, иг1, диегу) е 0ГГег(раде) Запросу будет соответствовать страница с обзором новейших портативных компьютеров высокого класса, но если она не предоставляет способ купить такой компьютер, то ее нельзя рассматривать как предложение. Например, можно утверждать, что страница является предложением, если на ней содержится слово "Ьиу" (покупка) или "рпсе" (цена) в какой-то ссылке НТМ1 или в форме, относящейся к этой странице.
Иными словами, если страница содержит строку в виде "<а ... Ьиу ... </а> ..", то является предложением; на ней может также применяться слово "рпсе" вместо "Ьиу", а вместо дескрип- <Ь1>0еиегйс Ои11ие < >Яе1есг</1> Ггот <и1> <11> <а Ьгег="ЬСГР <11> <а Ьгег="ЬССР <11> <а ЬгеГ="ЬГСР <11> <а Ьгег="ЬСГР <11> <а ЬгеГ="ЬССР </и1> //деп-ягоге.сот/сотри">Союригегя</а> //деи-ясоге.сот/серег">Сатегая</а> //деи-ягоге.сот/Ьоохя">Воохя</а> //деи-я гоге.
сот/иЫео" >иЫеоя</а> //деи-ягоге.сот/мияги">ниядс</а> Глава 10. Представление знаний 473 тора "а" использоваться дескриптор "бетт". Аксиомы, относящиеся к этим угвержле- ниям, могут быть записаны следующим образом: оттек(раде) ся (гптад( "а", ясг, раде)»г 1птад("готт", ясг, раде) ) л (1п ( "Ьиу", яег) и 1п ( "ртгсе", ятт) ) 1пТад(еад, ягг, раде) е» 1п("<" » Сад + яег е "<1" + Сад, раде) гп(яиь, ясг) с» 31 яст[1:1+ьепдсЛ(яиЬ) ) = яиЬ Теперь необходимо найти соответствующие страницы.
Применимая для этого стратегия состоит в том, чтобы начать с начальной страницы некоторого оперативного магазина и рассмотреть все страницы, которых можно достичь, следуя по соответствующим ссылкам'. Агент должен обладать знаниями о многих магазинах, например, в таком виде: Ататоп Е Оп11пеяготея л Нотераде(дтатоп, "атакои.сот") Яьау е ОЛ11пеясотея л нотераде(еьау, "еьау.сот") ОепЯСоте Е Оп1гпеятотея л Нотераде(оепяготе, "деп-яготе.сот") В этих магазинах товары классифицируются по категориям товаров, а на начальной странице предоставляются ссылки на основные категории товаров.
К младшим категориям можно перейти, следуя по цепочке соответствующих ссылок, что позволяет в конечном итоге проложить путь к требуемым предложениям. Иными словами, страница соответствует запросу, если ее можно достичь, проследовав по цепочке соответствуюгцих ссылок на категории от начальной страницы магазина, а затем пройдя е)це по одной ссылке к предложению товара: Ке1еиапг(раде, ит1, ггиету) е» Зясоте,лоте ясоге е Оп1гпеясотея л нотераде(ясоте, лоте) л Зит1г Ке1еиапССЛагп(Лоте, ит1г, диету) л Ьдп)г(ит1», иг1) л раде = Оеграде(иг1) Здесь предикат ьхп)с( этот, По) ОЗНаЧаЕт, чтО имЕется гиперссылка от [)В) ттот к 1)К1.
ло (см. упр.!0.13); чтобы определить, какая цепочка ссылок может рассматриваться как соответствующая запросу, Ке1еиапссЛауп, необходимо следовать не просто по любым существующим гиперссылкам, а только по таким ссылкам, связанный с которыми текст анкера указывает, что эта ссылка соответствует данному запросу на приобретение товара. Для этого используется предикат ьхп)гтехс(этот, со, сехс), который означает, что имеется ссылка межлу [гГ<1 агою и со, текстом анкера которой является сехс. Цепочка ссылок между двумя ЦВ[., ясатс и епс), соответствует описанию с[, если текст анкера каждой ссылки представляет собой соответствующее имя категории для с). Существование самой цепочки определяется с помощью рекурсивной формулировки, в которой в качестве базового случая используется пустая цепочка (ясатл=епс)): ке1еиапссЛа1п ( ясагс, епс), диету) с» ( ясатс=епс)) и (Зи, техт Ьгп)стеке(агат!,и, Лехе) л Ке1еиапССагедотунате(диету, Сехг) л Ке1еиапССЛа1п(и, епс1, диету)) ь Альтернативой стратегии, прсдусмвтривающсй прохождение по ссылкам, является использование какой-то машины поиска в!п(сгпсг; технология, лсжащая в основе поиска в !п(сгпс! и выборки информации, рассматривается в рвздслс 23.2.
474 Часть !П. Знания и рассуждения Теперь необходимо определить, что подразумевается под высказыванием, будто текст Сехс является соответствующим именем категории Яе1еиапсСаседогумате для запроса сцгегу. Прежде всего необходимо связать строки с категориями, именуемыми с помощью этих строк. Такую задачу можно решить с использованием предиката Мате(я, с), который сообшает, что строка я является именем категории с, например, чтобы можно было сформулировать утверждение, что Мате("1арсоря", ЕарсорСотрпсегя) . Некоторые дополнительные примеры применения предиката Мате приведены в табл.
10.1, б. Затем определим понятие соответствия. Допустим, что запросом диегу является "1арсоря" (Портативные компьютеры). В таком случае предикат Яе1еиапССаседогумате(диегу, Сехс) принимает истинное значение, когда выполняется одно из приведенных ниже условий. Таблица 10.1. Примеры обозначений категорий Таксономия категорий товаров Слова, которыми обозначаются зги категории б) ° Строки сехс и сгиезу именуют одну и ту же категорию, например "1арсор сотриеегя" и "1арсоря". ° В строке сехс именуется надкатегория, такая как "с отроге ге ".
° В строке сехс именуется подкатегория, такая как "и1сга11дЬс посеЬоо)ся ". Логическое определение предиката Яе1еиап сСа седогу(()ате состоит в следующем; яе1еиапссаседогумате(диегу, сехс) ео Зс,, сг Магие (диегу, с,) л Мате(сехС, сг) л (сг ~ сг и сг С сг) (10.1) В противном случае текст анкера не соответствует запросу, поскольку в нем именуется категория, не соответствующая данному описанию, такая как "тазпбгате сотрисегя" (мэйнфреймы) или "1аып й дагдеп" (газон и сад).
Поэтому, чтобы обладать способностью следовать по искомым ссылкам, необходимо иметь широкие знания об иерархии категорий товаров. Верхняя часть этой иерархии может выглядеть, как показано в табл. 10.1, а. Задача перечисления всех возможных товарных категорий неосу(цествима, поскольку у покупателя всегда могут Вселя С Ргсдисгя Миядслессгдгпдя С Ргсдисся Мияг'сСРя С МиягсЯессгдгпдя МиягсТарея С Мия1сЯессгдгпдя Е1есггспгся С РгсдисСв Ргдгса1сатегая с е1вссгспгся ясегеседигртепс с е1ессгспгся Ситригегя С Е1всггипгся гарссрсстрисегя с ситрисвгя Рея)гсорсстрисегя с сстрисвгя Мате("Ьсскв",Вссхя) Магие("тивг.с",Миягслесогддпдя) Мате("Спв",МиягсСРя) Мате("варев",МивгсТарея) мате("е1вссгапгсв", е1ессгспгся) Мате("дгдгса1 свтегав", Ргдгга1Сатегая) Мате("вгегесв", ЯСвгвс ЕдигртепС) Магпе("ситригегв",СотриСегя) Мате("1арсирв",ГаргорСогприСегя) мате("девхссрв", Рея)гссрсстрисегя) Глава 10.
Представление знаний 475 возникнуть какие-то новые пожелания, а производители всегда готовы предложить новые товары для их удовлетворения (возможно, скоро будут даже продаваться обогреватели для коленных чашечек?). Тем не менее онтология, состояшая примерно из тысячи категорий, должна оказаться очень полезным инструментом для большинства покупателей. Кроме самой иерархии товаров, необходимо иметь богатый словарь имен для категорий. Жизнь была бы гораздо проше, если бы существовало взаимно однозначное соответствие между категориями и символьными строками, которые их именуют.
Мы уже сталкивались с проблемой синонимов — двух имен для одной и той же категории, таких как "1аргор сотриеехв" апд "1ареорв". Кроме того, существует также проблема омонимов — обозначения одним именем двух или нескольких разных категорий. Например, если в базу знаний, приведенную в табл. 10.1, б, будет добавлено следуюшее вполне допустимое высказывание, что словом 5 0)эз" обозначаются депозитные сертификаты; ГГате)"Сов", СеггхгхсаееяОГПероязь) то имя "С)ээ" будет относиться к двум различным категориям.
Наличие синонимов и омонимов может стать причиной значительного увеличения количества путей, по которым должен следовать агент, и иногда может затруднить определение того, действительно ли данная страница соответствует запросу. Гораздо более серьезная проблема состоит в том, что пользователь может вводить очень широкий спектр описаний, а магазин может использовать не такие имена категорий, о которых знает агент. Например, в ссылке может быть указано ").ар сор ", тогда как в базе знаний имеется только имя "2аргорэ", или пользователь может ввести запрос: "компьютер, который помещается на откидном столике сидения экономического класса в самолете Вое1пя 737".
Невозможно заранее перечислить все способы, с помощью которых могут присваиваться имена какой-то категории, поэтому в некоторых случаях агент должен проявлять способность проводить дополнительные рассуждения для определения того, соответствует ли рассматриваемый текст отношению Мате. В наихудшем случае для этого требуется полное понимание естественного языка, но отложим эту тему до главы 22. На практике многое можно сделать с помощью нескольких простых правил, например, позволяющих согласовать слово ").ареор" с категорией, названной как "1ареорв", В упр. 10.15 предлагается разработать множество таких правил после проведения некоторых исследований, касающихся оперативных магазинов.