Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 255
Текст из файла (страница 255)
Разумеется, открытие этих законов находится и в пределах возможностей такой экспериментальной установки, в которой обезьяну посадили за пишушую машинку; нужны лишь более качественные эвристики и новые способы структуризации пространства поиска. Но не углубляясь в эти крайности, можно отметить, что системы обратной резолюции действительно позволяют совершать небольшие„но важные открытия— создавать новые предикаты.
Такую их способность часто рассматривают как нечто магическое, поскольку компьютеры принято считать устройствами, "просто работающими с тем, что им задано". Но в действительности новые предикаты непосредственно следуют из этапов обратной резолюции. Простейшим случаем создания таких предикатов является преобразование в гипотезы двух новых выражений С, и С, на основе выражения С. Применение операции резолюции к выражениям С, и С, приводит к удалению в этих лвух выражениях общего литерала, поэтому вполне возможно, что удаленный литерал содержал предикат, который не присутствовал в С. Таким образом, при проведении доказательства в обратном направлении одна из возможностей состоит в формировании нового предиката, из которого реконструируется недостающий литерал. На рис.
19.10 показан пример, в котором новый предикат г формируется в процессе изучения определения для отношения лпсезсож После его формирования предикат р может использоваться на дальнейших этапах обратной резолюции. Например, на одном из дальнейших этапов может быть выдвинута гипотеза, что мос)зег(х, у) ~р(х, у) . Таким образом, новый предикат р имеет смысл, определяемый процессом выработки гипотез, в которых он участвует. А обработка еше одного примера может привести к созданию ограничения василек(х,у) ~Р(х,у). Иными словами, предикат р представляет собой описание того, что обычно рассматривается как отношение рагепс. Как было указано выше, введение новых пре- 939 Глава 19.
Применение знаний в обучении причиной того, что эти методы были взяты на вооружение не только специалистами в области компьютерных наук, но и биологами. Применение методов 1ЬР способствует развитию не только биологии, но и других наук. Одним из наиболее важных таких направлений является обработка естественного языка, в котором системы 1ЬР используются для извлечения сложной реляционной информации из текста. Итоговые результаты, достигнутые в этом научном направлении, описаны в главе 23. 19.6. РЕЗЮМЕ В данной главе рассматривались различные способы, при использовании которых априорные знания могут помочь агенту обучаться на основе новых опытных данных. Поскольку основная часть априорных знаний выражена в терминах реляционных моделей, а не моделей, основанных на атрибутах, в настоящей главе описаны также системы, которые позволяют изучать реляционные модели. Наиболее важные идеи, изложенные в этой главе, перечислены ниже.
° Успешное применение априорных знаний в обучении показывает, что еще более перспективным является кумулятивное обучение, в котором обучающиеся агенты повышают свою способность к обучению по мере того„как приобретают все болыне и больше знаний. ° Априорные знания способствуют обучению, поскольку позволяют устранять ошибочные гипотезы, которые в ином случае считались бы совместимыми, а также "дополнять" объяснения примерами, что приводит к созданию более коротких гипотез.
Такие возможности часто позволяют добиться ускоренного обучения с помощью меньшего количества примеров. ° Априорные знания могут выполнять различные функции в логическом выводе, а описания этих функций, выраженные в форме ограничений логического следствия, позволяют определить целый ряд разнообразных методов обучения. ° В методе обучения на основе объяснения (Ехр!апагюп-Вазег( Ьеапз(пя — ЕВЬ) предусматривается извлечение общих правил из отдельных примеров путем формирования объяснений для этих примеров и обобщения объяснений.
Метод ЕВЬ представляет собой дедуктивный метод, с помощью которого знания основных принципов преобразуются в полезные, эффективные экспертные знания специального назначения. ° В методе обучения с учетом релевантиости (Ке!ечапсе-Вазед Ьеагшпя — КВЬ) используются априорные знания в форме определений для выявления релевантных атрибутов, что приводит к созданию уменьшенного пространства гипотез и ускорению обучения. Метод КВЬ обеспечивает также создание дедуктивных обобщений на основе отдельных примеров.
° В методе индуктивного обучения на основе знаний (Кпоч!езде-Вазед (пдцсг(хе Ьеапз)пя — КВГЬ) предусматривается поиск индуктивных гипотез, позволяющих объяснять множества результатов наблюдений с помощью фоновых знаний. ° В методах индуктивного логического программирования (1пг(цс11хе Ьоя(с Ргодгатш(пд — 1ЬР) метод КВ1Ь применяется к знаниям, выраженным в ло- 940 Часть 1Г[. Обучение гике первого порядка. Методы 1ЕР позволяют получать в процессе обучения такие реляционные знания, которое не могут быть выражены в системах на основе атрибутов.
° Индуктивное логическое программирование может осуществляться в рамках нисходящего подхода, в котором осуществляется уточнение очень общего правила, или восходящего подхода, обратного по отношению к процессу дедуктивного логического вывода. ° С помощью методов 1ЕР естественным путем вырабатываются новые предикаты, с помощью которых могут быть выражены новые емкие теории, поэтому они открывают возможность создания систем формирования научных теорий общего назначения. БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ ЗАМЕТКИ Хотя вполне очевидно, что одной из главных тем философии науки должно быть использование априорных знаний в обучении, ло последнего времени в этой области был проведен лишь небольшой объем работы. В книге Расг, Е1сгюп, але1 гогеслзг, написанной философом Нельсоном Гудманом [578], была опровергнута применявшаяся ранее гипотеза о том, что индукция сводится просто к изучению достаточного количества примеров некоторого высказывания с квантором всеобщности, а затем принятия его в качестве гипотезы.
Рассмотрим, например, гипотезу "Цвета всех изумрудов изменчивы", где под ек изменчивым подразумевается "зеленый, если наблюдения проводятся до времени с, но голубой, если наблюдения проводятся после этого'*. В любое время, предшествующее с, человеком могли бы рассматриваться миллионы примеров, подтверждающих правило, что цвета изумрудов изменчивы, и ни одного опровергающего примера, и тем не менее не была бы выражена готовность принять это правило. Такое свойство человеческой психики можно объяснить только с помощью анализа той роли, которую играют в процессе индукции релевантные априорные знания.
Гудман предложил рассматривать различные виды априорных знаний, которое могли бы оказаться применимыми в логическом выводе, включая одну из версий способа формулировки определений, называемую определением сверхгипотез. К сожалению, идеи Гудмана никогда не применялись в исследованиях по машинному обучению. Истоками подхода к обучения на основе объяснения явились методы, используемые в планировщике Бгпрз [465]. После формирования какого-то плана его обобщенная версия сохраняется в библиотеке планов и используется в дальнейшем планировании в качестве макрооператора. Аналогичные идеи просматриваются в архитектуре АСТ* Андерсона, где они выступают под названием компиляции знаний [31], и в архитектуре Боаг под названием формирование фрагментов [881].
Непосредственными причинами быстрого повышения интереса к методам обучения на основе объяснения стало появление методов приобретения схемы [379], аналитического обобщения [1062] и обобщения на основе ограничений [1056], которые были подытожены в статьях [381] и [1065]. Хирш [659] предложил алгоритм ЕВ[, описанный в данной книге, и показал, что этот алгоритм можно непосредственно включить в систему логического программирования. Ван Хармелен и Банди [1531] показали, что метод Глава 19.
Применение знаний в обучении 941 обучения на основе объяснения представляет собой олин из вариантов метода частичной оценки, используемого в системах анализа программ [742]. Проведенный в последнее время строгий анализ привел к лучшему пониманию потенциальных затрат и выгод, связанных с применением метода ЕВЬ, с точки зрения его влияния на скорость решения задач. Минтон [1057] показал, что использование метода ЕВ1.
без значительных дополнительных усилий со стороны пользователя вполне может привести к существенному замедлению работы любой программы. Тамб н др. [1488] обнаружили, что аналогичная проблема возникает при формировании фрагментов знаний, предназначенных для запоминания, и предложили способ уменьшения выразительной моши языка правил, позволяющий свести к минимуму стоимость операции согласования правил с содержимым рабочей памяти. В этой работе обнаружились явные аналогии с полученными недавно результатами анализа сложности логического вывода в ограниченных версиях логики первого порядка [см.
главу 9). Формальный вероятностный анализ ожидаемых преимуществ использования метода ЕВЕ можно найти в [595] и [1471]. Превосходный обзор этого метода приведен в [396]. Вместо использования примеров в качестве материала для обобщения их можно применять непосредственно для решения новых задач в процессе, называемом 'в. формированием рассуждений по аналогии. Такой метод формирования рассуждений осуществляется в нескольких вариантах, во-первых, в виде формирования приемлемых рассуждений с учетом степени подобия [540], во-вторых, в виде дедуктивного логического вывода, основанного на определениях, но требующего привлечения примеров [330], и, в-третьих, в виде метода ЕВЕ с "отложенным принятием решений", который позволяет корректировать направление обобщения старого примера с учетом потребностей решения новой задачи.
Последняя разновидность процесса формирования рассуждений по аналогии наиболее часто встречается в системах формирования рассуждения на основе конкретных случаев [830] и системах создания деривационной аналогии [1540]. Подход к использованию информации о релевантности в форме функциональных зависимостей был впервые разработан в сообществе пользователей баз данных, где он служит для структуризации больших множеств атрибутов на более легко управляемые подмножества. Функциональные зависимости применялись для формирования рассуждений по аналогии Карбонеллом и Коллинзом [222], а их трактовка, более подходящая для использования в логике, была предложена Бобровым и Рафаэлем [144]. Зависимости были повторно открыты независимо и подверглись всестороннему логическому анализу в работах Дэвиса и Рассела [329], [330].