Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 249
Текст из файла (страница 249)
Но как только агент съест плод с Древа познания, он не будет больше обязан заниматься подобными примитивными рассуждениями, а должен использовать свои фоновые знания лля все более эффективного обучения. Таким образом, вопрос заключается в том, как фактически следует использовать знания в обучении. Некоторые простые примеры Рассмотрим некоторые общеизвестные примеры обучения на основе фоновых знаний.
При этом необходимо учитывать, что во многих формах поведения, требующих логического вывода релевантных гипотез в связи с поступлением новых результатов наблюдения, не применимы даже самые элементарные принципы чистой индукции. ° Иногда возникают ситуации, в которых люди сразу же приходят к общим заключениям после одного лишь наблюдения.
Перу Гэри Ларсона принадлежит юмористический рисунок, на котором вооруженный очками пещерный человек Зог поджаривает на огне ящерицу, насаженную на заостренную палочку. За ним наблюдает восхищенная толпа его менее интеллектуальных соплеменников, которые до сих пор всегда разогревали свою пишу над огнем, держа ее голыми руками.
Этот наглядный пример является достаточным для того, чтобы ознакомить зрителей с общим принципом безболезненного приготовления пиши. ° В качестве еще одного примера рассмотрим случай, в котором путешествен- ник, прибывший в Бразилию, встречает первого в своей жизни бразильца. Ус- 915 Глава 19. Применение знаний в обучении лышав от него речь на португальском языке, путешественник сразу же приходит к выводу, что бразильцы говорят на португальском, но узнав, что его собеседника зовут Фернандо, он не делает вывод, что все бразильцы носят имя Фернандо. Аналогичные примеры можно найти в любой научной области.
Например, когда начинающий студент-физик измеряет плотность и проводимость медного образца при определенной температуре, он без колебаний обобщает эти данные на все предметы из меди. Но измерив затем массу этого образца, студент даже не рассматривает такую гипотезу, что все предметы из меди имеют такую же массу. С другой стороны, он может вполне резонно сделать такое обобщение относительно всех монет одинакового достоинства. ° Наконец, рассмотрим случай, в котором незнакомый с фармакологией, но глубоко освоивший специальность диагностики студент-медик присутствует на консультации, которую дает пациенту опытный терапевт.
После ряда вопросов и ответов специалист сообщает пациенту, чтобы он прошел курс лечения каким-то конкретным антибиотиком. На основании увиденного студент- медик выводит общее правило, что данный конкретный антибиотик является эффективным средством лечения при данном конкретном типе инфекции. Все эти случаи относятся к такому типу, в котором ог- использование фоновых знаний обеспечиваепг гораздо более быстрое обучение по сравнению с тем, чего можно ожидать при использовании программы чисто индуктивного обучения.
Некоторые общие схемы В каждом из предыдуших примеров имеется возможность обратиться к априорным знаниям, чтобы попытаться обосновать выбранный способ обобщения. В данном разделе рассмотрим, какого рода ограничения логического следствия применяются в каждом из этих случаев. В таких ограничениях, кроме гипотезы НуроСЛев1В, описаний наблюдаемых примеров певсх1рг1опв И КЛаеенфИкации с1авэ111са гдопв, применяются фоновые знания Васкдхоипсь В случае поджаривания ящерицы пещерный человек проводит обобщение, объясняя своим соплеменникам успех, достигнутый с помощью заостренной палочки, — он держит ящерицу над огнем и вместе с тем не приближает руки к огню.
Из этого объяснения его соплеменники могут вывести общее правило, что для поджаривания небольших мясистых съедобных объектов можно использовать любой длинный, твердый, заостренный предмет. Процесс обобщения такого рода получил название Ъ. обучения на основе объяснения, или сокращенно ЕВЬ (Ехр1апайоп-Вазед Ьеагп1пя). Обратите внимание на то, что общее правило следует логически из фоновых знаний, которыми обладают рассматриваемые в данном примере пещерные люди. Поэтому ограничения логического следствия, которые удовлетворяются в процессе ЕВЬ, являются таковыми: Нуроспев1в л Вевсх1рсдопв 'ь= С1авв111саецсав Васкдхоипгз Ы Нурссьевдв Поскольку в процессе ЕВЬ используется уравнение 19.3, на первых порах он рассматривался как наилучший способ обучения на примерах.
Но в связи с тем, что для обучения на основе объяснения требуется, чтобы фоновые знания были достаточными для объяснения гипотезы нурасдевдв, которая в свою очередь объясняет ре- 916 Часть чч. Обучение зультаты наблюдений, э- в действительности агент из полученного экземпляра примера не извлекает никаких принципиально новых знаний. Дело в том, что агент мог бы просто вывести логическим путем предъявленный ему пример из того, что он уже знает, хотя для этого, возможно, потребовался бы неоправданно большой объем вычислений. В настоящее время обучение на основе объяснения рассматривается как метод преобразования теорий, складывавшихся из основных принципов, в полезные знания специального назначения.
Алгоритмы обучения на основе объяснения рассматриваются в разделе 19хй В следующем примере, когда речь шла о путешественнике в Бразилию, ситуация совсем иная, поскольку не каждый путешественник знает о том, почему встретившийся ему бразилец говорит именно на португальском языке, если этот путешественник никогда не слышал о соответствующих буллах, изданных папой Римским. Более того, к аналогичному обобщению мог бы прийти путешественник, полностью незнакомый с историей португальских колоний. Соответствующие априорные знания состоят в том, что в каждой конкретной стране большинство людей, как правило, говорят на одном и тот же языке; с другой стороны, не предполагается, что имя Фернандо носят все бразильцы, поскольку указанная закономерность, касающаяся общего языка для всей страны, не распространяется на имена.
Аналогичным образом, начинающий студент-физик вряд ли мог бы объяснить, почему измеренные им значения проводимости и плотности меди являются именно таковыми. Но он знает, гго проводимость объекта зависит и от материала, из которого состоит объект, и от его температуры. В данном случае априорные знания Вас)гдхоипг) касаются 'в. релевантности множества характеристик по отношению к целевому предикату, Эти знания, наряду с результатами наблюдений, позволяют агенту вывести новое, общее правило, которое объясняет результаты наблюдений, следующим образом: Нурослея1я л Ыеясх1ре1опя )= С1аяя111сае1ооя Васндхоипг) н Веясхзргйопя л С1аяяйезсаезопя и нуроЬЛея1я (19.4) Мы будем называть обобщение такого рода 'в. обучением с учетом релевантиости, или сокращенно КВЬ (Ке)ечапсе-Вазег) Ьеагп)пя), хотя такое название указанного метода обучения не является общепринятым.
Обратите внимание на то, что в обучении с учетом релевантности используются результаты наблюдений, но не вырабатываются гипотезы, выходящие за пределы логического содержания фоновых знаний и наблюдений. Оно представляет собой дедуктивную форму обучения и поэтому не может само по себе рассматриваться как создание новых знаний с пустого места. А в том случае, когда студент-медик наблюдает за работой опытного врача, предполагается, что априорных знаний студента достаточно, чтобы прийти к заключению на основании симптомов о том, каково заболевание 1) этого пациента. Но этого не достаточно, чтобы объяснить тот факт, что врач прописал конкретное лекарство м.
Студент должен выдвинуть гипотезу, касающуюся еще одного правила, а именно, что лекарство )и обычно является эффективным средством против заболевания 1). С учетом этого правила и априорных знаний студент может теперь объяснить, почему в данном конкретном случае опытный врач прописал лекарство )к Этот пример можно обобщить так: указать, что он основан на приведенном ниже ограничении логического следствия. Васхдхоипо л Нуроелея1* н Пеясгйрс1опя я С1аяязгзсасзопя (19.5) Глава 19. Применение знаний в обучении 9)7 Это означает, что а для вбъяспенил примеров объединяются фоновые знаиия и новая гипотеза. Как и при чисто индуктивном обучении, алгоритм обучения должен выдвигать гипотезы, которые являются как можно более простыми и совместимыми сданным ограничением.
Алгоритмы, удовлетворяющие ограничению 19.5, называются алгоритмами ск индуктивного обучения иа основе знаний, или сокращенно КВ1Ь (Кпов1едйе-Вазед 1пдцсг)те 1.еагп1пй). Алгоритмы КВП, которые подробно описаны в разделе 19.5, в основном исследовались в области 'в. индуктивного логического программирования, или сокращенно 1ЬР (1пбцсбте Ьой)с Ргойгатпппй). В системах! ЬР априорные знания выполняют две описанные ниже ключевые функции при решении задачи уменьшения сложности обучения. 1. Поскольку любая сформированная гипотеза должна быть совместимой с априорными знаниями, а также с новыми наблюдениями, эффективный размер пространства гипотез сокращается таким образом, чтобы в него были включены только теории, согласованные с тем, что уже известно. 2.
Для любого конкретного множества наблюдений размер гипотезы, требуемый для формирования объяснения полученных результатов наблюдений, может быть намного сокращен, поскольку доступны априорные знания, на которые могут опираться новые правила при формировании объяснений результатов наблюдений. А чем короче гипотеза, тем проще ее сформулировать. Системы !ЬР не только позволяют использовать в процессе индукции априорные знания, но и дают возможность формулировать гипотезы на языке обшей логики первого порядка, а не на ограниченном языке, основанном на атрибутах, который рассматривается в главе 18. Это означает, что подобные системы могут осуществлять обучение в таких вариантах среды, которые остаются недоступными для понимания при использовании более простых систем.
19.3. ОБУЧЕНИЕ НА ОСНОВЕ ОБЪЯСНЕНИЯ Как было описано во введении в данной главе, обучение на основе объяснения представляет собой метод извлечения общих правил из отдельных результатов наблюлений. В качестве примера рассмотрим задачу дифференцирования и упрощения алгебраических выражений (упр. 9.15). После выполнения дифференцирования по Х такого выражения, как Х', будет получено выражение 2Х (Обратите внимание на то, что мы используем прописную букву для обозначения арифметического неизвестного х, чтобы отличить его от логической переменной х.) В системе формирования логических рассуждений такая цель может быть выражена как дв)с (г)есз ма гаге (х', х) =с), кд) с предполагаемым решением д=2х.
Любой, кто знает дифференциальное исчисление, может найти данное решение, лишь "ознакомившись с условиями задачи", благодаря приобретенным ранее навыкам решения подобных задач. А перед студентом, столкнувшимся с подобными задачами впервые, или перед программой, не накопившей опыта в решении этих задач, возникают гораздо более существенные затруднения. Применение стандартных правил лифференцирования в конечном итоге приводит к получению выражения Часть У). Обучение 918 1х(2х(х" "') ), а это выражение в дальнейшем упрощается до 2х. В логической программной реализации, подготовленной авторами данной книги, для решения такой задачи потребовалось 136 шагов доказательства, причем 99 из этих шагов относились к тупиковым ветвям доказательства. Тот, кто накопил такой отрицательный опыт, вполне естественно, стремится к тому, чтобы та же программа решала аналогичную задачу намного более быстро, встретившись с ней в следуюший раз.