Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 294
Текст из файла (страница 294)
Тем не менее целый ряд метафор применяется настолько широко, что мы даже не воспринимаем их как таковые. Одной из таких метафор является представление о том, что "чем больше, тем выше". Эта метафора позволяет нам говорить о том, что цены растут, повышаются или взмывают вверх, что температура понижается или падает, что чье-то доверие к кому-то рухнуло или что популярность какой-то знаменитости резко подскочила или пошла на убыль. Существуют два способа, позволяющих учесть наличие подобных метафор. Один из них состоит в том, чтобы включить все знания о метафоре в словарь — добавить новые толкования слов "расти", "падать", "повышаться" и т.д., чтобы описать их как относяшиеся к количествам любого масштаба, а не только к высоте. Этот подход является приемлемым для многих приложений, но не охватывает обобшаюший характер метафоры, которая позволяет людям использовать новые варианты ее реализации, такие как "войти в штопор" или "достичь заоблачных высот", без опасения быть непонятыми.
Второй подход состоит в том, что нужно включить в грамматику явно заданные знания об общих метафорах и использовать их для интерпретации новых вариантов применения по мере обнаружения в речи. Например, предположим, что в системе имеется информация о метафоре "чем больше, тем выше". Иными словами, система может определить, что логические выражения, ссылающиеся на точку шкалы высот, могут интерпретироваться как указываюШие на соответствуюгцие точки шкалы количеств.
В таком случае выражение ива1ез аге Ь18Ь" (объемы продаж высоки) получит буквальную интерпретацию по типу Л2 Сз Гис(е ( ьа1еп, Нздд), а это выражение можно будет интерпретировать метафорически как диане! су( эа2еэ, жгись) . Устранение неоднозначности Как было указано выше, ог- усврапепие неоднозначности — эпю проблема определения диагноза. Намерение говоряшего сообшить информацию становится ненаблюдаемой причиной появления слов в виде фрагмента речи, а задача получателя заключается в том, чтобы проделать эту работу в обратном направлении исходя из сказанных слов и знания ситуации, чтобы определить намерение говоряшего с 1084 Часть УП.
Общение, восприятие и осуществление действий наибольшей вероятностью. Иными словами, получатель находит решение для следуюшей задачи: агапах Ьа)гетдпооо(дпеепе ) еопо)а, ауеиаеаоп) Гпсепс где ьу)се19 боос) может представлять собой либо вероятность, либо любую другую числовую меру предпочтения. Предпочтение того или иного рода является необходимым, поскольку правила синтаксической и семантической интерпретации, отдельно взятые, не позволяют выявить уникальную правильную интерпретацию словосочетания или предложения. Поэтому данная работа делится на части: средства синтаксической и семантической интерпретация обеспечивают формирование множества потенциальных интерпретаций, а в процессе устранения неоднозначности среди них выбирается наилучшая. Обратите внимание на то, что выше было указано на намерение исполнителя речевого акта, а не просто на фактическое высказывание, провозглашаемое говоряшим.
Например, услышав от политика слова: "1 ат поГ а сгоо)г", можно формально назначить вероятность только 50%, что эти слова соответствуют высказыванию о том, что данный политик — не преступник, и 99,999% — высказыванию, что говоряший — не кривой посох пастуха. Тем не менее все равно следует присвоить большую вероятность следуюшей интерпретации, поскольку скорее всего именно это и подразумевалось: Лааегс(дреа)сег, (яреа)сеп е Спатзпа1а)) Рассмотрим е)це раз пример неоднозначного предложения; "1 зше11ег) а ччипрцз )и [2,2]".
Одной из предпочтительных эвристик является правило Ъ. правой ассоциации, которое гласит, что во время принятия решения о том, где можно поместить в дереве синтаксического анализа словосочетание рр "1п [2,2[", следует предпочесть вариант с размещением его в самой правой сугцествуюшей составляющей, а в данном случае таковой является словосочетание д)р "а ъчппрцз". Безусловно, это— всего лишь эвристика; при обработке предложения "1 зше))ед а ъчппрцз ччгп гпу позе" (Я почувствовал запах вампуса носом) эта эвристика будет перевешиваться тем фактом, что словосочетание ир "а чшприз чл(п ту позе" (вампус с моим носом) является маловероятным. Устранение неоднозначности обеспечивается путем комбинирования свидетельств с использованием всех методов представления знаний и формирования рассуждений в условиях неопределенности, которые рассматривались до сих пор в настоящей книге.
Все эти знания можно разбить на четыре описанных ниже модели. 1. Модель мира. Вероятность того, что некоторое высказывание является истинным в рассматриваемом мире. 2. Мыслительная модель. Вероятность того, что отправитель оформляет свое намерение сообшить о некотором факте получателю, при условии, что этот факт имел место. В таком подходе комбинируются модели того, в чем уверен отправитель, что думает отправитель о том, в чем уверен получатель, и т.д. 3.
Языковая модель. Вероятность того, что будет выбрана определенная строка слов, при том условии, что отправитель имеет намерение сообщить определенный факт. Модели СГО и ОСО, представленные в данной главе, имеют 1085 Глава 22. Общение булеву модель правдоподобия; в ней строка может иметь или не иметь определенную интерпретацию. В следующей главе рассматривается вероятностная версия грамматики СРО, позволяющая создать более информационно насыщенную языковую модель для устранения неоднозначности. 4. Акустическая модель. Вероятность того, что будет сформирована определенная последовательность звуков с учетом того, что отправитель выбрал данную конкретную строку слов.
Задачи распознавания речи рассматриваются в разделе 15.6. 22.7. ПОНИМАНИЕ РЕЧИ Ъ. Речь представляет собой языковой фрагмент произвольной длины, обычно превышающий по длине одно предложение. Как проявления речи рассматриваются учебники, романы, сообщения о погоде и разговоры. До сих пор в этой главе проблемы связной речи в основном игнорировались, поскольку язык проще изучать в лабораторных условиях, разделив речь на отдельные предложения.
А в этом разделе предложения рассматриваются в их естественной среде обитания. Он в основном посвящен двум конкретным подзадачам — разрешение ссылок и изучение связной речи. Разрешение ссылок Ъ. Разрешение ссылок представляет собой интерпретацию местоимения или определительного именного словосочетания, которое ссылается на некоторый обьект в мирем. Разрешение основано на знаниях о мире и на результатах анализа предыдуших фрагментов речи. Рассмотрим следующий отрывок текста: Джон помахал официанту. Он заказал бутерброд с ветчиной.
Чтобы понять, что слово "он" во втором предложении относится к Джону, необходимо знать, что в первом предложении упоминаются два человека и что Джон играет роль клиента, поэтому заказ, скорее всего, должен сделать он, а не официант. Обычно разрешение ссылок сводится к выбору референта (адресата ссылки) из списка кандидатов, но иногда эта задача требует создания новых кандидатов. Рассмотрим следующий отрывок текста: После того как джон сделал предложение Маше, они нашли свяшенника и поженились.
Чтобы отпраздновать медовый месяц, они отправились на Гавайи. Здесь определительное именное словосочетание "медовый месяц" относится к тому, что лишь неявно следует из ситуации, в которой используется глагол "поженились". Во втором предложении местоимение "они" указывает на группу людей, которая до сих пор еще не была явно обозначена как таковая — Джон и Маша (но не священник). и В лингвистике ссылка на то, что уже было сказано, называется анафорической ссылкой.
С другой стороны, ссылка на то, что епе должно быль сказано, называется катафорической ссылкой; таковой является местоимение "он'* в предложении шкогда он выиграв свой первый турнир, Тайгеру было 20 лет". 1086 Часть ЧП. Общение, восприятие и осугцествление действий Выбор наилучшего референта представляет собой процесс устранения неоднозначности, в основе которого лежит использование сочетаний разнообразной синтаксической, семантической и прагматической информации.
Некоторые намеки на правильные толкования заданы в форме ограничений. Например, местоимения должны быть согласованы в роде и числе со своими денотатами (словами, которые они заменяют): местоимение "он" может относиться к Джону, но не к Маше; местоимение "они" может относиться к группе, а не к отдельному лицу. Местоимения должны также подчиняться синтаксическим ограничениям, определяющим возвратные зависимости. Например, в предложении: "Он увидел его в зеркале" два местоимения должны ссылаться на разных людей, а в предложении: "Он увидел себя" местоимения должны ссылаться на одно и то же лицо.
Существуют также ограничения, касающиеся семантической согласованности. Например, в предложении: "Он съел это" местоимение "он" должно ссылаться на то, что ест, а "это" — нато, что едят. Некоторыми намеками могут служить предпочтения, которые не всегда соблюдаются. Например, если два смежных предложения имеют параллельную структуру, то предпочтительно иметь местоименные ссылки, в которых также соблюдается эта структура. Поэтому в следующем отрывке текста: Маша прилетела в Сан-Франциско из Нью-йорка. Джон прилетел туда из Бостона. мы предпочитаем такую трактовку, в которой местоимение "туда" ссылается на Сан-Франциско, поскольку оно играет такую же синтаксическую роль.
Если же параллельная структура отсутствует, то подлежащие как денотаты получают предпочтение над дополнениями, поэтому в следующем отрывке текста: Маша дала Салли указания по дому. Затем она ушла. предпочтительным денотатом для местоимения "она" является "Маша", подлежащее первого предложения. Еще один вариант предпочтения распространяется на сущность, которая в процессе речи выступает наиболее ярко. Рассмотрим следующую пару предложений, отдельно взятую; Дана уронила чашку на тарелку.