Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 295
Текст из файла (страница 295)
Она разбилась. При этом возникает проблема: не ясно, что является референтом местоимения "она" — чашка или тарелка. Но в более широком контексте эта неоднозначность устраняется: Дана очень любила синюю чашку. Зта чашка была подарена близким другом. К сожалению, однажды, накрывая на стол, Дана уронила чашку на тарелку. Она разбилась. В данном случае фокусом внимания является чашка, и поэтому рассматривается как предпочтительный референт. Был разработан целый ряд алгоритмов разрешения ссылок. Особенно замечательным является один из первых таких алгоритмов, разработанный Хоббсом [6621, поскольку он позволил достичь необычно высокой в то время степени статистической достоверности.
Хоббс использовал тексты трех разных жанров и сообщил о том, что с помощью этого алгоритма достигнута точность 92% Условием проведения этих экспериментов должны были стать правильные результаты синтаксического анализа, выработанные синтаксическим анализатором; не имея такового в своем распоряжении, Хоббс составлял деревья синтаксического анализа вручную.
1087 Глава 22. Общение Алгоритм Хоббса действует на основе поиска: в нем осу)цествляется поиск в предложениях, начиная от текущего предложения и двигаясь в обратном направлении. Такой метод гарантирует, что в первую очередь будут рассматриваться последние по времени определенные кандидаты. Поиск в предложении осуществляется в ширину, слева направо.
Это гарантирует, что подлежащие будут рассматриваться перед дополнениями. В алгоритме выбирается самый первый кандидат, который удовлетворяет описанным в этом абзаце ограничениям. Структура связной речи Откройте данную книгу на 10 случайно выбранных страницах и запишите на бумагу первое полное предложение с каждой страницы. Полученный текст обязательно будет несвязным.
Аналогичным образом, если вы возьмете связный отрывок текста, состоящий из 1О предложений, после чего переставите эти предложения случайным образом, то получите несвязный текст. Такой эксперимент показывает, что предложения в речи на естественном языке весьма отличаются от высказываний в логике. В логике после ввода в базу знаний с помощью предиката те1).
высказываний л, ди свлюбом порядкебудетполучена конъюнкция л л в п с. Авестественном языке играет роль порядок предложений; в качестве примера можно указать, насколько отличаются следующие два ответа на просьбу показать дорогу; "Пройдите два квартала. Поверните направо" и "Поверните направо. Пройдите два квартала'. Речь обладает структурой, возвьпнающейся над уровнем предложения. Эту структуру можно исследовать с помощью грамматики речи: дедтепс(х) †) д(х) дедтепг(сейегепсеяе1аезеп(х, у)) -е Бедтепс(х) Бедтепс(у) Приведенные выше грамматические правила указывают, что речь состоит из отрывков, где каждый отрывок представляет собой либо предложение, либо группу предложений, а сами отрывки связаны Ъ.
отношениями связности. В отрывке текста "Пройдите два квартала. Поверните направо" отношение связности состоит в том, что действие, указанное в первом предложении, создает предпосылки действия во втором предложении: получатель должен повернуть направо, только пройдя два квартала. Разные исследователи предложили различные варианты определения отношений связности; один из типичных перечней таких отношений приведен в табл. 22.7. Теперь рассмотрим приведенный ниже рассказ. 1. Вчера произошло забавное событие.
2. Джон отправился в модный ресторан. 3. Он заказал утку. 4. Счет составил почти 50 долларов. 5. Джон буквально испытал шок, обнаружив, что у него нет денег. 6. Он забыл кошелек дома. 7. Официант сказал, что можно заплатить позже. 8. Но он очень расстроился из-за своей забывчивости. !088 Часть чг]1. Общение, восприятие и осуществление действий Таблица 22.7. Перечень отношений связности, взятый из (663]. Кавщое отношение связывает два смежных фрапиента текста, 5, н вг Отношение свшвссти Описание Примечание Пример Описание предпо- сылки или причины "! гчепг овгз]бе.
1 дгоче го зс)гоо!" (Я вышел из до- ма. Я поехал в школу.) Выход из лома неявно создает предпосылки для поездки в автомобиле Объяснение — отно- шение связности, об- ратное описанию предпосылки "! гчаз!аге Гог зсйоо!. 1 очегз!ерг" (Я опоздал в школу. Я проспал.) Фрагмент текста 5, опи- сывает обстановку или предысторию для фраг- мента текста вг Подготовительное описание Оценка Применение в каче- стве примера Фрагменттекста 5, прел- ставляет собой пример общего принципа, опи- санного во фрагменте текста 5г Обобщение Констатациятого факта, что ожидания не оправдались Фрагмент текста вг от- ражает изменение со- стояния (которое может быть неявным), ставшее предпосылкой или при- чинойой того, что описано ВО фРаГМЕНтс тЕКСта вг Фрагмент текста 5, опи- сывает предпосылку или причину того, чем вы- звана ситуация, прел- ставленная во фрагменте текста 5„н тем самым служит для нее объясне- нием Из фрагмента текста 5, следует, что фрагмент текста 5, является реали- зацией плана говорящего по его использованию в составе речевого акта Фрагмент текста 5, пред- ставляет собой пример общего принципа, опи- санного во фрагменте текста 5, Вывод на основании фрагмента текста вг СЛСЛ- ствия в, отрицающего следствие Р, которое при обычных обстоятельствах должно бьшо быть полу- чено на основании фраг- мента текста 5, "!г гчаз а баг]г апд моггпу п]ййг.
](езг аул!агу" (Была темная и ветреная ночь. Остальная часть рас- сказа.) "А бзппу гб]пй баррелей Кезг аул]агу" (Одникдьг произошло забавное со- бытие. Остальная часть рассказа.) "Тййз а!йопйпп гечегзез а 11м. Тйе [прш [л, в, с] И шарреб го [с,в,л1" (Зтст алгоритм служит для обращения списка. Входные данные [л, в, с! преобразуются в [с в л] ) "[л,в,с! !зшарредго [с, в, л!. [п вепега], йе а!йог[йш гечешез а 1!м" (Входные данные [л, в, с] преобразуются в [с,в,л]. Вобщемэтот алгоритм служит для об- ращения списка.) "Тййз рарег ]ычеа]г. Оп йе о(бег ]заид, И [з 'ппегезг!пй" (Эта статья слаба.
С другой сторо- ны, она представляет интерес.) 1089 Глава 22. Общение Здесь предложение 1 находится в положении отношения оценки для остальной части речи; предложение ! представляет собой метакомментарий говорящего ко всему рассказу. Предложение 2 создает предпосылки предложения 3, а предложения 2 и 3, вместе взятые, указывают причину для предложения 4 с учетом того неявного промежуточного состояния, что Джон съел утку.
Теперь предложения 2 — 4 становятся обоснованием остальной части рассказа. Предложение 6 служит объяснением предложения 5, в предложения 5 и 6 являются предпосылкой для 7. Следует подчеркнуть, что они являются предпосылкой, а не причиной, поскольку официант мог среагировать на эту ситуацию иначе. Предложения 5 — 7, вместе взя.ые, становятся причиной для предложения 8.
В упр. 22.13 предлагается нарисовать дерево синтаксического анализа для этого рассказа. Отношения связности позволяют связать речь в единое целое. Они служат для говорящего руководящими указаниями при принятии решения о том, что следует сказать и что оставить не выраженным явно, а также служат руководством для получателя при восстановлении информации о намерениях говорящего. Отношения связности могут служить в качестве фильтра при устранении неоднозначности предложений: предложения, отдельно взятые, могут оказаться неоднозначными, но большинство из этих неоднозначных интерпретаций перестают согласовываться друг с другом в связной речи.
До сих пор вопросы разрешения ссылок и структуры речи рассматривались раздельно. Но фактически эти два вопроса тесно переплетаются. Например, в теории Гроша и Сиднера [598) учитывается, на что направлено внимание говорящего и слушающего во время речи. В их теорию включено описание стека ж пространств фокусов. Некоторые фрагменты речи вызывают сдвиг фокуса путем заталкивания или выталкивания элементов из стека.
Например, в истории с рестораном предложение: "Джон отправился в модный ресторан" заталкивает в стек новый фокус внимания. В пределах данного фокуса отправитель может использовать определенное словосочетание дгр, чтобы указать на "этого официанта" (а не просто на "какого-то официанта"). Если бы рассказ был продолжен словами: "Джон отправился домой", то данное пространство фокусов было бы вытолкнуто из стека и в рассказе больше нельзя было бы указывать на официанта словами "этот официант** или "он". 22.8. ИНДУКТИВНЫЙ ВЫВОД ГРАММАТИКИ Ж Индуктивный вывод грамматики представляет собой задачу определения с помощью обучения грамматики на основе данных. Очевидно, что попытка решить такую задачу вполне оправдана, поскольку практика показала, насколько сложно конструировать грамматику вручную, а в 1пгегпег можно бесплатно получить миллиарды готовых примеров фрагментов речи.
Но такая задача является сложной, поскольку пространство возможных грамматик бесконечно, а проверка того, что данная конкретная грамматика производит необходимое множество предложений, требует больших вычислительных затрат. Одной из интересных моделей является система Бецшгцг ~! 122). Для нее не требуется никаких входных данных, кроме одного отрывка текста (который не требуется даже предварительно разбивать на предложения). Эта система формирует грамматику в очень специализированной форме — грамматику, которая производит лишь Часть »с[1. Общение, восприятие и осуществление действий 1090 единственную строку, а именно первоначальный текст.
Иначе к анализу результатов этой системы можно подойти таким образом, что Вес)шгцг в процессе обучения определяет лишь такой обьем грамматических правил, который является достаточным для синтаксического анализа данного текста. Ниже приведена приемлемая разбивка с помощью скобок, обнаруженная этой системой для одного предложения из более крупного текста с информацией о новостях. [Нояп ЬаЬопт][яеппьюепе [[ьгоп1с) яс111][бачох СЬе] апо11сзоп]] [[от [еье нопяе])[оГ ьотс)я]] В этом фрагменте правильно выделены такие составляющие, как словосочетание РР "оу [Ье Ноцзе оу [ огг]з", хотя и допущены отклонения от традиционного метода анализа, например артикль ЦЬе" включен в одну группу с предшествуюгцим глаголом, а не со следующим существительным.
Система Вес)п)гог основана на той идее, что "хорошая грамматика — компактная грамматика". В частности, в ней принудительно применяются следующие два ограничения. Во-первых, ни одна пара смежных символов не должна появляться в грамматике больше одного раза. Если пара символов А в появляется в правой части нескольких правил, то эту пару следует заменить новым нетерминальным символом, назвать его, допустим, С и ввести правило С вЂ” »А В.
Во-вторых, каждое правило должно использоваться по меньшей мере дважды. Если некоторый нетерминальный символ С появляется в грамматике только один раз, то необходимо удалить правило для С и заменить его единственное вхождение правой частью данного правила. Эти два ограничения применяются в процедуре жадного поиска, которая сканирует текст слева направо, инкрементно наращивая в ходе этого грамматику и налагая ограничения, как только появляется такая возможность.