Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 289
Текст из файла (страница 289)
В английском и многих других языках требуется Ъ. согласование между подлежащим и основным глаголом предложения. Например, если подлежашим является о!", то предложение о! зше!!" является грамматически правильным, а "1 зше1!з" — нет. Если же подлежащим является "1(", то верно противоположное. В английском языке различия, обусловленные согласованием, являются минимальными: большинство глаголов имеют одну форму для подлежащего, представляющего собой местоимение третьего лица в единственном числе ("Ье", "я))е" или "1("), и вторую форму для всех других комбинаций лица и числа.
Есть только одно исключение: словосочетания "1 ат / уои аге / ))е )я" имеют три формы. Умножая эти три разные формы на две разные формы ир, И Иро, ПОЛУЧИМ ШЕСТЬ фОрМ ИР. ЕСЛИ бЫ КОЛИЧЕСТВО раЗЛИЧИй бЫЛО ЕШЕ бОЛЬШЕ, тО в конечном итоге общее количество вариантов выражалось бы экспоненциальной зависимостью. Альтернативный подход состоит в том, что необходимо 'як расширить сушествуюшие правила грамматики, а не вводить новые правила.
Вначале приведем пример того, как могли бы выглядеть расширенные правила (см. нижнюю часть листинга 22.5), а затем формально определим способ интерпретации этих правил. Расширенные правила допускают применение параметров в нетерминальных категориях. В листинге 22.5 показано, как описать грамматику Е, с использованием расширенных правил. Категории ир и Рпспоип имеют параметр, обозначающий их падеж. (Сушествительные не имеют падежа в английском языке, но имеют его во многих других языках.) В правиле для е словосочетание ир должно находиться в именительном падеже, тогда как в правилах для (гр и РР словосочетание ир должно 1067 Глава 22. Общение находиться в объектном падеже. Правило для в)Р принимает в качестве парамЕтра некоторую переменную, саяе.
Назначение этой конструкции состоит в том, что словосочетание в)Р может иметь любой падеж, но если вместо этого словосочетания ИР подставляется местоимение Рхспсип, то последнее должно иметь такой же падеж. Применение переменных, позволяющее исключить необходимость принятия решения, когда различие, определяемое переменной, не имеет значения, способствует тому, что не приходится увеличивать размер множества правил в экспоненциальной зависимости от количества рассматриваемых характеристик. Используемая для такого дополнения формальная система называется Ъ. грамматикой определенных выражений, или сокращенно ОСО (Оебпйе С!авве Огапппаг), поскольку каждое правило этой грамматики можно интерпретировать как определенное выражение' в хорновской логике.
Вначале мы покажем, как можно интерпретировать в качестве определенного выражения обьзчные, нерасширенные правила. Мы будем рассматривать каждый символ с обозначением категории как предикат, заданный на строках, поэтому выражение ггР(я) принимает истинное значение, если строка я образует некоторое словосочетание в)Р. Следующее правило СГО: Л -Ч ДГР РР является сокращенным обозначением для следующего определенного выражения: дгр(яг) л ъ'Р(яг) =г Я(ягаяг) Здесь я,+ я, обозначает конкатенацию двух строк, поэтому данное правило говорит о том, что если строка я, представляет собой словосочетание мр, а строка я,— словосочетание (гр, то их конкатенация представляет собой словосочетание ~; это означает, что данная интерпретация точно соответствует тому, как мы уже интерпретировали это правило СГО.
Важно отметить, что пу грамматика определенных выражений дозволяет рассматривать синтиксичеекий анализ как логический вывод. Такой подход открывает возможность рассуждать о языках и строках с помощью многих разных способов. Например, он означает, что восходящий синтаксический анализ можно осуществлять с помощью прямого логического вывода, а нисходящий синтаксический анализ — с помощью обратного логического вывода.
Как будет показано ниже, это также означает, что одна и та же грамматика может использоваться и для синтаксического анализа, и для производства новых предложений. Но самым важным преимуществом подхода на основе РСО является то, что он дает возможность дополнять символы категорий вспомогательными параметрами, отличными от обычных строковых параметров. Например, следующее правило: д)Р(саяе) -з Ргопоип(саяе) является сокращенным обозначение для такого определенного выражения: Ркопоип(саяе, яг) =г г(Р(саяе, яг) Это правило гласит, что если строка я, представляет собой местоимение Рдспсип с падежом, указанным переменной саяе, то я, также представляет собой словосочетание )г(Р с тем же падежом.
Вообще говоря, символ категории может быть з Напомним, что определенное выражение, будучи записанным в виде импликации, имеет в своем следствии точно один атом, а в своей предпосылке — конъюнкцию атомов в количестве от нуля яли больше. Двумя примерами таких выражений являются л л в ~ с и просто с. !068 Часть ЪЧ1.
Общение, восприятие и осуществление действий дополнен любым количеством формальных параметров, а сами формальные параметры могут заменяться фактическими параметрами, подлежащими унификации, как в обычном логическом выводе с использованием хорновских выражений. Но за такое удобство приходится платить: в распоряжение составителя грамматики передается все мощь системы автоматического доказательства теорем, поэтому приходится отказываться от гарантированного выполнения синтаксического анализа за время о(п'); задача синтаксического анализа грамматики с расширениями может оказаться ХР-трудной или даже неразрешимой, в зависимости от этих расширений. Для того чтобы обеспечить применение грамматики РСО, необходимо воспользоваться еще несколькими приемами; например, требуется способ задания терминальных символов, кроме того, было бы удобно иметь возможность не вводить автоматический строковый параметр.
Учтя все эти пожелания, авторы решили, что нужно задать грамматику определенных выражений как описано ниже. ° Запись х — ) у х .. должна быть преобразована в запись у(я,) л г(э,) л ... => Х(э,+я,+...). ° Запись х — + у [ х [ ... должна быть преобразована в запись у(э) Х(э) м ....=ь Х(я). ° В том и в другом приведенном выше правиле любой нетерминальный символ у может быть дополнен одним или несколькими параметрами. Каждый параметр может представлять собой переменную, константу или функцию от некоторых параметров.
После перевода в форму определенного выражения эти параметры должны предшествовать строковому параметру (например, терм л(Р(саяе) переводится в формул(Р(саяе, я,) ). ° Запись ( Р( .. ) ) может появляться в правой части правила и буквально переводится в Р(... ) . Это позволяет составителю грамматики вставлять проверку для терма . (... ) без необходимости добавления автоматического строкового параметра. ° Запись х — ~ згокет переводится как х( [ьозх11) . Проблему согласования подлежащего и глагольного сказуемого также можно решить с помощью дополнений, но мы отложим эту задачу до упр.
22.2. Вместо этого решим более сложную задачу, такую как субкатегоризация глагола. Субкатегоризация глагола Грамматика Е, является более совершенной по сравнению Е,, но все'еще допускает перепроизводство. Один из ее недостатков состоит в том, какой способ применяется для соединения глагольных словосочетаний с другими словосочетаниями. Требуется, чтобы считались приемлемыми глагольными словосочетаниями только такие группы слов, как "8пе те г))е 8оЫ** (отдай мне золото) и "8о го [1,2[" (отправляйся в квадрат [1,2]). Все эти словосочетания входят в состав языка Е,, но, к сожалению, порождаются также словосочетания "8о те г)зе 8о1((" и "8)хе (о [1,2Г'. Язык Е, позволяет устранить подобные словосочетания УР путем явного указания на то, какие словосочетания могут следовать за теми или иными глаголами.
Список с такой информацией называется списком 'в. субкатегоризапии для глагола. Идея этого подхода состоит в том, что категория (ген)з подразделяется на субкатегории— 1069 Глава 22. Общение Допустимо, чтобы глагол имел несколько различных субкатегоризаций, точно так же, как и слово может принадлежать к нескольким разным категориям. В действительности и глагол "я[че'* имеет список субкатегоризации []чр, дгр], как в словосочетании "О]че гпе йе яо]с)".
Такую ситуацию можно рассматривать как еще одну разновидность неоднозначности, требующей устранения. В табл. 22.4 приведены некоторые примеры глаголов и их списков субкатегоризации [или сокращенно субкатегоризаций). Таблица 22.4. Примеры глаголов с их списками субкатегоризаиии Глагол Список субкатегоризации Пример глагольного словосочетания [!ЧР, РР) [с!Р, 1ЧР) [!т'Р] [Асйессгче] [РР] [Ая)есггче] [РР] [!ч Р) П Л В!че В!че йе Во!д гп 3 3 го ие В!че гпе йе ВОЫ яцеп а лчпирпз згпеП алч[п! япей зиеП 1Рке а лчшпрпз Н япейу Ни 2 2 йарп сйеб сйеб Ье)!ече ЬеИече йе вчппрщ !з г[еад Для того чтобы включить механизм субкатегоризации глагола в грамматику, необходимо выполнить три этапа.