Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 298
Текст из файла (страница 298)
] э„), либо занять какое-то промежуточное положение. Выдающие лингвисты, такие как Хомский [251[, [252] и Пинкер [1211], [1213], использовали результат Голда для доказательства того, что должна существовать врожденная Ъ. универсальная грамматика, которой все дети владеют от рождения. При этом особый интерес представляет так называемый довод о бедности стимула (Рочепу о( гпе Бг!шц!цз), согласно которому дети не получают другой входной языковой информации, кроме положительных примеров: их родители и сверстники главным образом вырабатывают точные примеры используемого ими языка и очень редко исправляют ошибки. Таким образом, поскольку Голд доказал, что определение с помощью обучения контекстно-свободной грамматики на основании положительных примеров является невозможным, то дети уже обязаны "знать" эту грамматику и в процессе обучения языку просто настраивают некоторые параметры этой врожденной грамматики и учат словарь.
Хотя эти доводы продолжают повторять многие лингвисты школы Хомского, они были опровергнуты некоторыми другими лингвистами [436], [1243[ и большинством ученых, работающих в области компьютерных наук. Еще в 1969 году Хорнинг [679] показал, что с помощью такого 1097 Глава 22. Общение метода, как РАС-обучение, можно определить с помошью обучения вероятностную контекстно-свободную грамматику. С тех пор было проведено много убедительных эмпирических демонстраций успешного обучения на основании только положительных примеров, таких как работы в области 1ЬР [1075] и )! 10! ], а также замечательные докторские диссертации [350) н [1370). С помощью обучения возможно также определить и другие грамматические формальные системы, такие как регулярные языки [386], [! 157], регулярные древовидные языки [226] и конечные автоматы )1173].
Система Бег!ц!гпг разработана Невилл-Маннингом и Уиттеном [1122]. Интересно отметить, что эти авторы, так же как и де Маркен, указали, что предложенные ими схемы индуктивного вывода грамматики представляют собой одновременно хорошие схемы сжатия. Этот результат соответствует принципу кодирования с минимальной длиной описания: из определения качественной грамматики следует, что она должна минимизировать сумму двух значений длины: длины грамматики и длины дерева синтаксического анализа текста. К работам в области индуктивного логического программирования, относяшимся к определению языка с помошью обучения, принадлежат система С!й!1 [1640) и программа Муни и Калиффа [1076); эти работы позволили определить правила для прошедшего времени глаголов лучше, чем до сих пор удавалось добиться с помощью нейронных сетей или систем деревьев решений.
[315) представляет собой отредактированный сборник статей по определению с помощью обучения языка средствами логики. Ассоциация АС1 (Азаос(абоп гог Согпрцга1юпа! Ь[пйшз1!сз) проводит регулярные конференции и публикует журнал Сотри(а((опа! Ав8и(гг(сг.
Проводится также конференция!п(егпа(гола! Соп~егепсе ол Сотри(абопа( 7т8и(е(кз (С01.!ХО). Многие важные ранние статьи собраны в антологии ((еаб(п8г т (га(ига( 7.ал8иа8е Ргосезг!п8 [599). В [321[ основное внимание уделено описанию инструментальных средств, практически применимых для создания систем ]х[ЬР. В [756] приведено исчерпываюшее введение в эту область, [18] посвяшена описанию работ, проведенных немного раньше. В [298) и [1207] приведен краткий обзор по синтаксической обработке с помощью различных реализаций на языке Рго]ой. Много полезных статей с описанием этой области приведено в книге Епсус(ореб(а оу А7; особого внимания заслуживают статьи "Сотри(а(гола(Ь(л8и(г((сг" и "с(а(ига! (ап8иа8е Юпбегг(алб(л8 .
УПРАЖНЕНИЯ 22.1. Прочитайте следующий текст с описанием процедуры, состоящей из четырех этапов, чтобы понять его смысл, и запомните столько, сколько сможете. Достигнутые вами успехи будут оценены позже. Эта процедура фактически весьма проста. Сначала нужно распределить вещи по разным группам. Конечно, для одного раза может оказаться достаточно одной стопки, в зависимости от того, сколько еше предстоит сделать. Если вам потребуется отправиться куда-то еще из-за нехватки необходимых средств, то в этом будет состоять следуюший этап, а если нет, то вы уже достаточно хорошо подготовились. Набирая вещи, важно не переусердствовать. Это означает, что лучше сразу проделывать эту процедуру со слишком малым, чем со слишком большим !098 22.2.
Используя систему обозначений РСО, напишите грамматику языка, который полностью аналогичен б,, за исключением того, что требует соблюдения со- 22.7. 22.3. 22.4. 22.5. 22.6. Часть ЧП. Общение, восприятие и осуществление действий количеством вещей. Если прошло егце мало времени с начала процедуры, это может показаться неважным, но могут легко возникнуть осложнения. И в этом случае ошибки обходятся дорого. Сначала вся эта процедура будет казаться сложной. Однако вскоре она станет просто еще одним аспектом вашей жизни.
Трудно представить себе, что в недалеком будущем исчезнет потребность в выполнении этой задачи, но об этом трудно судить со всей определенностью. После выполнения процедуры вещи нужно снова распределить по разным группам. Затем их можно разложить по соответствуюгцим им местам. В конечном итоге они опять станут использованными и придется еще раз повторить весь цикл. Однако это занятие — часть повседневной жизни.
гласования между подлежащим и сказуемым предложения, поэтому не позволяет формировать такие предложения, как "1 зше11з г)зе вшпрцз". Дополните грамматику Е, таким образом, чтобы в ней соблюдалось согласование артикля и существительного. Иными словами, обеспечьте, чтобы слово "айепгз" рассматривалось как словосочетание ~', а "айепр' и "ап айепгз" — нет.
Опишите основные различия между языком )ача (или любым другим языком программирования, с которым вы знакомы) и естественным языком, прокомментировав в каждом случае проблему "понимания". Рассмотрите такие аспекты, как грамматика, синтаксис, семантика, прагматика, композициональность, контекстная зависимость, лексическая неоднозначность, синтаксическая неоднозначность, разрешение ссылок (включая местоимения), фоновые знания, а самое главное, укажите, что означает "понимание" текста на том и другом языке, Какие из приведенных ниже соображений послужили причинами для введения квазилогической формы? а) Упрощение написания простых композиционных грамматических правил. б) Расширение выразительности языка семантического представления. в) Получение возможности представлять в краткой форме варианты неоднозначности в области определения кванторов (кроме всего прочего).
г) Упрощение задачи устранения семантической неоднозначности. Определите, какая семантическая интерпретация была бгя получена при синтаксическом анализе приведенных ниже предложений с помощью грамматики, описанной в данной главе. а) 1г гв а ъшприз. б) ТЬе вшпрцз 1з беар. в) Т)зе чзшпрцз гв (п [2,2). Было бы целесообразно предусмотреть в качестве семантической интерпрета- ции для предложения "11 1з а ешприз" просто Зх х я ьгиглрцвев? Рассмот- рите альтернативные предложения, такие как "1г ххах а вшпрцз".
Не просматривая повторно текст, приведенный в упр. 22.1, ответьте на пере- численные ниже вопросы. 1099 Глава 22. Обшение а) Каковыми являются указанные четыре этапа? б) Какой этап пропущен? в) Каковыми являются "леши", упомянутые в тексте? г) Какого рода ошибка может оказаться дорогостоя)цей? д) Лучше ли в данном случае проделать эту процедуру со слишком большим или слишком малым количеством ве)цей? Объясните, почему. В этом упражнении речь идет о грамматиках для очень простых языков.
а) Напишите контекстно-свободную грамматику для языка а".Ь". б) Напишите контекстно-свободную грамматику для языка палиндромов— для множества всех строк, вторая половина которых представляет собой обрашение первой половины. в) Напишите контекстно-зависимую грамматику для языка дубликатов— для множества всех строк, вторая половина которых является такой же, как и первая половина. Рассмотрите предложение "Ботеопе )иа))гег) з!о)и)у го г))е зирегшаг)гег" (Некто медленно шел в супермаркет) и следующий словарь: 22.8. 22.9.
Рсопоип -) всввеопе У -э еа1)сей Ас)и -> в1ое1у Рпер -~ Ео пес -э епе )тоип — > вирехтпасвес Какая из трех приведенных ниже грамматик в сочетании с этим словарем вырабатывает указанное предложение? Покажите соответствующее дерево (деревья) синтаксического анализа. А) в) с) З вЂ” > НР Л з -э )тр гр я — > )тР ир ГГР -э Рсопоип А)Р -э Рсопоип ИР -~ Рсопоип ГГР -> Апс1с1е )тоип НР— > Ноип )тр -) Асс 'сте ГГР ир -э ир РР А) -э А -сдсте и )гР -) иесь Ас)и )гР -э )гр Аци Аии гр -э иесь ыиос) Аи -~ Ас)и Ае, ГР -~ иесЬ Ипос) -Ф Ас)и )Аиос) Аии — 3 РР РР -> РпеР ЫР Иеос) — ~ Ас)и РР— > Р-ер )тР ИР -э )тоип Аи~ -э РР )тР -э А)оип Р -э Рпер )тр Применив каждую из трех приведенных здесь грамматик, запишите три правильных и три неправильных английских предложения, сформированных с помошью этой грамматики.