Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика, страница 15
Описание файла
PDF-файл из архива "Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика", который расположен в категории "". Всё это находится в предмете "системы автоматизированного проектирования (сапр)" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "интеллектуальные подсистемы сапр" в общих файлах.
Просмотр PDF-файла онлайн
Текст 15 страницы из PDF
«Статус последних наименее ясен, хотя утверждается, чтоимеет место отображение пропозициональных структур на ментальные модели, апоследних – на образы. Что же касается ментальных моделей, то такая модельпонимаетсякакнепосредственноеотражениеситуации,описываемойвоспринимаемым текстом» [113: 595].
Использующиеся в гипотезе Джонсон-Лэйрдапонятиясоотносятсяслингвистическими,психолингвистическимиипсихологическими представлениями. Макроструктура семантики текста как иерархияпропозиций плюс фоновые и выводные знания сопоставима с расширеннымпредставлением о системе фреймов, действительных для данного текста.«Ментальная модель – это система собственно-когнитивных фреймов, перцепт,отвечающий семантике текста. <…> «образ» в описываемой системе можно пониматькак смысл – или некую систему смыслов – в духе Л.С.
Выготского и А.Н. Леонтьева»[113: 595].Семантические представления разных уровней (разной когнитивной глубины),как правило, сосуществуют, представляя собой разные стадии переработки одного итого же текста. Однако в зависимости от коммуникативных целей (стиля текста иличностных установок) человек может задавать уровень понимания (см. обсуждениев [113: 596]). Джонсон-Лэйрд пишет, что в случае высказываний, отражающихстереотипные (determinate) ситуации, глубина существенно выше: испытуемыезапоминают лучше смысл высказываний, чем их языковую форму.
В обратнойситуации – для высказываний, отражающих нестереотипные, в чем-то необычныеситуации, когнитивная глубина значительно меньше: лучше запоминается языковая36Переиздание монографии в [113].48форма, поверхностная структура высказывания (вплоть до буквального состава) [48:160–162]. Такого рода экспериментальные данные демонстрируют «отсутствиепринудительного набора процедур и операций в процессах восприятия речи (и,соответственно, хранения информации в памяти и извлечения ее из памяти)»[113: 596]. Адресат определяет стратегию восприятия и глубину понимания текста37.Выделение «поверхностного восприятия (и понимания)» из «восприятия,понимания и интерпретации текста» соотносимо с попытками выделить различиямежду «текстовой базой» и «моделью ситуации» в процедурах восприятия текста(например, [52; 60; 61].
В другой работе – на материале письменных текстов – [83;84]показывается, что соотношение между уровнями – уровнем модели ситуации и болееповерхностными уровнями (поверхностных структур и базы текста) – в процедурахпонимания может зависеть от функционального стиля текста (публицистический vs.литературно-художественный).В заключение краткого обзора когнитивистских и речедеятельностныхпредставлений о процедурах понимания текста приведем психофизиологическиеобоснования возможности функционирования моделируемых процедур (см.,например, [31; 54; 78]). Предполагается, что на уровне поверхностной структурызадействуется кратковременная память38. В рабочей памяти может удерживатьсяоколо двух предложений (с очень большим приближением); там же активируется ифункционирует наиболее важная информация, которая может соотноситься сдостаточно высокими уровнями представления текста.
В экспериментальной работе сносителями языка проявление психофизиологических ограничений – в частностиработа различных видов памяти человека – существенным образом определяетсяусловиями коммуникации или (в выше описанной терминологии) коммуникативнымконтекстом и функциональным стилем текста.§ 3.3.Анализ текста в парадигмах автоматического понимания текстаВ кратком описании особенностей прикладного подхода к пониманию текстабудем ориентироваться на книгу Н.Н. Леонтьевой, одного из признанных авторитетовв этой области [125].
Прежде всего, отметим, что автоматическое понимание текстовявляется необходимой частью разнообразных прикладных задач. Вполне очевидно,что, например, задачи машинного перевода и автоматического аннотирования (илиреферирования) суть разные задачи, предполагающие разный результатавтоматического понимания текста. Путь учета реальности таких разных подходовН.Н.
Леонтьева видит в последовательном применении идеи «мягкого» пониманиятекста. «Мягкое» понимание можно трактовать как подстройку работы автомата подС другой стороны, подобные данные свидетельствуют об относительной автономности семантическогокомпонента языка в процедурах восприятия и понимания. Особое внимание в экспериментальных работахуделяется последовательности/одновременности работы адресата (слушающего и/или читающего) на разныхуровнях представления текста. В последние годы все больше исследователей приходит к выводу о том, чтофункционирование верхних уровней определяет работу синтаксических (например, [49; 59; 66; 80]) илексических (например, [44; 68]) процедур.
Наиболее яркий представитель противоположного подхода Фодор иего модулярная теория [32], в которой предполагается автономность функционирования не толькофонологического, но и синтаксического модулей.38Некоторые авторы выделяют эхоическую (по аналогии с иконической для зрительного восприятия) память,она обеспечивает более или менее точный образ-слепок звукового сигнала, существующий лишь оченьнедолгое время (около 3 с) после сенсорного восприятия сигнала (см., например, [17]).3749разные коммуникативные цели. В отличие от ситуации естественной коммуникации впроцедурах автоматического понимания заложено разделение ролей: человекопределяет цель и оценивает окончательный результат, на долю автомата приходитсяпонимание текста (в соответствии с поставленной человеком целью) и оценкарезультата на всех промежуточных уровнях. Результат понимания реализуется в видепостроения некоторой семантической структуры.
Н.Н. Леонтьева выделяетследующие типы структур39:o «Лингвистические структуры предложений текста (локальное понимание).o Семантические сети целого текста (глобальное размытое понимание).o Информационные структуры целого теста (глобальное обобщенноепонимание).o Структуры баз данных и знаний (выборочное специальное понимание)»[125: 22].1.Лингвистические структуры предложений текста фиксируютрезультат «локального» понимания, ограниченного рамками каждого из предложенийтекста.
Наиболее известными лингвистическими структурами, по-видимому,являются структуры, основанные на модели «Смысл ⇔ Текст» [127]. Основой такогосемантико-синтаксического представления является синтаксическое деревопредложения, имеющее «семантические» узлы [127] или «семантические» связи [88].Работа автомата, построенного на базе модели «Смысл ⇔ Текст», опирается насложные и богатые словари (то есть словари являются компонентами работыавтомата), результатом такой работы является представление информации о единицахи связях в пределах предложения.
Формализованность такого рода представленияявляется и преимуществом, и недостатком. Главным достоинством такого родаструктур является детальность анализа, отражаемого в форме дерева –синтаксического и семантического представления структуры предложения. Приналичии словарных статей для всех слов предложения – естественно, при условииправильности структуры с точки зрения законов входного языка – автомат строитправильную синтаксическую структуру, сначала поверхностную, затем глубинную.Если все узлы глубинной синтаксической структуры заменить соответствующимитолкованиями из словаря, оставив все связи из глубинной синтаксической структуры,но расширив нотацию40, будет получена семантическая структура [127].
В системемашинного перевода ЭТАП-2 реализована единая синтаксическая структура, в узлахкоторой помещены слова исходной фразы. В этой единой синтаксической структуресохранены подробные связи поверхностной структуры, связи достаточнодифференцированные, поэтому их можно перевести в семантический план;соединяемые ими слова снабжены семантическими характеристиками вкомбинаторном словаре [88].Недостатком жестких древовидных структур является невозможность выхода запределы предложения, невозможность выборочного восприятия, «выхватывания»Описываемые далее структуры соответствуют разному положению дел в разработках систем автоматическогопонимания текста как с точки зрения современности, так и с точки зрения степени реализованности.
Задачараздела сводится к сопоставлению работы автомата и человека в процедурах восприятия и понимания текста вразных условиях (цели, задачи, подходы).40Под термином нотация принято понимать систему разметки (тэгов, помет). В частности, приводимый типнотации включает актантные связи (от 1 до 4), атрибутивную и координирующую.3950наиболее важной информации41. Другое ограничение такого подхода проявляется вслабой корреляции с системами представления знаний.
«Пока реально достижимоеСемП /семантическое представление/ целого – это последовательность СинСемП/синтактико-семантических представлений/ всех подряд предложений текста»[125: 24].«Лингвистические структуры предложений текста» можно соотнести суровнем, предшествующим построению текстовой базы как системы пропозицийтекста.