Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 19
Текст из файла (страница 19)
Повидимому,текстылитературно-художественногостиля(рассматриваемыйхудожественный текст), напротив, характеризуются максимально свободнымпорядком слов.Одним из «непрямых» следствий из положений теории коммуникативногодинамизма является общая идея о том, что строгая бинарность оппозиции «тема vs.рема» (или, например, «topic vs. comment») может оказаться нефункциональной:наряду с рассмотрением функционирования подобного противопоставлениянеобходимым становится анализ полевой структуры, а именно выделения ядра ипериферии «темы» (а, возможно, и «ремы»).Несмотря на пристальное внимание, оказываемое проблемам актуальногочленения предложения, существует «распределенность» между разнообразнымиподходами. В частности, проблемами актуального членения активно занимаются, содной стороны, специалисты по автоматической обработке текста, а с другой стороны– когнитивные лингвисты.
Очевидно, что это разделение связано с ограничением наСр. последнюю формулировку теории коммуникативного динамизма Фирбаса [28].Именно на материале научно-технических текстов работает целый ряд систем автоматического определениятема-рематических структур.52По данным случайной выборки 1000 предложений, принадлежащих текстам разных функциональных стилей(корпус «Бокренок», корпус-менеджер Бонито) порядок SVO доминирует (37%). Для текстов научнотехнического стиля наблюдается увеличение доли SVO до 48%. Доля предложений «объективного» порядка(SVO) в целом составляет более 70% (соответственно, 73% и 77% для всех функциональных стилей и длянаучно-технического стиля (данные по [102]).53При допущении сходства структурирования текстов научно-технического и официально-делового стилей этиданные, вероятно, могут соответствовать особенностям реализации и текстов официально-делового стиля(рассматриваемого делового текста).505158функциональные стили рассматриваемых текстов.
Для автоматической обработкитекста первостепенной является задача обработки информационных текстов, то естьтекстов официально-делового и научного стилей (например, задачи машинногоперевода, извлечения знаний, автоматического реферирования). Когнитивныелингвисты в большей степени ориентированы на тексты литературнохудожественного стиля (нарратива в широком смысле) и спонтанные тексты(например, тексты «разговорного» стиля). Различие подходов предполагает различиеметодологической базы. Как уже упоминалось, в случае информационных текстовможно предположить увеличение роли «формально-текстовых» параметров:позиционного и/или синтаксического. При когнитивистском подходе большеевнимание, как правило, уделяется принципиально различным параметрам:референции, фокусу внимания (по Чейфу) и т.д.
Возможная сложность проведенияисследованиясопряженасопределениемспецификирассматриваемогофункционального стиля и конкретного текста. Так, например, для рассматриваемогоделового текста – административного уложения – характерно то, что номинацияхарактеризует не сами объекты внешнего мира, а их классы. Таким образом, в случаеделового текста можно говорить о дистрибутивном типе референции: референции впеременном релевантном типе пространства [152: 98–100].
Отсутствие традиционныхреференциальных связей отражается, в частности, в том, что личные местоимениясоставляют в деловом тексте 0,4% от всех словоупотреблений.При когнинитивном подходе референцией, как правило, занимаются с позицииговорящего, а не адресата текста, тем не менее полагаем, что основные результатымогут быть применимы и к адресату. Референциальный выбор связывается обычно сактивацией референта в сознании говорящего (ср. [9; 40]). В соответствии суниверсалией, предложенной в [36], чем больше активация референта, тем большевероятность того, что он будет выражен более редуцированно. Большинствофакторов, предлагаемых в исследованиях референциального выбора, представляютсобой лингвистические корреляты когнитивного понятия «активация».
Одним изважнейших факторов является фактор линейного (референциального) расстояния,который измеряется в количествах границ предикаций между данным упоминаниемреферента и его ближайшим антецедентом (ср. [36]). В качестве других значимыхфакторов рассматриваются фактор риторического (иерархического) расстояния (ср.[33]) и свойства референта: одушевленность и его «дискурсивный вес» (например,является ли референт главным действующим лицом нарративного построения).Модель референциального выбора для русского языка была предложенаА.А. Кибриком [50]. Исследование влияния референции на принятие решения опринадлежности словоупотреблений к теме проводится в настоящее время.Полагаем необходимым подчеркнуть принципиальную неединственностькоммуникативного структурирования текста в целом и высказывания как важнейшейструктурной составляющей текста в разных процедурах: порождения / восприятия /анализа текста, разной глубины понимания и/или интерпретации текста и т.д.
Такимобразом, в общем случае неединственность коммуникативного структурированияопределяется структурой коммуникативной ситуации. На такого роданеединственность обратила в свое время внимание Е.В. Падучева, отметив, чторазличие в описании коммуникативной структуры высказывания – это различие в егофункционировании при решении тех или иных задач, например (по [135: 109–112]:59(1) Установить линейно-интонационную структуру при синтезе предложения изего синтаксического представления. «В рамках этой задачи откоммуникативной структуры требуется, чтобы в ней содержалась вся <…>дополнительная семантическая или прагматическая информация, котораядолжна быть добавлена к синтаксическому представлению предложения».(2) Выяснить, какие значения передаются в данном языке варьированиемлинейно-интонационной структуры высказывания.(3) Выразить оптимальным образом (например, при переходе от семантическогопредставления предложения к синтаксическому) заданное содержание – смысли разного рода акценты, контрасты, меняющиеся фокусировки и проч.
и т.д.Очевидно, что решение каждой из перечисленных задач задает свой типкоммуникативного структурирования.Мы будем отталкиваться от общих «психолингвистических» представлений оключевых словах (КС)54 на основании работ, выполненных в рамках научной школыЛ.В. Сахарного и А.С. Штерн, а также на основании работ А.И. Новикова (например,[130; 131]). КС определяются в ходе эксперимента с информантами, которые должныпрослушать текст, подумать над его содержанием и выписать 10-15 слов, наиболееважных с точки зрения его содержания.Наиболее функциональными, таким образом, могли бы стать основныеположения, изложенные в работах Л.В.
Сахарного и А.С. Штерн и их учеников.Кратко их можно сформулировать следующим образом:КС отражают тему текста;их упорядоченность – в наборе ключевых слов (НКС) – может трактоватьсякак эксплицитно невыраженная рема текста;при допущении того, что рема в тексте может быть не выражена эксплицитно(но лишь за счет ассоциативных связей), НКС рассматривается как один изминимальных вариантов «текста»;такого типа «текст» характеризуется «ядерной» цельностью и минимальнойсвязностью (см., например, [18; 146]).Первое положение кажется максимально обоснованным. Оставшиеся требуютдополнительного обсуждения. По-видимому, расширение понятия «текст»,позволяющее включить НКС в множество возможных текстов, не является для наснеобходимым.
В то же время возможность развертывания НКС в процедурахпорождения текста является экспериментально доказанной. Для порождения такогорода текстов необходима инструкция, запускающая механизм: например, «напишитесвязный осмысленный текст, употребив слова…» [133]. Вероятно, упорядоченностьслов в НКС активирует ассоциативные связи, необходимые для существованиялюбого текста [133]. Понимание ремы как «связующего элемента», соединяющеготемы и подтемы, оказывается противоречащим выше описываемому подходу кисследованию тема-рематической структуры и представлению о реме как оконституирующем компоненте (как высказывания, так и текста).Немного о результатах, полученных в экспериментах по восприятию звучащеготекста в шуме (сигнал/шум 0 дБ), с одной стороны, иллюстрирующих некоторые изВпрочем, вычислительный подход к оценке КС как наиболее значимых для текста (коллекции) иногдавыступал в качестве самостоятельной задачи, а не только для сопоставления результатов двух разныхэкспериментов.5460положений об информационной и коммуникативной структуре текста, с другой –позволяющие оценить осуществляемую текущим образом подстройку под текст(процедуры анализа и понимания).Коммуникативная структураДля делового текста (1) элементы темы распознаются лучше, чем элементы ремы(особенно на конечном фрагменте); (2) от начального к конечному фрагментутекста происходит улучшение распознаваемости каждого из элементов;(3) перцептивно значимой является позиция перед паузой.Для художественного текста (1) элементы ремы распознаются лучше, чемэлементы темы (особенно на конечном фрагменте); (2) от начального к конечномуфрагменту текста происходит ухудшение распознаваемости элементов темы иулучшение элементов ремы; (3) мелодика (прежде всего, понижение частотыосновного тона) представляет собой перцептивно наиболее значимыйфонетический признак для коммуникативного членения художественного текста;этот признак маркирует новое (не только для структуры «тема vs.
рема», но и«данное vs. новое»).Собственно смысловая структура• Для делового текста (1) КС распознаются лучше, чем неКС (особенно на конечномфрагменте); (2) от начального к конечному фрагменту текста происходитулучшение распознаваемости каждого из элементов; (3) перцептивно значимойявляется позиция перед паузой.• Для художественного текста (1) неКС распознаются лучше, чем КС (наначальном и конечном фрагментах); (2) наилучшей распознаваемостью обладаетсередина текста (здесь происходит нейтрализация противопоставления КС vs.неКС); (3) мелодика (прежде всего, понижение частоты основного тона) –перцептивно наиболее значимый фонетический признак маркирования КС.При распознавании слов делового текста наиболее существенным является факторзнакомства с текстом (его темой, структурой и наиболее частотными словами), КС иэлементы темы (как им и положено) распознаются сравнительно неплохо, конецтекста предсказуем и хорошо распознается. Для художественного текста бόльшая«опорность» приходится на начальный (преамбула) и срединный (развитие сюжета)композиционные фрагменты и по-разному соотносится с компонентамикоммуникативного и смыслового членения: с темой для преамбулы, с диалогом(особенно неКС или ремой) для срединного фрагмента.
Таким образом, говоря оструктурах текста и процедурах анализа, мы должны учитывать разнообразные видыконтекста, в частности, функциональный стиль, композиционную структуру ириторическую связность текста.Рассуждая о текущем словаре и ключевых словах в главе 2, мы уже упомянули,что выходя на более высокий уровень анализа и сопоставляя – (1) «текущие словари»,принадлежащие тексту и коллекциям разной степени однородности («уровнявложенности»), (2) ключевые слова, характеризующие текст и коллекции разнойстепени вложенности – можем получить полноценную информацию не только дляинформационно насыщенных текстов, но и для художественных текстов.Естественно, такого рода анализ предполагает сопоставление эксперимента синформантами и вычислительного эксперимента (для последнего особую значимостьприобретает формирование контрастивной коллекции).