Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379), страница 18
Текст из файла (страница 18)
Сахарным методика исследования коммуникативной структуры текста в указанномсмысле не используется.4856конституирующее (подробнее см. [164]). Естественно, конституирующийкомпонент является обязательным, а не-конституирующий компонент –факультативным. Традиционно в теории актуального членения рассматриваютречевой акт как реализацию сообщения (повествовательного предложения); в этомслучае рема – это конституирующий компонент, а тема – не-конституирующий. Удругих типов речевых актов также есть конституирующий и могут быть неконституирующий компоненты, хотя за ними не всегда закреплена традиционнаятерминология. В данной работе для любых типов речевых актовконституирующий компонент будем называть ремой, а не-конституирующий –темой.2.
«В языках существует не менее четырех способов маркирования темы, на которыеможет опираться воспринимающий речь человек. Это позиционный,грамматический, лексический и фонетический способы. Первый и последний изних, можно думать, являются универсальными, в то время как остальные двапредставлены в одних языках, но отсутствуют в других» [113: 600].3.
Наряду с бинарным противопоставлением тема vs. рема, (согласно теориикоммуникативного динамизма) может рассматриваться и «скалярное» деление.Поясним эти положения на примере противопоставления деловой vs.художественный тексты. В деловом тексте доминирует информативная функцияязыка, его высказывания рассматриваются как реализация сообщения, то естьматериал в наибольшей степени соответствует стандартной «платформе» дляисследования коммуникативного членения высказывания («актуального члененияпредложения» в русскоязычной традиции).
Кроме того, от делового текста можноожидать «нормативности» реализации (наличие обоих компонентов: «тема»+«рема»).Для художественного текста картина существенно другая. Сюжетный текст сэлементами диалога не ограничивает множество своих высказываний: кромесообщений, в нем представлены и вопросы, и императивы, и восклицания (не говоряуж о компонентах, вводящих прямую речь). В данной работе за соответствующимикоммуникативными структурами всех этих высказываний закрепляем терминологию«тема-рематическая», «тема» и «рема». Многообразие этих структур заставляетпредположить, что не все из них являются расчлененными, то есть факультативныйкомпонент темы в них может быть эксплицитно не выражен.Взаимодействие разных способов маркирования темы естественным образомстановится одним из центральных для данной работы.
Особое значение приизвлечении смысла в процессе восприятии речи имеет позиционный критерий: привосприятии звучащего текста, динамически развертывающегося во времени, особенноважно, чтобы сначала у слушающего активировалась тема, то есть чтобы «то, о чемговорится», предшествовало «тому, что говорится». Начальное положение слова(именной группы) в высказывании (вместе с синтаксической немаркированностью)заставляет слушающего выдвигать гипотезу о принадлежности слов к теме. Можнопредположить, что в случае каких-либо затруднений именно позиционный критерийстановится ведущим. В то же время варианты даже слабой активации темынеизбежно должны сказаться на результатах (ср. работы А.А.Кибрика и многихдругих когнитивистов).Как известно, теория коммуникативного динамизма в полной мере применималишь к тем высказываниям, в которых тема предшествует реме, а глаголрасполагаетсявцентре.Согласнорассматриваемойтеории,степень57коммуникативного динамизма у начальной темы минимальна, далее степенькоммуникативного динамизма увеличивается с продвижением к концу предложения.Глагол рассматривается как переход от темы к реме, ему приписывается средняястепень коммуникативного динамизма [27]50.
Возможны вариации идеикоммуникативного динамизма. Коммуникативный динамизм по Гаичовой относится к«глубинному» порядку слов, который может на поверхностном уровнереализовываться не только за счет позиционных и синтаксических средств, но и спомощью «размещения интонационного центра». Главное различие между двумятипами шкалирования проявляется в тех случаях, когда фраза несет логическое и/илиэмфатическое ударение, то есть наряду с фразовым ударением присутствует второйинтонационный центр на непоследнем слове [41].
Впрочем, пражские исследователиутверждают, что появление дополнительного интонационного центра редковстречается в текстах научно-технического функционального стиля51, то есть далеконе все функциональные стили допускают различие между глубинной иповерхностной структурами (см., например, [43; 44].Утверждение о преобладании прямого порядка следования тема – рема требуетподтверждения на репрезентативном массиве текстов.
Действительно, преобладаниеследования ремы за темой (и соответствующего порядка SVO (субъект-объектпредикат)) по корпусным данным реализуется для высказываний текстов разногофункционального стиля52. Корпусные данные свидетельствуют об увеличении долиподобного порядка слов для научного (научно-технического) стиля (например,[102])53. По результатам авторской ручной разметки научно-технических текстов[102] схема «тема предшествует реме» реализуется в 70% случаев; в 16% случаевкомпонент темы отсутствует (нерасчлененная тема-рематическая структура). Повидимому,текстылитературно-художественногостиля(рассматриваемыйхудожественный текст), напротив, характеризуются максимально свободнымпорядком слов.Одним из «непрямых» следствий из положений теории коммуникативногодинамизма является общая идея о том, что строгая бинарность оппозиции «тема vs.рема» (или, например, «topic vs.
comment») может оказаться нефункциональной:наряду с рассмотрением функционирования подобного противопоставлениянеобходимым становится анализ полевой структуры, а именно выделения ядра ипериферии «темы» (а, возможно, и «ремы»).Несмотря на пристальное внимание, оказываемое проблемам актуальногочленения предложения, существует «распределенность» между разнообразнымиподходами. В частности, проблемами актуального членения активно занимаются, содной стороны, специалисты по автоматической обработке текста, а с другой стороны– когнитивные лингвисты.
Очевидно, что это разделение связано с ограничением наСр. последнюю формулировку теории коммуникативного динамизма Фирбаса [28].Именно на материале научно-технических текстов работает целый ряд систем автоматического определениятема-рематических структур.52По данным случайной выборки 1000 предложений, принадлежащих текстам разных функциональных стилей(корпус «Бокренок», корпус-менеджер Бонито) порядок SVO доминирует (37%). Для текстов научнотехнического стиля наблюдается увеличение доли SVO до 48%. Доля предложений «объективного» порядка(SVO) в целом составляет более 70% (соответственно, 73% и 77% для всех функциональных стилей и длянаучно-технического стиля (данные по [102]).53При допущении сходства структурирования текстов научно-технического и официально-делового стилей этиданные, вероятно, могут соответствовать особенностям реализации и текстов официально-делового стиля(рассматриваемого делового текста).505158функциональные стили рассматриваемых текстов.
Для автоматической обработкитекста первостепенной является задача обработки информационных текстов, то естьтекстов официально-делового и научного стилей (например, задачи машинногоперевода, извлечения знаний, автоматического реферирования). Когнитивныелингвисты в большей степени ориентированы на тексты литературнохудожественного стиля (нарратива в широком смысле) и спонтанные тексты(например, тексты «разговорного» стиля). Различие подходов предполагает различиеметодологической базы. Как уже упоминалось, в случае информационных текстовможно предположить увеличение роли «формально-текстовых» параметров:позиционного и/или синтаксического. При когнитивистском подходе большеевнимание, как правило, уделяется принципиально различным параметрам:референции, фокусу внимания (по Чейфу) и т.д.
Возможная сложность проведенияисследованиясопряженасопределениемспецификирассматриваемогофункционального стиля и конкретного текста. Так, например, для рассматриваемогоделового текста – административного уложения – характерно то, что номинацияхарактеризует не сами объекты внешнего мира, а их классы. Таким образом, в случаеделового текста можно говорить о дистрибутивном типе референции: референции впеременном релевантном типе пространства [152: 98–100]. Отсутствие традиционныхреференциальных связей отражается, в частности, в том, что личные местоимениясоставляют в деловом тексте 0,4% от всех словоупотреблений.При когнинитивном подходе референцией, как правило, занимаются с позицииговорящего, а не адресата текста, тем не менее полагаем, что основные результатымогут быть применимы и к адресату.
Референциальный выбор связывается обычно сактивацией референта в сознании говорящего (ср. [9; 40]). В соответствии суниверсалией, предложенной в [36], чем больше активация референта, тем большевероятность того, что он будет выражен более редуцированно. Большинствофакторов, предлагаемых в исследованиях референциального выбора, представляютсобой лингвистические корреляты когнитивного понятия «активация». Одним изважнейших факторов является фактор линейного (референциального) расстояния,который измеряется в количествах границ предикаций между данным упоминаниемреферента и его ближайшим антецедентом (ср. [36]).
В качестве других значимыхфакторов рассматриваются фактор риторического (иерархического) расстояния (ср.[33]) и свойства референта: одушевленность и его «дискурсивный вес» (например,является ли референт главным действующим лицом нарративного построения).Модель референциального выбора для русского языка была предложенаА.А.
Кибриком [50]. Исследование влияния референции на принятие решения опринадлежности словоупотреблений к теме проводится в настоящее время.Полагаем необходимым подчеркнуть принципиальную неединственностькоммуникативного структурирования текста в целом и высказывания как важнейшейструктурной составляющей текста в разных процедурах: порождения / восприятия /анализа текста, разной глубины понимания и/или интерпретации текста и т.д.