Главная » Просмотр файлов » Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика

Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379), страница 18

Файл №1027379 Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика) 18 страницаБольшакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379) страница 182017-12-21СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 18)

Сахарным методика исследования коммуникативной структуры текста в указанномсмысле не используется.4856конституирующее (подробнее см. [164]). Естественно, конституирующийкомпонент является обязательным, а не-конституирующий компонент –факультативным. Традиционно в теории актуального членения рассматриваютречевой акт как реализацию сообщения (повествовательного предложения); в этомслучае рема – это конституирующий компонент, а тема – не-конституирующий. Удругих типов речевых актов также есть конституирующий и могут быть неконституирующий компоненты, хотя за ними не всегда закреплена традиционнаятерминология. В данной работе для любых типов речевых актовконституирующий компонент будем называть ремой, а не-конституирующий –темой.2.

«В языках существует не менее четырех способов маркирования темы, на которыеможет опираться воспринимающий речь человек. Это позиционный,грамматический, лексический и фонетический способы. Первый и последний изних, можно думать, являются универсальными, в то время как остальные двапредставлены в одних языках, но отсутствуют в других» [113: 600].3.

Наряду с бинарным противопоставлением тема vs. рема, (согласно теориикоммуникативного динамизма) может рассматриваться и «скалярное» деление.Поясним эти положения на примере противопоставления деловой vs.художественный тексты. В деловом тексте доминирует информативная функцияязыка, его высказывания рассматриваются как реализация сообщения, то естьматериал в наибольшей степени соответствует стандартной «платформе» дляисследования коммуникативного членения высказывания («актуального члененияпредложения» в русскоязычной традиции).

Кроме того, от делового текста можноожидать «нормативности» реализации (наличие обоих компонентов: «тема»+«рема»).Для художественного текста картина существенно другая. Сюжетный текст сэлементами диалога не ограничивает множество своих высказываний: кромесообщений, в нем представлены и вопросы, и императивы, и восклицания (не говоряуж о компонентах, вводящих прямую речь). В данной работе за соответствующимикоммуникативными структурами всех этих высказываний закрепляем терминологию«тема-рематическая», «тема» и «рема». Многообразие этих структур заставляетпредположить, что не все из них являются расчлененными, то есть факультативныйкомпонент темы в них может быть эксплицитно не выражен.Взаимодействие разных способов маркирования темы естественным образомстановится одним из центральных для данной работы.

Особое значение приизвлечении смысла в процессе восприятии речи имеет позиционный критерий: привосприятии звучащего текста, динамически развертывающегося во времени, особенноважно, чтобы сначала у слушающего активировалась тема, то есть чтобы «то, о чемговорится», предшествовало «тому, что говорится». Начальное положение слова(именной группы) в высказывании (вместе с синтаксической немаркированностью)заставляет слушающего выдвигать гипотезу о принадлежности слов к теме. Можнопредположить, что в случае каких-либо затруднений именно позиционный критерийстановится ведущим. В то же время варианты даже слабой активации темынеизбежно должны сказаться на результатах (ср. работы А.А.Кибрика и многихдругих когнитивистов).Как известно, теория коммуникативного динамизма в полной мере применималишь к тем высказываниям, в которых тема предшествует реме, а глаголрасполагаетсявцентре.Согласнорассматриваемойтеории,степень57коммуникативного динамизма у начальной темы минимальна, далее степенькоммуникативного динамизма увеличивается с продвижением к концу предложения.Глагол рассматривается как переход от темы к реме, ему приписывается средняястепень коммуникативного динамизма [27]50.

Возможны вариации идеикоммуникативного динамизма. Коммуникативный динамизм по Гаичовой относится к«глубинному» порядку слов, который может на поверхностном уровнереализовываться не только за счет позиционных и синтаксических средств, но и спомощью «размещения интонационного центра». Главное различие между двумятипами шкалирования проявляется в тех случаях, когда фраза несет логическое и/илиэмфатическое ударение, то есть наряду с фразовым ударением присутствует второйинтонационный центр на непоследнем слове [41].

Впрочем, пражские исследователиутверждают, что появление дополнительного интонационного центра редковстречается в текстах научно-технического функционального стиля51, то есть далеконе все функциональные стили допускают различие между глубинной иповерхностной структурами (см., например, [43; 44].Утверждение о преобладании прямого порядка следования тема – рема требуетподтверждения на репрезентативном массиве текстов.

Действительно, преобладаниеследования ремы за темой (и соответствующего порядка SVO (субъект-объектпредикат)) по корпусным данным реализуется для высказываний текстов разногофункционального стиля52. Корпусные данные свидетельствуют об увеличении долиподобного порядка слов для научного (научно-технического) стиля (например,[102])53. По результатам авторской ручной разметки научно-технических текстов[102] схема «тема предшествует реме» реализуется в 70% случаев; в 16% случаевкомпонент темы отсутствует (нерасчлененная тема-рематическая структура). Повидимому,текстылитературно-художественногостиля(рассматриваемыйхудожественный текст), напротив, характеризуются максимально свободнымпорядком слов.Одним из «непрямых» следствий из положений теории коммуникативногодинамизма является общая идея о том, что строгая бинарность оппозиции «тема vs.рема» (или, например, «topic vs.

comment») может оказаться нефункциональной:наряду с рассмотрением функционирования подобного противопоставлениянеобходимым становится анализ полевой структуры, а именно выделения ядра ипериферии «темы» (а, возможно, и «ремы»).Несмотря на пристальное внимание, оказываемое проблемам актуальногочленения предложения, существует «распределенность» между разнообразнымиподходами. В частности, проблемами актуального членения активно занимаются, содной стороны, специалисты по автоматической обработке текста, а с другой стороны– когнитивные лингвисты.

Очевидно, что это разделение связано с ограничением наСр. последнюю формулировку теории коммуникативного динамизма Фирбаса [28].Именно на материале научно-технических текстов работает целый ряд систем автоматического определениятема-рематических структур.52По данным случайной выборки 1000 предложений, принадлежащих текстам разных функциональных стилей(корпус «Бокренок», корпус-менеджер Бонито) порядок SVO доминирует (37%). Для текстов научнотехнического стиля наблюдается увеличение доли SVO до 48%. Доля предложений «объективного» порядка(SVO) в целом составляет более 70% (соответственно, 73% и 77% для всех функциональных стилей и длянаучно-технического стиля (данные по [102]).53При допущении сходства структурирования текстов научно-технического и официально-делового стилей этиданные, вероятно, могут соответствовать особенностям реализации и текстов официально-делового стиля(рассматриваемого делового текста).505158функциональные стили рассматриваемых текстов.

Для автоматической обработкитекста первостепенной является задача обработки информационных текстов, то естьтекстов официально-делового и научного стилей (например, задачи машинногоперевода, извлечения знаний, автоматического реферирования). Когнитивныелингвисты в большей степени ориентированы на тексты литературнохудожественного стиля (нарратива в широком смысле) и спонтанные тексты(например, тексты «разговорного» стиля). Различие подходов предполагает различиеметодологической базы. Как уже упоминалось, в случае информационных текстовможно предположить увеличение роли «формально-текстовых» параметров:позиционного и/или синтаксического. При когнитивистском подходе большеевнимание, как правило, уделяется принципиально различным параметрам:референции, фокусу внимания (по Чейфу) и т.д.

Возможная сложность проведенияисследованиясопряженасопределениемспецификирассматриваемогофункционального стиля и конкретного текста. Так, например, для рассматриваемогоделового текста – административного уложения – характерно то, что номинацияхарактеризует не сами объекты внешнего мира, а их классы. Таким образом, в случаеделового текста можно говорить о дистрибутивном типе референции: референции впеременном релевантном типе пространства [152: 98–100]. Отсутствие традиционныхреференциальных связей отражается, в частности, в том, что личные местоимениясоставляют в деловом тексте 0,4% от всех словоупотреблений.При когнинитивном подходе референцией, как правило, занимаются с позицииговорящего, а не адресата текста, тем не менее полагаем, что основные результатымогут быть применимы и к адресату.

Референциальный выбор связывается обычно сактивацией референта в сознании говорящего (ср. [9; 40]). В соответствии суниверсалией, предложенной в [36], чем больше активация референта, тем большевероятность того, что он будет выражен более редуцированно. Большинствофакторов, предлагаемых в исследованиях референциального выбора, представляютсобой лингвистические корреляты когнитивного понятия «активация». Одним изважнейших факторов является фактор линейного (референциального) расстояния,который измеряется в количествах границ предикаций между данным упоминаниемреферента и его ближайшим антецедентом (ср. [36]).

В качестве других значимыхфакторов рассматриваются фактор риторического (иерархического) расстояния (ср.[33]) и свойства референта: одушевленность и его «дискурсивный вес» (например,является ли референт главным действующим лицом нарративного построения).Модель референциального выбора для русского языка была предложенаА.А.

Кибриком [50]. Исследование влияния референции на принятие решения опринадлежности словоупотреблений к теме проводится в настоящее время.Полагаем необходимым подчеркнуть принципиальную неединственностькоммуникативного структурирования текста в целом и высказывания как важнейшейструктурной составляющей текста в разных процедурах: порождения / восприятия /анализа текста, разной глубины понимания и/или интерпретации текста и т.д.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
308
Средний доход
с одного платного файла
Обучение Подробнее