Главная » Просмотр файлов » Диссертация

Диссертация (1137218), страница 6

Файл №1137218 Диссертация (Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей) 6 страницаДиссертация (1137218) страница 62019-05-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 6)

Отношения;332. Схемы;3. Реализации схем;4. Структуры.Отношения–конкретныебинарныесвязи,которыеустанавливаются между частями текста. Каждое отношения связываетдва непересекающихся фрагмента текста, называемых ядром (nucleus)и спутником (satellite), обозначаемых N и S соответственно. Стоиттакже отметить, что определение отношений основывается не наморфологических и синтаксических признаках, а на функциональныхи семантических.

Так, для определения отношения Condition (условие)недостаточно лишь только наличия слова ‘if’.Отношение состоит из 4 компонентов:1. Ограничения на ядро.2. Ограничения на спутник.3. Ограничения на сочетание ядра и спутника.4. «Эффект».Схемы определяют общую структуру текста. Это абстрактныеобразцы, состоящие из небольшого числа фрагментов текста,отношений между ними и взаимосвязей между ядрами и всемифрагмента.

Они немного похожи на грамматические правила.34В теории риторических структур выделяют 5 основных видовсхем:Рис. 1.3. Основные виды схем в теории риторических отношений [74]Прямые линии отвечают атомарным фрагментам, а кривые –имеющимся отношениям (стрелка направлена от ядра к спутнику).Остальные схемы устроены так же, как схема обстоятельств(circumstance), и имеют выделенное ядро и спутник.Многоядерные схемы используются для представления текстов,которые не сводятся к одноядерной модели.

В отношении сontrastвсегда есть ровно два ядра, а в отношениях sequence и joint их можетбыть неограниченное число (для sequence они все последовательносвязаны). При этом данные фрагменты объявляются ядрами подоговоренности, несмотря на отсутствие соответствующих спутников.Схемы в реальных текстах могут быть составлены неполностью, допустимы некоторые отклонения от определения.Существует 3 основных вида реализаций схем:1. Неупорядоченные фрагменты: в схеме нет ограничений на порядокядро-спутник352.

Необязательные отношения: для схемы со многими отношениями– все одинарные необязательны, но хотя бы одно должновыполняться3. Повторяющиеся отношения: отношение, которое есть часть схемы,может быть повторено сколько угодно раз при применении этойсхемы.Результат структурного анализа – такой набор реализациисхем, что выполняются следующие ограничения:1. Полнота: есть одна реализация схемы, чьи фрагменты покрываютвесь текст.2. Связность: любой фрагмент текста либо является минимальнойединицей, либо является частью другой реализации схемы.3.

Уникальность: каждая реализации схемы состоит из разныхфрагментов текста, а для многоядерных схем каждое отношениеприменяется к разным фрагментам.4. Целостность: все вместе фрагменты каждой реализации схемыобразуют один текст.Стоит отметить, что ограничения 1-3 обеспечивают, чторезультатом анализа станут не произвольные структуры, а деревья.Ниже приведены примеры основных отношений: Circumstance (обстоятельство) Solutionhood (принятие решения) Elaboration (уточнение) Background (предпосылка) Enablement (снятие запрета) Motivation (побуждение)36 Evidence (свидетельство) Justify (подтверждение) Volitional Cause (волевая причина) Non-Volitional Cause (неволевая причина) Volitional Result (волевой результат) Non-Volitional Result (неволевой результат) Purpose (намерение) Antithesis (антитеза) Concession (уступка) Condition (условие) Otherwise (иначе) Interpretation (толкование) Evaluation (оценка) Restatement (подтверждение) Summary (резюме) Sequence (очередность) Contrast (контраст)Рассмотрим в качестве примера отношение evidence.Ограничения на ядро: читатель верит в ядро недостаточно сточки зрения автора.

Ограничения на спутник: читатель верит в егоутверждение. Ограничения на сочетание ядро-спутник: прочтениеспутника увеличивает доверие читателя к ядру.Эффект: читатель больше доверяет ядру. Положение эффекта:ядро.37В качестве конкретного употребления отношения можнорассмотреть следующий отрывок текста:‘The program as published for calendar year 1980 really works. Inonly a few minutes, I entered all the figures from my 1980 tax return andgot a result which agreed with my hand calculations to the penny.’Первое предложение – ядро, второе и третье образуют спутник.Последние два предложения подтверждают высказывание в первом.Рис.

1.4. Пример реализации риторического отношения evidence [74]1.4.3.3 Теория речевых актовТеория речевых актов была разработана Джон Остином и егоучеником Джоном Серлем для английского языка [82].Основной функцией языка считается формулирование истинныхили ложных высказываний, например, «снег белый». Однако не всепредложения укладываются в такую схему («Доброе утро»). В связи сэтим вводится понятие перформативных высказываний – реализациидействия. Они не совпадают с описаниями, для них невозможноввести истинность. Эти высказывания отвечают неким действиям,например, приказу или предупреждению.

Для перформативныхвысказыванийвводитсяоценкавыполнимости/невыполнимости.Перформативы обычно вводятся с помощью соответствующихглаголов, обычно у них есть субъект в единственном числе первомлице и стоят в простом настоящем времени, активном залоге иизъяснительном наклонении. Такие высказывания скорее указывают38на действие («Объявляю вас мужем и женой»). Перформативыбывают явные (с соответствующим глаголом, «Я обещаю прийти навечеринку») и неявные (без глагола, «Я приду на вечеринку»).Выделяют три типа речевых актов:1. Локутивный – констатация. Пример: «Он сказал ей: возьмикуртку»2.

Иллокутативный – выражает намерение. Пример: «Он советовалей взять куртку»3. Перлокутивный – воздействие на поведение другого человека.Пример: «Он уговорил ее взять куртку»На практике сложно отнести акт к какому-то одному типу, тоесть в чистом виде все типы не встречаются.Для выделения классов используют иллокутивную цель,направление отношений между содержанием акта и текущейобстановкой и другие факторы.Существуют следующие типы иллокутивных целей: информативная («Поезд пришел») побуждение («Пропустите!») принятие обязательств («Обещаю не опаздывать») эмоциональное состояние («Прошу прощения»)1.4.3.4 Семантическая организация данныхТеориясемантическойорганизацииданных(DatabaseSemantics)[127] описывает семантические отношения, возникающиепри взаимодействии людей посредством языка. Одной из частейтеорииявляется«разговаривающегофункциональнаяробота»,декларативнаяпозволяющаяописатьмодельпроцессы39мышления,слуха(восприятияинформации)иговорения,свойственные людям.

Теория включает в себя модель языка(используется специально разработанная модель Slim) и модельграмматики.Важнойчастьютеорииявляетсяпредставление,используемое для хранения высказываний ‒ так называемые проплеты(proplets) или центральные части высказываний, описываемые спомощью упорядоченных наборов атрибутов.1.4.3.5 Теория представления дискурсаТеория представления дискурса (Discourse representation theory)[128] является попыткой описания дискрусивных отношений идискурсивной структуры текста в терминах формальной логики.Авторы вводят специальное абстрактное логическое представление:структуры для представления дискурса (DRS).

Эти структурыиспользуются для формального описания интерпретации текста.Дискурсивные структуры строятся на основе применения к текстунабора предварительно заданных правил построения дискурсивныхотношений. Эти правила апеллируют к синтаксической структурепредложений и к деревьям синтаксического разбора, используя их какбазис для построения отношений, отражающих смысл текста иучитывающих различные правила языка.1.4.4 Чаща разбораВыше были рассмотрены несколько дискурсивных теорий,позволяющих установить связи внутри текста, состоящего изнескольких предложений.

Используя эти теории, можно обобщитьпонятие дерева синтаксического разбора на случай текстового абзаца.В работе [61] был введен термин чаща разбора (Parse Thicket). Чащаразбора описывает синтактико-дискурсивную структуру абзаца.40Определениеназывается1.16.совокупностьЧащейразборамножестватекстовогодеревьевабзацаразборадляпредложений абзаца и связей нескольких типов, устанавливаемыхмежду вершинами этих деревьев. Каждая связь – это упорядоченнаяпара вершин деревьев разбора, причем связаны между собой могутбыть как вершины одного и того же, так и разных деревьев.Со структурной точки зрения, чаща представляет собойориентированный граф, который включает в себя деревья разбора, атакже дуги, соответствующие несинтаксическим связям.Рисунок 1.3. Пример графического представления чащи разбора1.4.5 Теория «Смысл ⇔ Текст»Чаща разбора представляет собой непосредственное развитиеидеи синтаксических деревьев разбора на случай абзаца.

При этомфактически чаща предполагает частично независимое построение41синтаксических и дискурсивных связей. Более того, разные типыдискурсивных связей также строятся независимо друг от друга. Крометого, её применение предполагает наличие развитых инструментов,позволяющих автоматически конструировать деревья и связи междуними. Это требование в полной мере выполняется для английскогоязыка, который и рассматривался в экспериментах. Возможнойальтернативой чаще может служить представление, основанное наиспользованиитеории«Смысл⇔Текст»,разработаннойИ.Мельчуком [10]. Теория «Смысл ⇔ Текст» представляет собойописание естественного языка, понимаемого как устройство («системаправил»), обеспечивающее человеку переход от смысла к тексту(«говорение», или построение текста) и от текста к смыслу(«понимание», или интерпретация текста). Теория постулируетмногоуровневую модель языка, то есть такую, в которой построениетекста на основе заданного смысла происходит не непосредственно, ас помощью серии переходов от одного уровня представления кдругому.

Помимо двух «крайних» уровней — фонологического(уровня текста) и семантического (уровня смысла), выделяютсяповерхностно-морфологический,глубинно-морфологический,поверхностно-синтаксический и глубинно-синтаксический уровни.Каждый уровень характеризуется набором собственных единиц иправил представления, а также набором правил перехода от данногоуровня представления к соседним. Семантическое представлениеявляетсянеупорядоченнымпредставленияявляютсяграфом(«сетью»),графическимсинтаксическиедеревом(«деревомзависимостей»).Данная теория обладает целым рядом важных свойств:421.

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6390
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее