Главная » Просмотр файлов » Диссертация

Диссертация (1173445), страница 18

Файл №1173445 Диссертация (Тональность текста синтаксические паттерны выражения отношений между сущностями) 18 страницаДиссертация (1173445) страница 182020-05-15СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 18)

Предикат «предлагать» вкачестве слотов требует два дополнения, прямое и косвенное. Прямое дополнениев этом примере является лексемой, показывающей взаимную тональность истоящей в аккузативе. Так как это не связано напрямую с именованнымисущностями, на схеме это не отмечено. Косвенное дополнение стоит в дативе, чтовписывается в схему управления этого глагола. В этом примере можно говорить онеравноправии сущностей, сущность в номинативе однозначно будет субъектом.Отношение, в котором вторая сущность является субъектом, скорее дополняетпервое, но не является полностью самостоятельным. Предикат «предлагать»выражает интенцию первой сущности установить сотрудничество, тем не менее,не говорит об ответном отношении второй сущности напрямую. Можнопредположить наличие имплицитной части высказывания: сущность 1 и сущность2 явно достаточно хорошо друг к другу относятся, чтобы говорить об96установлении сотрудничества в каком-либо внешнеполитическом вопросе,следовательно, можно говорить о положительной взаимной тональности.В контексте [NE {nomn} недовольна, что NE {nomn} – ее союзник поНАТО… ], компоненты мнения и эксплицитная и имплицитная информацияпредставлены в Таблице 21, между сущностями с одинаковым падежом нетсочинительной связи, тем не менее, есть взаимная тональность.

При глубокоманализе можно отметить, что отношения между сущностями будут ненегативными, так как, несмотря на недовольство сущности 1 сущностью 2, онивсе же являются членами одной политической организации, поэтому не могутиметь серьезных конфликтов. Нужно отметить и не полностью положительнуюоценку тональных отношений, так как сущность 1 недовольна поведениемсущности 2, при этом сущность 2 совершила нечто, вызвавшее такое отношение.Таблица 21 – Нетипичная тональная структура для паттернаСубъектОбъектЭксплицитнаяинформацияNamed Entity Named Entity 2 NamedEntity11недовольна поведениемNamed Entity 2.Named Entity 1 являетсясоюзникомNamedEntity 2.Named Entity Named Entity 1 Named Entity 2 является2союзникомNamedEntity 1.NamedEntity2совершилакакое-тодействие,непонравившееся NamedEntity.ИмплицитнаяинформацияNamedEntity1разделяетосновныеполитическиеубежденияNamedEntity 2, так как онисоюзники.Ониосталисьсоюзниками,ноотношение субъекта кобъекту стало хуже.NamedEntity2совершилакакое-тодействие,непонравившееся NamedEntity 1.97Рассмотрев подробно структуру тональных отношений этого предложения,можно сказать, что общая тональность будет скорее положительной, чемотрицательной,поэтомувслучаебинарноговыборастоитвыбратьположительную метку.

При градуальной оценке тональное высказывание«недовольна»должнопонизитьобщуютональность.Врядеязыковыхвысказываний нельзя установить отношение в рамках Булевой логики, поэтому,как в этом примере, необходимо выбрать более подходящий вариант, если стоитбинарный выбор.В примере [NE1 {datv} и NE2 {datv} важно поддерживать связи] дативименованных сущностей обоснован модификатором «важно». В целом, примерсоответствует требованиям об одинаковом падеже, нужно лишь учитыватьуправление лексических единиц.2.5 Особенности выражения мнения автораПри анализе аналитических статей можно увидеть, что ряд тональныхотношений имеет в качестве субъекта не сущность внутри текста, а автора текста,что не подразумевается жанром информационной журналистики. Тем не менее,автор текста не выражает мнение напрямую, используя эксплицитные оценочныеконструкции, вместо этого применяется ирония, сарказм и стилистическисниженная лексика [Семина, 2019б].

Примером подобной лексики будетвыражение «альфа-самец» по отношению к президенту РФ В.В. Путину впримере:Британское решение покинуть ЕС вполне устраивает российского альфасамца, – такова оценка старшего научного сотрудника Датского институтамеждународных исследований и специалиста по России Флемминга Сплидбёля(Flemming Splidsboel) [Линдегорд, 2016, Электронный ресурс].98Нужно отметить, что автор текста также может считаться именованнойсущностью, потому что для текста публикации известен автор статьи или издание,опубликовавшее текст. Автор статьи имеет явно определенного референта вреальности, что касается и названия газеты или интернет-ресурса, следовательно,они являются именованными сущностями и на этом уровне анализа тональностимогутбыть объектом исследования.Отличие от остальныхсущностейзаключается в том, что мнение автора может быть высказано в статье в любомместе, при этом использование эксплицитных оценочных предикатов непредставлятся возможным.Так как для части статей осуществлялась ручная разметка тональныхотношений, был проведен анализ частотности выражения мнения автором.На рисунке 1 представлено отношение статей, содержавших мнение автора,ко всем статьям, для которых была проведена разметка.

Можно увидеть, что в25% статей был минимум один случай выражения мнения автором.Рисунок 1Если рассмотреть общее количество мнений между именованнымисущностями и мнений автора, получаем отношение, представленное на рисунке 2.Так, мнений автора в текстах оказалось около 5%, при этом стоит учесть, чтонекоторые случаи мнения могли быть не учтены при разметке. Все же, и 5%являются достаточным числом примеров, чтобы рассмотреть особенности ихвыражения.99Рисунок 2Как было сказано ранее, при выражении мнения автор обычно используетнетипичную для стиля аналитических статей лексику.

Подобный способвыражения мнения затрудняет автоматический поиск подобных тональныхотношений, потому что при любом подходе к анализу необходимо вноситьдополнительные правила для поиска таких оценок. При машинном обучении вобучающий корпус вся подобная лексика не попадет, следовательно, на практикесистема будет пропускать эту информацию. Добавить список этих лексем всистему на основе правил тоже не представляется возможным, так как списковтаких выражений не существует.Для поиска подобной ироничной лексики предлагается использоватьобратную частоту документа (idf–inverse document frequency), так как еепоказатель для редких слов в корпусе будет выше, чем для частотных [Семина,2019б].

Метрика idf обычно применяется в информационном поиске и машинномобучении для нормализации векторного пространства, но для каждого термина вдокументе она применяется совместно с частотой термина в документе (tf–termfrequency). Произведение tf*idf (часто записывается как tf-idf) позволяет оценитьстепень важности каждой языковой единицы для описания документа. Однакозадача состоит не в описании терминопортрета документа, а в поиске ироничныхтерминов во всей коллекции, поэтому частота термина tf была убрана из расчётов.idft = log(N / dft)100В анализе тональности tf-idf применяется в тех случаях, когда онрассматривается как задача классификации, тогда эта метрика помогает«взвесить» термины и определить их значимость. Существует и так называемаяdelta-схема взвешивания весов признаков, она учитывает распространениепризнака не во всем корпусе текстов, а неравномерность распределения слова вклассах тональности.

Чем неравномернее распределено слово или выражение, темвыше будет его вес при delta-схеме.Цель заключается в другом–необходимо найти закономерности на основередких слов в коллекции, которые помогут извлекать мнение автора. Простойпоиск слов с низкой частотой в языке не дал бы результатов, потому чтостилистически сниженная лексика может, наоборот, быть частотной в языке.Метрика idf позволит найти слова, которые редко встретились не в языке, а вотобранных текстах [Семина, 2019б].Для этой задачи можно использовать и простой поиск редких слов вколлекции на основе частотного словаря корпуса. Нужно отметить, что междуединичным упоминанием в корпусе и упоминанием только в одном документеестьразличия.Преимуществомобратнойчастотыдокументаявляетсявозможность привлечения показателя частоты термина в документе (tf), что моглобы быть полезным в поиске текстов, тематически отличающихся от основногомассива.

В этом случае, показатель idf будет высоким для некоторых терминов,при этом, если термин частотен в документе, то и показатель tf будет высоким. Втаком случае, при помощи комбинации этих данных есть возможность отличатьлексику, которая может быть показателем мнения автора, от терминов, невписывающихся в общую тематику.

Так, у слова будет высокая обратная частотадокумента, но низкая частота термина в документе, если оно в целом редковстречается в корпусе. Если у термина оба показателя высокие, это можетговорить о наличии слова из другой сферы дискурса. Это могут быть какэкономические термины, так и, например, названия событий, которые необсуждались в других статьях.101Для поиска редкой лексики без необходимости выделять описанные вышеслучаи может применяться простой поиск редкой лексики в корпусе. Конечно,для этого не подойдет общий частотный словарь русского языка, необходимчастотный словарь для анализируемого корпуса.

Соответственно, при добавленииновых статей в корпус, он должен обновляться.В Приложении В одна из статей была представлена в виде списка частотвсех лексем, не относящихся к числу стоп-слов. Можно отметить несколько группредких слов, которые могут являться показателем мнения автора. Рассмотримфрагмент этой статьи, в котором для носителя очевидно отношение автора кобсуждаемой сущности.Иногда он ведет себя как капризный ребенок, который пытается добитьсяот родителей своего, бросая игрушки. Иногда как политический хулиган. Аиногда он напоминает Хрущева, стучащего дырявым ботинком по трибуне[Велиньский, 2016, Электронный ресурс].В примере есть несколько групп слов в низкой частотностью, например,«капризный [1] ребенок [9]», «от родителей [1], бросая [3] игрушки [1]»,«стучащего [1] дырявым [2] ботинком [1] по трибуне [2]».

Возможны и случаикомбинации высокочастотных и низкочастотных слов в рамках словосочетания,как в «политический [168] хулиган [6]». Подчеркнутые слова являютсятональными.Как было сказано ранее, низкая частота не является точным показателемналичия мнения автора в тексте, но кластеры таких слов, и особенно наличиенескольких таких групп в пределах абзаца, могут быть индикатором мнения.2.5.1 Прямая речьПростое извлечение мнений без дополнительной процедуры анализа можетпривести к большому количеству ошибок. Кроме того, как было сказано ранее,102порядок объект-субъект частотен в виде отношений в прямой речи. Прежде всего,нужно установить, кому принадлежит высказываемое мнение в прямой речи,потому что это является неоднозначным вопросом, требующим анализа языковогоматериала. Стоит выделить возможные ситуации, которые могут оказать влияниена тональность:1.

автор прямой или косвенной речи может высказывать собственноемнение о сущностях,2. автор мнения может передавать факты, показывающие отношениясущностей друг к другу,3. автор может высказывать отношения о сущностях, не являющиесяистинными [Семина, 2019д].В первом случае автор прямой речи может высказывать свое мнение онекоторой именованной сущности, тогда целесообразно устанавливать егосубъектом мнения во всех тональных отношениях, как в примере:«Многие члены НАТО не платят по счетам, не делают то, что должны», –заявил миллиардер [= Дональд Трамп] [«Агент Путина»: рассуждения Трампанапугали американские СМИ, 2016, Электронный ресурс].В примере выше автор прямой речи высказывает мнение об именованнойсущности НАТО, других тональных отношений в предложении нет. Подобныеслучаи проще всего поддаются анализу, так как достаточно установить авторапрямой речи как субъекта всех тональных отношений на этом отрезке, если же ивнутри высказывания есть только одна именованная сущность, все тональныевысказывания можно приписать этому отношению.Похожая ситуация в примере:«Если применить ядерные вооружения, то последствия будут ужасными.Поэтому вызывают тревогу постоянные напоминания России, что у нее естьядерное оружие», – говорит министр обороны Петер Хультквист [Хольмстрём,2016, Электронный ресурс].В речи находится только одна именованная сущность, поэтому объектомтонального отношения устанавливается она, автор прямой речи ставится в роль103субъекта тональности.

Характеристики

Список файлов диссертации

Тональность текста синтаксические паттерны выражения отношений между сущностями
Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6367
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее