Главная » Просмотр файлов » Диссертация

Диссертация (1173445), страница 6

Файл №1173445 Диссертация (Тональность текста синтаксические паттерны выражения отношений между сущностями) 6 страницаДиссертация (1173445) страница 62020-05-15СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 6)

Ранние работы по анализу тональности почти всегдаискали только эксплицитно выраженные мнения, в настоящее время происходитсмещение интереса на исследование имплицитных мнений, то есть мнений, неимеющих явного тонального высказывания. В примере эксплицитно выраженотолько одно мнение: ({Евросоюз}, positive, {Белоруссия}, current}. Человекпоймет намного больше при чтении этого предложения.

Так, если раньше санкциибыли введены, то это свидетельствует о мнении ({Евросоюз}, negative,{Белоруссия}, past}). Кроме того, можно найти и мнения ({Белоруссия}, negative,{Евросоюз}, past}), ({Белоруссия}, positive, {Евросоюз}, current}, потому чтовведение/отмена санкций – это событие, из-за которого сущность Белоруссиятоже меняла свое отношение к сущности Евросоюз.В начале этого года Евросоюз отменил санкции против Белоруссии [ЛауренА.-Л., 2016, Электронный ресурс].31Подходов к извлечению имплицитных мнений достаточно много.

Впоследнее время растет внимание исследователей к логическому выводутональности, распознающему имплицитные мнения путем вывода их изэксплицитных мнений через правила. Современные работы по логическомувыводу тональности различаются между собой тем, какие правила определены икак они выражены. Например, Л. Чжан и Б. Лью собрали лингвистическиешаблоны для распознавания фраз, выражающих имплицитное мнение [Zhang, Liu,2011], в то время как Л.

Денг и Дж. Виби представили несколько правил в видеограничений на эквивалентность/неэквивалентность в рамках целочисленноголинейного программирования [Deng, Wiebe, 2014]. Позднее Л. Денг и Дж. Вибисобрали более общий набор правил логического вывода и закодировали их врамках вероятностной мягкой логики [Deng, Wiebe, 2015a]. Вероятностная мягкаялогика – это разновидность логических сетей Маркова, которая является средойдля вероятностной логики, использующей взвешенные формулы в виде логикипервого порядка для компактного кодирования сложных неориентированныхвероятностных графических моделей (то есть Марковских сетей) [Beltagy, Erk,Mooney, 2014].Для каждого предложения s Л.

Денг и Дж. Виби определяли множество E,состоящее из сущностей, событий и автора s, и множества P и N, элементамикоторых являются положительные и отрицательные тональности соответственно.Каждый элемент множества P – это кортеж, представляющий положительнуюпару двух сущностей (e1 и e2), где e1, e2 ∈ Е и e1 положительно относится к e2.Положительная пара (e1, e2) включает в себя все положительные тональности e1 поотношению к e2 в предложении. N – это аналогичное множество отрицательныхпар. Цель исследования состояла в том, чтобы автоматически распознаватьмножество положительных пар (Pauto) и множество отрицательных пар (Nauto). Онисравнивали выходные данные (Pauto ∪ Nauto) с эталоном (Pgold ∪ Ngold) для каждогопредложения [Deng, Wiebe, 2015a].32Другим широко применяемым подходом к выявлению имплицитнойтональности будет применение импликатурных ограничений [Deng, Wiebe, 2014].Часто этот метод называют +/-effect события или goodFor/badFor события.

Этотподход характеризуется распространением тональности за счет правил, которыеучитывают положительное или отрицательное влияние на сущности.В некоторых исследованиях авторы рассматривают не только сам текст, нои социальный и дискурсивный контекст текста. Документы часто представляютсобой сеть фактов и мнений между сущностями, которые могут быть выраженынеявно при помощи фактической информации или социального контекста. Группаисследователей из университета Вашингтона показала, что учет всех этихфакторов может сделать предсказание о тональности более полным.

Онипредставили модель, которая сочетала в себе три типа сведений: классификациютональности пары сущностей, извлечение фактов на основе шаблонов и динамикунастроений в социальных группах. Вместе они позволяют делать более полныепрогнозы как эксплицитно выраженного мнения, так и имплицитно [Choi, Wiebe,Mihalcea, 2017].Динамика настроений в социальных группах включает в себя идею, чточлены одной группы склонны иметь схожие мнения. Например, известно, чтоРоссия плохо относится к Белоруссии, а Белоруссия хорошо относится кСаакашвили. Из этого можно сделать вывод, что Россия негативно относится кСаакашвили.

Отличие этой работы от других заключается в следующем:социальная динамика применяется к тональности от сущности к сущности в неструктурированном тексте. Они восстанавливают тональность, которая можетбыть выведена из данных, которые охватывают несколько предложений. Онивпервыепредлагаютмоделироватьотношениямеждуфактическимиисубъективными связями [Document-level Sentiment Inference with Social, Faction,and Discourse Context, 2016].Классификатор для пар сущностей подразумевает наличие сущности авторамнения (e) и ее упоминаний, объекта мнения (j) и его упоминаний, и документа.Он предсказывает тональность (e→j)∈{positive, unbiased, negative}.

На вход33подается простой текст, автоматически происходит определение сущностей,анализ зависимостей и разрешение кореференции. [Ibid.] используют три типапризнаков:Признаки зависимости – они рассмотрели все пути зависимостей между e иj в каждом предложении и суммировали предложения, в которых они встречаютсясовместно.Признаки документа – понятия, связанные со значимостью (например,близость к тональным высказываниям), могут помочь в обнаружении целевойтональности.

В своих данных [Ibid.] обнаружили, что характер появлениясущности является важным фактором для того, чтобы быть вовлеченным втональности, например, если объект упоминается чаще остальных, он с большейвероятностью будет иметь оценку, сущность в заголовке также имеет большуювероятность иметь тональность.

Также используются признаки, указывающие,упоминаются ли e и j:1) в заголовке,2) один раз во всем документе.Когда они являются двумя наиболее часто встречающимися объектами,добавляется метка тональности документа в качестве признака.Признаки цитирования – цитаты часто содержат в себе субъективныемнения в отношении известных лиц в новостных статьях.

Прямая речьизвлекалась с использованием регулярных выражений. В пределах цитатыдобавляется метка тональности от говорящего к объектам в ней, кроме техслучаев, когда объект появляется в тексте менее трех раз. Для извлечениякосвенной речи использовался список из 20 глаголов говорения, что позволялообнаружить прямую речь и автора мнения. В данных исследователей около 25%меток тональностей переступают границу предложения, более того, сущностьможет проявлять отношение к другой, ни разу не оказавшись в одномпредложении.

Если в статье некоторая тема обсуждается в каком-то фрагментетекста, объект может и не упоминаться [Ibid.].341.3.2 Уровни анализа тональностиПод уровнем анализа тональности понимается языковая единица, прианализекоторойизвлекаетсяодномнение.Враннихработахбылораспространено выделение трех уровней: уровня документа, уровня предложенияи уровня аспектов. В настоящее время эта классификация не потерялаактуальность, но смещение интересов в сторону более глубокого анализатональности привела к ее расширению.Уровень документа – единицей анализа является весь текст, в котором естьодин объект, один субъект (как правило, автор текста) и одна тональность.

Какправило, на этом уровне анализируются твиты, потому что из-за небольшогообъема (280 символов) субъект тональности обычно выражает мнение об одномобъекте. На уровне документов может производиться анализ рецензий илиотзывов, если в качестве результата анализа исследователь хочет видеть общуюоценку объекта. Кроме того, при анализе рецензий на фильмы или на отзывы отоварах возможно создание обучающего корпуса без дополнительной разметки,потому что большинство сайтов с отзывами имеют и оценку объекта,поставленную автором текста, на основании чего можно собрать корпус даже дляанализа с оценочной шкалой.

Проблемой анализа текста на данном уровнеявляется низкая чувствительность к единицам, влияющим на тональность(отрицанию или резкой смене тональности), для этого может применяться модель,выполняющая анализ в несколько этапов с выявлением таких фрагментов [Polarityshift detection, elimination and ensemble: A three-stage model for document-levelsentiment analysis, 2016].Уровень предложения – единицей анализа является каждое предложениетекста, методы анализа могут не отличаться от анализа на уровне документа.

Темне менее, подобный уровень может потребовать привлечения специалистов дляразметки корпуса текстов по предложениям. Одним из первых таких корпусов35был корпус Б. Пана, в котором были размечены рецензии на фильмы [Pang et al.,2002]. Так, подавая документ на анализ, результатом будет ответ о тональностикаждого предложения [Jagtap, Pawar, 2015, p. 164–165]. Можно оставитьподобный результат, или сделать общие выводы о тональности всего документа.Это похоже на уровень документа, но есть ряд важных отличий в самом процессеанализа. На уровне документа не всегда учитывается расположение тональныхвысказываний и может применяться модель мешка слов. На уровне предложенийизвестна тональность каждого предложения, можно учесть его положение втексте при выводе общего результата.Уровень фраз (фрагментов) – единицей анализа является фрагмент текста,меньший, чем предложение.

В данной терминологической традиции фраза такжепонимается как единица, не превышающая предложение, в ряде случаев онаможет быть равно словосочетанию. Анализ обычно проводится в два этапа:сначала выражения классифицируются как нейтральные или тональные, затемопределяется полярность тональных высказываний. Анализ на этом уровнесложнее, но дает более точные представления о мнении людей, потому что водном предложении может быть несколько мнений с разной тональностью[Wilson, Wiebe, Hoffmann, 2005, p. 347–348].Уровень аспектов – единицей анализа является не заданный фрагменттекста, а характеристика объекта (аспект).

Непосредственно анализу тональностипредшествует поиск аспектов – характеристик объекта [Aspect-level SentimentAnalysis using AS-Capsules, p. 2033].Для создания списка аспектов могут применяться различные подходы,например, специалист может вручную создать список; могут быть собраны самыечастотныесуществительныев корпусеанализируемыхдокументов(илианалогичных по теме), они признаются аспектами, хотя и в данном случаежелательна последующая “чистка” результатов человеком; может применятьсятематическое моделирование. Д.А. Рой и Н.Э.

Характеристики

Список файлов диссертации

Тональность текста синтаксические паттерны выражения отношений между сущностями
Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6375
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее