Диссертация (Тональность текста синтаксические паттерны выражения отношений между сущностями), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Тональность текста синтаксические паттерны выражения отношений между сущностями". PDF-файл из архива "Тональность текста синтаксические паттерны выражения отношений между сущностями", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГОУ. Не смотря на прямую связь этого архива с МГОУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
Например, глаголverhindern (предотвращать) накладывает положительный эффект на субъект, нотолько если прямой объект отрицателен (например, для предотвращениянесчастного случая), в противном случае эффект отрицательный (например, дляпредотвращения решения проблемы). Эти ограничения на полярность нафразовом уровне определяются на основе лексикона полярности (включающегоприблизительно 6000 существительных и прилагательных) и простого соединениятональностей. Ожидаемая полярность – более слабое ограничение.
В то время какограничения полярности исключают случай нейтральных филлеров (так какэффект не может быть надежно установлен), ожидания лишь блокируютпротивоположные полярности, но допускают нейтральные филлеры.Одной из главных идей М.
Кленнера и М. Амслера является то, чтосоотнесенность с действительностью играет решающую роль в определенииполярности, накладываемой отдельным глаголом.На основе 120 созданных вручную предложений, предназначенных дляотражения основных случаев синтаксической вариации, набор правил извлечениябыл автоматически извлечен из деревьев синтаксического анализа. Только еслидерево было правильно с точки зрения структуры аргументов глагола, онианнотировали базовую структуру аргументов, а также сочинение, отрицание иконструкции со вспомогательными глаголами. Корпус для оценки качестваприменения SentiFrames состоял из почти 100 тысяч предложений, 12 тысяч изних содержали один или несколько глаголов из фреймов.
Не во всех этихпредложениях были найдены фреймы при анализе. Существует несколькопричин: ограничения выбора не выполняются, правило выделения не найдено.Более того, некоторые глаголы ведут себя совершенно по-разному, учитываяразличные предлоги, которые они допускают (sorgen fur, sorgen wegen, sorgenum). М. Кленнер и М. Амслер получили 6,603 экземпляра глагольных фреймов,которые были основой оценки.
Сгенерирован стратифицированный образец (50041предложений), два аннотатора проверили правильность назначенных эффектов.Точность составила 0,76 и 0,80 для аннотаторов. Более тщательный анализошибок показал, что неоднозначность глаголов, как и ожидалось, являетсяважным источником ошибок, но также модальность, обусловленная модальнымиглаголами (указывающими на фактичность) и отрицание (было лишь несколькоправил для отрицания) делают свой вклад в неверные случаи классификации.Наиболее частотными глаголами, для которых аннотировали фреймы, были:unterstützen (поддерживать), gewinnen (побеждать), verlieren (проигрывать),ablehnen (уменьшаться), bedrohen (угрожать) töten (убивать), feiern (праздновать),scheitern (терпеть неудачу), verbieten (запрещать), vorwerfen (упрекать), leiden(терпеть), kritisieren (критиковать), helfen (помогать), empfehlen (продвигать),weigern (отказаться), zwingen (заставить), stören (беспокоить) [Klenner, Amsler,2016].Похожие фреймы созданы для английского языка, авторы назвали ихконнотационными[Rashkin,Singh,Choi,2016].Этифреймысодержатинформацию о сущностях и отношениях между ними, когда они находятся вотношениях с глаголами-единицами фрейма.
Коннотационный фрейм дляпредиката состоит из: перспективы, то есть направления отношения от одной сущности кдругой, характеристики ценности сущности; эффекта (положительного или отрицательного), оказанного на сущность; ментального состояния сущности [Ibid., p. 312].ДлярусскогоязыкасозданпроектRuSentiFrames.Отличиемрусскоязычного проекта от проектов для немецкого и английского языковявляется общий объем перечня фреймов и представленность не только глаголов.Оценочный фрейм содержит в себе информацию разного рода, в том числе:отношение между участниками ситуации, отношение автора к участникамситуации,последствиядляучастниковситуации(положительныеилиотрицательные), состояние участников ситуации, ценность участников ситуации42для других компонентов фрейма [Лукашевич, Карнаухова, Русначенко, 2018, с.173]. В ходе эксперимента авторами была проведена проверка созданныхфреймов сопоставлением с данными, найденными в текстах.
Для экспериментабыло отобрано 50 фреймов и два эксперта подготовили по 10 предложений изтекстов для них. После этого, эксперты заполнили слоты фреймов, опираясь насобранные данные, и эти фреймы, после усреднения, сравнивались с исходнымифреймами RuSentiFrames. Для некоторых фреймов были найдены новые слоты,кроме того, были и сильные отклонения между фреймом RuSentiFrames ифреймами, собранными во время эксперимента [Там же. С. 175–177].1.3.4 Типы языковых единиц в анализе тональностиАнализ тональности по своей сути является частным случаем задачиклассификации.
Но кроме положительного, нейтрального и отрицательногокласса можно также выделить и ряд других.Важнейшимпонятием,связаннымстональностью,являетсясубъективность, более того, в первых работах по анализу тональностииспользовалсятермин“анализсубъективности”.Классификацияпосубъективности выявляет объективные и субъективные предложения.Объективное предложение содержит фактическую информацию, в то времякак субъективное выражает личные чувства, точку зрения и убеждения.
Важнопонять, что субъективность не тождественна тональности, так как и вобъективных предложениях может содержаться мнение, а субъективныепредложения не всегда содержат тональность.Подобная неоднозначность этих понятий привела к введению новоготермина “тональная релевантность”.Тональная релевантность (Sentiment Relevance) – понятие, позволяющееотличать информативное содержание для определения тональности документа от43неинформативного.Оноконтрастируетсобычнымразличиеммеждусубъективным и объективным содержанием [Scheible, Schutze, 2013].
Хотя междуприведенными двумя понятиями существует связь, они не эквивалентны.Как было сказано ранее, субъективность и тональная релевантность – этодве разные концепции, которые не подразумевают друг друга: в целомнейтральные и объективные предложения могут быть релевантными, в то времякак субъективный контент – нерелевантным. Ц. Шнайбл и Х. Шутце [Scheible,Schutze, 2013] проводили классификацию релевантности настроений в сферекино.
Для создания аннотированного корпуса, или SR-корпуса, они случайнымобразом отобрали 125 текстов из базы обзоров фильмов [Pang, Lee, 2008]. Всего вкорпусе SR содержится 275 релевантных и 728 нерелевантных предложений,корпус находится в свободном доступе.Несомненно,прианализетекстоврецензийвстречаютсяошибки,совершенные при разметке, но, так как первоначальная цель корпуса – бытьматериалом для задач обучения на прецедентах, это не критично, так как большойобъем коллекции не позволит неточностям испортить результаты выдачи.У термина «тональная релевантность» есть еще одно значение.
Тональнорелевантными могут признаваться языковые единицы (синтагмы), кроме того,рассматриваетсярелевантностьобъектовпоотношениюктональнымвысказываниям [Семина, 2018в].В неперсонализованных текстах установление тональной релевантностисводится к тому, что подобранный лингвистом алгоритм должен находитьтональные высказывания и подбирать к ним сущность-источник и сущность-цель.Возможно и обратное направление анализа: поиск пар сущностей, потенциальноявляющихся элементами мнения (субъектом или объектом) и дальнейшая оценкатональности их отношения.
Тональные высказывания могут находиться как припомощи методов машинного обучения, так и при помощи специальных словарейоценочной (тональной) лексики.В качестве примера рассмотрим текст статьи с сайта inosmi.ru. Этот сайтразмещает переводы статей из зарубежных изданий на русский язык. Конечно,44нельзя считать перевод абсолютно эквивалентным с прагматической точки зрения[Марчук, 2016], но качество тестирования и работы подобной системы анализа отэтого не ухудшится.Во фрагменте статьи ниже присутствует ряд именованных сущностей и рядтональных высказываний (т.е.
языковых единиц, эксплицитно выражающихтональность). В пределах одного абзаца могут быть как положительные, так иотрицательные отношения между сущностями, в том числе и между одной паройсущностей.По словам Пескова, выступившего перед репортерами в Москве в пятницу,27 октября, президент России Владимир Путин, который на прошлой неделеобвинил США в том, что «они возвращают нас в 1950-е годы», пристальноследит за новостями о санкциях. Путин не захотел выступить с критикой вадрес лично Трампа, а Песков, сославшись на слова президента, отметил, чтоМосква продолжит стремиться к налаживанию двусторонних отношенийнастолько, «насколько к этому готовы и этого желают наши американскиеколлеги» [Демирчян, 2017, Электронный ресурс].Если представить текст статьи в виде списка мнений, который в общем видебудет выглядеть [<Сущность А>, <Сущность В>, тональность], где А – субъекттональности, В – объект тональности, тональность – полярность оценки(положительная или отрицательная), мы получим:[Путин, США, neg], т.к.
«обвинил США в том, что «они возвращают нас в1950-е годы»»;[Путин, Трамп, pos], «Путин не захотел выступить с критикой в адреслично Трампа»;[Москва, США, pos], «Москва продолжит стремиться к налаживаниюдвусторонних отношений» [Семина, 2018в].Понятие релевантности, как было показано выше, в современном анализетональности изменило свое значение, от релевантности предложений каккритерия отбора для обучения и тестирования, исследователи перешли к болееузкой сфере – релевантности сущности для конкретного высказывания [Deng,45Wiebe, 2015a]. Иногда в работах употребление термина в этом значении называюттональной релевантностью сущностей (entities sentiment relevance), что кажетсянамудачнымтермином.Терминологическоеразличениерелевантностифрагментов текста и сущностей важно, так как, по сути, это разные подзадачианализа тональности, каждая из которых требует применение особых алгоритмованализа и создание обучающей или тестовой коллекции.1.3.5 Анализ тональности и уровни языкаЕсли рассматривать язык как уровневую систему, мнения и эмоции будутотноситься к семантике, тем не менее, для выявления этого компонента значениявысказывания необходимо рассмотреть другие языковые уровни.Анализ тональности обычно проводится на материале письменных текстов,и основные методы этого направления не подходят для изучения устной речи безперевода в письменный модус.