КонфЭмоции09 (Лексикографирование оценочных наименований сторонников украинских политиков в украиноязычном онлайн-дискурсе)

2021-10-14СтудИзба

Описание файла

Документ из архива "Лексикографирование оценочных наименований сторонников украинских политиков в украиноязычном онлайн-дискурсе", который расположен в категории "". Всё это находится в предмете "языковедение" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. .

Онлайн просмотр документа "КонфЭмоции09"

Текст из документа "КонфЭмоции09"

Лексикографирование оценочных наименований
сторонников украинских политиков в украиноязычном онлайн-дискурсе
1

Dictionary representation of the evaluative naming of people: the case of the Ukrainian politicians’ supporters in online discourse

Аннотация

В статье описываются особенности фиксации наименований участников политической онлайн-коммуникации в электронных словарях тезаурусного типа. Рассматриваются как технические вопросы обработки украинского текста, так и собственно лингвистические аспекты. Основное внимание уделяется лексикографированию коннотативного и референциального компонентов лексических единиц.

The article deals with the ways to describe different naming strategies used when addressing supporters of other political views online in thesauri-like electronic dictionaries. While the paper mainly focuses on the connotational and referential components of lexical meaning, some technical issues arising when processing Ukrainian online texts are also addressed.

Ключевые слова

Компьютерная лексикография, политическая онлайн-коммуникация, украинский язык

Computational lexicography, political e-communication, Ukrainian language

Одной из наиболее важных проблем, стоящих перед различными исследователями современных политических процессов в онлайн-пространстве, является определение максимально возможного количества наименований участников анализируемых процессов с минимальными усилиями. В данной работе мы остановимся на рассмотрении политической ситуации в ходе президентских выборов на Украине 2019 г. Украинский политический дискурс во всем своем многообразии раскрывается в сети Интернет. При этом высокий уровень поляризации политического Интернет-пространства ведет к значительной доле резко негативных лексических блендов и иных имплицитных (с точки зрения автоматической обработки) форм обращения коммуникантов друг к другу.

В данной работе описывается один из подходов к формализации подобных наименований в тексте — тезаурусное лексикографирование. В пользу выбора именно данного подхода к описанию политической ситуации свидетельствуют, во-первых, существующий опыт по созданию словарей-тезаурусов по политической ситуации на Украине в разрезе «Майдан/Антимайдан» [Жаботинская 2015], и, во-вторых, применение баз данных тезаурусного типа для описания различных проявлений имплицитных оценок в системах автоматической обработки текстов [Куликов 2016: 20; Kulikov 2017: 128]. Стоит отметить, что процитированные выше работы имеют определенные недостатки, которые требуют существенных доработок при описании современных политических реалий Украины. Так, словарь С. А. Жаботинской составлен на русскоязычном материале и не предназначен для использования в системах автоматической обработки текстов, т.к. использует разные конвенции для описания оценочных имен собственных и имен, обозначающих представителей отдельных групп (например, статьи «УЗУРПАСТОР» [Жаботинская 2015: 77] и «БАНДЕРТРОЛЛИ» [там же: 79]), а также не содержит указаний на косвенные употребления, которые могут быть выражены частями речи, отличными от существительных. С другой стороны, схема, предложенная в наших предыдущих работах [Куликов 2016; Kulikov 2017], не предполагала учета внутрисловного переключения кодов, что применительно к обработке украинских текстов потребовало бы создания отдельного программного компонента по синтезу поликодовых лексем и неоправданному увеличению объема словаря.

Основой лексического наполнения разрабатываемого словаря-тезауруса является создаваемый в БФУ им. И. Канта корпус украинского политического кибербуллинга CYBUL-UA, содержащий разметку украиноязычных политических твитов по 11 аспектам языка вражды. В данной работе мы остановимся на описании оценочных лексем, которые обозначают сторонников трех ведущих политиков (Вл. Зеленский, П. Порошенко, Ю. Тимошенко), участвовавших в первом туре президентских выборов на Украине в конце марта 2019 года. Все анализируемые лексемы относятся к тегу «политические взгляды» разметки данного корпуса.

Ключевой задачей при создании схемы словарного описания является определение вокабулы (или первичного ключа базы данных). В связи со сформулированной задачей — формированием наиболее полного списка наименований участников коммуникации — в качестве вокабулы была выбрана синтетическая форма наименования сторонника того или иного политика (зеленівець 2, порошенківець, тимошенківець). В отличие от предыдущей схемы описания однореферентных оценочных слов добавлена отдельная обязательная зона для аналитической формы, которая начинается со слова прихильник ― ‘сторонник’ и далее содержит именованную сущность в родительном падеже (ФИО). Зона аналитической формы является множественной и включает отдельные поля базы данных для полной и двух сокращенных форм имени. Для полноты описания для каждой из перечисленных словарных зон добавлены дериваты-феминитивы, например, прихильниця Володимира Зеленського, порошенківка, тимошенківка. Для более компактного описания лексем мы решили отказаться от отдельных словарных зон для обозначения частей речи, знака оценки и ее силы. На данном этапе работы над словарем мы также решили ограничиться описанием только дериватов двух частей речи — существительных и прилагательных, что вызвано, с одной стороны, бóльшим деривационным разнообразием в украинских глаголах, а, с другой стороны, сравнительно небольшим количеством употреблений глагольных и наречных дериватов в текстах.

Орфографические особенности украиноязычных онлайн-текстов требуют введения дополнительных зон для орфографических вариантов. Эти зоны следует признать факультативными, их количество для каждой конкретной вокабулы зависит от количества потенциальных орфографических вариантов. Наиболее существенным маркером на наличие орфографических вариантов является наличие кириллической буквы і (символ Юникод U+0407), который часто заменяется на сходный латинский символ i (символ Юникод U+0069). Важно отметить, что рассматриваемые орфографические варианты не несут новой семантической или прагматической информации и дублируют уже существующие зоны. В базе данных для них вводится служебное расширение названия уже существующего поля _OV, например, HEAD_FEM_OV для записи порошенкiвка, где HEAD_FEM — обозначение деривата-феминитива для вокабулы HEAD (порошенківець).

Количество базовых полей (зон) зависит от следующих факторов. Наиболее значимым фактором является количество псевдооснов3, от которых могут образовываться дериваты-существительные. Так для фамилии Зеленський псевдоосновами будут -зеле-, -зеля-, -зе- (от предвыборного лозунга), от Порошенко-порошенко-, -порошенка-, -порохо-. В случае с Ю. В. Тимошенко основные оценочные наименования образуются от имени, например, -юле-, -юля-, -йуле-. Важно отметить, что приведенный список не является исчерпывающим. Позитивные и негативные префиксоиды (например, супер-, анти-) также могут присоединяться к перечисленным основам, в этом случае слово заносится в словарную зону с соответствующим тегом BON или NEG. Для обозначения каждой псевдоосновы используется служебный тег STEM с порядковым номером, который добавляется к основному оценочному тегу.

Другим значимым фактором, влияющим на количество полей, является тип оценочного суффиксоида или правого элемента сложного слова. Помимо уже приводившихся в литературе примеров с компонентами -фоб, -філ, -ненависник, -люб, обозначающих общую приязнь или неприязнь 4, новые реалии Интернет-коммуникации требуют расширения схемы новыми оценочными классами. В качестве примера на первый случай можно привести следующее высказывание: ще один порохофоб і зелефіл з поребрику 5. Ярким примером второй ситуации является следующий твит: Порохосос ще той, згоден :) Хоча байдуже за кого він, хоть Юлябот, хоть Зелябот, він огидна істота! Данный пример содержит случай обвинения в нетрадиционных сексуальных отношениях (зона NEG_H 6, — ‘homophobia’), а также бездумном, запрограммированном поведении, которое свойственно Интернет-ботам (зона NEG_Bot). Каждое из описанных выше полей имеет поле, содержащее дериваты-феминитивы. Также каждому из перечисленных полей соответствует поле с дериватом-прилагательным, обозначающим косвенную референцию с объектом при сохранении такого же коннотативного значения.

Для автоматизации составления словаря-тезауруса потребуется выработать правила морфемного синтеза для феминитивов и отыменных прилагательных, аналогичные тем, что были определены для русского языка. Но некоторые синонимичные формы, не являющиеся однокоренными, в любом случае придется заносить в словарную базу данных вручную. Также необходимо отметить одно принципиальное ограничение предлагаемого подхода — проблема множественной референции. Например, в твите варто комусь щось сказати проти порошенка, як одразу тикають в йулю та зєльнку бєніну. а от цікаво, ви реально думаєте, що всі хто не порохолюб то обов’язково йулєбойкозелєнськофіл? встречается слово йулєбойкозелєнськофіл, обозначающее человека с одновременной симпатией к трем разным политикам (Ю. В. Тимошенко, Ю. А. Бойко и В. А. Зеленскому). На текущий момент мы предлагаем включать подобные слова одновременно во все словарные статьи, содержащие подходящий референт.

Подводя итоги, в данной работе приводится предварительная структура словаря тезаурусного типа, предназначенного для использования в автоматизированных информационных системах (например, разрабатываемых в «Ай-Теко ВЦ» системах «Аналитический курьер» и SmartCS или аналогичных им). Мы считаем, что подобный словарь может быть полезен при проведении политологических, социологических и междисциплинарных исследований явлений конфликтной коммуникации на материале украинского языка.

Литература

Жаботинская С. А. Язык как оружие в войне мировоззрений. Майдан — Антимайдан: словарь-тезаурус лексический инноваций. Украина, декабрь 2013 — декабрь 2014. Интернет-издание. Киев: УАКЛиП, 2015 // http://uaclip.at.ua/zhabotinskaja-jazyk_kak_oruzhie.pdf.

Куликов С. Ю. Автоматическое извлечение мнений: лингвистический аспект. Автореф. дисс. канд. наук. М.: ИЯз РАН, 2016.

Kulikov S. Enriching hate speech databases with linguistic knowledge // 13th Biennial Conference of the International Association of Forensic Linguists. Book of Abstracts. Porto, 2017. P. 128.

1 Исследование выполнено при поддержке Российского научного фонда (грант № 18-18-00442) в БФУ им. И. Канта.

2 Довольно редкий термин по сравнению с аналитической формой прихильник Зеленського — ‘сторонник Зеленского’. Выбран нами для единообразного описания.

3 Под псевдоосновами в данном случае мы понимаем определенную трансформацию фамилии или имени перечисленных политиков, которая позволяет однозначно идентифицировать данного политика.

4 Относимых соответственно к зонам NEG, BON, NEG1 и BON1.

5 Все примеры взяты из Твиттера (https://twitter.com). Конкретные источники примеров не указываются в целях соблюдения принципа анонимности.

6 К настоящему моменту нам не удалось обнаружить словоупотреблений указанного типа для референтов, являющихся сторонниками политиков-женщин.

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5168
Авторов
на СтудИзбе
438
Средний доход
с одного платного файла
Обучение Подробнее