Диссертация (1173445), страница 13
Текст из файла (страница 13)
Трамп. В первойгруппе лексема, обозначающая должность, не влияет на тип именованнойсущности. Члены этой группы должны стоять в одном падеже, как в номинативе,так и в одном из косвенных падежей. В корпусе встречались варианты в аблативе,аккузативе, генитиве и дативе.Вторая группа – последовательность, состоящая из занимаемой должности,указания страны или организации, после представлено имя: министр обороныИталии Пинотти. Анализ осложняется соседством двух типов сущностей:{GEOPOLIT} и {PER}. Метка, обозначающая человека, должна распространитьсяна всю последовательность слов, началом будет должность, концом – метка{PER}. Кроме того, подобные группы могут быть материалом для подбораэквивалентных сущностей. Падежное оформление этой группы отличается,должность и имя стоят в одном падеже, название страны или организацииуказывается в генитиве.Третья группа – указание только должности или поста и названия страныили организации: министр обороны Италии.
Во второй группе можно былорасширить границы именной сущности влево, но в этой ситуации это неприменимо из-за отсутствия метки {PER}. В примере министр обороны Италииметка будет указана только для Италии, и показателем будет {GEOPOLIT}, чтоявляется неудачным результатом для последующего установления тональныхотношений, потому что, как было сказано ранее, тип именованной сущностиможет накладывать ограничения на возможность быть субъектом оценки. Так какнельзя расширить границы метки типа сущности, можно установить, что слова,обозначающие должность или пост, при контакте с именованной сущностью сметкой, отличной от {PER}, меняют тип именованной сущности.
Структурагруппы похожа на предыдущую, название страны или организации будет указанов генитиве, падеж лексемы, обозначающей должность, будет зависеть отконтекста.67Четвертая группа похожа на вторую, в последовательности также указаныдолжность или пост, имя и государство или организация. Отличие заключается впорядке и способе выражения связи лица и государства: в примере не указываетсяименованная сущность с меткой {GEOPOLIT}.
В примере сирийский президентБашар аль-Асад будет указана только одна метка, при этом правильная – словопрезидент не вступит в конфликт со меткой {PER}. Тем не менее, информация освязи Сирии и Башар аль-Асада могла бы применяться для расширения спискаэквивалентной лексики или служить для поиска имплицитной тональности.Проблема могла бы быть решена сведением единиц в гиперлексему. С точкизрения синтаксической структуры эта группа похожа на описанные ранее. Падежлексемы, обозначающей должность, будет совпадать с падежом именованнойсущности,нопередэтойгруппойбудетнаходитьсяприлагательное,согласующееся по грамматическим категориям с существительным.2.2 Характеристика лексического состава компонентов мненияС точки зрения анализа структуры мнений можно выделить два классалексем: нейтральная лексика, не выражающая отношение к объекту, и тональная,которая может являться показателем оценки.
В свою очередь, тональная лексикаможет быть оценочной, фактической и эмоциональной, важным является наличиедля каждой тональной единицы полярности оценки. Оценочная лексикамаксимально эксплицитно выражает мнение субъекта, она может служитьпоказателем и основой для выявления тональности. Не все тональные словаривводят деление лексем на эти классы, так как это не является необходимым длябольшинства задач анализа тональности.
В тональном лексиконе РуСентиЛекс[Лукашевич, Левчик, 2016] оценочной лексикой, то есть имеющей метку«opinion», являются слова и выражения вроде «авантюрный», «бесподобный»,«бестактный» или «пир во время чумы».68Фактическая лексика не всегда будет оцениваться носителями языка каклексика, выражающее мнение или отношение.
Фактическая лексика описываетфакт, который указывает или на негативное отношение субъекта по отношению кобъекту,илинаотрицательныехарактеристикиобъекта.ВлексиконеРуСентиЛекс [Лукашевич, Левчик, 2016] в качестве фактической лексики (сметкой «fact») внесены подобные примеры: «перхоть», «перепачкать», «передоз»и «залезть в долги». Фактическая лексика оказывается более полезной приопределении тональных отношений между сущностями, потому что мнение чащевыражается при помощи событий, положительно или отрицательно отразившихсяна объектах.
Эмоциональная лексика отражает чувства субъекта, это, например,«жжение», «замучиться» или «угнетенность».Некоторые лексемы, в зависимости от значения, могут относиться к разнымтипам тональной лексики. Так «дутый» может быть как фактической лексемой снейтральной окраской, когда говорится про предмет, изготовленный дутьем, так иоценочной с отрицательной тональностью, в значении «преувеличенный».Возможно и различие в полярности оценки в зависимости от значения вмногозначных словах.Стоит отметить, что, несмотря на разные типы тональных лексическихединиц, различия между ними не всегда учитываются.
Это связано, во-первых, сне всегда точным делением тональной лексики на классы, во-вторых, с частымотсутствием необходимости отбора тональных единиц только одного вида.Количество тональных лексем в текстах может быть показателем наличиямнения. В собранном корпусе из 8932 уникальных слов без учета стоп-слов быловыделено 1038 единиц с отрицательной тональностью и 508 единиц сположительной тональностью. Выходит, что лексический состав уникальныхединиц на 17,3% состоит из тональных лексем, что является свидетельствомналичия оценки в аналитических политических статьях.
Подсчет лексемпроводился при помощи написанного кода на языке Python, пакета Pymorphy2[Электронный ресурс] для лемматизации, модуля регулярных выражений дляпредварительногоудалениязнаковпрепинаниядляболеекорректной69лемматизации, списка стоп-слов для русского языка из библиотеки NaturalLanguage Tool Kit [Электронный ресурс] и тонального лексикона РуСентиЛекс[Лукашевич, Левчик, 2016], из которого были сгенерированы списки лексем сположительной и отрицательной тональностью. Если подсчитать количествословоупотреблений положительной и отрицательной лексики, получится 5880 и9564 соответственно (при общем числе словоупотреблений 103655).Нейтральная лексика, как правило, не несет в себе информацию,необходимую для установления тональных отношений.
Тем не менее, это невсегда верно. Нейтральная лексика, а точнее, определенные виды лексики, могутоказывать влияние на тональную лексему, меняя степень положительного илиотрицательного мнения, или же меняя его на противоположное. В первом случаепри неградуированной оценке лексика не будет негативно влиять на результаты,но при инвертировании тональности результаты при подобном контакте будутневерными [Семина, 2018г]. Под инвертированием тональности понимаетсяизменение полярности оценки на противоположную под влиянием каких-товербальных или структурных компонентов [Семина, 2018б].Для анализа случаев инвертирования тональности из корпуса былиавтоматически извлечены предложения, содержащие хотя бы одно слово-триггеринвертирования и хотя бы одно тональное слово.
В качестве набора триггеровбыли взяты лексемы «отменять», «отмена», «отмениться», «прекращение»,«прекращать», «прекратиться», «аннулирование», «аннулировать», «аннуляция».Поиск проводился по лемматизированным при помощи пакета Pymorphy2[Электронный ресурс] текстам.В большинстве случаев триггер инвертирования находился в контактныхотношениях с тональным высказыванием, на которое он оказывал влияние.Для предложений с триггером и тональным выражением с отрицательнойтональностью, было найдено 99 предложений.
Так как поиск велся по оченьпростому запросу, несколько предложений дублировались из-за наличиянескольких триггеров или тональных слов, кроме того, в ряде случаев слово изсписка не оказывало влияние ни на одно тональное высказывание, например, в70сочетании «не отменяет факт». В Таблице 5 представлены примеры контактныхсвязей между триггером и тональным высказыванием. При наличии несколькихслов в столбце с тональными высказываниями курсивом выделено тональное,остальные лексические единицы являются важной частью контекста.
Некоторыепримеры были опущены, если они полностью дублировали ранее внесеннуюинформацию. Триггерами могли быть как существительные, так и глаголы.Таблица 5 – Триггеры инвертирования тональности с негативной лексикойТриггер инвертированияотменыпрекращениепрекращенияпрекращениеотменупрекращениеотменапрекращенииотменыотменитьпрекратитьТональная лексикасанкцийбоевых действийогнявраждебных действийсанкцийСирийской гражданской войныблокадыогняантироссийских санкцийсанкцииогоньНесмотря на наличие слов между тональным высказыванием и триггером,примеры все равно можно отнести к контактному типу, так как они представляютсобой существительные с модификаторами.
В таких случаях тональной единицейможет быть как существительное, так и модификатор. При этом всесуществительные стоят в генитиве, падежи триггеров разные, но это связано стем, что падеж тональной лексики как зависимой единицы с точки зрениясинтаксических отношений устанавливается триггером.Если триггером является существительное, при контактном способеинвертирования стоит искать именную группу с существительным в генитивепосле триггера инвертирования. Если оно оказывается тональным, полярностьоценкидолжнаменятьсянапротивоположную,вданномслучаенаположительную. Если существительное в генитиве есть, но оно является71нейтральным, нужно проверить модификаторы перед этим существительным. Приналичии тонального модификатора полярность его оценки меняется. Подобныйпоисковый паттерн может улучшить качество автоматического определениятональности, потому что часть ошибок в подобных системах связана сотсутствием обработки такой лексики.Если триггер является глаголом, тональное высказывание должно быть ваккузативе.
Подобных примеров было мало, но был произведен поисковый запроспо фразе «прекратить огонь» на сайте Иносми.ру через язык поисковых запросовGoogle, поиск велся именно по заданной форме слов. В итоге было найдено 709примеров. Несмотря на относительно небольшое количество триггеров, ониявляются достаточно частотными в политических текстах. Например, слово«отмена» в нашем корпусе по частотности является 749, а «прекращение» – 409,при общем количестве уникальных слов, равном 8932, при этом, при созданиичастотного словаря стоп-слова были исключены. Список стоп-слов для русскогоязыка был взят из библиотеки Natural Language Tool Kit [Электронный ресурс]для Python. Часть частотного словаря доступна в Приложении А, в него невключались слова, которые встретились меньше 10 раз.Случаи дистантного инвертирования тональности встретились только одинраз в контексте «прекращение введенного после вторжения на Украину режимаполитической и военной изоляции».