Автореферат (Тональность текста синтаксические паттерны выражения отношений между сущностями), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Тональность текста синтаксические паттерны выражения отношений между сущностями". PDF-файл из архива "Тональность текста синтаксические паттерны выражения отношений между сущностями", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГОУ. Не смотря на прямую связь этого архива с МГОУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
В собранном корпусе из 8932 уникальных слов без учетастоп-слов было выделено 1038 единиц с отрицательной тональностью и 508единиц с положительной тональностью. Выходит, что лексический составуникальных единиц на 17,3% состоит из тональных лексем, что являетсясвидетельством наличия оценки в аналитических политических статьях.Подсчет лексем проводился при помощи написанного кода на языке Python,пакета Pymorphy2 [Электронный ресурс] для лемматизации, модулярегулярных выражений для предварительного удаления знаков препинаниядля более корректной лемматизации, списка стоп-слов для русского языка избиблиотеки Natural Language Tool Kit [Электронный ресурс] и тональноголексикона РуСентиЛекс [Лукашевич, Левчик, 2016], из которого былисгенерированыспискитональностью.Еслиположительнойилексемсположительнойподсчитатьотрицательнойколичестволексики,иотрицательнойсловоупотребленийполучится5880и9564соответственно (при общем числе словоупотреблений 103655).Нейтральная лексика, как правило, не несет в себе информацию,необходимую для установления тональных отношений.
Тем не менее, это не12всегда верно. Нейтральная лексика, а точнее, определенные виды лексики,могутоказыватьвлияниенатональнуюлексему,меняястепеньположительного или отрицательного мнения, или же меняя его напротивоположное. Под инвертированием тональности понимается изменениеполярности оценки на противоположную под влиянием каких-то вербальныхили структурных компонентов [Семина, 2018б].Для анализа случаев инвертирования тональности из корпуса былиавтоматически извлечены предложения, содержащие хотя бы одно словотриггер инвертирования и хотя бы одно тональное слово. В качестве наборатриггеров были взяты лексемы «отменять», «отмена», «отмениться»,«прекращение»,«прекращать»,«прекратиться»,«аннулирование»,«аннулировать», «аннуляция».
Поиск проводился по лемматизированнымпри помощи пакета Pymorphy2 [Электронный ресурс] текстам, похожиесписки были составлены для других классов нейтральной лексики,влияющих на тональную.Случаи усиления и ослабления тональности имеют схожую синвертированием структуру, которая представлена в Таблице 1.Таблица 1 – Характеристика тональной лексики при разных типах триггераТип триггерасуществительноеглаголТональное словоименная группа в генитивемодификатор именной группыгенитивевименная группа с существительным ваккузативемодификатор именной группы ссуществительным в аккузативеВзаимное расположение компонентов мненияК основным компонентам мнения, если говорить об анализетональности на уровне именованных сущностей, можно отнести субъект,объект, тональное высказывание и тональность.13Анализ тональности на уровне сущностей представляет собой дваэтапа: поиск двух (и более) сущностей, состоящих в тональных отношениях,и определение полярности этого отношения.
Для реализации первого этапаважным является взаимное расположение субъекта и объекта. После ручногоанализа статей общим объемом 424 предложения, были выделены примерымнений с разным расположением субъекта и объекта относительно другдруга. Кроме того, для каждой группы отдельно выделялись случаипересечения границы предложения, то есть случаи, когда субъект и объектнаходилисьвразныхпредложениях.Полученныераспределенияпредставлены в Таблице 2.Таблица 2 – Статистика взаимного расположения компонентов мненияТиппересекает границупредложениянепересекаетграницу предложенияСубъект-объект12,99 %Объект-субъект6,49 %57,14 %23,38%Варианты с пересечением границы предложения не так просты дляанализа, в таких случаях сложно говорить о наличии закономерностей ввыражении мнений.
При этом в предложениях с сущностями могутприсутствовать кореферентные сущностям языковые единицы. Для порядкаобъект-субъект характерна одна из следующих ситуаций:1. Пассивный предикат;2. Субъект оценки в дативе с предлогом «для»;3. Тональное высказывание со значением «испортить отношение субъектатональности к себе»;4. Прямая или косвенная речь, где субъектом тональности является авторцитаты.При субъекте, предшествующем объекту, представлено большееразнообразие в организации структуры мнения. Могут быть представлены и14структуры с отсутствующим субъектом или объектом, но подобные случаине рассматриваются в рамках данного диссертационного исследования.
Вслучаях употребления в пределах предложения и субъекта, и объекта, можновыделить закономерные характеристики компонентов.В Таблице 3представлены падежи именованных сущностей, занимающих слоты вструктуре мнения.Таблица 3 – Характеристика сущностей при расположении субъект-объектИС – субъектявляется подлежащим (номинатив)генитив (с предлогом «у»)номинатив + ИС в генитиведатив (с предлогом «для»)ИС – объектдативгенитивдатив + ИС в генитивеноминатив в придаточной клаузеаккузативВзаимная тональность между сущностямиВзаимная тональность – ситуация, в которой между субъектом иобъектом мнения есть взаимное тональное отношение с одной полярностьюоценки. Выделение взаимной тональности в отдельную группу случаеввыражения мнения позволит найти в тексте часть имплицитной информации.Встает вопрос о способах выражения такой тональности. Соответственно, нанекотором отрезке текста есть два компонента мнения, при этом их статусможет быть разным; в ряде случаев можно говорить о равноправииэлементов, в других – один элемент скорее является субъектом, тем не менее,объект также имеет оценочное направленное отношение по отношению ксубъекту.Для поиска примеров взаимной тональности в корпусе был составленядерный набор лексем-показателей и проведен поиск по корпусу, после чегосписок был расширен.
В ядерный набор вошли такие слова как «отношения»,«связь», «сотрудничество», «разногласие», «союзник», при этом, все слова,кроме «отношения» искались по документу, в котором слова былиприведены в нормальную форму при помощи лемматизации через пакет15PyMorphy2 для Python с предварительной чисткой пунктуации при помощирегулярных выражений. Ядерный набор был составлен в ходе просмотрачастотного словаря для корпуса текстов.Выделено три паттерна взаимной тональности в зависимости отрасположения компонентов мнения (две именованные сущности и лексемапоказатель взаимной тональности). Наиболее частотным оказался паттерн, вкотором показатель предшествует сущностям.
В Таблице 4 представленаструктура паттерна и требуемый падеж именованных сущностей.Таблица 4 – Структура паттерна SOOS – Named Entity – Named EntityОкружениеИС{падеж}конфликт, взаимодействие, союз,договоренность,отношения,разногласия, междунапряжениеNE {ablt}сотрудничество, связь, отношения, NE {gent}конфликт, взаимодействиеКоннектор ИС{падеж}NE {gent}NE {gent}иNE {ablt}cNE {ablt}Следующим по встречаемости оказался паттерн, в котором показательвзаимной тональности расположен между именованными сущностями, в немлексемой-показателем может быть и глагол (Таблица 5).Таблица 5 – Структура паттерна Named Entity-SOOS-Named EntityИменованная Окружениесущность{падеж}NE {nomn}сотрудничать, дружить сNE {nomn}NE {nomn}Именованнаясущность{падеж}NE {ablt}партнерство,взаимодействие, NE {ablt}отношения, связи, сотрудничество,дружба ссоюзник, партнер, враг, другNE {gent}Verb16Наиболеетональноститональномредкимслучаемотносительноотношении,расположенияименованныхявляетсялексемысущностей,предшествованиевзаимнойучаствующихобеихвсущностейпоказателю (Таблица 6).Таблица 6 – Структура паттерна Named Entity - Named Entity – SOOSИС {падеж}КоннекторИС {падеж}NE {nomn}иNE {nomn}NE {datv}иNE {datv}ОкружениеVerbСвязиСотрудничествоСотрудничатьModal verb, СвязиVerbСотрудничествоПартнерствоВзаимодействиеОсобенности выражения мнения автораПри анализе аналитических статей можно увидеть, что ряд тональныхотношений имеет в качестве субъекта не сущность внутри текста, а авторатекста, что не подразумевается жанром информационной журналистики.
Темне менее, автор текста не выражает мнение напрямую, используяэксплицитные оценочные конструкции, вместо этого применяется ирония,сарказм и стилистически сниженная лексика [Семина, 2019б]. Примеромподобной лексики будет выражение «ужас, летящий на крыльях ночи» и «сгулькин нос» в примере:Между тем резервы эти и так с гулькин нос, а перспектива резкойдевальвации рубля после деноминации, призванной укрепить к нему доверие,— это для белорусского руководства просто ужас, летящий на крыльяхночи [Класковский, 2016, Электронный ресурс].Нужно отметить, что автор текста также может считаться именованнойсущностью, потому что для текста публикации известен автор статьи илииздание, опубликовавшее текст.
Автор статьи имеет явно определенного17референта в реальности, что касается и названия газеты или интернетресурса, следовательно, они являются именованными сущностями и на этомуровне анализа тональности могут быть объектом исследования. Отличие отостальных сущностей заключается в том, что мнение автора может бытьвысказано в статье в любом месте, при этом использование эксплицитныхоценочных предикатов не представляется возможным.Так как для части статей осуществлялась ручная разметка тональныхотношений, был проведен анализ частотности выражения мнения автором.На рисунке 1 представлено отношение статей, содержавших мнениеавтора, ко всем статьям, для которых была проведена разметка.
Можноувидеть, что в 25% статей был минимум один случай выражения мненияавтором.Рисунок 1При выражении мнения автор обычно использует нетипичную длястиля аналитических статей лексику. Метрика idf позволит найти слова,которые редко встретились не в языке, а в отобранных текстах [Семина,2019б]. Для этой задачи можно использовать и простой поиск редких слов вколлекции на основе частотного словаря корпуса. Нужно отметить, чтомежду единичным упоминанием в корпусе и упоминанием только в одномдокументе есть различия. Преимуществом обратной частоты документа18является возможность привлечения показателя частоты термина в документе(tf), что могло бы быть полезным в поиске текстов, тематическиотличающихся от основного массива.Прямая речьСтоит выделить возможные ситуации выражения прямой речи, которыемогут оказать влияние на тональность:1.