Главная » Просмотр файлов » Диссертация

Диссертация (1136870), страница 6

Файл №1136870 Диссертация (Методы тематической классификации текста (на примере образа Российской Федерации в New York Times)) 6 страницаДиссертация (1136870) страница 62019-05-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 6)

Поиск осуществлялся с помощью информационной базы данных LexisNexis.6225была сформирована итоговая выборка, объем составил 411 статей (20% релевантного корпуса, 80% исходной выборки оказалось «шумом» исследования).Полученный результат свидетельствует о необходимости при решении задачсоциального анализа верификации корпуса текстов исследования, отобранных спомощью применения формализованных методов. Показано, что эвристическоекодирование кратно повышает качество результатов.На третьем этапе, на основании различения состава и функций частейновостного сообщения, корпус текстов статей был разделен на обособленныеединицы анализа (заголовок, текст статьи).

Следующие этапы исследованияреализовывались параллельно для каждой из единиц анализа.На четвертом этапе с целью определения интенционально сконструированных авторами макроструктур текстов новостей, был проведен контентанализ заголовков. В результате были выявлены речевые показатели, маркирующие статью, как посвященную России, определены наиболее часто встречаемые из них. Данные показатели присутствуют в заголовках 85% корпуса (95%из них содержит слова «Russia» («Russian»), «Putin», «Moscow»)63.На пятом этапе для выявления тематической структуры заголовков былпроведен тематический анализ.

В качестве альтернатив были использованыкластерный анализ64 и эвристический тематический анализ65, использоваласьапостериорная категоризация. Первым способом удалось выявить 4 темы, вторым – 21 тему, 4 наиболее часто встречаемые темы: экономическая политика,внешняя политика, выборы, протесты совпали. По итогам оценки качества результатов кластеризации66 коэффициенты точности/полноты не превышают55% (Таблица 1). Наилучшие результаты качества (по показателям точности иРезультат свидетельствует также о том, что заголовки инвариантны относительно событий в России.Формализованный тематический анализ проводился методом кластерного анализа, алгоритм двукластерногорешения (bisecting k-means), косинусная мера.

Использовалось программное обеспечение TLab.65Эвристический тематический анализ проводился согласно этапам, описанным в §3 главы 1.66Для оценки качества кластеризации использовался метод внешнего сравнения, показатели точности(precision) и полноты (recall). Точность - это доля релевантных документов в корпусе. Полнота - это долянайденных релевантных документов среди всех релевантных.636426полноты) получены в кластере «Внешняя политика»67. Верификация кластеров,выделенных формальным методом, показала гетерогенность их состава и непригодность для интерпретации. Также верификация позволила увеличить показатели качества для кластеров «Выборы» и «Протесты» путем взаимногоизменения названий кластеров (Таблица 1, строки «после замены»).Таблица 1.

Показатели качества кластеризацииКластерЭкономическая политикаВнешняя политикаВыборыПротестыВыборы (после замены)Протесты (после замены)Точность45%33%14%13%23%25%Полнота17%30%15%16%55%40%На шестом этапе был проведен анализ тональности заголовков. Тональность заголовка определялась альтернативными методами: методом обучения сучителем68 и эвристическим кодированием. Результаты показали, что заголовкиновостных материалов, посвященных России, в «Нью-Йорк таймс» носят, вбольшинстве случаев, негативную эмоциональную окраску, единственной темой, освещаемой исключительно положительно, является российская культура.Результаты применения методов совпали в 54,6% случаях (Таблица 2).Таблица 2. Сравнение результатов анализа тональности заголовков статей альтернативнымиспособамиКодировщик, %+-Программное обеспечение, %+3,98,337,150,7На наш взгляд, данный результат свидетельствует о невозможности применения автоматического метода определения тональности, основанного наобучении с учителем, без последующей верификации результатов.Результат объясняется лексическим однообразностью заголовков статей данной темы.Для автоматического определения тональности использовалось программное обеспечение Tweenator,основанное на методе обучения с учителем, уровень анализа - предложение.676827На седьмом этапе был проведен формализованный69 и эвристический тематический анализ текстов статей, использовалась апостериорная категоризация.

По результатам кластеризации удалось выделить 2 наиболее часто встречаемые темы: внутренняя и внешняя политика, по результатам тематическогомоделирования – 8 тем (выборы, руководство, ресурсы, полиция, Путин, СССР,Сирия, культура). Кластеры в обоих случаях не интерпретируемы. Только спомощью тематического моделирования удалось выявить тему «культура»,которая не фигурировала в предыдущих результатах.

Данная тема оказаласьочень важна для содержательных результатов исследования, поэтому результатсвидетельствует о преимуществе тематического моделирования перед кластеризацией.На восьмом этапе на основании выделенной тематической структурыбыли описаны элементы образа России.Параграф 2 «Образ России как интегральное понятие» посвящен описанию интегрального образа России, созданного «Нью-Йорк таймс» в периоддумских и президентских выборов в России.

Образ России в период август 2011-июль 2012 г. состоит из следующих элементов: характеристика внутренней политика, характеристика внешней политики, характеристика экономической политики, характеристика культуры. В тексте диссертации основныехарактеристики этих сторон жизни современной России, формирующих ее интегральный образ, проинтерпретированы в контексте паттерна ключевых ценностей американского образа жизни.

Это позволяет перейти в следующем параграфе к роли этих ценностей в формировании образа «другого».В параграфе 3 «Ценности американского общества в статьях «НьюЙорк таймс» о России» показана роль традиционных ценностей американскогообщества в представлении материалов о России. Параграф был добавлен поАнализ текстов статей проводился альтернативными методами – кластерный анализ (параметры совпадают спараметрами при анализе заголовков) и тематическое моделирование (алгоритм латентного размещенияДирихле). Использовалось программное обеспечение TLab.6928результатам эмпирического анализа и может служить примером, демонстрирующим один из возможных механизмов влияния на массовую аудиторию.Для успешного коммуникативного воздействия на аудиторию необходимо опираться на разделяемые ею интересы, ценности, стереотипы. По результатам анализа корпуса текстов исследования у автора сформировалось предположение, что при описании событий в России авторы издания, как правило, апеллируют к ценностям американского общества70.Для ответа на вопрос об отражении ценностей американского общества встатьях «Нью-Йорк таймс» о России был проведен контент-анализ корпусастатей исследования.

Было показано, что при описании каждого из элементовобраза России автор статьи, как правило, апеллирует к той или иной ценностиамериканского общества. Самой часто встречаемой ценностью является «демократия и свободное предпринимательство» (упоминается в 71,6% корпуса). Впараграфе подробно описано распределение ценностей по отношению к темам.Основная проблема подобного взгляда на Россию, по мнению автора, заключается в том, что в нем происходит подмена целей и средств их достижения.Иными словами, терминальные ценности подменяются инструментальными, иих достижение провозглашается необходимым условием процветания российского обществаВ заключении кратко обобщаются результаты диссертационного исследования, приводятся основные выводы и обозначается круг проблем для дальнейших исследований.

К основным достижениям работы относится разработкаи апробация алгоритма анализа корпуса текстовых данных в рамках стратегиисмешивания методов, компенсирующего ограничения формализованного иНа протяжении десятилетий многие ученые, политики и журналисты пытались обобщить и сформулироватьосновополагающие ценности американского общества. Признавая его исключительную разнородность,большинство исследователей сходится во мнении, что безоговорочно разделяемой практически всемиамериканцами является вера в либеральную демократию как наилучший государственный строй.

Автор вкачестве теоретической схемы ключевых ценностей американского общества использовал набор ценностей,выделенный Р. Уильямсом, описанный в §2 гл. 2. Преимущество данной теоретической схемы дляэмпирического анализа состоит в конечности списка ценностей и операциональности определений.7029эвристического подходов к анализу текста, определение места и роли эвристического кодирования на каждом этапе анализа.

С содержательной точки зрениязначимость представляет описание интегрального образа России в «Нью-Йорктаймс».Работы, опубликованные автором в ведущих рецензируемых научныхжурналах и журналах, рекомендованных ВАКом Министерства образования и науки России:Просянюк Д.В. Теоретико-методологические основания изучения образаРоссии // Человек. Сообщество. Управление. 2012. № 4 . С.

Характеристики

Список файлов диссертации

Методы тематической классификации текста (на примере образа Российской Федерации в New York Times)
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6374
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее