Диссертация (1136870), страница 6
Текст из файла (страница 6)
Поиск осуществлялся с помощью информационной базы данных LexisNexis.6225была сформирована итоговая выборка, объем составил 411 статей (20% релевантного корпуса, 80% исходной выборки оказалось «шумом» исследования).Полученный результат свидетельствует о необходимости при решении задачсоциального анализа верификации корпуса текстов исследования, отобранных спомощью применения формализованных методов. Показано, что эвристическоекодирование кратно повышает качество результатов.На третьем этапе, на основании различения состава и функций частейновостного сообщения, корпус текстов статей был разделен на обособленныеединицы анализа (заголовок, текст статьи).
Следующие этапы исследованияреализовывались параллельно для каждой из единиц анализа.На четвертом этапе с целью определения интенционально сконструированных авторами макроструктур текстов новостей, был проведен контентанализ заголовков. В результате были выявлены речевые показатели, маркирующие статью, как посвященную России, определены наиболее часто встречаемые из них. Данные показатели присутствуют в заголовках 85% корпуса (95%из них содержит слова «Russia» («Russian»), «Putin», «Moscow»)63.На пятом этапе для выявления тематической структуры заголовков былпроведен тематический анализ.
В качестве альтернатив были использованыкластерный анализ64 и эвристический тематический анализ65, использоваласьапостериорная категоризация. Первым способом удалось выявить 4 темы, вторым – 21 тему, 4 наиболее часто встречаемые темы: экономическая политика,внешняя политика, выборы, протесты совпали. По итогам оценки качества результатов кластеризации66 коэффициенты точности/полноты не превышают55% (Таблица 1). Наилучшие результаты качества (по показателям точности иРезультат свидетельствует также о том, что заголовки инвариантны относительно событий в России.Формализованный тематический анализ проводился методом кластерного анализа, алгоритм двукластерногорешения (bisecting k-means), косинусная мера.
Использовалось программное обеспечение TLab.65Эвристический тематический анализ проводился согласно этапам, описанным в §3 главы 1.66Для оценки качества кластеризации использовался метод внешнего сравнения, показатели точности(precision) и полноты (recall). Точность - это доля релевантных документов в корпусе. Полнота - это долянайденных релевантных документов среди всех релевантных.636426полноты) получены в кластере «Внешняя политика»67. Верификация кластеров,выделенных формальным методом, показала гетерогенность их состава и непригодность для интерпретации. Также верификация позволила увеличить показатели качества для кластеров «Выборы» и «Протесты» путем взаимногоизменения названий кластеров (Таблица 1, строки «после замены»).Таблица 1.
Показатели качества кластеризацииКластерЭкономическая политикаВнешняя политикаВыборыПротестыВыборы (после замены)Протесты (после замены)Точность45%33%14%13%23%25%Полнота17%30%15%16%55%40%На шестом этапе был проведен анализ тональности заголовков. Тональность заголовка определялась альтернативными методами: методом обучения сучителем68 и эвристическим кодированием. Результаты показали, что заголовкиновостных материалов, посвященных России, в «Нью-Йорк таймс» носят, вбольшинстве случаев, негативную эмоциональную окраску, единственной темой, освещаемой исключительно положительно, является российская культура.Результаты применения методов совпали в 54,6% случаях (Таблица 2).Таблица 2. Сравнение результатов анализа тональности заголовков статей альтернативнымиспособамиКодировщик, %+-Программное обеспечение, %+3,98,337,150,7На наш взгляд, данный результат свидетельствует о невозможности применения автоматического метода определения тональности, основанного наобучении с учителем, без последующей верификации результатов.Результат объясняется лексическим однообразностью заголовков статей данной темы.Для автоматического определения тональности использовалось программное обеспечение Tweenator,основанное на методе обучения с учителем, уровень анализа - предложение.676827На седьмом этапе был проведен формализованный69 и эвристический тематический анализ текстов статей, использовалась апостериорная категоризация.
По результатам кластеризации удалось выделить 2 наиболее часто встречаемые темы: внутренняя и внешняя политика, по результатам тематическогомоделирования – 8 тем (выборы, руководство, ресурсы, полиция, Путин, СССР,Сирия, культура). Кластеры в обоих случаях не интерпретируемы. Только спомощью тематического моделирования удалось выявить тему «культура»,которая не фигурировала в предыдущих результатах.
Данная тема оказаласьочень важна для содержательных результатов исследования, поэтому результатсвидетельствует о преимуществе тематического моделирования перед кластеризацией.На восьмом этапе на основании выделенной тематической структурыбыли описаны элементы образа России.Параграф 2 «Образ России как интегральное понятие» посвящен описанию интегрального образа России, созданного «Нью-Йорк таймс» в периоддумских и президентских выборов в России.
Образ России в период август 2011-июль 2012 г. состоит из следующих элементов: характеристика внутренней политика, характеристика внешней политики, характеристика экономической политики, характеристика культуры. В тексте диссертации основныехарактеристики этих сторон жизни современной России, формирующих ее интегральный образ, проинтерпретированы в контексте паттерна ключевых ценностей американского образа жизни.
Это позволяет перейти в следующем параграфе к роли этих ценностей в формировании образа «другого».В параграфе 3 «Ценности американского общества в статьях «НьюЙорк таймс» о России» показана роль традиционных ценностей американскогообщества в представлении материалов о России. Параграф был добавлен поАнализ текстов статей проводился альтернативными методами – кластерный анализ (параметры совпадают спараметрами при анализе заголовков) и тематическое моделирование (алгоритм латентного размещенияДирихле). Использовалось программное обеспечение TLab.6928результатам эмпирического анализа и может служить примером, демонстрирующим один из возможных механизмов влияния на массовую аудиторию.Для успешного коммуникативного воздействия на аудиторию необходимо опираться на разделяемые ею интересы, ценности, стереотипы. По результатам анализа корпуса текстов исследования у автора сформировалось предположение, что при описании событий в России авторы издания, как правило, апеллируют к ценностям американского общества70.Для ответа на вопрос об отражении ценностей американского общества встатьях «Нью-Йорк таймс» о России был проведен контент-анализ корпусастатей исследования.
Было показано, что при описании каждого из элементовобраза России автор статьи, как правило, апеллирует к той или иной ценностиамериканского общества. Самой часто встречаемой ценностью является «демократия и свободное предпринимательство» (упоминается в 71,6% корпуса). Впараграфе подробно описано распределение ценностей по отношению к темам.Основная проблема подобного взгляда на Россию, по мнению автора, заключается в том, что в нем происходит подмена целей и средств их достижения.Иными словами, терминальные ценности подменяются инструментальными, иих достижение провозглашается необходимым условием процветания российского обществаВ заключении кратко обобщаются результаты диссертационного исследования, приводятся основные выводы и обозначается круг проблем для дальнейших исследований.
К основным достижениям работы относится разработкаи апробация алгоритма анализа корпуса текстовых данных в рамках стратегиисмешивания методов, компенсирующего ограничения формализованного иНа протяжении десятилетий многие ученые, политики и журналисты пытались обобщить и сформулироватьосновополагающие ценности американского общества. Признавая его исключительную разнородность,большинство исследователей сходится во мнении, что безоговорочно разделяемой практически всемиамериканцами является вера в либеральную демократию как наилучший государственный строй.
Автор вкачестве теоретической схемы ключевых ценностей американского общества использовал набор ценностей,выделенный Р. Уильямсом, описанный в §2 гл. 2. Преимущество данной теоретической схемы дляэмпирического анализа состоит в конечности списка ценностей и операциональности определений.7029эвристического подходов к анализу текста, определение места и роли эвристического кодирования на каждом этапе анализа.
С содержательной точки зрениязначимость представляет описание интегрального образа России в «Нью-Йорктаймс».Работы, опубликованные автором в ведущих рецензируемых научныхжурналах и журналах, рекомендованных ВАКом Министерства образования и науки России:Просянюк Д.В. Теоретико-методологические основания изучения образаРоссии // Человек. Сообщество. Управление. 2012. № 4 . С.