Главная » Просмотр файлов » Диссертация

Диссертация (1136870)

Файл №1136870 Диссертация (Методы тематической классификации текста (на примере образа Российской Федерации в New York Times))Диссертация (1136870)2019-05-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

На правах рукописиПросянюк Дарья ВячеславовнаМетоды тематической классификации текста (на примере образаРоссийской Федерации в New York Times)Специальность: 22.00.01 –Теория, методология и история социологииАВТОРЕФЕРАТдиссертации на соискание ученой степеникандидата социологических наукМосква - 2014Работа выполнена в Федеральном государственном автономном учреждениивысшего профессионального образования «Национальный исследовательскийуниверситет «Высшая школа экономики»Научный руководитель:кандидат социологических наук, доцентГрадосельская Галина Витальевнадоцент кафедры методов сбора и анализасоциологической информации факультетасоциологии Национального исследовательскогоуниверситета «Высшая школа экономики»Официальные оппоненты:доктор социологических наукЖаворонков Александр ВасильевичВедущий научный сотрудникЦентра методологии социологическихисследований Института социологииРоссийской академии науккандидат социологических наукКрутий Ирина Андреевнаруководитель управления маркетинговымиинтернет-коммуникациями «Современнойгуманитарной академии»Ведущая организация:ФГОБУ ВПО МГИМО Московскийгосударственный институт международныхотношений (Университет) МИД РФЗащита состоится «3» марта 2015 года в 17.00 часов на заседании Совета по защитедиссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук Д 212.198.09 на базе Российского государственного гуманитарногоуниверситета по адресу: 125993, ГСП-3, Москва, Миусская площадь, дом 6, корп.

5,ауд. 406.С диссертацией можно ознакомиться в научной библиотеке РГГУ по адресу: 125993,ГСП-3, Москва, Миусская площадь, д. 6. и на официальном сайте организации поадресу www.rsuh.ru.Автореферат разослан «25» января 2015 года.Ученый секретарьдоктор социологических наук, профессорБуланова М.Б.2ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫАктуальностьСтремительное распространение технологий производства, обработки,трансляции и хранения информации в текстовом виде, лавинообразный рост иширокая доступность данных в электронном виде, а также повышение ролиинформации как ресурса и основы принятия решений обусловили запрос наразработку автоматизированных средств обработки и анализа текстовых данных.

В настоящее время мы являемся свидетелями интервенции формализованных методов анализа текстовых данных1, что обусловливает завышенные ожидания к возможностям автоматизированных средств и их неадекватное использование. Основными причинами завышенных ожиданий, на наш взгляд, является агрессивная маркетинговая политика корпораций-разработчиков специализированного программного обеспечения, акцентирующая внимание на возможности практически полного исключения человека при сборе, обработке и анализе информации; низкий уровень осведомленности пользователей об алгоритмах и ограничениях методологий, лежащих в основе того или иного программного продукта; а также исключительно небольшое количество междисциплинарных научных исследований, направленных на решение задач определения«границ» и условий применения формализованных методов анализа текстовыхданных в гуманитарных науках (которые являются одним из их основных «потребителей»).Вместе с тем, подавляющее большинство современных гуманитарных исследований, содержащих этап обработки текстовой информации (в том числеответы на открытые вопросы анкеты, транскрипты интервью и фокус-групп,тексты новостей и пр.), продолжают использовать традиционные методы ана-Формализованные методы анализа текстовых данных развивались обособленно, чаще в техническихдисциплинах, таких как искусственный интеллект, нейросетевое моделирование, лингвистическоеобеспечение систем автоматизированного проектирования и программирования и пр.1лиза, основанные на эвристических алгоритмах2: кодировании, априорной категоризации и пр.

Основными причинами устойчивого применения традиционных методов анализа текстовых данных, на наш взгляд, является определеннаястепень инерционности методической составляющей исследований; неизученность, и, как следствие, отсутствие доказательств надежности и валидностиформализованных методов при решении конкретных задач социального анализа; а также отсутствие исследований, посвященных верификации возможностейи условий интеграции различных направлений методов анализа текстовых данных.Таким образом, в настоящее время наблюдается значительный разрывмежду потенциальными возможностями формализованных методов анализатекстовых данных и фактическим использованием их потенциала. Применениеформализованных методов для анализа больших массивов текстовых данныхдля решения задач социального анализа является скорее новаторством, чемнормой.

Возможно, по причине того, что применение методов не стало нормой,они используются не всегда корректно и адекватно поставленным задачам.Несмотря на взрывной рост количества методов и алгоритмов формализованного тематического анализа, крайне малочисленны исследования, дающиепредставления и конкретные руководства эмпирическому исследователюгуманитарию об их специфике, достоинствах и недостатках.

Узконаправлены инемногочисленны исследования, сфокусированные на сравнительной оценкеприменимости отдельных направлений методов анализа текстовых данных вконкретных исследовательских ситуациях, определяющие роль эвристическихалгоритмов в процессе анализа. Следствием является отсутствие пошаговогоалгоритма анализа корпуса текстовых данных, основанного и направленного нарешение конкретной задачи социального анализа, необходимого в эмпирических исследованиях.

Сказанное позволяет считать, что работа, направленная наПод эвристическими алгоритмами понимается способ анализа данных и решения задач, не имеющийстрогого обоснования, но дающий приемлемые решения в большинстве практически значимых задач.24изучение специфики и ограничений методов формализованного анализа текстовых данных и разработку стратегий их интеграции с эвристическими методамиявляется актуальной. Подобная схема поможет систематизировать и адаптировать основные наработки точных наук в области анализа текстовых данных,продемонстрирует области единоличного «господства» каждого из направлений анализа, поспособствует очерчиванию круга типовых задач, потенциальноинтересных для решения формализованными методами. Также подобное руководство может быть тиражировано и адаптировано для решения широкого круга научных и практических задач.Разработанность проблемыМы исходим из предположения, что определение типов и конкретных параметров методов тематической классификации текста зависит от задач исследования.

Поэтому круг проанализированных в диссертации работ содержитпубликации, посвященные как современным методам и алгоритмам тематической классификации текста, так и работы, связанные с содержательным фокусомисследования.ВкачестветаковогобылвыбранобразРоссий-ской Федерации в одном из наиболее влиятельных американских и мировыхизданий – «Нью-Йорк таймс». Интерес и актуальность изучения данного объекта обусловливаются важностью в информационном обществе образа страны дляадекватного диалога между странами на различных уровнях.В спектре современных методов анализа текста в гуманитарных наукахможно выделить два основных подхода к тематической классификации текста –формализованный и эвристический (неформализованный, слабо формализованный).Начало развития формализованных методов анализа текста в гуманитарных дисциплинах принято связывать с возникновением метода контентанализа. Работы, нацеленные на количественное измерение параметров содержания текстов, тематическую классификацию газет появляются на рубеже5XIXXX веков.

В этом русле работали Г. Спид3, М. Уилли4, С. Кингсбери, X.Харт и Л. Кларк, Дж. Вудворд. Методику анализа средств массовой информации, предложенную в своей работе М. Уилли, использовал советский исследователь общественного мнения и прессы В.А. Кузьмичев5.Стремительное распространение средств массовой информации, а такжеповышение актуальности изучения пропагандистских материалов обусловилинеобходимость разработки метода, позволяющего выявлять социальные целитекстов на основании количественного анализа эксплицированного содержания.

Теоретической основой послужила классическая модель массовой коммуникации Г. Д. Лассвелла (кто, что, по какому каналу, кому говорит и с какимэффектом). На конференции по исследованию междисциплинарных средствмассовой коммуникации в Чикаго в августе 1941 г. был предложен термин длянового метода – контент-анализ. Суть анализа в данный период заключалась ванализе знаков и утверждений с целью проверки их влияния на аудиторию;результатом анализа была частота определенных символов, их интенсивность иоценкаотправителя.СредивидныхисследователейследуетназватьБ. Берельсона и П.

Характеристики

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов диссертации

Методы тематической классификации текста (на примере образа Российской Федерации в New York Times)
Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6367
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее