Для студентов МГТУ им. Н.Э.Баумана по предмету АвтоматизацияАвтоматические методы анализа социологических данныхАвтоматические методы анализа социологических данных
2024-05-252024-05-25СтудИзба
Курсовая работа: Автоматические методы анализа социологических данных
Описание
Введение | 4 | |||
1. | Постановка задачи | 6 | ||
2. | Обзор литературы | 7 | ||
2.1. | Подходы, основанные на правилах и словарях . . . . . . | 7 | ||
2.2. | Машинное обучение с учителем . . . . . . . . . . . . . . . | 7 | ||
2.3. | Машинное обучение без учителя . . . . . . . . . . . . . . | 8 | ||
3. | Используемые методы | 9 | ||
3.1. | Постановка задачи классификации . . . . . . . . . . . . . | 9 | ||
3.2. | Классификаторы ....................... | 9 | ||
3.2.1. | Метод опорных векторов (SVM) . . . . . . . . . . | 9 | ||
3.2.2. | Наивный байесовский классификатор . . . . . . . | 11 | ||
3.3. | Извлечениепризнаков .................... | 13 | ||
4. | Описание набора данных | 14 | ||
4.1. | Наборыданных ........................ | 14 | ||
4.2. | Предобработкаданных.................... | 15 | ||
5. | Результаты экпериментов | 16 | ||
5.1. | Структура экспериментов . . . . . . . . . . . . . . . . . . | 16 | ||
5.2. | Методыоценки ........................ | 16 | ||
5.3. | Корпус автоматически размеченных текстов . . . . . . . | 17 | ||
5.4. | Классификация тестовых коллекций . . . . . . . . . . . . | 18 | ||
5.5. | Вывод.............................. | 19 | ||
Заключение | 20 | |||
Список литературы | 21 |
3
Введение
За последние несколько лет можно наблюдать большой рост в ис-пользовании социальных сетей и платформ для микроблоггинга, кото-рые стали очень популярным инструментом для общения среди поль-зователей Интернета. Миллионы сообщений появляются каждый день на таких сервисах как Twitter, Facebook, Vk. Авторы таких сообщений пишут об их жизни, делятся своими мнениями на различные темы и обсуждают злободненвные вопросы.
Так как все больше и больше пользователей пишут о продуктах, услугах, которые они используют, или выражают свои политические и религиозные взгляды, сайты для микроблоггинга становятся ценным источником информации о людях. Такие данные могут эффективно использоваться во многих областях, таких как маркетинг, реклама, ме-дицина, психология и социологические исследования.
Обработка текстов вручную с целью извлечения полезной информа-ции требует слишком много времени и человеческих ресурсов. В боль-шинстве случаев данны так много, что это делает данную задачу неосу-ществимой. Для решения этой проблемы существуют различные авто-матические методы анализа текста на естестественных языках, в том числе автоматический анализ тональности текстов.
Основной задачей анализа тональности текстов является извлече-ние эмоциональной окраски из текстов. Эмоциональная окраска может определяться как ”положительная”, ”отрицательная” или же может при-нимать значения из некоторого промежутка, например от 0 до N. В данной области проводится все больше и больше исследований, и на данный момент существует много различных подходов, которые уже применяются при решении большого количества практических задач.
- помощью такого анализа текстов компании могут отслеживать то, как потребители относятся к их продукции и предоставляемым услу-гам. Полученные знания могут быть использованны для дальнейшего анализа и разработки новых маркетинговых стратегий. Также широкое применение можно найти в области социологических исследований. С
Характеристики курсовой работы
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
395 Kb
Список файлов
Автоматические методы анализа социологических данных.doc