Для студентов МТИ по предмету МоделированиеПрименение методов машинного обучения в задаче агрегации новостных статейПрименение методов машинного обучения в задаче агрегации новостных статей
5,00570
2025-10-112025-10-12СтудИзба
Курсовая работа: Применение методов машинного обучения в задаче агрегации новостных статей
Новинка
Описание
Содержание
Введение
В настоящее время существует множество новостных сайтов, генерирующих содержимое разностороннего характера. Для объединения всей информации в одном удобном пользователю месте, были созданы новостные агрегаторы. Однако для разделения новостей по темам они либо используют ручной подход, либо ориентируются на то, к какой теме принадлежит новость в оригинальном источнике. В первом случае разметка будет весьма субъективна, к тому же могут допускаться ошибки. Также наличие большого объема источников пропорционально увеличивает необходимый штат сотрудников. Во втором случае необходимо настраивать точную сеть тематического соответствия между новостным агрегатором и каждым сайтом в отдельности. А также исключается возможность использования ресурсов, на которых отсутствует тематическая разметка.Актуальность работы заключается в исследовании методов автоматического разделения коллекции новостей на заранее заданные тематики. Это поможет автоматизировать новостные агрегаторы и позволит им пользоваться новостными ресурсами без предварительной разметки.
Объект исследования – применение методов классификации для предоставления пользователю средств навигации по коллекции документов.
Предмет исследования – разбиение новостных документов на темы при помощи классификации и векторных моделей.
Цель работы – сравнение методов машинного обучения в задаче классификации и векторизации новостных статей.
Введение
В настоящее время существует множество новостных сайтов, генерирующих содержимое разностороннего характера. Для объединения всей информации в одном удобном пользователю месте, были созданы новостные агрегаторы. Однако для разделения новостей по темам они либо используют ручной подход, либо ориентируются на то, к какой теме принадлежит новость в оригинальном источнике. В первом случае разметка будет весьма субъективна, к тому же могут допускаться ошибки. Также наличие большого объема источников пропорционально увеличивает необходимый штат сотрудников. Во втором случае необходимо настраивать точную сеть тематического соответствия между новостным агрегатором и каждым сайтом в отдельности. А также исключается возможность использования ресурсов, на которых отсутствует тематическая разметка.Актуальность работы заключается в исследовании методов автоматического разделения коллекции новостей на заранее заданные тематики. Это поможет автоматизировать новостные агрегаторы и позволит им пользоваться новостными ресурсами без предварительной разметки.
Объект исследования – применение методов классификации для предоставления пользователю средств навигации по коллекции документов.
Предмет исследования – разбиение новостных документов на темы при помощи классификации и векторных моделей.
Цель работы – сравнение методов машинного обучения в задаче классификации и векторизации новостных статей.
Характеристики курсовой работы
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
816,5 Kb
Список файлов
___Primenenie_metodov_masinnogo_obucenia_v_zadace_agregacii_novostnyh_statej.doc