Для студентов СПбПУ Петра Великого по предмету ДругиеИсследование и разработка методов извлечения именованных сущностейИсследование и разработка методов извлечения именованных сущностей
2024-09-172024-09-17СтудИзба
Курсовая работа: Исследование и разработка методов извлечения именованных сущностей
Описание
Содержание:
Введение
1. Особенности предметной области
2. Основные методы извлечения ИС
2.1 Подходы к извлечению именованных сущностей
2.2 Современные реализации инструментов извлечения именованных сущностей
3. Материал исследования - корпусы текстов
3.1 Корпус текстов микроблогов
3.2. Корпус новостных текстов
4. Практическое применение инструментов выделения именованных сущностей
4.1. Система GATE
4.2. Томита-парсер
5. Методика оценки результатов
6. Количественные результаты исследования
7. Выводы, направления дальнейшей работы
Библиография
Введение
Целью данного исследования является разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей.
Для решения заявленной цели были поставлены следующие задачи:
- исследовать существующие методы извлечения именованных сущностей;
- изучить особенности предметной области – текстов микроблогов;
- выбрать и доработать наиболее подходящие инструменты для анализа выбранной предметной области;
- собрать и разметить корпус текстов микроблогов
Характеристики курсовой работы
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
927,72 Kb
Список файлов
ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ ИЗВЛЕЧЕНИЯ ИМЕНОВАННЫХ СУЩНОСТЕЙ.docx