Для студентов МГИМО по предмету ДругиеОценка автоматических методов выявления устойчивых словосочетанийОценка автоматических методов выявления устойчивых словосочетаний
2024-10-042024-10-04СтудИзба
ВКР: Оценка автоматических методов выявления устойчивых словосочетаний
Описание
Оглавление
ВВЕДЕНИЕ
ГЛАВА 1. СЛОВОСОЧЕТАНИЯ В ЯЗЫКЕ
1.1.Отношения между словами
1.2. Понятие сочетаемости.
1.3. Устойчивые словосочетания
1.4.1. Классификация устойчивых словосочетаний по В.В.Виноградову
1.4.2. Классификация устойчивых словосочетаний по А.Н. Баранову и Д.О. Добровольскому
Выводы по главе 1
ГЛАВА 2. МЕТОДЫ ВЫЯВЛЕНИЯ УСТОЙЧИВЫХ СЛОВОСОЧЕТАНИЙ
2.1. Корпуса текстов как исходный материал для выявления коллокаций
2.2. Коллокации и их извлечение
2.3.Факторы, от которых зависит качество работы методов
2.4.Меры лексической ассоциации
2.5. Классификация мер ассоциации
Выводы по главе 2
ГЛАВА 3. МЕТОДЫ И КРИТЕРИИ ОЦЕНКИ
3.1.Точность и полнота
3.2.F-мера
3.3.Средняя точность
3.4.Составление золотого стандарта
Выводы по главе 3
ГЛАВА 4. ОЦЕНКА АВТОМАТИЧЕСКИХ МЕТОДОВ ИЗВЛЕЧЕНИЯ КОЛЛОКАЦИЙ
4.1.Эксперимент
4.2. Оценка результатов
Выводы по главе 4
ЗАКЛЮЧЕНИЕ
Список литературы
Источники золотого стандарта
Приложение 1. Коллокаты для слова сердце
Приложение 2. Коллокаты для слова вода
Приложение 3. Коллокаты для слова рука
Приложение 4. Коллокаты для слова белый
Приложение 5. Коллокаты для слова скакать
Приложение 6. Коллокаты для слова семь
Приложение 7. Коллокаты для слова свой
Приложение 8. Экспертная оценка коллокаций, содержащих слово сердце
Приложение 9. Экспертная оценка коллокаций, содержащих слово вода
Приложение 10. Экспертная оценка коллокаций, содержащих слово рука
Приложение 11. Экспертная оценка коллокаций, содержащих слово белый
Приложение 12. Экспертная оценка коллокаций, содержащих слово скакать
Приложение 13. Экспертная оценка коллокаций, содержащих слово семь
Приложение 14. Экспертная оценка коллокаций, содержащих слово свой
Приложение 15. Коэффициент корреляции Спирмена между различными мерами для слова сердце
Приложение 16.Коэффициент корреляции Спирмена между различными мерами для слова вода
Приложение 17.Коэффициент корреляции Спирмена между различными мерами для слова рука
Приложение 18.Коэффициент корреляции Спирмена между различными мерами для слова белый
Приложение 19.Коэффициент корреляции Спирмена между различными мерами для слова скакать
Приложение 20.Коэффициент корреляции Спирмена между различными мерами для слова семь
Приложение 21.Коэффициент корреляции Спирмена между различными мерами для слова свой
Аннотация
Данная работа посвящена оценке мер ассоциации, используемых для выявления коллокаций. Поставлена цель выяснить, насколько эффективны и релевантны эти меры ассоциации, и показать это на примере популярных мер. В работе рассматриваются теоретические вопросы извлечения коллокаций, классификации устойчивых словосочетаний, дано описание мер ассоциаций. В работе описан эксперимент по выявлению коллокаций из корпуса Araneum Russicum Russicum Maius объемом 1,2 млрд токенов в системе NoSketch Engine, представлена оценка работы мер ассоциации.
Ключевые слова: корпуса, извлечение
ВВЕДЕНИЕ
ГЛАВА 1. СЛОВОСОЧЕТАНИЯ В ЯЗЫКЕ
1.1.Отношения между словами
1.2. Понятие сочетаемости.
1.3. Устойчивые словосочетания
1.4.1. Классификация устойчивых словосочетаний по В.В.Виноградову
1.4.2. Классификация устойчивых словосочетаний по А.Н. Баранову и Д.О. Добровольскому
Выводы по главе 1
ГЛАВА 2. МЕТОДЫ ВЫЯВЛЕНИЯ УСТОЙЧИВЫХ СЛОВОСОЧЕТАНИЙ
2.1. Корпуса текстов как исходный материал для выявления коллокаций
2.2. Коллокации и их извлечение
2.3.Факторы, от которых зависит качество работы методов
2.4.Меры лексической ассоциации
2.5. Классификация мер ассоциации
Выводы по главе 2
ГЛАВА 3. МЕТОДЫ И КРИТЕРИИ ОЦЕНКИ
3.1.Точность и полнота
3.2.F-мера
3.3.Средняя точность
3.4.Составление золотого стандарта
Выводы по главе 3
ГЛАВА 4. ОЦЕНКА АВТОМАТИЧЕСКИХ МЕТОДОВ ИЗВЛЕЧЕНИЯ КОЛЛОКАЦИЙ
4.1.Эксперимент
4.2. Оценка результатов
Выводы по главе 4
ЗАКЛЮЧЕНИЕ
Список литературы
Источники золотого стандарта
Приложение 1. Коллокаты для слова сердце
Приложение 2. Коллокаты для слова вода
Приложение 3. Коллокаты для слова рука
Приложение 4. Коллокаты для слова белый
Приложение 5. Коллокаты для слова скакать
Приложение 6. Коллокаты для слова семь
Приложение 7. Коллокаты для слова свой
Приложение 8. Экспертная оценка коллокаций, содержащих слово сердце
Приложение 9. Экспертная оценка коллокаций, содержащих слово вода
Приложение 10. Экспертная оценка коллокаций, содержащих слово рука
Приложение 11. Экспертная оценка коллокаций, содержащих слово белый
Приложение 12. Экспертная оценка коллокаций, содержащих слово скакать
Приложение 13. Экспертная оценка коллокаций, содержащих слово семь
Приложение 14. Экспертная оценка коллокаций, содержащих слово свой
Приложение 15. Коэффициент корреляции Спирмена между различными мерами для слова сердце
Приложение 16.Коэффициент корреляции Спирмена между различными мерами для слова вода
Приложение 17.Коэффициент корреляции Спирмена между различными мерами для слова рука
Приложение 18.Коэффициент корреляции Спирмена между различными мерами для слова белый
Приложение 19.Коэффициент корреляции Спирмена между различными мерами для слова скакать
Приложение 20.Коэффициент корреляции Спирмена между различными мерами для слова семь
Приложение 21.Коэффициент корреляции Спирмена между различными мерами для слова свой
Аннотация
Данная работа посвящена оценке мер ассоциации, используемых для выявления коллокаций. Поставлена цель выяснить, насколько эффективны и релевантны эти меры ассоциации, и показать это на примере популярных мер. В работе рассматриваются теоретические вопросы извлечения коллокаций, классификации устойчивых словосочетаний, дано описание мер ассоциаций. В работе описан эксперимент по выявлению коллокаций из корпуса Araneum Russicum Russicum Maius объемом 1,2 млрд токенов в системе NoSketch Engine, представлена оценка работы мер ассоциации.
Ключевые слова: корпуса, извлечение
Характеристики ВКР
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
475,57 Kb
Список файлов
ОЦЕНКА АВТОМАТИЧЕСКИХ МЕТОДОВ ВЫЯВЛЕНИЯ УСТОЙЧИВЫХ СЛОВОСОЧЕТАНИЙ.docx