Диссертация: Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний
Описание
Характеристики диссертации
Список файлов
- Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний
- Автореферат.pdf 543,34 Kb
- Диссертация.pdf 2,29 Mb
- Описание.txt 2,37 Kb
- Прочти меня!!!.txt 136 b
Кандидатская диссертация
Соискатель:Ильвовский Дмитрий Алексеевич
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Лукашевич Наталья Валентиновна, Аншаков Олег Михайлович
Дата защиты:26.10.2015
В диссертационной работе рассмотрены модели текстов на естественном языке, предназначенные для поиска, классификации и кластеризации текстовых данных. Разработана графовая модель текстов, использующая и обобщающая модель структурного синтактико-семантического представления текстового абзаца (чащу разбора). Модель использует синтаксические деревья разбора и дискурсивные связи для представления текстовых абзацев на английском языке. Предложенная модель реализована в задаче поиска ответов по сложным запросам. Разработан метод, позволяющий улучшить качество поиска и устранить недостатки существующих моделей. Также модель текстовых данных реализована в виде численного метода, использующего ядерные функции. Применение модели позволяет улучшить качество работы существующих моделей в задаче классификации текстов благодаря ранее не применявшемуся в задачах классификации абзацев использованию семантической информации. Разработано таксономическое представление коллекции текстовых данных в виде решетки замкнутых структурных синтактико-семантических описаний. Разработана на основе модели текстов и теории решеток замкнутых описаний оригинальная модель тождественных денотатов для формальных описаний. Предложенная модель применена в задаче построения связей типа «та же сущность» в моделях текстов и реализована в виде численного метода и алгоритма, использующих оригинальный индекс ранжирования замкнутых формальных описаний для нахождения денотатов. Создан единый программный комплекс для работы с текстовыми данными. Также в рамках работы модифицирован программный комплекс для обработки данных на основе решеток замкнутых описаний, представляющий собой универсальное средство поддержки полного цикла исследований и позволяющий повысить эффективность решения ряда задач в области анализа данных.
Объявление о защите (дата размещения 10.07.2015) :
Защита состоится 26 октября 2015 г. в 14-00 по адресу: г. Москва, ул. Кирпичная, 33, ауд. 503
Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:Д 212.048.09 - Совет по техническим и физико-математическим наукам
Ключевые слова:решетки замкнутых описаний, структурное представление, текстовые данные
Файл скачан с сайта StudIzba.com
При копировании или цитировании материалов на других сайтах обязательно используйте ссылку на источник
Начать зарабатывать