Диссертация: Методы автоматического выделения тезаурусных отношений на основе словарных толкований
Описание
Характеристики диссертации
Список файлов
- Методы автоматического выделения тезаурусных отношений на основе словарных толкований
- Summary.pdf 222,18 Kb
- Диссертация.pdf 1,14 Mb
- Описание.txt 2,17 Kb
- Резюме.pdf 169,73 Kb
- Прочти меня!!!.txt 136 b
Кандидатская диссертация
Ученая степень НИУ ВШЭ
Соискатель:Алексеевский Даниил Андреевич
Руководитель:Толдова Светлана Юрьевна
Дата защиты:20.11.2018
С некоторыми задачами обработки текстов человек справляется лучше, чем компьютер. Например, в отличие от компьютера человек может легко найти в коротком отрывке все упоминания жидкостей и сосудов. Чтобы компьютер смог отвечать на такого рода вопросы, ему нужны базовые представления о мире, например, что чашка -- это сосуд, а чай -- это жидкость. Такие знания называются тезаурусными отношениями. В читаемом для людей виде они содержатся в толковых словарях: "Чашка 1. Небольшой, обычно округлой формы, с ручкой, сосуд для питья". Понятным компьютеру способом представления таких знаний являются семантические сети: тезаурусы и онтологии. Защищаемая работа посвящена автоматизации построения тезауруса на основе толкового словаря. В работе предложен новый подход к извлечению отношений, состоящий из трёх этапов. Для того, чтобы извлекать отношения из толкований, нужно обозреть всё их разнообразие. В помощь исследователю предлагается автоматически группировать похожие по синтаксической структуре толкования так, чтобы легко было убедиться, что все типы толкований охвачены. Это и есть первый этап. На втором этапе исследователь описывает интересные ему свойства каждой группы толкований, а компьютер по описаниям извлекает из толкований тезаурусные отношения. В результате получается набор пар слов, связанных отношениями. Чтобы собрать из них тезаурус, необходимо объединить их в одну сеть: из набора пар чашка-сосуд, чашка-миска, сосуд-вместилище, сосуд-орган нужно понять, в каких случаях мы говорим об одном понятии. Наша цель получить в этом случае цепочку чашка-сосуд-вместилище. Решение такой задачи называется дизамбигуацией и является заключительным этапом работы. Для каждого этапа исследованы и описаны существующие подходы, проведены эксперименты для сравнения различных подходов, предложено наилучшее решение среди исследованных.
Дисс. совет:Совет по филологии
Ключевые слова:автоматическая обработка текстов, векторные семантические модели, ворднет, дизамбигуация, извлечение отношений, обучение с частичным привлечением учителя, тезаурус
Файл скачан с сайта StudIzba.com
При копировании или цитировании материалов на других сайтах обязательно используйте ссылку на источник
Начать зарабатывать