Диссертация (Автоматизация лексико-типологических исследований методы и инструменты)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Автоматизация лексико-типологических исследований методы и инструменты". PDF-файл из архива "Автоматизация лексико-типологических исследований методы и инструменты", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯНАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»Факультет гуманитарных наукШкола лингвистикиНа правах рукописиРыжова Дарья АлександровнаАВТОМАТИЗАЦИЯ ЛЕКСИКОТИПОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ: МЕТОДЫИ ИНСТРУМЕНТЫСпециальность «Теория языка»Диссертация на соискание ученой степеникандидата филологических наук НИУ ВШЭНаучный руководительдоктор филол.
наукЕ.В. РахилинаМосква 2018ОГЛАВЛЕНИЕВВЕДЕНИЕ ...................................................................................................................................................... 4ГЛАВА 1. ОБЩИЕ СВЕДЕНИЯ .................................................................................................................... 9§1. КРАТКИЙ ОБЗОР ИМЕЮЩИХСЯ МЕТОДИК И ПОДХОДОВ К ТИПОЛОГИЧЕСКОМУ ОПИСАНИЮ ЛЕКСИКИ ........ 101. Экспериментальная парадигма Инстутита психолингвистики имени Макса Планка .....................
102. Теория семантических примитивов ......................................................................................................... 123. Серия подходов, основанных на анализе лексикографических источников.......................................... 134. Серия подходов, основанных на использовании параллельных корпусов .............................................. 185.
Методологическая ниша ........................................................................................................................... 20§2. ТЕОРЕТИЧЕСКАЯ БАЗА: ФРЕЙМОВЫЙ ПОДХОД К ЛЕКСИЧЕСКОЙ ТИПОЛОГИИ ............................................... 21ГЛАВА 2. ВЕРИФИКАЦИЯ ПОНЯТИЯ ФРЕЙМА С ПОМОЩЬЮ МОДЕЛЕЙДИСТРИБУТИВНОЙ СЕМАНТИКИ.........................................................................................................
26§1. ПОСТАНОВКА ЗАДАЧИ.................................................................................................................................... 26§2. МОДЕЛИ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ...................................................................................................... 28§3.
ПИЛОТНЫЕ ЭКСПЕРИМЕНТЫ .......................................................................................................................... 31§4. НОВАЯ СЕРИЯ ЭКСПЕРИМЕНТОВ .................................................................................................................... 321. Подготовка типологических и дистрибутивных данных ...................................................................... 331.1. Подготовка типологического векторного пространства ................................................................................... 33Предобработка Базы данных признаковой лексики ............................................................................................ 34Метрика типологической близости ....................................................................................................................... 381.2.
Подготовка дистрибутивного векторного пространства ................................................................................... 391.3. Подсчет корреляции ............................................................................................................................................. 451.4. Базовый алгоритм ................................................................................................................................................. 462. Эксперимент 1: признаковые поля ‘острый’ и ‘гладкий’ ......................................................................
463. Эксперимент 2: глаголы качания ............................................................................................................. 514. Эксперимент 3: англоязычный обучающий корпус ................................................................................ 545. Эксперимент 4: визуализация векторных пространств ....................................................................... 566.
Выводы........................................................................................................................................................ 61ГЛАВА 3. АВТОМАТИЧЕСКАЯ РАЗРАБОТКА АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙДИСТРИБУТИВНОЙ СЕМАНТИКИ......................................................................................................... 65§1. КРАТКИЙ ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ СОСТАВЛЕНИЯ ТИПОЛОГИЧЕСКИХ АНКЕТ ............................. 65§2. ПОСТАНОВКА ЗАДАЧИ.................................................................................................................................... 67§3.
ОПРЕДЕЛЕНИЕ КРУГА ЛЕКСЕМ, ОТНОСЯЩИХСЯ К ИЗУЧАЕМОМУ ПОЛЮ ....................................................... 721. Проблема границ поля ............................................................................................................................... 722. Проблема метафорических значений ...................................................................................................... 753. Формализация задачи ................................................................................................................................ 784.
Методы (полу)автоматического составления списка прилагательных ............................................. 794.1. Метод анализа синонимов ................................................................................................................................... 794.2. Метод ближайших соседей .................................................................................................................................. 804.3. Определение границ поля по материалам онтологии RuWordNet ...................................................................
834.4. Метод обратных переводов ................................................................................................................................. 845. Анализ результатов .................................................................................................................................. 86§4. СОСТАВЛЕНИЕ СПИСКОВ КОЛЛОКАЦИЙ ........................................................................................................ 891. Выбор корпуса ............................................................................................................................................
892. Установление порога частотности ........................................................................................................ 96§5. РАЗДЕЛЕНИЕ КОЛЛОКАЦИЙ НА ГРУППЫ ........................................................................................................ 981. Выбор основания для кластеризации и подготовка векторного пространства................................. 9822. Кластеризация векторного пространства........................................................................................... 1001. Алгоритмы с автоматическим определением количества кластеров ................................................................ 1012.
Алгоритмы с заданным числом кластеров .......................................................................................................... 102§7. УМЕНЬШЕНИЕ ОБЪЕМА АНКЕТЫ .................................................................................................................. 104§8. ОЦЕНКА РЕЗУЛЬТАТОВ .................................................................................................................................
105§9. ЭКСПЕРИМЕНТЫ С ДРУГИМИ ПОЛЯМИ ......................................................................................................... 108§10. ВЫВОДЫ ..................................................................................................................................................... 112ГЛАВА 4. МЕТОДЫ АВТОМАТИЧЕСКОГО СБОРА ДАННЫХ ........................................................ 115§1. ПОСТАНОВКА ЗАДАЧИ..................................................................................................................................