Диссертация (1137502)
Текст из файла
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯНАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»Факультет гуманитарных наукШкола лингвистикиНа правах рукописиРыжова Дарья АлександровнаАВТОМАТИЗАЦИЯ ЛЕКСИКОТИПОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ: МЕТОДЫИ ИНСТРУМЕНТЫСпециальность «Теория языка»Диссертация на соискание ученой степеникандидата филологических наук НИУ ВШЭНаучный руководительдоктор филол.
наукЕ.В. РахилинаМосква 2018ОГЛАВЛЕНИЕВВЕДЕНИЕ ...................................................................................................................................................... 4ГЛАВА 1. ОБЩИЕ СВЕДЕНИЯ .................................................................................................................... 9§1. КРАТКИЙ ОБЗОР ИМЕЮЩИХСЯ МЕТОДИК И ПОДХОДОВ К ТИПОЛОГИЧЕСКОМУ ОПИСАНИЮ ЛЕКСИКИ ........ 101. Экспериментальная парадигма Инстутита психолингвистики имени Макса Планка .....................
102. Теория семантических примитивов ......................................................................................................... 123. Серия подходов, основанных на анализе лексикографических источников.......................................... 134. Серия подходов, основанных на использовании параллельных корпусов .............................................. 185.
Методологическая ниша ........................................................................................................................... 20§2. ТЕОРЕТИЧЕСКАЯ БАЗА: ФРЕЙМОВЫЙ ПОДХОД К ЛЕКСИЧЕСКОЙ ТИПОЛОГИИ ............................................... 21ГЛАВА 2. ВЕРИФИКАЦИЯ ПОНЯТИЯ ФРЕЙМА С ПОМОЩЬЮ МОДЕЛЕЙДИСТРИБУТИВНОЙ СЕМАНТИКИ.........................................................................................................
26§1. ПОСТАНОВКА ЗАДАЧИ.................................................................................................................................... 26§2. МОДЕЛИ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ...................................................................................................... 28§3.
ПИЛОТНЫЕ ЭКСПЕРИМЕНТЫ .......................................................................................................................... 31§4. НОВАЯ СЕРИЯ ЭКСПЕРИМЕНТОВ .................................................................................................................... 321. Подготовка типологических и дистрибутивных данных ...................................................................... 331.1. Подготовка типологического векторного пространства ................................................................................... 33Предобработка Базы данных признаковой лексики ............................................................................................ 34Метрика типологической близости ....................................................................................................................... 381.2.
Подготовка дистрибутивного векторного пространства ................................................................................... 391.3. Подсчет корреляции ............................................................................................................................................. 451.4. Базовый алгоритм ................................................................................................................................................. 462. Эксперимент 1: признаковые поля ‘острый’ и ‘гладкий’ ......................................................................
463. Эксперимент 2: глаголы качания ............................................................................................................. 514. Эксперимент 3: англоязычный обучающий корпус ................................................................................ 545. Эксперимент 4: визуализация векторных пространств ....................................................................... 566.
Выводы........................................................................................................................................................ 61ГЛАВА 3. АВТОМАТИЧЕСКАЯ РАЗРАБОТКА АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙДИСТРИБУТИВНОЙ СЕМАНТИКИ......................................................................................................... 65§1. КРАТКИЙ ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ СОСТАВЛЕНИЯ ТИПОЛОГИЧЕСКИХ АНКЕТ ............................. 65§2. ПОСТАНОВКА ЗАДАЧИ.................................................................................................................................... 67§3.
ОПРЕДЕЛЕНИЕ КРУГА ЛЕКСЕМ, ОТНОСЯЩИХСЯ К ИЗУЧАЕМОМУ ПОЛЮ ....................................................... 721. Проблема границ поля ............................................................................................................................... 722. Проблема метафорических значений ...................................................................................................... 753. Формализация задачи ................................................................................................................................ 784.
Методы (полу)автоматического составления списка прилагательных ............................................. 794.1. Метод анализа синонимов ................................................................................................................................... 794.2. Метод ближайших соседей .................................................................................................................................. 804.3. Определение границ поля по материалам онтологии RuWordNet ...................................................................
834.4. Метод обратных переводов ................................................................................................................................. 845. Анализ результатов .................................................................................................................................. 86§4. СОСТАВЛЕНИЕ СПИСКОВ КОЛЛОКАЦИЙ ........................................................................................................ 891. Выбор корпуса ............................................................................................................................................
892. Установление порога частотности ........................................................................................................ 96§5. РАЗДЕЛЕНИЕ КОЛЛОКАЦИЙ НА ГРУППЫ ........................................................................................................ 981. Выбор основания для кластеризации и подготовка векторного пространства................................. 9822. Кластеризация векторного пространства........................................................................................... 1001. Алгоритмы с автоматическим определением количества кластеров ................................................................ 1012.
Алгоритмы с заданным числом кластеров .......................................................................................................... 102§7. УМЕНЬШЕНИЕ ОБЪЕМА АНКЕТЫ .................................................................................................................. 104§8. ОЦЕНКА РЕЗУЛЬТАТОВ .................................................................................................................................
105§9. ЭКСПЕРИМЕНТЫ С ДРУГИМИ ПОЛЯМИ ......................................................................................................... 108§10. ВЫВОДЫ ..................................................................................................................................................... 112ГЛАВА 4. МЕТОДЫ АВТОМАТИЧЕСКОГО СБОРА ДАННЫХ ........................................................ 115§1. ПОСТАНОВКА ЗАДАЧИ..................................................................................................................................
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.