Главная » Просмотр файлов » Диссертация

Диссертация (1137502), страница 2

Файл №1137502 Диссертация (Автоматизация лексико-типологических исследований методы и инструменты) 2 страницаДиссертация (1137502) страница 22019-05-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 2)

115§2. МАТЕРИАЛ ДЛЯ ЭКСПЕРИМЕНТОВ ............................................................................................................... 116§3. АЛГОРИТМЫ АВТОМАТИЧЕСКОГО ЗАПОЛНЕНИЯ ТИПОЛОГИЧЕСКОЙ АНКЕТЫ ............................................ 1183.1. Перевод анкеты ....................................................................................................................................

1182.1.1. Онлайн-переводчики компаний Yandex и Google ........................................................................................ 1192.1.2. Машиночитаемые словари Freedict и Verdict ................................................................................................ 1212.1.3. Параллельные корпуса ....................................................................................................................................

1222.1.4. Анализ результатов ......................................................................................................................................... 1232.2. Заполнение анкеты ............................................................................................................................... 125§4. ВЫВОДЫ ....................................................................................................................................................... 126ГЛАВА 5. ПОСТРОЕНИЕ СЕМАНТИЧЕСКОЙ КАРТЫ И АНАЛИЗ ТИПОВ СИСТЕМ ................ 129§1.

СУЩЕСТВУЮЩИЕ МЕТОДЫ СОЗДАНИЯ СЕМАНТИЧЕСКИХ КАРТ.................................................................. 1291.1. Графовые семантические карты ........................................................................................................ 1291.2. Вероятностные семантические карты ............................................................................................. 130§2. ГРАФОВАЯ И ВЕРОЯТНОСТНАЯ МОДЕЛИ В ПРИМЕНЕНИИ К НАШЕМУ МАТЕРИАЛУ ..................................... 131§3.

ПОСТРОЕНИЕ СЕМАНТИЧЕСКИХ КАРТ С ПОМОЩЬЮ РЕШЕТОК ФОРМАЛЬНЫХ ПОНЯТИЙ ............................ 1371. Анализ формальных понятий ..................................................................................................................

1372. Решетки формальных понятий как лексические семантические карты ........................................... 1383. Представление метафорических значений ........................................................................................... 141§4. ВЫВОДЫ ....................................................................................................................................................... 144ЗАКЛЮЧЕНИЕ ...........................................................................................................................................

145БИБЛИОГРАФИЯ ...................................................................................................................................... 148ПРИЛОЖЕНИЕ 1. АНКЕТА ДЛЯ ПОЛЯ ‘ОСТРЫЙ’ ............................................................................ 161ПРИЛОЖЕНИЕ 2. АНКЕТА ДЛЯ ПОЛЯ ‘ГЛАДКИЙ’.......................................................................... 166ПРИЛОЖЕНИЕ 3. АНКЕТА ДЛЯ ПОЛЯ ГЛАГОЛОВ КАЧАНИЯ .....................................................

170ПРИЛОЖЕНИЕ 4. АВТОМАТИЧЕСКИ СКОНСТРУИРОВАННАЯ АНКЕТА ДЛЯ ПОЛЯ‘ПРЯМОЙ’ ................................................................................................................................................... 171ПРИЛОЖЕНИЕ 5. АВТОМАТИЧЕСКИ СКОНСТРУИРОВАННАЯ АНКЕТА ДЛЯ ПОЛЯ‘ТОЛСТЫЙ’ ................................................................................................................................................. 1733ВведениеЛексическая типология – сравнительно молодая область лингвистики, основнойзадачей которой является сопоставительный анализ значений слов в разных языках.Сильнейший импульс для развития лексическая типология получила с выходомзнаменитой статьи Berlin & Kay 1969 о типологии цветообозначений, где была предложеначеткая методика сопоставления лексических значений, широко применяемая до сих пор.Эта работа вызвала широкий резонанс в лингвистическом сообществе и положила началоактивномуразвитиюлексическойтипологии.Внастоящеевремяинтересктипологическому анализу лексики только продолжает возрастать.За полвека лексическая типология добилась существенных результатов: разработаныразличные методики сбора и анализа материала (см., например, недавний обзорKoptjevskaja-Tamm, Rakhilina, & Vanhove 2016, описан целый ряд семантических полей(глаголы давания (Newman 1998), разделения объектов на части (Majid & Bowerman 2007),движения в воде (Майсак & Рахилина 2007), извлечения объектов (Kopecka & Narasimhan2012) и многие другие, в том числе не-глагольные).

Между тем, некоторыеметодологические сложности по-прежнему не преодолены. В первую очередь, онисвязаны с тем, что для анализа лексики необходим обширный и представительныйматериал,которыйлексикографическихвбольшинствеисточников.Этослучаевневозможновынуждаетпочерпнутьисследователейизразрабатыватьспециальные анкеты и собирать команду экспертов по различным языкам, способныхпровести работу с носителями и проанализировать полученный материал. Трудоемкостьвсего процесса не позволяет проводить подробный анализ обширных семантических зон вбольшом количестве языков.

Поэтому, в большинстве случаев, приходится серьезноограничивать либо количество языков в выборке, либо степень подробности их анализа.Автоматизация трудоемкой деятельности по сбору и обработке лексического материалапозволила бы получить огромный массив структурированных данных для многих языковмира,подготовленныхклексикографическойобработкеинепосредственномусопоставлению.Результаты подробного и обширного сравнительного анализа лексических значений,а также сама алгоритмизация и компьютеризация лексико-типологического исследованияпредставляют несомненную теоретическую ценность: они позволяют не только расширятьи уточнять данные, полученные ручным путем, но и уточнять методологические4основания, на которых была построена ручная работа с этими данными.

В частности, вданной диссертации мы предполагаем доказать реальность и лингвистическуюрелевантность такого теоретического понятия, как лексико-типологический фрейм,которое лежит в основе наших исследований. Таким образом, с алгоритмизациейлексическая типология повышает свой статус как научно обоснованная областьлингвистических исследований: мы строим не гипотезы, а полноценные модели.Одновременно привлечение в лексическую типологию больших данных принесло быи практическую пользу: их можно было бы учитывать при решении задач ручного имашинного перевода, а также при разработке более эффективных методик обученияиностранному языку. Таким образом, актуальность представляемой на защитудиссертационной работы, определяется востребованностью методов автоматическогоанализа лексики как в теоретической, так и в прикладной лингвистике.Наша работа опирается на фреймовый подход к лексической типологии,разработанный Московской лексико-типологической группой MLexT (Рахилина &Резникова 2013; Rakhilina & Reznikova 2016) и восходящий к традициям Московскойсемантической школы, см.

Апресян 1974. Ключевое для данной парадигмы понятиефрейма обозначает минимальную ситуацию, которая может в каком-либо языкеописываться отдельной лексемой. Задача типологического описания некоторогосемантического поля в таком случае сводится к определению набора составляющих егофреймов (т.е. типов ситуаций, которые могут покрываться относящимися к немулексемами) и моделей их лексикализации (т.е.

стратегии объединения значений в рамкаходного лексического средства – прототипически, слова). Набор фреймов определяетсячерез анализ сочетаемости слов, которая изучается по словарям и корпусам и уточняетсяв ходе опросов носителей, а принципы объединения фреймов отображаются насемантических картах, подобных тем, что создаются по результатам исследований вграмматической типологии (см. Haspelmath 2003).Цель нашей работы – обосновать фреймовый подход в качестве методологическойосновы и теоретической базы лексико-типологических исследований и предложитьновые методы автоматического сбора и анализа лексико-типологических данных, которыепозволят упростить и ускорить процесс сбора первичных данных и обнаружить новыезакономерности в выражении лексических значений.В соответствии с поставленной целью, работа решает следующие задачи:5(1) формализация базовых понятий и процедуры лексико-типологическогоисследования, выполняемого в рамках фреймовой парадигмы: выделение основных егоэтапов и формулировка задач, которые должны быть решены на каждом шаге;(2) подбор и апробация автоматических методов реализации каждого из этапов;(3)анализполученныхрезультатов,определениеперспективпримененияквантитативных методик в лексической типологии.Основные методы, на которые мы опираемся при разработке алгоритмовавтоматического сбора и анализа лексических данных, – это дистрибутивный анализ(модели дистрибутивной семантики, см.

Baroni, Bernardi, & Zamparelli 2014), кластерныйанализ (Everitt 2011) и анализ формальных понятий (Ganter & Wille 1999).Научная новизна исследования обусловлена слабой изученностью лексикотипологической области в целом и узким кругом исследований, посвященных задачеразработки компьютерных методов анализа значений слов. Методы, которые мыиспользуем в диссертации, пока не применялись для решения подобных задач. Мыпредлагаем свои собственные алгоритмы их внедрения в процесс типологического анализалексики.На защиту выносятся следующие положения:(1) Фреймовая структура поля имеет квантитативное обоснование и представляетсобой пересекающиеся кластеры с ярко выраженными центрами («фокусами»).(2) Предварительный вариант лексико-типологической анкеты может быть полученна основе одноязычного корпуса текстов с помощью моделей дистрибутивной семантикии кластерного анализа полученного дистрибутивного пространства.(3) Процесс сбора данных по анкете может быть полностью автоматизирован спомощью параллельных и одноязычных корпусов, машиночитаемых переводных словарейи онлайн-переводчиков.(4) Решетки формальных понятий могут быть использованы как новый аналогсемантических карт.

Такие карты независимы от изначальных теоретических предпосылокисследователя и имеют более широкий круг возможностей по сравнению с обычнымиграфовыми и вероятностными моделями. Они позволяют отображать не толькоотносительные расстояния между исходными значениями, но и стратегии объединенияпрямых значений и системные связи между прямыми и метафорическими употреблениямилексем.6Тем самым, теоретическая значимость работы определяется её вкладом в развитиелексической типологии в целом и фреймового подхода в частности. Результаты,полученные в ходе настоящего исследования, позволяют уточнить наши представления оборганизации семантического пространства лексических значений и выдвинуть новыегипотезы относительно степени их сопоставимости.Практическая значимость диссертации заключается в разработке алгоритмов,которыемогутпозволитьоптимизироватьпроцесслексико-типологическогоисследования, а значит, ускорить процесс подготовки материала, необходимого длярешения задач в области лексикографии (в том числе компьютерной), обучения языку,ручного и машинного перевода.Все эксперименты, описанные в настоящей работе, проводятся на материаленескольких признаковых и глагольных семантических полей, уже исследованных вручнуюучастниками группы MLexT: ‘острый’ (Кюсева 2012), (Kyuseva, Parina, & Ryzhova toappear), ‘гладкий’ (Кашкин 2013), (Kashkin & Vinogradova to appear), ‘прямой’ (Лучина2014), ‘толстый’ (Kozlov & Privizentseva to appear), ‘качание’ (Шапиро 2015), ‘падение’(Кузьменко & Мустакимова 2015; Reznikova & Vyrenkova 2015) и некоторые другие.Апробация результатов исследования.

Основные результаты исследования былипредставлены на XI Конференции по типологии и грамматике для молодыхисследователей (г. Санкт-Петербург, 2014), мастер-классе по лексической типологии вУниверситетеХельсинки(г.Хельсинки,Финляндия,2014),XVIАпрельскоймеждународной научной конференции НИУ ВШЭ (г.

Характеристики

Тип файла
PDF-файл
Размер
1,9 Mb
Предмет
Высшее учебное заведение

Список файлов диссертации

Автоматизация лексико-типологических исследований методы и инструменты
Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
308
Средний доход
с одного платного файла
Обучение Подробнее