Диссертация (1137502), страница 6

Файл №1137502 Диссертация (Автоматизация лексико-типологических исследований методы и инструменты) 6 страницаДиссертация (1137502) страница 62019-05-202019-05-20СтудИзба

Автоматизация лексико-типологических исследований методы и инструменты

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 6)

также предложение составлять на базе параллельных корпусов анкеты для исследований в областиграмматической типологии в статье (Dahl, 2007).7195. Методологическая нишаИтак, в современной мировой практике можно выделить несколько подходов клексической типологии, каждый из которых опирается на один из трех возможныхисточников данных: полевую работу (психолингвистический подход Института имениМакса Планка), словарную информацию (А. Франсуа, А.А. Кибрик и некоторые другие) икорпусные данные (А. Виберг, Б. Вельхли и М. Сисоу и др.).

Особняком стоит подходАнны Вежбицкой и Клиффа Годдарда, которые предлагают анализировать языковоеповедение слов, но сам анализ строят преимущественно на основе интроспекции.Методология, на которую мы опираемся в настоящем исследовании и которую мырассмотрим подробно в следующем разделе, – фреймовый подход к лексическойтипологии (Рахилина & Резникова 2013; Rakhilina & Reznikova 2016) – совмещает в себевсе три основных подхода и предполагает работу со словарями, с корпусами (в случае,если они доступны) и с носителями-информантами.

Это позволяет получить наиболееполное представление о семантике изучаемых лексем. С другой стороны, стольмногосторонний анализ оказывается очень трудоемким и заставляет существенносократить языковую выборку, что и обуславливает необходимость разработки методовавтоматизации различных этапов лексико-типологического исследования в этойпарадигме.Как мы только что показали, компьютерные методы сбора и анализа данных вобласти лексической типологии уже начинают появляться, однако у каждого из них естьдовольно существенные недостатки. Принципиальное отличие наших экспериментов отрассмотренных выше разработок заключается в том, что мы располагаем существенныммассивом лексико-типологических данных, собранных вручную по методологии,отработанной на разнородном лексическом материале. Эти данные мы можемиспользовать в качестве “золотого стандарта” и, тем самым, не просто предлагать те илииные методы компьютерной обработки, но и определять, насколько эти методыприменимы для поставленных задач, а также подбирать наиболее оптимальные параметрыконструируемых систем.В следующем разделе мы обсудим основные положения фреймового подхода клексической типологии, выделим этапы исследования в рамках этой парадигмы исформулируем, какая задача должна быть решена на каждом из шагов.20§2.

Теоретическая база: фреймовый подход к лексической типологииФреймовый подход к лексической типологии, на который мы опираемся в настоящейработе,разработанМосковскойлексико-типологическойгруппой(MLexT)подруководством Е.В. Рахилиной. Он восходит к традициям Московской семантическойшколы (см. Апресян 1974, 2004, 2014) и предполагает сравнительный анализ внутри- имежъязыковых квазисинонимов через призму их сочетаемостных свойств. Для того, чтобысравниватьсловаизразличныхязыков,удобноразбитьихсемантикунанепересекающиеся понятийные фрагменты, т.е.

типы ситуаций, в которых эти слова могутупотребляться. Каждому типу ситуаций соответствуют разные группы контекстов.Например, семантику русского прилагательного тонкий можно представить в видетакого набора понятийных фрагментов:‘малый диаметр поперечного среза’; реализуется в контексте названийдлинных вытянутых предметов [карандаш, веревка, палка]‘малое расстояние от одной грани объекта до другой’ – о размере плоскихпредметов («слоев»), таких как книга, ткань или бумага;‘слабая громкость и высокий частотный диапазон’ – качество звука,реализуется в контексте существительных звук, голос;‘учтивый, деликатный, тактичный’ – о качествах человека;…Те же самые элементарные ситуации позволяют устанавливать соответствия междурусским прилагательным тонкий и его переводными эквивалентами. Ср., например,перевод этого слова на китайский:‘тонкий’ + название длинного вытянутого предмета => xì (xì gùnzi – ‘тонкаяпалка’);‘тонкий’ + название плоского предмета => báo (báo zhǐ – ‘тонкая бумага’) ит.д.

(подробнее см. Кюсева, Рыжова, & Холкина 2013; Наний, 2016).Такие ситуации, релевантные для лексикализации рассматриваемой семантическойзоны (см. Рахилина & Резникова 2013 (c. 12): «…ситуации, которые чаще всегопротивопоставляются лексическими средствами в языках мира»), называются фреймами.Эти единицы можно считать эквивалентами традиционных лексических значений(словарных входов), но их основное отличие от значений, обычно выделяемых в словарях,заключается в том, что они типологически ориентированы, и их набор составляется порезультатам подробного анализа материала нескольких языков.

Кроме того, обычно21фреймы описываются не с помощью толкований, а посредством определения типовконтекстов, которые этот фрейм иллюстрируют. Предполагается, что фреймы – этоминимальные лексические значения, и любое слово в любом языке, относящееся крассматриваемой семантической области, должно покрывать ту или иную их комбинацию.ПРИМЕЧАНИЕТермин фрейм был введен Марвином Минским (см.

Минский 1979) дляобозначения особых единиц памяти, пучков связанных между собой смыслов взадачах моделирования баз знаний в области искусственного интеллекта. Фреймаминазывались ситуации-сценарии, предполагающие определенный состав участникови взаимоотношения между ними. Утверждалось, что элементы фрейма тесносвязаны между собой: упоминание одного из них актуализирует все остальные(например, слово ресторан вызывает в сознании человека представления обопределенной ситуации и особом сценарии поведения: об особом помещении,официантах, меню, еде и напитках, счета, чаевых и т.п.). В лингвистике это понятиеактивно использовалось Чарльзом Филлмором (см. Fillmore 1982, а также созданныйпод его руководством ресурс FrameNet 8 ) для моделирования предикатныхотношений: анализа наборов участников, релевантных для того или иного фрейма,их семантических ролей и моделей их синтаксического оформления.

Понятиефрейма, о котором говорим мы, основано на теории фреймовой семантикиЧ. Филлмора, однако в него вносятся определенные модификации: к представлениюо семантической роли и синтаксическом оформлении добавляются сведения осемантических типах участников (в простейшем случае, информация о том, к какимтаксономическим классам они принадлежат). Например, филлморовский фреймCUTTING объединяет различные типы разделения объекта на части и включает триядерных участника (агенс (Agent), пациенс (Item) и фрагменты, на которыеразделяется пациенс (Pieces)) и несколько периферийных (инструмент, цель, время,место и др.). Этих сведений достаточно для анализа аргументной структурыотносящихся к этому фрейму слов, но не для исследования их лексическойсемантики. У русских глаголов рубить (дрова топором) и резать (бумагуножницами) аргументные структуры одинаковы, но при этом они обозначают дваразных типа действий, которые совершаются над разными типами объектов, а,следовательно, и с помощью разных инструментов – с этим связано и наличие в этойсемантической зоне разных лексических средств.

Чтобы такого рода лексическиепротивопоставления можно было выявлять и анализировать, группа MLexTназывает отдельным фреймом каждую когнитивно значимую комбинацию,скалдывающуюся из типа действия, объекта, инструмента и прочих участниковситуации разделения объекта на части (см. Кашкин 2010).Тем самым, фреймы в понимании MLexT – это более дробные, болееспецифицированные семантические фрагменты, чем фреймы Ч.

Филлмора. Заметим,что и самому Ч. Филлмору такое представление было не чуждо. В статье Fillmore &Atkins 2000, где приводится сравнительный анализ английского глагола crawl‘ползать’ и его французского эквивалента ramper, выделяются значения, основанныена различиях в типе движущегося объекта: движение в полном контакте споверхностью (ср. ползание змей, червяков, улиток) vs. в частичном контакте споверхностью (характерно для крабов, пауков и т.п.).8URL: [https://framenet.icsi.berkeley.edu/]22Не все комбинации фреймов одинаково вероятны: какие-то значения частообъединяются в рамках одного слова, а какие-то, напротив, в большинстве случаевоказываются лексически противопоставлены. Закономерности объединения фреймов врамках одной лексемы представляются графически в виде лексико-семантических карт.Такие карты строятся по тем же принципам, что и семантические карты в грамматическойтипологии (см.

Haspelmath 2003) и лексические карты А. Франсуа (см. François 2008, атакже §1.3), с той разницей, что узлами графа служат фреймы, а не грамматическиефункции или словарные подзначения.Этот подход, в отличие от предложенных в работах Youn et al. 2016 и Kibrik 2012 илиреализованных в системах типа CLICS, предполагает очень подробный анализ компактныхлексических областей, ср. анализ глаголов движения в воде (Майсак & Рахилина 2007),предикатов боли (Брицын и др. 2009), глаголов вращения (Круглякова 2010), глаголовзвуков животных (Резникова и др.

2015; Rakhilina, Merle, & Chahine 2017), признаковойлексики (Кашкин 2013; Кюсева 2012; Холкина 2014) и др. В ходе проведенныхисследований показано, что этот подход действительно позволяет анализировать иэффективно сопоставлять лексику разных языков, выявляя для каждого поля егофреймовую структуру и сравнивая языки между собой на основании того, как они членятэту понятийную область с помощью лексических средств. Для более глобальных задач вобласти широкой типологии лексических систем в нем пока накоплено слишком малоданных, однако кажется, что именно списки фреймов могли бы стать надежной основой идля баз, подобных CLICS, и для метода анализа лексических систем в целом,предложенного в работе Kibrik 2012.Исследование лексических единиц в этой парадигме включает несколько основныхэтапов:1.

Составление анкеты, т.е. предварительное определение набора фреймов и подбордиагностических контекстов на каждый фрейм.2. Сбор данных других языков выборки.3. Составление семантической карты для описания системы каждого языка и еевизуализации.4. Анализ типов систем, реализованных в разных языках.Все эти этапы очень трудоемки. Процесс составления анкеты (этап 1) подразумеваетопределение набора фреймов, релевантных для рассматриваемого поля, и выбор наиболеепоказательных контекстов-иллюстраций для каждого фрейма. Только для этого, самого23первого шага уже необходимо провести подробный анализ сочетаемости лексем,покрывающих выбранную семантическую область, на материале словарных и корпусныхданных 3-5 языков, дополнив их в ходе опросов носителей.

Далее, посколькуподготовленная по итогам первого этапа работы анкета состоит из контекстов, в которыхмогут употребляться изучаемые слова, ее необходимо переводить на каждый из языков,включаемых в выборку, и только после этого заполнять (этап 2), также на основе словарей,корпусов и работы с носителями. Оба этих этапа в рамках фреймового подхода обычновыполняются вручную и требуют долгой, кропотливой и согласованной работыспециалистов по всем языкам, включенным в выборку.Задачи построения семантической карты и последующего анализа типов систем(этапы 3 и 4) также требуют ручной работы, которая осложняется тем, что эти этапы хужевсего формализованы (подробное обсуждение этой проблемы см.

Характеристики

Тип файла

PDF-файл

Размер

1,9 Mb

Материал

Автоматизация лексико-типологических исследований методы и инструменты

Тип материала

Кандидатская диссертация

Предмет

Филология

Высшее учебное заведение

НИУ ВШЭ

Список файлов диссертации

avtomatizacija-leksiko-tipologicheskih-issledovanij-metody-i-instrumenty.rar

Автоматизация лексико-типологических исследований методы и инструменты

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.