Диссертация (1137502), страница 6
Текст из файла (страница 6)
также предложение составлять на базе параллельных корпусов анкеты для исследований в областиграмматической типологии в статье (Dahl, 2007).7195. Методологическая нишаИтак, в современной мировой практике можно выделить несколько подходов клексической типологии, каждый из которых опирается на один из трех возможныхисточников данных: полевую работу (психолингвистический подход Института имениМакса Планка), словарную информацию (А. Франсуа, А.А. Кибрик и некоторые другие) икорпусные данные (А. Виберг, Б. Вельхли и М. Сисоу и др.).
Особняком стоит подходАнны Вежбицкой и Клиффа Годдарда, которые предлагают анализировать языковоеповедение слов, но сам анализ строят преимущественно на основе интроспекции.Методология, на которую мы опираемся в настоящем исследовании и которую мырассмотрим подробно в следующем разделе, – фреймовый подход к лексическойтипологии (Рахилина & Резникова 2013; Rakhilina & Reznikova 2016) – совмещает в себевсе три основных подхода и предполагает работу со словарями, с корпусами (в случае,если они доступны) и с носителями-информантами.
Это позволяет получить наиболееполное представление о семантике изучаемых лексем. С другой стороны, стольмногосторонний анализ оказывается очень трудоемким и заставляет существенносократить языковую выборку, что и обуславливает необходимость разработки методовавтоматизации различных этапов лексико-типологического исследования в этойпарадигме.Как мы только что показали, компьютерные методы сбора и анализа данных вобласти лексической типологии уже начинают появляться, однако у каждого из них естьдовольно существенные недостатки. Принципиальное отличие наших экспериментов отрассмотренных выше разработок заключается в том, что мы располагаем существенныммассивом лексико-типологических данных, собранных вручную по методологии,отработанной на разнородном лексическом материале. Эти данные мы можемиспользовать в качестве “золотого стандарта” и, тем самым, не просто предлагать те илииные методы компьютерной обработки, но и определять, насколько эти методыприменимы для поставленных задач, а также подбирать наиболее оптимальные параметрыконструируемых систем.В следующем разделе мы обсудим основные положения фреймового подхода клексической типологии, выделим этапы исследования в рамках этой парадигмы исформулируем, какая задача должна быть решена на каждом из шагов.20§2.
Теоретическая база: фреймовый подход к лексической типологииФреймовый подход к лексической типологии, на который мы опираемся в настоящейработе,разработанМосковскойлексико-типологическойгруппой(MLexT)подруководством Е.В. Рахилиной. Он восходит к традициям Московской семантическойшколы (см. Апресян 1974, 2004, 2014) и предполагает сравнительный анализ внутри- имежъязыковых квазисинонимов через призму их сочетаемостных свойств. Для того, чтобысравниватьсловаизразличныхязыков,удобноразбитьихсемантикунанепересекающиеся понятийные фрагменты, т.е.
типы ситуаций, в которых эти слова могутупотребляться. Каждому типу ситуаций соответствуют разные группы контекстов.Например, семантику русского прилагательного тонкий можно представить в видетакого набора понятийных фрагментов:‘малый диаметр поперечного среза’; реализуется в контексте названийдлинных вытянутых предметов [карандаш, веревка, палка]‘малое расстояние от одной грани объекта до другой’ – о размере плоскихпредметов («слоев»), таких как книга, ткань или бумага;‘слабая громкость и высокий частотный диапазон’ – качество звука,реализуется в контексте существительных звук, голос;‘учтивый, деликатный, тактичный’ – о качествах человека;…Те же самые элементарные ситуации позволяют устанавливать соответствия междурусским прилагательным тонкий и его переводными эквивалентами. Ср., например,перевод этого слова на китайский:‘тонкий’ + название длинного вытянутого предмета => xì (xì gùnzi – ‘тонкаяпалка’);‘тонкий’ + название плоского предмета => báo (báo zhǐ – ‘тонкая бумага’) ит.д.
(подробнее см. Кюсева, Рыжова, & Холкина 2013; Наний, 2016).Такие ситуации, релевантные для лексикализации рассматриваемой семантическойзоны (см. Рахилина & Резникова 2013 (c. 12): «…ситуации, которые чаще всегопротивопоставляются лексическими средствами в языках мира»), называются фреймами.Эти единицы можно считать эквивалентами традиционных лексических значений(словарных входов), но их основное отличие от значений, обычно выделяемых в словарях,заключается в том, что они типологически ориентированы, и их набор составляется порезультатам подробного анализа материала нескольких языков.
Кроме того, обычно21фреймы описываются не с помощью толкований, а посредством определения типовконтекстов, которые этот фрейм иллюстрируют. Предполагается, что фреймы – этоминимальные лексические значения, и любое слово в любом языке, относящееся крассматриваемой семантической области, должно покрывать ту или иную их комбинацию.ПРИМЕЧАНИЕТермин фрейм был введен Марвином Минским (см.
Минский 1979) дляобозначения особых единиц памяти, пучков связанных между собой смыслов взадачах моделирования баз знаний в области искусственного интеллекта. Фреймаминазывались ситуации-сценарии, предполагающие определенный состав участникови взаимоотношения между ними. Утверждалось, что элементы фрейма тесносвязаны между собой: упоминание одного из них актуализирует все остальные(например, слово ресторан вызывает в сознании человека представления обопределенной ситуации и особом сценарии поведения: об особом помещении,официантах, меню, еде и напитках, счета, чаевых и т.п.). В лингвистике это понятиеактивно использовалось Чарльзом Филлмором (см. Fillmore 1982, а также созданныйпод его руководством ресурс FrameNet 8 ) для моделирования предикатныхотношений: анализа наборов участников, релевантных для того или иного фрейма,их семантических ролей и моделей их синтаксического оформления.
Понятиефрейма, о котором говорим мы, основано на теории фреймовой семантикиЧ. Филлмора, однако в него вносятся определенные модификации: к представлениюо семантической роли и синтаксическом оформлении добавляются сведения осемантических типах участников (в простейшем случае, информация о том, к какимтаксономическим классам они принадлежат). Например, филлморовский фреймCUTTING объединяет различные типы разделения объекта на части и включает триядерных участника (агенс (Agent), пациенс (Item) и фрагменты, на которыеразделяется пациенс (Pieces)) и несколько периферийных (инструмент, цель, время,место и др.). Этих сведений достаточно для анализа аргументной структурыотносящихся к этому фрейму слов, но не для исследования их лексическойсемантики. У русских глаголов рубить (дрова топором) и резать (бумагуножницами) аргументные структуры одинаковы, но при этом они обозначают дваразных типа действий, которые совершаются над разными типами объектов, а,следовательно, и с помощью разных инструментов – с этим связано и наличие в этойсемантической зоне разных лексических средств.
Чтобы такого рода лексическиепротивопоставления можно было выявлять и анализировать, группа MLexTназывает отдельным фреймом каждую когнитивно значимую комбинацию,скалдывающуюся из типа действия, объекта, инструмента и прочих участниковситуации разделения объекта на части (см. Кашкин 2010).Тем самым, фреймы в понимании MLexT – это более дробные, болееспецифицированные семантические фрагменты, чем фреймы Ч.
Филлмора. Заметим,что и самому Ч. Филлмору такое представление было не чуждо. В статье Fillmore &Atkins 2000, где приводится сравнительный анализ английского глагола crawl‘ползать’ и его французского эквивалента ramper, выделяются значения, основанныена различиях в типе движущегося объекта: движение в полном контакте споверхностью (ср. ползание змей, червяков, улиток) vs. в частичном контакте споверхностью (характерно для крабов, пауков и т.п.).8URL: [https://framenet.icsi.berkeley.edu/]22Не все комбинации фреймов одинаково вероятны: какие-то значения частообъединяются в рамках одного слова, а какие-то, напротив, в большинстве случаевоказываются лексически противопоставлены. Закономерности объединения фреймов врамках одной лексемы представляются графически в виде лексико-семантических карт.Такие карты строятся по тем же принципам, что и семантические карты в грамматическойтипологии (см.
Haspelmath 2003) и лексические карты А. Франсуа (см. François 2008, атакже §1.3), с той разницей, что узлами графа служат фреймы, а не грамматическиефункции или словарные подзначения.Этот подход, в отличие от предложенных в работах Youn et al. 2016 и Kibrik 2012 илиреализованных в системах типа CLICS, предполагает очень подробный анализ компактныхлексических областей, ср. анализ глаголов движения в воде (Майсак & Рахилина 2007),предикатов боли (Брицын и др. 2009), глаголов вращения (Круглякова 2010), глаголовзвуков животных (Резникова и др.
2015; Rakhilina, Merle, & Chahine 2017), признаковойлексики (Кашкин 2013; Кюсева 2012; Холкина 2014) и др. В ходе проведенныхисследований показано, что этот подход действительно позволяет анализировать иэффективно сопоставлять лексику разных языков, выявляя для каждого поля егофреймовую структуру и сравнивая языки между собой на основании того, как они членятэту понятийную область с помощью лексических средств. Для более глобальных задач вобласти широкой типологии лексических систем в нем пока накоплено слишком малоданных, однако кажется, что именно списки фреймов могли бы стать надежной основой идля баз, подобных CLICS, и для метода анализа лексических систем в целом,предложенного в работе Kibrik 2012.Исследование лексических единиц в этой парадигме включает несколько основныхэтапов:1.
Составление анкеты, т.е. предварительное определение набора фреймов и подбордиагностических контекстов на каждый фрейм.2. Сбор данных других языков выборки.3. Составление семантической карты для описания системы каждого языка и еевизуализации.4. Анализ типов систем, реализованных в разных языках.Все эти этапы очень трудоемки. Процесс составления анкеты (этап 1) подразумеваетопределение набора фреймов, релевантных для рассматриваемого поля, и выбор наиболеепоказательных контекстов-иллюстраций для каждого фрейма. Только для этого, самого23первого шага уже необходимо провести подробный анализ сочетаемости лексем,покрывающих выбранную семантическую область, на материале словарных и корпусныхданных 3-5 языков, дополнив их в ходе опросов носителей.
Далее, посколькуподготовленная по итогам первого этапа работы анкета состоит из контекстов, в которыхмогут употребляться изучаемые слова, ее необходимо переводить на каждый из языков,включаемых в выборку, и только после этого заполнять (этап 2), также на основе словарей,корпусов и работы с носителями. Оба этих этапа в рамках фреймового подхода обычновыполняются вручную и требуют долгой, кропотливой и согласованной работыспециалистов по всем языкам, включенным в выборку.Задачи построения семантической карты и последующего анализа типов систем(этапы 3 и 4) также требуют ручной работы, которая осложняется тем, что эти этапы хужевсего формализованы (подробное обсуждение этой проблемы см.