Диссертация (1137502), страница 9
Текст из файла (страница 9)
Подготовка типологических и дистрибутивных данных1.1. Подготовка типологического векторного пространстваВ рамках этой части нашей работы мы проводили эксперименты с рядомпризнаковых полей (прежде всего, с полями ‘острый’ и ‘гладкий’) и с глагольным полемкачания. Данные о лексикализации зоны качания в нескольких языках были нампредоставлены М. М. Шапиро в формате таблицы, в строках которой расположены пунктыанкеты, а в столбцах – проанализированные глагольные лексемы. В ячейках таблицы, напересечении пункта анкеты и конкретного слова, указано, может ли данное словоупотребляться в соответствующем контексте (см. фрагмент в Таблице 1).
В основутаблицы положена анкета из 30 строк, иллюстрирующих 11 фреймов, релевантных длялексикализации этой зоны (каждый фрейм представлен несколькими примерами). Этаанкета заполнена материалами семи языков (русского, финского, коми-зырянского,ненецкого, японского, хинди и томо-кана), общее число внесенных в таблицу глагольныхлексем – 4110.10Мы благодарим Марию Шапиро за предоставленные данные и помощь с их оформлением.33гибкиестеблицветокводорослиобъекты,фонарьзакрепленныесверхулампамаятникобъекты,деревозакрепленныеснизу…качаться heilualiehuaвалъёоны…(русский) (финский) (финский) (комизырянский)++++++--++++++--Таблица 1. Фрагмент таблицы с типологическими данными (поле глаголов качания).Сведения о лексикализации признаковых зон ‘острый’ и ‘гладкий’ были нами взятыиз типологически ориентированной базы данных признаковой лексики (Кюсева, Резникова,Рыжова 2013b).
В Базе собрана информация о 32 прилагательных из 15 языков для поля‘острый’ и о 32 лексемах из 9 языков для поля ‘гладкий’.На основе заполненных типологических анкет было сформировано 5 наборовтестовых данных (см. анкеты в Приложениях 1-3):(1) поле ‘острый’, все пункты анкеты;(2) поле ‘острый’, только те пункты анкеты, которые соответствуют фреймам прямыхзначений;(3) поле ‘гладкий’, вся анкета;(4) поле ‘гладкий’, только прямые значения;(5) поле глаголов качания, только прямые значения.Сведениями о типологии метафор в поле глаголов качания мы не располагаем.Предобработка Базы данных признаковой лексикиБаза данных признаковой лексики имеет следующую структуру.
Единица входа вБазу — это микрофрейм, т. е. релевантная для признакового поля ситуация, или примерреализации того или иного фрейма. Поскольку для семантической дизамбигуацииприлагательного в большинстве случаев достаточно определяемого существительного, вкачестве ярлыка для микрофрейма, как правило, используется словосочетание«прилагательное + существительное». Для каждого микрофрейма указывается фрейм, к34которому он относится, семантическое поле, которое содержит этот фрейм, а такжетаксономический класс слов, которые этот микрофрейм реализуют. Кроме того, длякаждого фрейма (а, следовательно, и микрофрейма) указано, к каким значениям онотносится: исходным (т.е.
прямым, буквальным, физическим) или переносным (какправило, абстрактным метафорическим)11.Для каждой признаковой лексемы такая анкета-заготовка заполняется полностью: встроках, соответствующих тем контекстам, в которых может употребляться данное слово,оно пишется в начальной форме без дополнительных помет; если слово не употребляетсяв том или ином контексте, то в нужных строках указывается та же лексема в начальнойформе, но со знаком «-»; если данные о поведении слова в указанном контекстеотсутствуют, строка не заполняется. Иными словами, анкета для каждого поля повторяетсяв Базе столько раз, сколько лексем в нее заносится.
В отдельной графе указывается язык,к которому относится лексема. Так, фрагмент Базы данных для лексемы ž’an (поле‘острый’, бесленеевский диалект кабардино-черкесского языка) имеет следующий вид:Заметим, что задача четкого и формализуемого разделения значений на прямые и переносные (а такжеклассификации самих семантических сдвигов и типологии моделей семантических переходов) слишкомсложна и, по-видимому, пока не имеет однозначного решения. Этой проблематике посвящена обширнаятеоретическая литература, начиная с классических работ Lakoff & Johnson 1980, Lakoff & Turner 1989,Sweetser 1990, ср.
также журнальную статью Peirsman & Geeraerts 2006, вызвавшую большой отклик, иисследования, выполненные в отечественной традиции: Падучева 2004, Кустова 2004, Зализняк 2009,Рахилина и др. 2010 и многие другие. В рамках настоящей работы мы не касаемся этого вопроса и опираемсяна готовые пометы из Базы данных, никак их не обсуждая и не верифицируя.1135Микро-фреймЛексема‘острый нож’ž’anЯзыкФреймПолеТакс.Типклассзначения‘физ.исходноесвойства’бесленеевский ‘острый‘острый’диалектинструменткабардинос режущимчеркесскогокраем’языка2 ‘острый меч’бесленеевский ‘острый‘острый’ ‘физ.исходноедиалектинструментсвойства’кабардинос режущимчеркесскогокраем’языка3 ‘острыйž’anбесленеевский ‘острый‘острый’ ‘физ.исходноекоготь’диалектинструментсвойства’кабардинос режущимчеркесскогокраем’языка4 ‘острая сабля’бесленеевский ‘острый‘острый’ ‘физ.исходноедиалектинструментсвойства’кабардинос режущимчеркесскогокраем’языка5 ‘остроебесленеевский ‘острый‘острый’ ‘физ.исходноелезвие’диалектинструментсвойства’кабардинос режущимчеркесскогокраем’языка6 ‘острая игла’ -ž’anбесленеевский ‘острый‘острый’ ‘физ.исходноедиалектинструментсвойства’кабардинос колющимчеркесскогоконцом’языка7 ‘остраябесленеевский ‘острый‘острый’ ‘физ.исходноестрела’диалектинструментсвойства’кабардинос колющимчеркесскогоконцом’языка8 ‘острый-ž’anбесленеевский ‘острый‘острый’ ‘физ.исходноегвоздь’диалектинструментсвойства’кабардинос колющимчеркесскогоконцом’языкаТаблица 2.
Фрагмент Базы данных для лексемы ž’an (поле ‘острый’, бесленеевский диалекткабардино-черкесского языка). Знак «-» перед словом означает, что оно не может бытьупотреблено в данном контексте.1Таблица формата Базы данных признаковой лексики была нами приведена к форматутаблицы глаголов качания. Заметим, что данные в таблице с прилагательными получилисьочень разреженными. Это связано с особенностями заполнения Базы: далеко не длякаждого языка была собрана информация по каждому пункту анкеты. В большинствеслучаев эксперты по языкам, собирая данные, исходят из теоретического предположения,36что строки анкеты, относящиеся к одному и тому же фрейму, единообразнообслуживаютсядоступнымилексическимисредствами.Поэтомувусловияхограниченных ресурсов (отсутствия корпусов достаточного объема или невозможностидлительного общения с информантом) эксперт заполняет только часть строк, относящихсяк одному фрейму, по умолчанию предполагая, что введенная информация может бытьобобщена и на остальные микрофреймы данного фрейма (ср.
Таблицу 2).Разреженность типологических данных, особенно в условиях того, что все нашивыборки языков не очень большие, может привести к тому, что метрика типологическойблизости будет отражать реальное положение дел недостаточно адекватно. Так, например,пункт ‘острый меч’ в анкете для поля ‘острый’ (строка 2 Таблицы 2) очень часто остаетсянезаполненным, поскольку меч – это очень специфическая реалия, известная не всемкультурам. Если объяснить носителю, что это такое, он, вероятнее всего, употребит дляописания этого предмета то же самое прилагательное, которое используется в его языкедля описания острого ножа, но обычно, конечно, эксперты стараются не использоватьтакого рода искусственные контексты в полевой работе и просто оставляютсоответствующую строку пустой.
С другой стороны, бывают случаи, когда за мечами идругими типами устаревшего оружия закрепляются устаревающие прилагательные (как,например, сербское бридак, почти полностью уступившее место прилагательному оштар),т.е. фактически устаревает все словосочетание целиком. В этом случае, посколькуконтекст ‘острый меч’ описывается не тем словом, которое используется в другихконтекстах, относящихся к тому же фрейму, эксперт заполняет соответствующую строку.Типологически такие случаи очень редки, но, так как фактически информация в Базе естьтолько о них, именно их отразит метрика типологической близости (см. Формулу 1), иконтексты ‘острый нож’ и ‘острый меч’ окажутся, согласно этой метрике, значительнодальше друг от друга, чем они есть на самом деле.Мы приняли решение преодолеть эту проблему, автоматически дозаполнив пустыеклетки в Базе.