Диссертация (1137502), страница 16
Текст из файла (страница 16)
также наше пилотное исследование Рыжова 2014), после чего оптимальнаяверсия алгоритма была опробована на дополнительном материале несколькихпризнаковых и глагольных полей. В следующем параграфе (§2) мы подробно опишемтрадиционную методику подготовки типологической анкеты в рамках фреймовогоподхода к лексической типологии, сформулируем требования к анкете, которыенеобходимо соблюсти при попытке автоматизации этого процесса, и поставимформальные задачи, которые должен решать разрабатываемый алгоритм. Затем, впараграфах 3-8, мы представим все вариации алгоритма, которые мы тестировали наматериале поля ‘острый’.
В параграфе 9 мы демонстрируем возможности примененияоптимальной конфигурации параметров алгоритма к анализу нескольких признаковых иглагольных полей. В параграфе 10 мы подводим итоги этого этапа работы.§2. Постановка задачиФреймовый подход к лексической типологии основан на анализе правилсочетаемости исследуемых лексем. Этот общий принцип определяет и формат анкет,которые представляют собой наборы контекстов, а не, например, экстралингвистическихстимулов.Для успешного выполнения своих функций анкета должна удовлетворять рядутребований. Во-первых, она должна быть представительной: в ней должны быть учтенывсе основные типы контекстов, в которых могут употребляться лексемы изучаемогосемантического поля.
Это нетривиальная задача, так как известно, что слова разных языков67обычно не совпадают по объёму значений, и поэтому простого перевода всехсловосочетаний (предложений), иллюстрирующих круг возможных употребленийнекоторой лексемы в одном языке, недостаточно для полного анализа её переводногоэквивалента в другом. Так, например, английский эквивалент русского прилагательноготолстый – thick – может сочетаться со словами ‘туман’, ‘дым’ и т.п., выражая при этомзначение ‘густой’, которое в русском языке не только покрывается другой лексемой, но и– на интуитивном уровне – не имеет никакого отношения к признакам размера. Между тем,такое объединение очень частотно: оно наблюдается во французском, немецком,кабардинском и многих других языках.С другой стороны, анкета должна быть не очень большой: в противном случаеэкспертам по языкам будет очень сложно с ней работать.
Поэтому важно не просто собратьсписок всех возможных словосочетаний, в которых могут фигурировать лексемыизучаемого семантического поля, но и расклассифицировать их, выделив набор различныхтипов ситуаций, в которых могут употребляться рассматриваемые слова. При этом важноучесть все потенциально возможные лексические противопоставления, но включить ванкету всего по несколько (3-5) примеров реализации каждого из предполагаемых типовситуаций.Далее,примерыдляанкетыдолжныбытьдостаточнопоказательными.Предполагается, что анкета будет предъявляться носителям очень разных языков икультур, а значит, она должна быть построена на основе максимально универсальныхпонятий и реалий.
Например, в качестве иллюстрации ситуации описания размерапоперечного среза длинного вытянутого объекта правильнее использовать формулировку‘толстая палка’, а не ‘толстый лом’.КОММЕНТАРИЙВ рамках фреймового подхода к лексической типологии термин анкета можетиспользоваться для обозначения двух разных типов инструментов.
С одной стороны,анкетой может называться набор стимулов, предъявляемых носителям изучаемыхязыков. В этом случае стимул практически никогда не сводится к словосочетанию издвух элементов: контекст расширяется до предложения или короткого фрагментатекста, чтобы информант имел возможность максимально полно и точно представитьсебе ситуацию, которую имеет в виду исследователь. Например, ситуации ‘толстаяпалка’ мог бы соответствовать такой пункт анкеты: Я выбрал слишком толстуюпалку, ее неудобно держать в руке.С другой стороны, анкетой называют и набор коротких словосочетаний(минимальных диагностических контекстов), который выдается экспертам по языкам,включенным в выборку, и используется для сопоставления собранных данных.
Такаяанкета служит ориентиром для исследователя: частотность употребления именно68таких единиц оценивается по корпусам; на основе именно таких словосочетанийисследователь создает расширенную версию опросника (т.е. анкету первого типа),учитывающую специфику обследуемого языка.В рамках настоящей работы мы будем говорить исключительно об анкетахвторого типа.Таким образом, разработка анкеты – очень важная и трудоёмкая часть лексикотипологического исследования, включающая в себя несколько этапов. Традиционно этаработа выполняется вручную.
Первый вариант анкеты создаётся на основе русского языка.Этот язык хорошо обеспечен лексикографическими ресурсами (словарями и корпусами) ик тому же является родным для исследователей из группы MLexT, что позволяет намсобирать по нему надежный и достаточно полный материал, а затем подробно и аккуратноего анализировать.
В первую очередь с помощью НКРЯ собираются и изучаютсявозможные контексты употребления лексем рассматриваемого семантического поля.Спорные места уточняются с помощью опросов носителей. Далее полученные контекстыделятся на смысловые группы – будущие фреймы. Так, например, для анализапризнаковых семантических полей в анкету включаются в основном сочетанияприлагательных изучаемого поля с различными существительными (носителямипризнака), при этом общий набор контекстов делится на классы в зависимости отсемантики существительного. При самом грубом делении в каждый класс попадаютсочетания с именами одного таксономического класса.
Например, в анкете для поля‘острый’ в один класс попадут названия инструментов (‘нож’, ‘серп’, ‘игла’, ‘копьё’), вдругой класс – обозначения различных видов пищи (‘суп’, ‘соус’, ‘приправа’), в третий –обозначения разного рода взаимодействий (‘конфликт’, ‘конфронтация’, ‘дебаты’).Дальнейшее деление происходит на основе других параметров, которые, как нам известноиз нашего предыдущего опыта, часто бывают релевантны для признаковых семантическихполей.
Так, нам известно, что часто важную роль играет не только таксономическая, но итопологическая классификация существительных (см. Рахилина 2010), т.е. классификацияс точки зрения формы обозначаемых этими словами предметов (ср. пример про признак‘тонкий’ в §2 Главы 1). В соответствии с этим параметром, первый класс анкеты длясемантического поля ‘острый’ разделится на две части: объекты с режущим краем (‘нож’,‘серп’) и колющим концом (‘игла’, ‘копьё’), т.е. «линия» vs.
«точка». Однако важнопонимать, что теоретических рассуждений для выделения фреймов в любом случаенедостаточно, поэтому анкета, составленная на материале одного языка, создаётся повозможности с некоторой избыточностью: каждый выделенный класс иллюстрируетсядостаточно большим количеством примеров.69На следующем этапе анкета «тестируется» на материале другого языка, причемжелательно, чтобы этот язык был также обеспечен обширными и доступнымилексикографическими ресурсами и чтобы у исследователя была возможность общения сего носителями.
Всё это необходимо для того, чтобы новый язык можно было изучитьстоль же подробно, опираясь не только на анкету, но и на другие источники информации.Привлечение нового материала всегда влечет за собой уточнение и расширение анкеты:обнаруживаются новые противопоставления, новые метафорические сдвиги.Уточняется при этом и материал русского языка. Это происходит за счёт того, что вновом языке слова рассматриваемого семантического поля покрывают, как правило, иконтексты, которые в русском языке обслуживаются другими лексемами, не включеннымив исследование изначально на основании чисто теоретических соображений (ср. примервыше про прилагательное густой).Возврат к русскому языку после анализа каждого нового идиома и последующееуточнение анкеты называется челночным методом, см. Рахилина & Резникова 2013.
Оченьважно, что этот процесс продолжается не до бесконечности: надежная анкета, способнаяиграть роль основного инструмента исследования, формируется после последовательногоанализа 3-5 языков. В дальнейшем она ещё может подвергаться разного родамодификациям, но уже только в деталях, касающихся преимущественно метафорическихупотреблений. Таким образом, в результате мы получаем анкету, состоящую из набораконтекстов, разделенных на группы и представляющих ситуации, которые в разных языкахмогут покрываться лексемами рассматриваемого семантического поля (см. анкету дляполя ‘острый’ в Приложении 1, а также её фрагмент в Таблице 8).70ФреймСловосочетание-иллюстрация‘острый инструмент с режущим краем’Острый ножОстрый меч‘острый инструмент с колющим концом’Острая иглаОстрый гвоздь‘четкая линия’Резкий контрастРезкая фотография‘колющая поверхность’Колючее одеялоКолючий свитер…Таблица 8.
Фрагмент анкеты для семантического поля ‘острый’Задача данного этапа нашего исследования – разработать алгоритм автоматического(или полуавтоматического) составления лексико-типологической анкеты на основеданных одного языка – русского. Для того, чтобы составить полноценную анкетуопросник, удовлетворяющую всем перечисленным требованиям, необходимо решитьнесколько подзадач. А именно:1) определить, какие слова в русском языке могут иметь отношение к изучаемомуполю;2) для каждого такого слова составить список коллокаций (например, в случае сприлагательными, – существительных, в сочетании с которыми они могут употребляться);3) разделить список контекстов на минимальные семантически однородные группы;4) в случае необходимости сократить анкету до приемлемого размера;5) оценить результат.В последующих разделах мы рассмотрим каждую из этих задач и подробно обсудимвозможные методы их решения.
Все базовые эксперименты по подбору методовпроводились преимущественно на материале поля ‘острый’, а затем настройки,признанные оптимальными, дополнительно тестировались на базе других признаковых инекоторых глагольных полей. Именно так мы и построим наше дальнейшее изложение:сначала опишем все опробованные нами методики, затем сделаем промежуточный выводоб эффективности каждой из них, а после этого приведем результаты дополнительныхэкспериментов с другими семантическими полями.71§3.
Определение круга лексем, относящихся к изучаемому полюЗадача составления списка прилагательных, относящихся к тому или иномусемантическому полю, при своей кажущейся простоте связана с рядом нетривиальныхмоментов, которые так или иначе преодолеваются в процессе ручной работы, но могутсерьезно осложнять задачу автоматической разработки анкеты-опросника. Прежде всего,задача составления списка слов (в нашем случае, прилагательных), на основе которыхбудет строиться анкета, естественным образом связана с задачей определения границизучаемого поля.