Автореферат (1148434), страница 3
Текст из файла (страница 3)
Это время и можно считать началом современнойтекстологии, задачей которой является подготовка научного издания текста, гдеприводятся данные из разных источников и объясняются особенности различныхвариантов чтений.Наиболее тиражируемые рукописные тексты, являющиеся основнымобъектом для применения компьютерной текстологии, можно разделить на два типа:литературные памятники и библейские тексты.Способы копирования библейских и авторских произведений несколькоотличались. При работе с библейским текстом от писца требовалась максимальнаякорректность передачи текста антиграфа. Это требование диктовалосьдогматическими и литургическими соображениями, использовались различныесредства надзора за стабильностью текста.
Кроме этого, один литературныйпамятник обычно сохраняется в небольшом количестве экземпляров, а числобиблейских текстов исчисляется тысячами, в силу чего возможности исследованияданных традиций значительно различаются.Подход к выбору метода для текстологического исследования рукописнойтрадиции определяется типом традиции. Для памятников, количество списковкоторых не превышает нескольких десятков экземпляров, широко используются10методы кладистики и стемматологии, целью которых является представлениеистории текста в виде дерева отношений между рукописями. Однако для библейскойтрадиции, насчитывающей несколько тысяч свидетелей и характеризующейсяконтаминацией, невозможно построить дерево отношений между отдельнымирукописями и необходимо искать метод, позволяющий выявить группы наиболееблизких между собою рукописей, и анализировать отношения уже между этимигруппами.Революционным стал метод, впервые предложенный двумя американскимитекстологами – Э.
Колвеллом и Э. Тьюном в 1963 г. для греческой новозаветнойтрадиции. Э. Колвелл и Э. Тьюн предложили отказаться от эталона, сравнивать всерукописи попарно между собой и оценивать их близость по общему тексту, а не поразличиям. К концу XX в. возможности вычислительной техники позволили широкои эффективно применять данный метод в текстологии, опираясь на математическийаппарат кластерного анализа. Вариации кластерного анализа активно используютсяв современных текстологических исследованиях как для поиска групп рукописей сблизким текстом, так и при построении стеммы или дерева отношений междурукописями.
Данный метод применялся в работах А. Хруби, Э. Пула, Дж. Гриффита,П. Гэлловей, Дж. Брефельд, в отечественной текстологии – в работахА. А. Алексеева, А. А. Пичхадзе, Н. Л. Гориной, Е. В. Афанасьевой. При этомразличные исследователи пользуются различными коэффициентами близости илирасстояния для классификации рукописей в зависимости от особенностейисследуемой традиции.В 1985 г.
проф. СПбГУ А. А. Алексеев предложил план исследованияСлавянского Евангелия, который включал в себя использование кластерного анализадлявозможностиобработкинеограниченногоколичестварукописейконтролируемой традиции. Проект был успешно реализован, и автоматизацияклассификации рукописей при помощи кластерного анализа значительнооптимизировала обработку источников.В 70-е гг. XX в., немного позже выхода в свет работы Э. Колвелла и Э. Тьюна,голландский текстолог А.
Деес разработал метод для построения дерева отношениймежду рукописями. В отличие от предшественников – приверженцев представлениярукописной традиции в виде ориентированного дерева – он не ставил задачиобязательного построения ориентированного дерева и обнаружения архетипа. Онпредложил начать с построения неориентированного дерева, в котором все конечныеузлы – реальные рукописи, а промежуточные узлы – гипотетические рукописи. В90-е гг. голландский ученый, математик Э.
Ваттель в сотрудничестве с текстологамиразвил метод А.Дееса, формально его описал, сделал ряд доработок иусовершенствований, также положив в основу кластерный анализ. Метод Ваттеля,11получивший название трехуровневого метода, позволяет строить стеммы для любойрукописной традиции, как библейской, так и авторской, с любым количествомрукописей. Формально программа строит дерево не более чем для 250 рукописей, нопрактически идентичные рукописи можно представить как одну, что даетвозможность построить дерево для гораздо большего числа источников.Э. Ваттель предлагает следующую процедуру построения глубиннойструктуры. Пусть в некотором узле разночтений рукописи имеют следующие чтения:a – 1; b – 2; c – 2; d – 1; e – 3, f – 3.
Тогда в данном узле получаем группы рукописей:ad, bc, ef. Э. Ваттель записывает данные о группировке рукописей для данного узлав виде строки ad/bc/ef и называет такую запись формулой разночтений. Из данныхшести рукописей можно составить 15 пар (ab, ac, ad, ae, af, bc, bd, be, bf, cd, ce, cf,de,df, ef), из них в 12-и случаях у рукописей пары будут разные чтения, а в 3-х –одинаковые.Коэффициент близости между рукописями Э. Ваттель определяет следующимобразом.Пусть x и y – две рукописи, а Ф – совокупность всех формул разночтений. Длякаждой формулы (узла разночтений) φ Ф вычисляем число Eφ – количество пар содинаковым чтением в этой формуле, и число Dφ – количество пар с разнымичтениями в этой формуле.
Пусть Wφ – вес φ, заданный текстологом (при отсутствииранжирования узлов разночтений по текстологической значимости вес можносчитать равным 1). Тогда коэффициент близости σφ (x,y) для рукописей x и y в даннойформуле будет равен:для x и y, имеющих одинаковое чтение в φ,для x и y, имеющих разные чтения в φ,и 0, если для x или y данный узел нерелевантен (например, лакуна).Коэффициент близости для пары (x, y) по всем узлам разночтенийопределяется как:12Метод Ваттеля не ограничивает количество рукописей обрабатываемойтрадиции.
Несмотря на то, что одновременно можно обрабатывать максимум 250источников, метод позволяет работать с материалом по частям и группироватьпрактически идентичные рукописи, так что из них может быть взят только одинпредставитель.Основными требованиями, предъявляемыми А. А. Алексеевым к методукластерного анализа, стали экономичность алгоритма и минимальный субъективизм.Кластерный анализ решено было проводить по степени близости между рукописями,в связи с тем, что степень близости подразумевает более естественные группы. В1995 году в рамках проекта исследования церковнославянского Евангелия от Иоаннанаучным сотрудником кафедры математической лингвистики Е.
Л. Алексеевой быларазработана программа кластерного анализа для церковнославянской евангельскойтрадиции.Для классификации был выбран наиболее простой критерий близости –отношение количества общих чтений к общему числу узлов разночтений для даннойпары (из общего числа узлов исключаются те узлы, в которых хотя бы одна изрукописей имеет лакуну или индивидуальное чтение): K=F / V *100%, где K –коэффициент близости, F – количество общих чтений для данной пары, V –количество узлов, по которым сравнивается эта пара.После ряда экспериментов с критерием объединения рукописей в кластерыостановились на том, что очередной объект должен иметь наиболее высокий процентсходства с одной из рукописей уже образовавшегося кластера. От подборакоэффициента или порогового значения, определяющего окончательные границыкластеров, отказались, представляя полученные данные в виде квадратной матрицырукописей, упорядоченной по убыванию процента сходства (процентное выражениекоэффициента близости).Недостатком метода является то, что иногда кластеры объединяются междусобою раньше, чем отдельные рукописи, которые, имея не очень высокий процентсходства со своей группой, не успевают к ней присоединиться.
Такие рукописиоказываются внизу таблицы. Их приходится, если это возможно, распределять покластерам с помощью отдельной процедуры.Для корректного сравнения методов Ваттеля и Алексеева и определения ихдостоинств и недостатков работа обоих методов была проверена на одном и том жематериале. Во Второй главе «Классификация рукописной традициицерковнославянского текста Евангелия от Матфея» рассмотрены результатыприменения трехуровневого метода Ваттеля и метода кластерного анализа Алексеевак 525 рукописям церковнославянского текста Евангелия от Матфея.13Первым шагом на пути к созданию классификации текстов рукописныхисточников является коллация текстов. В качестве базового текста для коллаций приработе с церковнославянским Новым Заветом был взят текст ОстромироваЕвангелия.
Каждую рукопись по отдельности сравнивали с базовым текстом,выписывая различия (эта работа была проделана рядом исследователей врукописных хранилищах России и Европы по одной инструкции). Далее нами былсоставлен упорядоченный по тексту список мест в Мф. 14.14 –14.34, в которых хотябы в одной рукописи текст отличался от текста Остромирова Евангелия, таких местоказалось 792. После исключения индивидуальных узлов был составлен список из532 узлов разночтений, и все варианты каждого узла были пронумерованы попорядку.После того, как по коллациям для каждого узла разночтений был полученсписок вариантов, данные для работы программы кластерного анализа былипредставлены в виде таблицы, в которой строки соответствуют сиглам рукописей, астолбцы – номерам узлов разночтений.Рассмотрим алгоритм составления таблицы узлов разночтений дляавтоматической обработки рукописей на примере из Мф.