Диссертация (1148436), страница 7
Текст из файла (страница 7)
Такие рукописи оказываются внизу таблицы. Их приходится,если это возможно, распределять по кластерам с помощью отдельнойпроцедуры. Приведем в качестве примера матрицу с результатом кластерногоанализа для 19 рукописей (Таблица 5, с. 44).Двигаясь вниз по главной диагонали матрицы, можно отметить границыэлементарных кластеров: внутри кластера процент сходства вдоль главнойдиагонали убывает, и увеличение процента сходства сигнализирует о началенового кластера. Элементарные кластеры следуют в матрице в том порядке, вкаком они объединялись в более крупные кластеры в процессе кластеризации.44Таблица 5 – Результат кластерного анализа с образованием периферии 1010abcklmnoxyzpquvfghia090 87 79 85 80 81 85 77 74 72 70 73 75 74 66 62 66 63b900c87 88k79 81 85l85 85 84 90m80 83 85 90 90n81 81 80 87 88 88o85 82 83 87 88 87 87x77 76 77 78 80 79 77 80y74 76 72 71 72 70 71 73 87z72 72 73 73 78 76 71 72 80 81p70 71 70 68 66 62 68 67 76 75 76q73 71 73 68 73 74 74 76 75 76 74 76u75 76 76 66 68 70 70 69 74 72 70 73 71v74 76 75 69 69 70 68 68 71 72 72 73 71 85f66 68 69 70 72 68 68 67 69 71 70 71 72 72 77g62 61 62 64 66 61 60 62 73 71 70 70 71 66 64 68h66 65 65 70 72 71 70 70 66 65 63 60 66 64 63 67 66066i63 62 65 66 64 60 63 62 61 64 63 61 62 60 63 66 64 66088 81 85 83 81 82 76 76 72 71 71 76 76 68 61 65 62085 84 85 80 83 77 72 73 70 73 76 75 69 62 65 65090 90 87 87 78 71 73 68 68 66 69 70 64 70 66090 88 88 80 72 78 66 73 68 69 72 66 72 64088 87 79 70 76 62 74 70 70 68 61 71 60087 77 71 71 68 74 70 68 68 60 70 63080 73 72 67 76 69 68 67 62 70 62087 80 76 75 74 71 69 73 66 61081 75 76 72 72 71 71 65 64076 74 70 72 70 70 63 63076 73 73 71 70 60 61071 71 72 71 66 62085 72 66 64 60077 64 63 63068 67 66066 64Опубликовано ранее в работе Д.
М. Мироновой, посвященной кластерному анализу и трехуровневому методу Ваттеля [91, с. 248].45Рукопись g не примыкает ни к какому кластеру, но по проценту сходствавидно, что она ближе к кластеру xyzpq, так как ее сходство с рукописямиданного кластера составляет 70–73%, тогда как процент сходства со всемиостальными рукописями находится в пределах 60–68%.
Также и рукопись hближе к кластеру klmno при сходстве с рукописями данного кластера 70–72%, ас остальными рукописями – 60–67%. В исследовании такие рукописиопределяются как периферийные. В данном случае рукопись g можно отнестик периферии кластера xyzpq, а рукопись h – к периферии кластера klmno.1.3 ВЫВОДЫ ПО ГЛАВЕ 1В данной главе рассмотрены особенности двух методов автоматическойклассификации рукописей – метода характеристических дихотомий Э.
Ваттеля икластерного анализа А. А. Алексеева. Метод Ваттеля был опробован на целомряде сравнительно небольших рукописных традиций (см. раздел 1.1.1), но можетохватывать до 250 рукописей, метод Алексеева был применен к 650 рукописямцерковнославянского текста Евангелия от Иоанна и меньшему количествуисточниковтакихпамятниковцерковнославянскойписьменностикакДревнеславянский Паримейник – 51 список [31], церковнославянский переводПесни Песней – 34 списка [3].
Для корректного сравнения рассмотренныхметодов и определения их достоинств и недостатков необходимо проверить ихработу на одном и том же материале, чему будет посвящена Глава 2.46ГЛАВА 2. КЛАССИФИКАЦИЯ РУКОПИСНОЙ ТРАДИЦИИЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА Е ВАНГЕЛИЯ ОТМАТФЕЯВ данной главе рассматриваются результаты применения трехуровневогометода Э. Ваттеля и метода кластерного анализа А. А. Алексеева к 525рукописям церковнославянского текста Евангелия от Матфея.
Описываютсяполученные группы рукописей и приводятся чтения, характеризующие каждуюгруппу, которые Д. С. Лихачев определяет как приметы – «наиболеехарактерные признаки принадлежности текста к той или иной группе редакциили вида редакции» [26, с. 220].2.1 ПОДГОТОВКА МАТЕРИАЛА2.1.1 КОЛЛАЦИИПервым шагом на пути к созданию классификации текстов рукописныхисточников является коллация текстов – сравнение их между собою ивыявление таких мест, где тексты отличаются.Коллации можно подготовить как вручную, выписывая разночтения илизанося их в компьютер, так и автоматически, после представления всего текстав электронном виде. Для автоматического сравнения рукописей английскимученым Питером Робинсоном была разработана программа Collate, с помощьюкоторой «можно также выполнять статистическую обработку результатов47сравнений и подготовить критическое издание текста 11.
Работу над ней онначал в середине 1980–х гг. в ходе исследования 44 рукописей двухдревнеисландских песен [101], затем программа непрерывно дорабатывалась исовершенствовалась, и была доведена до коммерческого продукта.На первом этапе обработки рукописей их текст вводится в компьютер.Для этой работы необходимо нормализовать орфографию рукописей, то естьна базе авторитетного словаря соответствующего древнего языка привестиразличные варианты написания одного и того же слова к одному варианту.Нормализация позволяет упростить процесс ввода большого числа рукописей:после введения базового текста каждый следующий текст получается через егокорректуру, т.е. только введением разночтений.На следующем этапе «компьютер сопоставляет введенные рукописи истроит узлы разночтений.
Однако ученые, работавшие с первым вариантомпрограммы Collate, обнаружили, что компьютер нередко неправильнопроводит границы между узлами, поэтому в более поздней версии программыCollateбылпредусмотрендиалоговыйрежимформированияузлов,позволяющий человеку корректировать работу компьютера.В работе с церковнославянскими текстами программное обеспечениеCOLLATE использовалось для следующих рукописных традиций:155 рукописей сказания «О письменах» Черноризца Храбра в работеУ. Федера [37];14 рукописей Евангелия, коллации чтений из Синайского Евхология вработе М. Баккера [40];19 рукописей Апостола (главы 17–20) в работе М. Баккера [41], [42];21 рукопись Апостола (перикопы от Пятидесятницы до Великого Поста),в работах Й.
ван дер Така [121, 122];Опубликовано ранее в работе Е. Л. Алексеевой и Д. М. Мироновой по компьютернойтекстологии [10, с. 265–266].114825 рукописей Апостола (главы 1, 2, 12, 28), в работе А. Кириченко [76].При помощи программы Collate в 2007 г. на базе Бирмингемскогоуниверситета было полностью подготовлено издание византийского текстаЕвангелия от Иоанна [123] по 70 источникам в двух вариантах, печатном иэлектронном. Электронный вариант по сравнению с книгой обладает рядомдополнительных возможностей: он позволяет посмотреть текст каждойрукописи целиком, узлы разночтений расположены списком, а не идут подряд,как в книге, они снабжены гиперссылками к текстам рукописей и т.п.Теоретически число обрабатываемых программой рукописей и их объемне ограничиваются, но в действительности даже более поздний вариант могобработать не более 200 рукописей.Основную сложность для автоматической коллации, как отмечаетУ.
Федер [128, с. 28], представляет ввод текста. Эта трудоемкая работа требуеттщательной проверки. Ошибки при вводе, как и ошибки при переписывании,порождают новые разночтения, в результате чего дальнейшие трудытекстолога могут привести к ложному результату. При работе с небольшойрукописной традицией, состоящей из нескольких источников, не представляетзатруднений ввести в компьютер все тексты, однако в случае такой объемнойтрадиции, как церковнославянское Евангелие, насчитывающей несколькотысяч источников, ресурсы для ввода всего массива текста отсутствуют.Большое количество источников порождает еще одну проблему – размертекста для сравнения.
При работе над классификацией порядка тысячиисточниковЕвангелияотИоаннанаиболееоптимальнымрешениемпредставился выбор небольшого отрывка текста, на котором будет проведеносравнение всех рукописей, а в дальнейшем при подготовке изданияиспользование полных текстов избранных рукописей [22, с. 7–17]. Из опытаработы с библейскими рукописями на разных языках известно, чторедакционная правка может охватывать лишь часть рукописи, так чтотекстовая природа рукописи может быть неоднородна на всем ее протяжении.49ПриподготовкекритическогоизданияЕвангелияотИоаннавцерковнославянской традиции был выбран пассаж 13.31–18.1, которыйчитается на утрени в пятницу Страстной недели и находится в последнейчетверти как четвероевангелия, так и апракоса [22, с.
7–8]. Для классификациирукописей Евангелия от Матфея был взят отрывок 14.14–34, находящийся вначале евангельских рукописей, так как предположительно начало текстаписец переписывал в начале работы, и допускал меньше ошибок, вызываемыхусталостью.Вкачествебазовоготекстадляколлацийприработесцерковнославянским Новым Заветом был взят текст Остромирова Евангелия.Каждую рукопись по отдельности сравнивали с базовым текстом, выписываяразличия (эта работа была проделана рядом исследователей в рукописныххранилищах России и Европы по одной инструкции). Далее нами былсоставлен упорядоченный по тексту список мест в Мф.
14.14–34, в которыххотя бы в одной рукописи текст отличался от текста Остромирова Евангелия,таких мест оказалось 792. После исключения индивидуальных узлов былсоставлен список из 532 узлов разночтений (см. Приложение В), и всеварианты каждого узла были пронумерованы по порядку12.2.1.2 ПРЕДСТАВЛЕНИЕ ДАННЫХ КОЛЛАЦИЙ ДЛЯ КЛАСТЕРНОГОАНАЛИЗАПосле того, как по коллациям для каждого узла разночтений былполучен список вариантов, данные для работы программы кластерного анализабыли представлены в виде таблицы, в которой строки соответствуют сигламрукописей, а столбцы – номерам узлов разночтений.12Подробно работа по формированию узлов разночтений описана в Главе 3.50Рассмотрим алгоритм составления таблицы узлов разночтений дляавтоматической обработки рукописей на примере из Мф.