Диссертация (1148436)
Текст из файла
Федеральное государственное бюджетное образовательное учреждениевысшего образованияСАНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТНа правах рукописиМИРОНОВА ДИНА МАРКОВНААВТОМАТИЗИРОВАННАЯ КЛАССИФИКАЦИЯ ДРЕВНИХРУКОПИСЕЙ(на материале 525 списков славянского Евангелия от Матфея XI–XVI вв.)Специальность 10.02.21 – Прикладная и математическая лингвистикаДиссертация на соискание ученой степеникандидата филологических наукНаучный руководитель:к.ф.н. Алексеева Елена ЛеонидовнаСанкт-Петербург20172ОГЛАВЛЕНИЕВведение .....................................................................................................................4Глава 1.
Методы компьютерной обработки рукописных традиций ......................131.1Компьютерная стемматология ....................................................................171.1.1 Метод глубинных структур А.Дееса .......................................................201.1.2 Трехуровневый метод Ваттеля .................................................................231.2 Кластерный анализ ..........................................................................................331.2.1 Алгоритм кластерного анализа.................................................................341.2.2.
Метод Алексеева ......................................................................................371.3 Выводы по Главе 1 ..........................................................................................45Глава 2. Классификация рукописной традиции церковнославянского текстаЕвангелия от Матфея ...............................................................................................462.1 Подготовка материала .....................................................................................462.1.1 Коллации....................................................................................................462.1.2 Представление данных коллаций для кластерного анализа ...................492.1.3 Представление данных коллаций для трехуровневого метода Ваттеля.522.2 Результаты автоматической классификации церковнославянских рукописейЕвангелия от Матфея ............................................................................................532.2.1 Поздний текст ............................................................................................552.2.2 Преславский текст .....................................................................................642.2.3.
Новый литургический тетр ......................................................................742.2.4. Древний текст ...........................................................................................792.2.5. Чудовский Новый Завет ...........................................................................852.2.6. Текстовые особенности полученных редакций ......................................852.3 Выводы по Главе 2 ..........................................................................................90Глава 3.
Возможности оптимизации автоматической классификации рукописейна основании исследования различных типов узлов разночтений........................913.1 Понятие узла разночтений ..............................................................................9233.1.1 Текстологически нерелевантные различия между рукописями .............923.1.2 Длина узла разночтений............................................................................953.1.3 Вес узла разночтения .............................................................................. 1033.2 Влияние отдельных видов узлов разночтений на результаты кластерногоанализа .................................................................................................................
1073.2.1 Лексические замены ................................................................................ 1073.2.2 Грамматические замены ......................................................................... 1133.2.3 Замены глагольных форм ....................................................................... 1173.2.4 Строевые элементы ................................................................................. 1223.2.5 Омиссии ...................................................................................................
1283.2.6 Омиссии без учета строевых элементов ................................................ 1323.2.7 Перестановки ........................................................................................... 1363.2.8 Классификация рукописей с поочередным исключением одного типаузлов.................................................................................................................. 1403.3 Текстологические приметы редакций .......................................................... 1403.3.1 Текстологические приметы церковнославянского текста ....................
1423.3.2 Сопоставление разночтений греческого и церковнославянского текста........................................................................................................................... 1483.4 Выводы по Главе 3 ........................................................................................
153Заключение ............................................................................................................. 155Список принятых сокращений .............................................................................. 160Список иллюстративного материала ....................................................................
163Список литературы ................................................................................................ 167Приложение А. Источники, привлеченные к исследованию............................... 183Приложение Б. Список исследованных рукописей в порядке возрастания сигл................................................................................................................................. 206Приложение В. Список узлов разночтений .......................................................... 225Приложение Г. Выявленные текстологические приметы ....................................
3114ВВЕДЕНИЕСегодня в славянской медиевистике все большее распространениеполучает использование компьютерных методов, направленных на решениеразличных задач, таких как создание корпусов текстов, коллации памятников,обработка материала, полученного при коллации произведений, преобразованиетекста критического издания в структурированный корпус 1.Одной из задач компьютерной текстологии в рамках автоматизациилингвистическихисследованийявляетсяклассификацияпамятниковрегулярного копирования, использовавшихся в средневековье при совершениибогослужения и сохранившихся в большом числе списков.
Решение такойзадачи направлено на репрезентативный отбор источников для критическогоаппарата издания.Актуальность темы данного исследования обусловлена неоспоримойважностью изучения библейской традиции как на языках оригиналов, так ипереводных версий.Эта традиция играет исключительую роль в историиевропейской культуры и представлена большим числом памятников, равно какбольшимчисломавтоматизированнойпосвященныхклассификацииейисследований.древнихОднакорукописейметодикаостаетсямалоОбширная электронная коллекция славянских средневековых рукописей создана в Ижевскомгосударственном техническом университете под руководством В. А.
Баранова [13, 14, 15, 16,17], в Институте русского языка им. В. В. Виноградова РАН разработаны электронные базыданных древнерусских рукописных памятников [11, 34]. Ряд текстологов используютпрограмму автоматизированной коллации Collate, разработанную П. Робинсоном вКембриджском университете [101, 103]. Методы компьютерной классификации рукописейприменяются на этапе подготовки критического издания, в частности, издания Евангелия отИоанна [22] и Евангелия от Матфея [23] в славянской традиции, позволяя более точно и полноатрибутировать тексты списков традиции.
В СПбГУ на кафедре математической лингвистикив программе Паратекст Е. Л. Алексеевой и И. В. Азаровой «создается структурированныйкорпус славянских вариантов Евангелия», основанный на разработанной аннотациикритического аппарата издания Четвероевангелия [1].15разработанной, нет ни одного исследования, которое можно было бы считатьокончательным, и выработка оптимального компьютерного метода призванаспособствовать решению основных задач библейской текстологии.
В данномдиссертационном исследовании проблема автоматизированной классификациирассматриваетсяспозицийкластерногоанализаикомпьютернойстемматологии.Объектом диссертационного исследования являются церковнославянскиерукописи Евангелия XI–XVI вв.
Предметом исследования является разработкаоптимального алгоритма классификации рукописных источников путем ихразбиения на группы по признаку текстовой близости при помощи кластерногоанализа и методов стемматологии с последующим определением характерныхособенностей выявленных групп.Целью данного исследования является формализация критериев отборатекстовых фрагментов для текстологического анализа и последовательноепрактическое исследование влияния различных типов таких фрагментов нарезультат объединения рукописей в осмысленные группы посредствомавтоматического кластерного анализа.Для достижения поставленной цели в диссертации решается ряд задач:1)описание методов компьютерной текстологии, используемых дляклассификациирукописныхтрадицийвотечественнойизарубежной текстологии;2)выявление методов компьютерной текстологии, применимых кцерковнославянской евангельской рукописной традиции;3)на основании методов, применимых к церковнославянскойевангельской рукописной традиции – кластерного анализа итрехуровневогометодакомпьютернойразработкаоптимальнойметодикитекстовыхфрагментов,позволяющейстемматологии,автоматизациис–отборанаименьшими6ограничениямиинаименьшимизатратамиусилийрешатьпоставленную задачу;4)подробное описание методики вычленения узлов разночтений,примененной в данной работе;5)подготовка списка узлов разночтений для пассажа Евангелия отМатфея 14.14.-14.34 по 525 рукописям;6)осуществление классификации 525 списков Евангелия от Матфеяпо выявленным узлам разночтений с помощью описанных методови проведение сравнительного анализа результатов;7)исследование зависимости автоматизированной классификациирукописей от типа учитываемых узлов разночтений и определениетекстологической значимости каждого типа узлов;8)разработка программно реализованной процедуры выделениятекстологических примет для групп рукописей.Материалом исследования послужили коллации пассажа Евангелия отМатфея14.14–14.34церковнославянскимобъемомрукописямв300(списоксловоупотребленийисследованныхпорукописей525поредакциям приводится в Приложении А, список рукописей, упорядоченный повозрастанию сигл – в Приложении Б).
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.