Автореферат (1148434)
Текст из файла
Федеральное государственное бюджетное образовательное учреждение высшегообразованияСАНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТНа правах рукописиМИРОНОВА ДИНА МАРКОВНААВТОМАТИЗИРОВАННАЯ КЛАССИФИКАЦИЯ ДРЕВНИХРУКОПИСЕЙ(На материале 525 списков славянского Евангелия от Матфея XI-XVI вв.)Специальность 10.02.21 – Прикладная и математическая лингвистикаАВТОРЕФЕРАТдиссертации на соискание ученой степеникандидата филологических наукСанкт-Петербург20172Работа выполнена в федеральном государственном бюджетном образовательном учреждениивысшего образования«Санкт-Петербургский государственный университет»Научный руководитель:Алексеева Елена Леонидовна,Кандидат филологических наук,доцент, ФГБОУ ВО «Санкт-Петербургскийгосударственный университет», доцент кафедрыматематической лингвистики.Официальные оппоненты:Пичхадзе Анна Абрамовна,доктор филологических наук, ведущий научныйсотрудник Отдела лингвистическогоисточниковедения и истории русскоголитературного языка ИРЯ РАН им.
Виноградова.Бонч-Осмоловская Анастасия Александровна,кандидат филологических наук, доцент,Национальный исследовательский университет«Высшая школа экономики», доцент Школылингвистики.Ведущая организация:ФГБОУ ВО «Ижевский государственныйтехнический университет имениМ. Т. Калашникова»Защита состоится «______» ________________ 2018 г.
в 16-00 часов на заседании советаД 212.232.23 по защите диссертаций на соискание степени доктора филологических наук, насоискание степени кандидата филологических наук при ФГБОУ ВО «Санкт-Петербургскийгосударственный университет» по адресу: 199034, Санкт-Петербург, Университетская наб.
д. 11,ауд. 191.С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького СанктПетербургского государственного университета (г. Санкт-Петербург, Университетскаянабережная, д. 7/9) и на сайте: https://disser.spbu.ru/disser/soiskatelyu-uchjonoj-stepeni/dislist/details/14/1511.html.Автореферат разослан «______» ________________2018 г.Ученый секретарьдиссертационного советакандидат филологических наукК. В. Манерова3ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫСегодня в славянской медиевистике все большее распространение получаетиспользование компьютерных методов, направленных на решение различных задач,таких как создание корпусов текстов, сравнение текстов рукописных памятниководного произведения и выявление разночтений (коллация) с последующейподготовкой критического издания или классификацией рукописей, преобразованиетекста критического издания в структурированный корпус1.Одной из задач компьютерной текстологии в рамках автоматизациилингвистических исследований является классификация памятников регулярногокопирования, использовавшихся в средневековье при совершении богослужения исохранившихся в большом числе списков.
Решение такой задачи направлено нарепрезентативный отбор источников для критического аппарата издания.Актуальность темы данного исследования обусловлена неоспоримойважностью изучения библейской традиции как на языках оригиналов, так ипереводных версий. Эта традиция играет исключительную роль в историиевропейской культуры и представлена большим числом памятников, равно какбольшим числом посвященных ей исследований.
Однако методикаавтоматизированной классификации древних рукописей остается малоразработанной, нет ни одного исследования, которое можно было бы считатьокончательным, и выработка оптимального компьютерного метода призванаспособствовать решению основных задач библейской текстологии. В данномдиссертационном исследовании проблема автоматизированной классификациирассматривается с позиций кластерного анализа и компьютерной стемматологии.Объектом диссертационного исследования являются церковнославянскиерукописи Евангелия XI–XVI вв. Предметом исследования является разработкаоптимального алгоритма классификации рукописных источников путем их разбиенияна группы по признаку текстовой близости при помощи кластерного анализа иметодов стемматологии с последующим определением характерных особенностейвыявленных групп.Обширная электронная коллекция славянских средневековых рукописей создана в Ижевскомгосударственном техническом университете под руководством В.
А. Баранова, в Институтерусского языка им. В. В. Виноградова РАН разработаны электронные базы данных древнерусскихрукописных памятников. Ряд текстологов используют программу автоматизированной коллацииCollate, разработанную П. Робинсоном в Кембриджском университете. Методы компьютернойклассификации рукописей применяются на этапе подготовки критического издания, в частности,издания Евангелия от Иоанна и Евангелия от Матфея в славянской традиции, позволяя более точнои полно атрибутировать тексты списков традиции.14Целью данного исследования является формализация критериев отборатекстовых фрагментов для текстологического анализа и последовательноепрактическое исследование влияния различных типов таких фрагментов нарезультат объединения рукописей в осмысленные группы посредствомавтоматического кластерного анализа.Для достижения поставленной цели в диссертации решается ряд задач:1) описание методов компьютерной текстологии, используемых дляклассификации рукописных традиций в отечественной и зарубежной текстологии;2) выявление методов компьютерной текстологии, применимых кцерковнославянской евангельской рукописной традиции;3) на основании методов, применимых к церковнославянской евангельскойрукописной традиции – кластерного анализа и трехуровневого методакомпьютерной стемматологии, – разработка оптимальной методики автоматизацииотбора текстовых фрагментов, позволяющей с наименьшими ограничениями инаименьшими затратами усилий решать поставленную задачу;4) подробное описание методики вычленения узлов разночтений,примененной в данной работе;5) подготовка списка узлов разночтений для пассажа Евангелия от Матфея14.14.
– 14.34 по 525 рукописям;6) осуществление классификации 525 списков Евангелия от Матфея повыявленным узлам разночтений с помощью описанных методов и проведениесравнительного анализа результатов;7) исследованиезависимостиавтоматизированнойклассификациирукописей от типа учитываемых узлов разночтений и определение текстологическойзначимости каждого типа узлов;8) разработка программно реализованной процедуры выделениятекстологических примет для групп рукописей.Материалом исследования послужили коллации пассажа Евангелия отМатфея 14.14 – 14.34 объемом в 300 словоупотреблений по 525 церковнославянскимрукописям. Исследование выполнялось на материале церковнославянскойевангельской традиции на более чем 1500 рукописях, полностью или частичносодержащих текст славянского перевода Евангелий2.
Очевидно, что пока нетДо начала подготовки коллаций самый полный список источников церковнославянскогоЕвангелия, составленный Л. П. Жуковской, включал около 500 источников XI-XV вв. Приподготовке издания Евангелия от Иоанна был составлен список из 1500 единиц. Оба эти спискабыли составлены de visu. Уже после окончания коллаций М.
Гарзанити опубликовал список из 2500единиц, составленный по опубликованным описаниям. В действительности рукописей Евангелиябольше, чем 2500; множество рукописей XVI-XVII вв. до сих пор не включено в описания.25возможности сравнить такое большое число рукописей по всему тексту, поэтомубыло решено ограничиться одним текстовым пассажем. При его выбореучитывалось, что по способу представления евангельского текста существует дваосновных типа рукописей: четьи (четвероевангелия) с последовательнымрасположением текста четырех евангелий, и служебные (апракосы), в которых текстприводится не подряд, а в том порядке, в каком он читается в церкви в течениецерковного года.
Соответственно, нужно было подобрать отрывок, который был бынепрерывным и в апракосах. В ходе коллаций было замечено, что рукописи XV–XVIвв. в значительном большинстве входят в одну группу, на базе которой в XVI в.появились печатные издания. Это наблюдение позволило считать, что 525рукописей, подвергшихся коллациям, обеспечивает достаточно полноепредставление материала, при том что в это число вошло подавляющее большинстворукописей XI–XIV вв. и значительное число рукописей XV в.Методы исследования рукописной традиции, использованные в работе,включают кластерный анализ, основанный на объединении объектов в группы посходству, и трехуровневый метод, подразделяющий процесс построения стеммы натри этапа, первый из которых опирается на кластерный анализ. Для описания узловразночтений применяются методы морфологического, синтаксического илексического анализа.Теоретическую и методологическую основу диссертации составляют трудыотечественных и зарубежных ученых, посвященные компьютерной текстологии(И.
В. Азарова, А. А. Алексеев, Е. Л. Алексеева, Е. В. Афанасьева, М. Баккер,Дж. Брефельд, В. А. Баранов, М. Вайцман, Н. Л. Горина, Дж. Гриффит, П. Гэлловей,В. Диаринг, А. Кириченко, А. А. Пичхадзе, Б. Салеманс, М. Спенсер, П. Робинсон,Д. Фроже, К. Хау, А. Хруби), кластерному анализу (М. Андерберг, А. Гордон,Э. Дидей, Р. Кормак, В.
Кржановский, П. Снит, Б. Эверитт), текстологическимисследованиям древних славянских памятников (И. В. Азарова, А. А. Алексеев,Е. Л. Алексеева, М. Баккер, Г. А. Воскресенский, М. Гарзанити, Н. Л. Горина,Л. П. Жуковская, Д. С. Лихачев, А.
А. Пичхадзе, Й. ван дер Так, С. Ю. Темчин,У. Федер), текстологии Нового Завета (Л. Вагане, К. Вахтель, Э. Колвелл, К. Лахман,П. Маас, Б. Мецгер, Г. Минк, А. ден Холландер, Э. Эпп), компьютернойстемматологии (Э. Ваттель, А. Деес, Дж. Зарри, Э. Лангбрек, Э. Маер, Х. Мейеринг,У. Мерисало, М. ван Мулкен, Э. Пул, Б. Салеманс, У. Смелик, К.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.