Главная » Просмотр файлов » Диссертация

Диссертация (1148552), страница 25

Файл №1148552 Диссертация (Лингвистические методы определения авторства средневековых текстов (на материале французского романа XIII века Продолжение Персеваля)) 25 страницаДиссертация (1148552) страница 252019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 25)

Атрибуция при помощи вероятностного алгоритмаПроцесс атрибуции при помощи вероятностного алгоритма аналогиченприведенному в разделе 3.8.Исходная матрица данных приведена в таблице 4.23.169Таблица 4.23Параметр«Четвёртое«Роман о «Продолжениепродолжение», Фиалке»,̅σiМанессье», Ω2Ω3Ω1P10,2970,3070,2730,2920,014P20,7030,6930,7270,7080,014P30,1830,1740,1320,1630,022P40,8170,8260,8680,8370,022P50,0710,0720,0520,0650,009P60,2420,2840,3000,2750,024P70,1550,1130,1440,1370,018P80,0260,0080,0150,0160,007P90,0000,0060,0060,0040,003P100,2770,2790,1790,2450,047P110,2290,2380,3040,2570,033Стандартизированная матрица исходных данных приведена в таблице 4.24.Таблица 4.24Стандартизированная матрица исходных данныхПараметр«Четвёртое«Роман о «Продолжениепродолжение», Фиалке»,̅σiМанессье», Ω2Ω3Ω1P10,3271,028-1,35501P2-0,327-1,0281,35501P30,9000,495-1,39501P4-0,900-0,4951,39501P50,6520,761-1,41301170P6-1,3630,3541,00901P70,993-1,3680,37501P81,305-1,125-0,18001P9-1,4140,7070,70701P100,6860,728-1,41401P11-0,837-0,5681,40601На основании таблицы 4.24.

строится матрица евклидовых расстояний междуобъектами:Таблица 4.25Матрица евклидовых расстояний между априорными классами и атрибутируемымобъектом«Четвёртое продолжение», Р1«Роман о Фиалке», Ω14,508«Продолжение Манессье», Ω26,527Матрица вероятностей представлена в таблице 4.26:Таблица 4.26Матрица вероятностей принадлежности объектов априорным классам«Четвёртое продолжение», Р1«Роман о Фиалке», Ω10,591«Продолжение Манессье», Ω20,408Так как в данном случае априорных классов всего два, то решающее правилоформулируется как ∈ Ω , ( ∈ Ω ) > 0,5.

Соответственно, по результатам работывероятностного алгоритма «Четвёртое продолжение» атрибутируется Жерберу деМонтрёй с вероятностью ~ 0,59.1714.4.3. Оценка качества классификацииДля оценки качества классификации по методу, предложенному в 3.9, строитсяматрица исходных данных для класса Ω11, Ω12, Ω13 см. таблица 4.27.Таблица 4.27.Матрица исходных данных для класса Ω1ПараметрΩ11Ω12Ω13̅σiP10,2850,2970,3380,3070,023P20,7150,7030,6620,6930,023P30,1980,1410,1830,1740,024P40,8020,8590,8170,8260,024P50,0480,0780,0900,0720,018P60,2820,2970,2720,2840,010P70,1170,1380,0840,1130,022P80,0150,0090,0000,0080,006P90,0120,0000,0060,0060,005P100,2730,2550,3080,2790,022P110,2520,2220,2400,2380,012Матрица исходных данных приводится к стандартному виду:Таблица 4.28Стандартизированная матрица исходных данныхПараметрΩ11Ω12Ω13̅̅̅̅σiP1-0,955-0,4261,38101P20,9550,426-1,38101P31,005-1,3640,35901172P4-1,0051,364-0,35901P5-1,3610,3471,01401P6-0,1691,301-1,13101P70,1831,123-1,30601P81,1360,162-1,29801P91,226-1,224-0,00201P10-0,258-1,0751,33301P111,158-1,2820,12401На основании стандартизированной матрицы данных строится матрицарасстояний.

Матрица расстояний представляет собой квадратную матрицу,содержащую в качестве элементов евклидовы расстояния между объектами. Матрицарасстояний, в соответствии со свойствами евклидова расстояния, должна обладатьсвойствами, указанными в разделе 3.9. Матрица евклидовых расстояний приведена втаблице 4.29.Таблица 4.29Матрица евклидовых расстояний между объектами класса Ω1Ω11Ω12Ω13Ω1105,5955,617Ω125,59506,010Ω135,6176,0100Таким образом, средний квадрат расстояний между объектами класса равен5,741.

Для оценки качества классификации строится матрица исходных данных дляобъектов апостериорного класса Ω1’, см. таблицу 4.30.173Таблица 4.30Матрица исходных данных для класса Ω1’Параметр Ω11Ω12Ω13Ω3̅σiP10,2850,2970,3380,2970,3040,020P20,7150,7030,6620,7030,6960,020P30,1980,1410,1830,1830,1760,021P40,8020,8590,8170,8170,8240,021P50,0480,0780,0900,0710,0720,015P60,2820,2970,2720,2420,2740,020P70,1170,1380,0840,1550,1240,027P80,0150,0090,0000,0260,0130,009P90,0120,0000,0060,0000,0050,005P100,2730,2550,3080,2770,2780,019P110,2520,2220,2400,2290,2360,011Стандартизированная матрица исходных данных приведена в таблице 4.31.Таблица 4.31Стандартизированная матрица исходных данных для класса Ω1’Параметр Ω11Ω12Ω13Ω3̅ σiP1-0,953-0,3571,681-0,37101P20,9530,357-1,6810,37101P31,035-1,6540,3010,31801P4-1,0351,654-0,301-0,31801P5-1,5540,4161,187-0,04801P60,4341,176-0,052-1,55801P7-0,2410,550-1,4951,18501174P80,266-0,370-1,3241,42801P91,509-0,9040,299-0,90401P10-0,272-1,2141,564-0,07701P111,454-1,1920,332-0,59501Матрица евклидовых расстояний приведена в таблице 4.32.Таблица 4.32Матрица евклидовых расстояний между объектами класса Ω1’Ω11’Ω12’Ω13’Ω3Ω11’05,8615,7354,624Ω12’5,86105,8854,556Ω13’5,7355,88505,654Ω34,6244,5565,6540Так как средний квадрат расстояний между объектами класса равен 5,386<5,741, то можно сделать вывод о том, что выполняется условие однородностиапостериорного класса, то есть результат работы вероятностного алгоритмаподтверждён, и автором «Четвёртого продолжения» можно считать Жербера деМонтрёя.4.5.

Атрибуция при помощи критерия Сёренсена-ЧекановскогоДля атрибуции с использованием критерия Сёренсена-Чекановского значениекритерия определяется для каждого априорного класса и атрибутируемого класса по175каждому из параметров. Значения критерия по каждому параметру приведены втаблице 4.33.Таблица 4.33Определение критерия Сёренсена-ЧекановскогоЗначение критерия дляПараметркласса Ω1 «Роман оФиалке»Значение критерия дляклассаΩ2«ПродолжениеМанессье»P120,2410,209P130,3430,381P140,3540,352P150,9340,845P160,9610,875P1-P110,9060,82В результате, можно отметить, что по параметрам P12 и P13 класс Ω3соответствует априорному классу Ω2 «Продолжение Манессье», а по остальным –классу Ω1 «Роман о Фиалке». Таким образом, атрибуция с использованием критерияСёренсена-Чекановского даёт результаты примерно схожие с результатами атрибуциипо методу с использованием вероятностных классификаторов, за исключениемпараметра P14, но так как в данном случае значения критерия практически равны, томожно сделать вывод о том, что произошёл отказ распознавания.1764.6.

Атрибуция с использованием иерархической кластеризацииИспользование алгоритма аггломеративной иерархической кластеризации,аналогично разделу 3.11. может применяться и к параметрам, полученным наосновании анализа рифмованных строк. Для оценки авторства использовалисьпараметры, определенные в разделах 4.1. и 4.2. Результаты1. Род рифмыРис. 4.1. Род рифмы1772. Богатство рифмыРис.

4.2. Кластеризация по богатству рифмы3. Число рифмыРис. 4.3. Число рифмы1784. Часть речи рифмыРис. 4.4. Часть речи рифмы5. Часть предложения рифмыРис. 4.5. Часть предложения рифмы1796. Род, богатство и число рифмРис. 4.6. Род, число, богатство рифмы7. Композиция параметровРис. 4.7.

Композиция всех параметров180Изполученныхдендрограммследует,чтоиспользованиеметодааггломеративной иерархической кластеризации не даёт таких чётких результатов, какв случае раздела 3.11, но, тем не менее, исходя из анализа некоторых дендрограмм,сделаны выводы об авторстве объекта аттрибуции.4.7. Выводы к Главе 4Для проверки атрибуционной гипотезы в настоящей главе использовались такиеже алгоритмы и методы, как в главе 3, но для случая объекта атрибуции и априорныхклассов, параметризированных с использованием рифмованных строк. Посколькувыбранные параметры несли различный смысл, подразделялись в ходе работы нагруппы («количественные» и «качественные» параметры) и различными способамииспользовались в рассмотренных в данной работе алгоритмах, то и получить единыйинтегральный результат, обобщённый на все параметры, по каждому методу в рядеслучаев не представлялось возможным, в связи с тем, что в некоторых случаяхиспользование отдельных параметров или даже групп параметров являлосьневозможным.Результаты атрибуции для каждого метода затруднительно напрямуюсравнивать с результатами, полученными для других методов, или для того же метода,но для набора параметров из главы 3.

Тем не менее, можно, рассматривая итоговыйрезультат атрибуции по каждому методу и (при наличии такой возможности)точность, с которой был получен этот результат, помимо решаемой задачи атрибуциианонимного произведения, также параллельно решить задачу оценки допустимостииспользования параметризации при помощи рифмованных строк в задачах поискаавторства стихотворных произведений на старофранцузском языке.181Для рассмотренных в данной главе методов атрибуции были полученыследующие результаты:1. Атрибуция с использованием теории распознавания образовПриданнойатрибуциинеиспользовалисьпараметрыизгруппы«количественные параметры», обоснование этого приведено в разделе 4.2.

даннойглавы.Привыполненииатрибуциипроизошёлотказотраспознаваниядетерминированного алгоритма, и оценка авторства осуществлялась на основерезультатов прогона вероятностного алгоритма. По итогам работы данного алгоритмабыл сделан вывод о принадлежности «Четвёртого продолжения» Жерберу де Монтрёйс вероятностью, приблизительно равной 0.6, причём результат работы алгоритмаподтверждён на основании оценки качества классификации.2. Атрибуция с использованием коэффициента Сёренсена-ЧекановскогоПри данной атрибуции использовались как параметры из группы «качественныепараметры», так и из группы «количественные», обоснование этого также приведенов разделе 4.2.

данной главы. В результате, как и в главе 3, можно сделать вывод о том,что с точки зрения данного критерия атрибутируемое произведение достаточноблизко как к одному, так и к другому априорному классу, а в абсолютном значениинаибольшая близость достигается в «качественных параметрах» и параметрах P15 иP16, которые по смыслу достаточно близки к «качественным». По параметрам P1-11,P15, P16 и P12 автором «Четвёртого продолжения» является Жербер де Монтрёй, поP13 и P14 – Манессье.3. Атрибуция с использованием наивного классификатора БайесаПри данной атрибуции рассматривались все параметры, с уточнениями,приведёнными в разделе 4.2.

данной главы. В процессе проведения исследования наподготовительной стадии был исключён параметр P15 из-за возникновения ошибокклассификации тестовых выборок. Обобщая результаты исследования авторства182данным методом сделан вывод о том, что по группе «качественные параметры»подтверждается гипотеза о принадлежности «Четвёртого продолжения» Жерберу деМонтрёй, а по группе «количественные параметры» возникают определённыесложности с выполнением атрибуции, и ярко выраженный результат удаётся получитьтолько по параметрам P13, P14 и P16, при этом для первых двух подтверждаетсягипотеза об авторстве Манессье, а для последнего – Жербера де Монтрёй.Такимобразом,дляданногометодарекомендованоотказатьсяотиспользования парамтеров P12 и P15 для проведения атрибуции.4.

Характеристики

Список файлов диссертации

Лингвистические методы определения авторства средневековых текстов (на материале французского романа XIII века Продолжение Персеваля)
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее