Автореферат (1149535), страница 3
Текст из файла (страница 3)
. . , Lk . Тогда в пространстве фрагментов можно определить следующееправило классификации, относящее фрагмент к одному из классов l1 , . . . , lk :Правило классификации 2Два фрагмента xi и xj относятся к одному классу lk , если соответствующие имвектора F (xi ) и F (xj ) попали в один кластер k.Теорема 2. Если r(x, y) — положительно определенное ядра и выполнено Предположение 1, то кластеризация в пространстве F обеспечивает однозначностьи корректность Правила классификации 2.В третьей главе “Экспериментальные результаты” представлены результатыприменения предложенных алгоритмов кластеризации к задаче определения авторского стиля текстов нескольких серий популярных книг.В п. 3.1 дается определение задачи определения авторства, описываются основные алгоритмы решения этой задачи.В п. 3.2 приводится результат применения алгоритма классификации текстовна основе кластеризации с помощью спектрального представления к задаче определения авторского стиля в трех коллекциях книг.
Ниже представлены примерыграфика периодограмм для двух книг А. Азимова из цикла “Основание” и результатиерархической кластеризации всех книг из цикла (7 романов).14В п. 3.3 приводится результат применения алгоритма классификации текстовна основе кластеризации с помощью расстояния, основанного на ядрах. Ниже ввиде таблицы представлен результат сравнения стилей книг А. Азимова из цикла“Основание”, полученный с помощью расстояния dSpearman . Здесь ‘1’ обозначает, чтодля соответствующей пары книг найдено различие в стилях:F1F2 F3 F4 F5 F6 F7F10011111F20011111F31101011F41110011F51100011F61111101F71111110Результатом иерархической кластеризации книг из цикла является следующая дендрограмма:Эксперименты показали, что рассмотренные в диссертации новые динамическиемодели текстов действительно оказались уникальными характеристиками авторского стиля.В заключении формулируются основные результаты диссертации.15Работы автора по теме диссертацииСтатьи в периодических рецензируемых изданиях, индексируемых внаукометрических базах данных SCOPUS и Web of Science или включенных в перечень научных журналов, рекомендованных ВАК:[1] Amelin K., Granichin O., Kizhaeva N., Volkovich Z.
Patterning ofwriting style evolution by means of dynamic similarity // Pattern Recognition,2017, https://doi.org/10.1016/j.patcog.2017.12.011[2] Granichin O., Kizhaeva N., Shalymov D., Volkovich Z. Writing styledetermination using the KNN text model // Proceedings of the 2015 IEEEInternational Symposium on Intelligent Control. — Sydney, Australia, 2015. —September 21–23. — P. 900–905.[3] Kizhaeva N., Volkovich Z., Granichin O., Granichina O., Kiyaev V.Spectral profiling of writing process // Proceedings of the 2017 IEEE Conferenceon Control Technology and Applications.
— Coast, Hawaii, USA, 2017. — August27–30. — P. 2063–2068.[4] Кижаева Н.А., Шалымов Д.С. Определение авторского стиля текстов на основе статистического подхода двухвыборочного тестирования и метода K-ближайших соседей // Компьютерные инструментыв образовании, 2015. — №5. — C.14–23.Другие научные публикации:[5] Kizhaeva N., Shalymov D., Granichin O., Volkovich Z. Studying of KNN twosample test approach applications for writing style comparison of English andRussian text collections // Proceedings of the AINL-ISMW FRUCT (ArtificialIntelligence and Natural Language & Information Extraction, Social Media andWeb Search). — ITMO University, FRUCT Oy, Finland.
— Saint-Petersburg,Russia, 2015. — November 9–14. — P. 163–166.[6] Кижаева Н.А. Тематическое моделирование и кластеризация текстов на арабском языке // Стохастическая оптимизация в информатике, 2013. — T. 9, —№2. — С. 33–40[7] Кижаева Н.А. Динамическая модель процесса эволюции текстовых документов // Стохастическая оптимизация в информатике, 2018. — T. 14. — №1.
—С. 31–45.16.