Отзыв ведущей организации (1149540)
Текст из файла
отзыв ведущей организации на диссертационную работу Кнжаевой Натальи Александровны «Исследование паттернов в текстах на основе динамических моделей», представленную на соискание ученой степени кандидата физико-математических наук по специальности 01.01.09 - дискретная математика и математическая кибернетика Актуальность темы выполненной работы В настоящее время большая часть информации в бизнесе, промышленности, государственных и других учреждениях хранится в виде текстовых документов.
Текстовый документ представляет собой пример неструктурированной информации, которая легко воспринимается человеком, но гораздо более сложна для понимания компьютером. Интеллектуальный анализ текстов является частью более широкого класса задач интеллектуального анализа данных, машинного обучения и теории распознавания образов. Задачей интеллектуального анализа текстов является нахождение новой информации, которая неизвестна или не записана.
Автоматизированный анализ текстов позволяет выявлять скрытые закономерности, незаметные при простом прочтении. Среди существующих подходов к решению задач интеллектуального анализа данных большинство рассматривает текст как некоторый статический объект, при этом динамика последовательности изложения или процесса написания не учитывается. Диссертационная работа Н.А. Кижаевой посвящена исследованию возможности классификации текстов по их динамическим моделям.
Для этого был предложен один из возможных методов построения динамической модели текста, для которого удалось продемонстрировать, что динамика изменений фрагментов текстовых документов является их отличительной характеристикой. На основе предложенной динамической модели были разработаны и обоснованы два метода классификации документов и их фрагментов. Новизна полученных результатов, выводов и рекомендаций, сформулированных в работе Научной новизной обладают следующие результаты диссертации: Ь Предложен метод построения динамической модели текстовых документов 2.
Разработан и теоретически обоснован алгоритм классификации текстовых документов на основе кластеризации спектрального представления динамических моделей текстовых документов. 3. Разработан и теоретически обоснован алгоритм классификации фрагментов текстовых документов, основанный на кластеризации динамических моделей текстовых документов с помощью расстояний на ядрах. Новизна научных результатов содержательно отражена автором в тексте диссертационной работы. Обоснованность полученных результатов обеспечивается корректностью и строгостью используемого в работе математического аппарата и подтверждается результатами численных экспериментов в компьютерной среде МАТЬАВ.
Теоретическая и практическая значимость результатов диссертации Теоретическая ценность работы состоит в предложенном новом методе построения динамической модели текста и в обосновании разработанных новых алгоритмов классификации фрагментов текстовых документов. Предложенные новые методы находят применение во множестве прикладных и исследовательских задач; определение авторства текстов в литературных исследованиях, криминалистике, выявление плагиата и т.п.
Анализ неструктурированной текстовой информации в отчетах технических устройств с помощью предложенного алгоритма предоставляет возможность выявления неоднородности стиля, а, значит, и возможного сбоя технического устройства. Соответствие диссертационной работы заявленной специальности 01.01.09 Тема диссертации соответствует пункту 5 «Математическая теория распознавания и классификации» паспорта специальности 01.01.09 - Дискретная математика и математическая кибернетика, поскольку посвящена разработке модели текстовых документов и построению алгоритмов классификации.
Апробация результатов, публикации Основные результаты диссертации опубликованы в семи публикациях, одна из которых является публикацией в издании из перечня ВАК, три работы в изданиях из баз цитирования %еЬ оТ Бс1епсе и Бсорпз. Одна из статей опубликована в журнале Раггегп Кесобп111оп, который входит в первый квантиль журналов в базе данных %еЬ оТ Яс1епсе. Основные положения диссертационной работы докладывались и обсуждались на семинарах системного программирования математико-механического факультета СПбГУ, семинарах Лаборатории анализа и моделирования социальных процессов СПбГУ, колледже ОРТ им. Брауде (Кармиэль, Израиль), на международных конференциях А1ХЫЯМ% ЕК(ЗСТ Агбйс(а1 1пге111яепсе апо Машга! 1.апяпаяе й !пГогпиг1оп Ехггасйоп, Кос(а! Мег!1а апд ЖеЬ ВеагсЬ (9-14 ноября, 2015, СанктПетербург, Россия), 2015 1ЕЕЕ 1пГегпа11опа! эугпрозшт оп 1пге1!!сепг Сон!го! (БергетЬег 21-23, 2015, Бус1пеу, Апзгга11а), 2017 1ЕЕЕ СопГегепсе оп Сопгго1 ТесЬпо1оду апд Арр1(сайопз (Аияизг 27-30, 2017, Соазг, Надай, 1)БА), 81Ь 1пгегпаг(опа! Бс1епг(йс СопГегепсе оп РЬуясз апд Сон!го! (РЬузСоп 2017) (а!у 17-19, Р1огепсе,!Га1у).
Недостатки диссертационной работы По материалу диссертационной работы можно сделать следующие замечания: 1. В главе 1 не приведен подробный обзор методов валидации кластеризации, которые используются в дальнейшем 2. В главе 2 не дано определение слова "паттерн" 3. В главе 3 не приведено сравнение с существующими методами кластеризации последовательных данных 4.
Не пояснено, почему в качестве паттернов используются только две приведенные в диссертации характеристики временных рядов. Рекомендация по использованию результатов и выводов диссертационной работы Результаты диссертационной работы представляют как теоретический, так и практический интерес и могут быть использованы в научных исследованиях, проводимых на филологическом факультете Санкт-Петербургского государственного университета, лаборатории криминалистики на юридическом факультете СанктПетербургского государственного университета, лингвистических исследовательских центрах, специалистам в Институте проблем управления РАН, Институте системного анализа ФИЦ ИУ РАН, Институте проблем управления сложными системами РАН, Институте проблем машиноведения РАН, Московском государственном университете, Санкт-Петербургском государственного университета, Национальном исследовательском университете ИТМО„Политехническом университете им.
Петра Великого, Московском государственном техническом университете им. Баумана, Московском физико-техническом институте. Заключение Отмеченные недостатки не оказывают существенного влияния на общий уровень диссертационной работы и ее положительную оценку. Название диссертационной работы адекватно ее содержанию, структура работы носит логичный характер. Автореферат диссертации достаточно полно отражает ее содержание. Диссертация Кижаевой Н.А. представляет собой законченное научное исследование на актуальную тему.
Результаты, полученные в диссертации, представляют собой метод построения новой модели текстовых документов и два алгоритма классификации текстовых документов на ее основе. Таким образом, диссертационная работа полностью удовлетворяет требованиям «Положения о порядке присуждения ученых степеней», утвержденных постановлением Правительства Российской Федерации от 24 сентября 2013 г. № 842, предъявляемым к диссертациям, представленным на соискание ученой степени кандидата физико-математических наук по специальности 01.01.09 - «Дискретная математика и математическая кибернетика».
Ее автор Кижаева Наталья Александровна заслуживает присуждения ученой степени кандидата физико-математических наук по специальности 01.01.09 — «Дискретная математика и математическая кибернетика». Отзыв заслушан и одобрен на заседании семинара ИСА ФИЦ ИУ РАН «Математические методы системного анализа» «5» мая 2018 года. Руководитель семинара Попков Ю.С. Я.:с/~:...~. =--С..— Директор ИСА Академик РАН т 60-летия Октября, д. 9;фоски„.Россия,, Адрес: 117312 Проспек Тел.: +7 (499) 135-24 -38 Е-~и!: ~юЯив,щ Адрес официального сайта: Ыр://илчю.ьа.гп с /7,...7 Реп~па ФИЦ ИУ РДН Б.н, Зла«роя чо Д~,. Попков Ю.С. .
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.