diss005-ilvovsky_ZaklPrisuzdenie (Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей)
Описание файла
Файл "diss005-ilvovsky_ZaklPrisuzdenie" внутри архива находится в папке "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей". PDF-файл из архива "Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
ЗАКЛЮЧЕНИЕ ДИССЕРТАЦИОННОГО СОВЕТА Д 002.073.04 на базе федерального государственного учреждения «Федеральный исследовательский центр "Информатика и управление" Российской академии наук» (ФИЦ ИУ РАН) по диссертации на соискание ученой степени кандидата технических наук. аттестационное дело № решение диссертационного совета от 05 июня 2017 г.
№ 9 О присуждении Ильвовскому Дмитрию Алексеевичу, гражданину Российской Федерации, ученой степени кандидата технических наук. Диссертация «Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей» по специальности 05.13.18 «Математическое моделирование, численные методы и комплексы программ» принята к защите 3 апреля 2017 г., протокол №7, диссертационным советом Д 002.073.04 на базе федерального государственного учреждения «Федеральный исследовательский центр "Информатика и управление" Российской академии наук» 1ФИЦ ИУ РАН), 119333, Москва, ул.
Вавилова, д.44, корп.2, приказ Министерства образования и науки Российской Федерации № 747/нк от 22 июня 2016 г. Соискатель — Ильвовский Дмитрий Алексеевич, 1986 г. рождения, в 2010 г. окончил государственное образовательное учреждение высшего профессионального образования «Московский авиационный институт (государственный технический университет) «МАИ»» по специальности «Прикладная математика и информатика»; в 2014 году окончил заочную аспирантуру федерального государственного автономного образовательного учреждения высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики» по специальности 05.13.18 — «Математическое моделирование, численные методы и комплексы программ»; в 2016 г. был прикреплен для подготовки диссертации по научной специальности 05.13.18 — «Математическое моделирование, численные методы и комплексы программ» к федеральному государственному автономному образовательному учреждению высшего образования «Национальный исследовательский университет «Высшая школа экономики».
В настоящее время работает в федеральном государственном автономном образовательном учреждении высшего образования «Национальный исследовательский университет «Высшая школа экономики» в должности младшего научного сотрудника международной научно-исследовательской лаборатории интеллектуальных систем и структурного анализа. Диссертация выполнена в Департаменте анализа данных и искусственного интеллекта факультета компьютерных наук федерального государственного автономного образовательного учреждения высшего образования «Национальный исследовательский университет «Высшая школа экономики».
Научный руководитель — доктор физико-математических наук, профессор Кузнецов Сергей Олегович, федеральное государственное автономное образовательное учреждение высшего образования «Национальный исследовательский университет ссВысшая школа экономики», руководитель Департамента анализа данных и искусственного интеллекта. Официальные оппоненты: 1. Богатырев Михаил Юрьевич, доктор технических наук, доцент, профессор кафедры информационной безопасности Института прикладной математики и компьютерных наук федерального государственного бюджетного образовательного учреждения высшего профессионального образования ссТульский государственный университет».
Отзыв оппонента положительный, имеются замечания: ° В работе на стр. б8 имеется ссылка на параметры проведения эксперимента, описанные в работе 1731. Однако среди авторов данной работы нет соискателя. В целом, авторство соискателя не вызывает сомнения, но следовало бы сослаться на другую работу с его участием. ° Примеры с текстами в разд. 2.3.2 ссразличные подходы к выявлению сходства между текстовыми абзацами» изложены недостаточно подробно. Из них неясно, как выполняется попарное обобщение абзацев. ° Аналогичное замечание относится к разд.
3.2 «Пример расширения деревьев разбора». ° В разделе 2.7 оценка вычислительной сложности дается на примере и приведены ссылки на литературу. Следовало бы привести в данном разделе известные аналитические результаты, касающиеся оценки вычислительной сложности, в том числе и из литературы, на которую выполнены ссылки. е Нецелесообразно помещать в приложения ~Приложения 1-6) код программ, тем более фрагменты кода без подробных комментариев. Лучше было бы раскрыть в приложениях детали, касающиеся экспериментальной части работы.
2. Виноградов Дмитрий Вячеславович, кандидат физико-математических наук, старший научный сотрудник лаборатории интеллектуального анализа данных и автоматизированной поддержки научных исследований федерального государственного учреждения «Федеральный исследовательский центр "Информатика и управление" Российской академии наук» Огзыв оппонента положительный, имеются замечания: ° В обзоре предыдущих подходов к проблеме не упомянуты работы отечественных исследователей. ° Описание математических деталей частных подходов (ядра и онтологии) перенести из первой главы в соответствующие главы ~3 и 4, соответственно), Тогда первая глава станет компактнее, а читателю будет удобно читать о применении ядер для коротких текстов и поиске тождественных сущностей в онтологиях, ознакомившись с относящимися к делу определениями в первых параграфах соответствующих глав.
° Рецензент находит странным порядок перечисления использованных источников в списке литературы. ° В списке литературы некоторые отечественные работы процитированы на английском языке (В.К. Финн, С.А. Евтушенко, одна и та же работа которого цитируется 2 раза в ~111 по-русски, а в ~1031 — по-английски). ° Исправления опечаток: ~ Страница 22: в определении 1.9 следует опустить индексы у знаков частичного порядка. ~ Страница 24: операция может быть алгоритмически ~не асимптотически!) сложной. ~ Страница 27: в формуле для Ый1,О) опечатка.
Ведущая организация — федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. А.А. Харкевича Российской академии наук ХИППИ РАН) дала положительное заключение ~заключение составил и подписал Цинман Леонид Львович, кандидат физико- математических наук, ведущий научный сотрудник лаборатории компьютерной лингвистики ИППИ РАН им. А.А. Харкевича).
Замечания: 1. В связи с тем, что в работе используется широкий спектр методов и технологий из разных областей, хотелось бы видеть их более подробное описание. Из текста диссертации часто понятно, как именно используется та или иная технология, но не до конца ясно, для чего она используется. Описание редко иллюстрируется содержательными примерами. 2. В определении понятия «чащи разбора» существенно используется парсер лингвистического процессора ЭТАП-3, разработанный в ИППИ РАН им.
А.А.Харкевича. В частности, рис. 1.3 на стр. 40 прямо воспроизводит структуры, полученные с помощью этого парсера. Между тем никакой ссылки на указанный процессор в диссертации нет. 3. Глава 4 о поиске тождественных денотатов весьма отдаленно соотносится с основной тематикой диссертации, Несмотря на схожесть используемых методов (решетки формальных понятий), в данной главе речь идет не об обработке текста, а об обработке формальных объектов, уже заранее сконструированных из текста некоторыми алгоритмами, описание которых не приводится. Более релевантным было бы рассмотреть задачу в комплексе: взяв текст, автоматически сформировать на его основе онтологию, а затем приведенным алгоритмом выявить в ней тождественные объекты, решив таким образом задачу кореферентности текстовых выражений.
Есть целый ряд замечаний к таблице 2.1 на странице б8 (Оценка релевантности поиска) и описанию, приведенному под этой таблицей: 4. В описании сравнивается метод проекций с другими методами, а в заголовках таблицы слово «проекция» не встречается, поэтому сложно понять о каких колонках таблицы идет речь. 5. Автор заявляет «Нетрудно видеть, что с ростом сложности запроса увеличивался эффект от применения технологии обобщения». Не совсем понятно, на основе каких цифр сделано данное утверждение. Беглое сравнение колонок показывает, что это справедливо только для одного (второго) типа запроса из трех.
Было бы уместно провести сравнение или даже выразить «эффект» явными цифрами в таблице, но этого не сделано. 6. Автор утверждает также, что «другим важным выводом является незначительная потеря в точности при существенном выигрыше в скорости за счет использования проекций». Однако данные по скорости в таблице не представлены. Соискатель имеет 20 опубликованных научных работ, из них по теме диссертации опубликовано 15 научных работ общим объемом 10.15 п.л., в том числе, 3 статьи — в научных журналах и изданиях, которые включены в перечень российских журналов и изданий для опубликования основных результатов диссертаций, 12 статей - в рецензируемых трудах международных конференций.
Личный вклад соискателя составляет 5 п,л. Наиболее значимые работы по теме диссертации: 1. Ильвовский Д., Применение семантически связанных деревьев синтаксического разбора в задаче поиска ответов на вопросы, состоящие из нескольких предложений. НТИ. Сер.2 - 2014.