Отзыв на автореферат (авт. Кутузов А. Б.) (1100474)
Текст из файла
Отзывна автореферат диссертациина соискание учёной степеникандидата филологических наукКузнецова Ильи Олеговичана тему«АВТОМАТИЧЕСКАЯ РАЗМЕТКА СЕМАНТИЧЕСКИХ РОЛЕЙВ РУССКОМ ЯЗЫКЕ»Диссертация Ильи Кузнецова посвящена крайне актуальном вопросу, весьмаповерхностно затронутому в существующей литературе по автоматическойобработке текстов на русском языке. Инструменты для работы с морфологией исинтаксисом существуют и широко применяются. В то же время, компьютернаяобработка семантического яруса языка для русскоязычного материала находится всамом начале своего пути.При этом, автоматическое выделение актантов (то есть, разметка семантическихролей, Semantic Role Labeling) — одно из наименее разработанных направленийвычислительной семантики.
Именно эту задачу решает диссертационноеисследование Ильи Олеговича. Таким образом, его актуальность исвоевременность несомненна.Диссертация представляет собой хороший пример сочетания новизныисследования и, одновременно, опоры на труды предшественников: ИльяОлегович использует в качестве обучающего материала ранее ужесуществовавший корпус FrameBank, а также дистрибутивно-семантические модели,обученные в рамках проекта RusVectōrēs, но делает это вполне оригинальнымобразом. Знакомство автора с русскоязычной и англоязычной литературой по теметакже несомненно — соответствующие ссылки не просто приведены, но иподробно проанализированы и использованы в работе.
Подробно описываетсяспецифика русскоязычного материала, в том числе использование присинтаксическом парсинге деревьев зависимостей, а не непосредственныхсоставляющих.Технический уровень проведенного исследования не вызывает нареканий.Эксперименты с машинным обучением для Semantic Role Labeling проведены иописаны корректно, учтены лингвистические особенности данных, качествообученных моделей даёт показатели, достаточные для академической работы (хотя,возможно, и не для промышленного применения). Пожелания автору:1. Сделать модели и код использованного алгоритма доступными научномусообществу, в идеале под свободной лицензией.2.
Сравнить качество полученного алгоритма со state-of-the-art результатамидля английского языка.Считаю, что диссертация соответствует всем требованиям ВАК, а Илья ОлеговичКузнецов безусловно заслуживает присвоения учёной степени кандидатафилологических наук по специальности 10.02.21 (прикладная и математическаялингвистика).Кутузов Андрей Борисовичкандидат филологических наукУниверситет Осло,научный сотрудник, докторантandreku@ifi.uio.noPostboks 1080 Blindern 0316 OSLO, Norway23.04.2016.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.