Заключение ВШЭ (1100471)
Текст из файла
Актуальность выбранной темы обусловлена большим прикладным значением исследований в выбранной области и популярностью темы в современной компьютерной лингвистике. Предложенные в работе методы впервые апробированы на русском материале. Кроме того, это первая работа, которая использует открытый ресурс ГгатеВап1с для выполнения автоматической разметки семантических ролей. Научная новизна работы состоит в том, что ранее подобных исследований на русском материале не проводилось.
Предложенное исследование — первый опыт применения систем на основе машинного обучения к корпусу примеров ГгатеВапЕ. Ряд частных решений также применяется к русскому языку впервые, кроме того, это первое известное нам полноценное описание подобной системы, достаточно подробное для успешной реимплементации и усовершенствования предложенного метода. Теоретическая значимость исследования состоит в оценке вклада различных лингвистических свойств в качество работы классификатора. Система опирается на ряд свойств, в т.ч. на путь в дереве зависимостей, падеж актанта, предлог, которым оформлен актант, лемму и кластер актанта и др.
Представленный анализ демонстрирует важность синтаксических свойств для автоматической разметки актантов в русском языке. Роль лексических свойств оказывается второстепенной, подробно рассматриваются возможные причины такого поведения системы. Для русского языка подобное исследование проводится впервые. Практическая значимость исследования состоит в подробном качественном и количественном анализе результатов работы системы.
Кроме того, работа содержит детальное описание компонентов системы, а также ряд рекомендаций для дальнейших экспериментальных исследований в этой области. Достоверность выводов диссертации обеспечивается опорой на фундаментальные работы в области лингвистики и машинного обучения. Научные положения работы обоснованы и подтверждены в ходе эксперимента по оценке качества системы, который включал в себя автоматическую оценку на основе тестового набора данных, так и детальный экспертный анализ результатов. Личный вклад соискателя состоит в проектировании и описании системы автоматической разметки семантических ролей, оценке качества работы системы и интерпретации полученных результатов.
Работа была апробирована в ходе обсуждений на заседаниях и семинарах кафедры, а также на конференциях АИСТ-2013 (4-б апреля 2013 г., Екатеринбург) АИСТ-2015 (9-11 апреля 2015 г., Екатеринбург) Диалог-2013 (29 мая — 2 июня 2013 г., Бекасово) ЕСИ Поссога1 Сопзогйшп (24 марта 2013 г., Москва) Основные результаты диссертационного исследования опубликованы в б работах общим объемом 6,7 п.л. Личный вклад автора составляет 5,08 п.л.
Работы, опубликованные автором в ведущих рецензируемых научных журналах и изданиях, рекомендованных ВАК: 1. Кузнецов И. Автоматическое выделение глагольных актантов: теоретическая основа и актуальные подходы. // НТИ. Информ. процессы и системы. ВИНИТИ РАН. — 2012 № 12. — С. 34-44 — 1,39 п.л. 2. Кузнецов И. Автоматическое извлечение двусловных терминов по тематике «Нанотехнологии в медицине» на основе корпусных данных.
// НТИ. Информ. процессы и системы. ВИНИТИ РАН. — 2013 № 5. — С, 25-33 — 1,27 3. Акинина Ю., Кузнецов И., Толдова С. Сравнение двух методов автоматического извлечения участников из неструктурированных источников. // НТИ. Информ. процессы и системы. ВИНИТИ РАН. — 2013 № 6. — С, 24-34— 1,16 п.л. (личный вклад — 0,39 п.л.) Работы, опубликованные автором в других изданиях: 1.
Кузнецов И. Распознавание и классификация актантов в русском языке // Доклады Всероссийской научно-практической конференции «Анализ Изображений, Сетей и Текстов», Екатеринбург„ 2013. — С. 205-210 — 0,92 п.л. 2. АЫп1па У., Кпхпегзоч 1., ТоЫо~а Б. ТЬе 1гпрасг о?' зупгасг?с зггисШге оп ~егЬ-попп со11 ос ай оп ехггасйоп // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая — 2 июня 2013 г.). Вып.
12 (19). — М.: Изд-во РГГУ, 2013. С. 2-16 — 1,27 п.л. (личный вклад - 0,42 п.л.) 3. Кпгле1зо~ 1. Бегпап1?с Ко!е ЬаЬе1?п8 1ог Коза?ап Ьапдиа8е Ьазег? оп Кпзз1ап ГгатеВап1 // Апа!уз?з о?' ?гпа8ез, Бос?а! Хе1иог?ся апс? Тех!а. 41Ь ?пгегпаг?опа! Соп?егепсе, А?8Т 2015, Уе1сагеппЬиг8, Кпзз?а, Арп1 9 — 11, 2015, Кемям? 8е!есгег? Рарегз / Ед. Ьу М. У. КЬасЬау, Ь1.
Копзгапг?по~а„А. РапсЬеп1со, В. 1. ?8па1оч, У. ЬаЬипегв. Уо1. 542: 8епез: Сотпшп?сайопз 1п Согпригег апс??п?оппайоп 8с?епсе. Брпп8ег ?пгегпаг?опа1 РпЬ?иЬ?п8, 2015. Р. 337-348. — 0,69 п.л. Публикации полностью соответствуют теме диссертационного исследования и раскрывают ее основные положения. Диссертационная работа Кузнецова Илья Олеговича на тему «Автоматическая разметка семантических ролей в русском языке» вЂ” это законченная научно-квалификационная работа, соответствующая требованиям п. 9,10 Положения о присуждении ученых степеней, Паспорту научной специальности 10.02.21 «Прикладная и математическая лингвистика» группы специальностей 10.02.00 «Языкознание» отрасли 10.00.00 «Филологические науки» Номенклатуры специальностей научных работников.
Диссертация на тему: «Автоматическая разметка семантических ролей в русском языке» Кузнецова Ильи Олеговича соответствует всем требованиям ВАК РФ, предъявляемым к диссертациям на соискание ученой степени кандидата филологических наук и рекомендуется к защите на соискание ученой степени кандидата филологических наук по специальности 10.02.21 «Прикладная и математическая лингвистика». Заключение принято на заседании Школы лингвистики факультета гуманитарных наук Национального исследовательского университета «Высшая школа экономики».
Присутствовало на заседании 10 чел. Результаты голосования: «з໠†чел., «проти⻠— 0 чел., «воздержалось» — 0 чел., протокол № 2/1 от «9» июня 2015 г. Доктор филологических наук, профессор, руководитель школы лингвистики факультета гуманитарных наук НИУ ВШЭ, Екатерина Владимировна Рахилина .
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.