Автореферат (1100479), страница 5
Текст из файла (страница 5)
В частности, рассказывается ометоде проекции аннотаций, предложенном Х. Фюрстенау17, который позволяетосуществить проекцию разметки по синтаксическим ролям на неразмеченные данные спомощью выравнивания синтаксических деревьев исходного и целевого предложений.Наконец, финальные замечания связаны с возможными шагами по усовершенствованиюкорпуса FrameBank. Отмечается важность экспертной синтаксической разметки вподобных ресурсах, проблема репрезентативности данных, а также упоминаютсятехнические возможности по представлению корпуса примеров в одном из стандартныхформатов.Диссертацию завершает Заключение, в котором перечисляются основныерезультаты проделанной работы:17Furstenau, H., & Lapata, M.
(2011). Semi-supervised semantic role labeling via structural alignment.Computational Linguistics, 38(1), 135–17123o Разработана и подробно описана система автоматической классификации актантовдля русского языка с использованием методов машинного обучения на основекорпуса примеров FrameBanko Определеныгруппысвойств, использованных длямашинного обучения,разработаны принципы интеграции свойств в модуль предобработки данныхo Разработан модуль глобальной оптимизации, контролирующий соответствиерезультатов работы системы формальным ограничениям теории семантическихролейo Качество работы системы оценено с использованием изолированных тестовыхданных.
Определён вклад и особенности отдельных свойств, а также влияниеразмера выборки и глобальной оптимизации на качество работы системыo Выявленыпотенциальныевозможностидляоптимизациипредставленнойсистемы, а также выработаны рекомендации по дальнейшему развитию какпредставленной системы, так и других подобных систем, основанных на русскомматериале.Содержание работы отражено в следующих публикациях:o Кузнецов И.
Автоматическое выделение глагольных актантов: теоретическаяоснова и актуальные подходы. НТИ. Сер. 2. ИНФОРМ. ПРОЦЕССЫ ИСИСТЕМЫ. 2012. No. 12.o Кузнецов И. Автоматическое извлечение двусловных терминов по тематике"Нанотехнологии в медицине" на основе корпусных данных. НТИ.
Сер. 2.ИНФОРМ. ПРОЦЕССЫ И СИСТЕМЫ. 2013. No. 5.o Акинина Ю., Кузнецов И., Толдова С. Сравнение двух методов автоматическогоизвлечения участников из неструктурированных источников. НТИ. Сер. 2.ИНФОРМ. ПРОЦЕССЫ И СИСТЕМЫ. 2013. No. 6.o Kuznetsov I. Semantic Role Labeling for Russian Language based on Russian FrameBank //Analysis of Images, Social Networks and Texts. 4th International Conference, AIST 2015,24Yekaterinburg, Russia, April 9–11, 2015, Revised Selected Papers / Ed. by M. Y.
Khachay, N.Konstantinova, A. Panchenko, D. I. Ignatov, V. Labunets. Vol. 542: Series: Communications inComputer and Information Science. Springer International Publishing, 2015. P. 337-348.o И. Кузнецов. Распознавание и классификация актантов в русском языке // ДокладыВсероссийской научно-практической конференции «Анализ Изображений, Сетей иТекстов». Екатеринбург, 2013.o Akinina Y., Kuznetsov I.
, Toldova S. The impact of syntactic structure on verb-nouncollocation extraction // Компьютерная лингвистика и интеллектуальные технологии:По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая— 2 июня 2013 г.). Вып. 12 (19). — М.: Изд-во РГГУ, 2013.25.