Автореферат (1137506), страница 5
Текст из файла (страница 5)
Проведённый22анализ демонстрирует важность синтаксических свойств для автоматической разметкиактантов, а также важность соответствия исходной и целевой предметной областей прииспользовании дистрибутивных моделей для учёта лексического сходства актантов.Полученные результаты также демонстрируют, что глобальная оптимизация являетсяважным шагом в автоматической обработке актантов.Наши выводы о возможных альтернативных подходах к решению задачиавтоматической разметки актатнов в русском языке можно условно разделить на тригруппы. Первая группа выводов связана с решениями, которые находятся в руслеиспользуемых в работе подходов и так или иначе могли бы способствовать развитию иулучшениюразработаннойсистемы.Мыостанавливаемсянаперспективахиспользования классификаторов на основе интерпретируемых моделей, на возможныхмодификациях использованных в работе свойств и усовершенствованиях модуляглобальной оптимизации.
Вторая группа выводов касается проблемы использованияметодов обучения без учителя для решения задач автоматической семантическойразметки актантов применительно к русскому материалу. В частности, рассказывается ометоде проекции аннотаций, предложенном Х. Фюрстенау17, который позволяетосуществить проекцию разметки по синтаксическим ролям на неразмеченные данные спомощью выравнивания синтаксических деревьев исходного и целевого предложений.Наконец, финальные замечания связаны с возможными шагами по усовершенствованиюкорпуса FrameBank.
Отмечается важность экспертной синтаксической разметки вподобных ресурсах, проблема репрезентативности данных, а также упоминаютсятехнические возможности по представлению корпуса примеров в одном из стандартныхформатов.Диссертацию завершает Заключение, в котором перечисляются основныерезультаты проделанной работы:17Furstenau, H., & Lapata, M. (2011).
Semi-supervised semantic role labeling via structural alignment.Computational Linguistics, 38(1), 135–17123o Разработана и подробно описана система автоматической классификации актантовдля русского языка с использованием методов машинного обучения на основекорпуса примеров FrameBanko Определеныгруппысвойств, использованных длямашинного обучения,разработаны принципы интеграции свойств в модуль предобработки данныхo Разработан модуль глобальной оптимизации, контролирующий соответствиерезультатов работы системы формальным ограничениям теории семантическихролейo Качество работы системы оценено с использованием изолированных тестовыхданных.
Определён вклад и особенности отдельных свойств, а также влияниеразмера выборки и глобальной оптимизации на качество работы системыo Выявленыпотенциальныевозможностидляоптимизациипредставленнойсистемы, а также выработаны рекомендации по дальнейшему развитию какпредставленной системы, так и других подобных систем, основанных на русскомматериале.Содержание работы отражено в следующих публикациях:o Кузнецов И. Автоматическое выделение глагольных актантов: теоретическаяоснова и актуальные подходы. НТИ. Сер. 2. ИНФОРМ. ПРОЦЕССЫ ИСИСТЕМЫ. 2012.
No. 12.o Кузнецов И. Автоматическое извлечение двусловных терминов по тематике"Нанотехнологии в медицине" на основе корпусных данных. НТИ. Сер. 2.ИНФОРМ. ПРОЦЕССЫ И СИСТЕМЫ. 2013. No. 5.o Акинина Ю., Кузнецов И., Толдова С. Сравнение двух методов автоматическогоизвлечения участников из неструктурированных источников.
НТИ. Сер. 2.ИНФОРМ. ПРОЦЕССЫ И СИСТЕМЫ. 2013. No. 6.o Kuznetsov I. Semantic Role Labeling for Russian Language based on Russian FrameBank //Analysis of Images, Social Networks and Texts. 4th International Conference, AIST 2015,24Yekaterinburg, Russia, April 9–11, 2015, Revised Selected Papers / Ed. by M. Y. Khachay, N.Konstantinova, A. Panchenko, D. I. Ignatov, V. Labunets. Vol.
542: Series: Communications inComputer and Information Science. Springer International Publishing, 2015. P. 337-348.o И. Кузнецов. Распознавание и классификация актантов в русском языке // ДокладыВсероссийской научно-практической конференции «Анализ Изображений, Сетей иТекстов». Екатеринбург, 2013.o Akinina Y., Kuznetsov I. , Toldova S. The impact of syntactic structure on verb-nouncollocation extraction // Компьютерная лингвистика и интеллектуальные технологии:По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая— 2 июня 2013 г.).
Вып. 12 (19). — М.: Изд-во РГГУ, 2013.25.