Главная » Просмотр файлов » Отзыв ведущей организации (сост. Козеренко Е. Б.)

Отзыв ведущей организации (сост. Козеренко Е. Б.) (1100473)

Файл №1100473 Отзыв ведущей организации (сост. Козеренко Е. Б.) (Автоматическая разметка семантических ролей в русском языке)Отзыв ведущей организации (сост. Козеренко Е. Б.) (1100473)2019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

ИУ РАН ,-~ Мй йййии ОКОЛОВ 201б г. ОТЗЫВ ведущей организации «Федеральный исследовательский центр «Информатика и управление» Российской академии наук» на диссертацию Кузнецова Ильи Олеговича на тему «Автоматическая разметка семантических ролей в русском языке», представленную на соискание ученой степени кандидата филологических наук по специальности 10.02.21 — Прикладная и математическая лингвистика.

Диссертационное исследование Кузнецова Ильи Олеговича посвящено очень важной и актуальной теме — автоматической разметке семантических ролей (или актантов) и относится к области создания семантических представлений глагольного распространения для обработки естественно- языковых текстов в информационных системах. Задачи выработки методик и последующей автоматизации семантической разметки текстов на русском языке являются в настоящий момент наиболее приоритетными для области прикладной и математической лингвистики. В центре исследования диссертанта находятся проблемы, которые возникают при создании структурированных лингвистических ресурсов, необходимых для подготовки и разметки текстовых данных для машинного обучения, применяемого в современных интеллектуальных системах обработки знаний, а также для решения широкого класса задач исследования и моделирования естественного языка.

Для русского языка подобные ресурсы разработаны еще в очень малой степени. Актуальность работы Диссертация Кузнецова Ильи Олеговича «Автоматическая разметка семантических ролей в русском языке» является весьма актуальной в настоящий момент. В задачах извлечения знаний из текстов центральной процедурой является установление семантической вершины предложения, клаузы ~предиката, выраженного глагольной формой или другой языковой формой, выполняющей роль предиката предложения или клаузы), и корректная идентификация актантов анализируемого преди ката является основой правильного извлечения и интерпретации знаний из текста на естественном языке. В работе впервые предложен лингвистически обоснованный способ автоматизации разметки актантов и детально проанализированы результаты ее работы, выявлен вклад различных лингвистических свойств и других параметров задачи в качество классификации семантических ролей.

Актуальность диссертационной работы обусловлена стремительно растущей потребностью в обучающих и тестовых корпусах с разметкой по семантическим ролям и доступных инструментах предварительной обработки текста. В качестве объекта исследования диссертант рассматривает проблемы и специфические задачи, возникающие при создании модели классификации актантов на основе деревьев зависимостей и лингвистических свойств изучаемых явлений русского языка. Работа проводилась на материале нового отечественного лингвистического ресурса русского языка РгатеВап1с, содержащего семантически размеченные представления глагольных фреймов, в разработке которого автор диссертации принимает участие, подобное исследование для русского языка ранее не проводилось.

Научная новизна и достоверность исследования Научная новизна диссертационной работы Кузнецова Ильи Олеговича заключается в том, что в ней впервые предложены и обоснованы методы применения систем на основе машинного обучения к корпусу примеров ЕгатеВап1с, при этом ряд ключевых решений применяется к материалу русского языка впервые. Результаты исследований верифицированы на основе анализа представительного языкового материала, достоверно определены те лингвистические и формальные характеристики, которые необходимы для реализации в системе разметки семантических ролей. Автор диссертационной работы демонстрирует высокую степень владения как лингвистическими, так и вычислительно-алгоритмическими методами исследования для решения поставленных задач.

Теоретическая значимость полученных результатов Диссертация Кузнецова Ильи Олеговича - серьезное самостоятельное исследование. Точно поставлены цели и задачи, результаты исследования убедительно доказаны на представительном фактическом материале. Теоретическая значимость диссертации заключается в определении влияния различных лингвистических параметров на качество работы классификатора. Разработанная автором система опирается на такие свойства, как путь в дереве зависимостей, падеж актанта, предлог, которым оформлен актант, лемма и кластер актанта, и другие характеристики. Представленный анализ наглядно демонстрирует важность синтаксических свойств для автоматической разметки актантов в русском языке.

Автор убедительно показывает, что роль лексических свойств оказывается второстепенной, и подробно рассматривает возможные причины такого поведения системы. Практическая значимость полученных результатов Результаты диссертационного исследования Кузнецова Ильи Олеговича несомненно имеют высокую практическую ценность и технологическое значение и могут быть использованы для создания широкого класса систем обработки естественного, в данном случае русского, языка. Полученные результаты имеют большую практическую значимость не только в качестве инструмента лингвистических исследований и создания лингвистических ресурсов, но и для развития современных информационных технологий.

Предложенные автором диссертации методы и реализованные программы являются инновационными и могут быть использованы в системах извлечения знаний из текстов на русском языке и других типов информационных систем, в которых предусмотрены лингвистические процессоры с функциями обучения на текстовых корпусах. Кроме того, полученные результаты имеют большое значение для разработки новых курсов и учебных пособий по математической и прикладной лингвистике. Для успешного достижения целей диссертационного исследования автором решены поставленные задачи: для обеспечения исходного корпуса РгатеВап1с морфологической и синтаксической информацией автором разработаны и включены в систему специальные доступные ресурсы предобработки; для повышения качества обучающих и тестовых данных произведена фильтрация корпуса примеров ГгатеВап1с; разработана модель классификации актантов на основе деревьев зависимостей и лингвистических параметров с учетом характеристик, специфичных для русского языка; разработан модуль глобальной оптимизации, обеспечивающий выполнение ограничений, накладываемых теорией семантических ролей; произведены оценка качества работы полученной системы на отдельной тестовой выборке и оценка влияния лингвистических характеристик и других специальных параметров на качество работы системы; выработаны рекомендации по дальнейшему развитию системы и корпуса ГгатеВап1с.

Композиционно диссертация состоит из введения, четырех глав, в которых подробно описаны теоретические и практические результаты, заключения, библиографического списка. Во Введении приводится общее описание исследовательской задачи, указываются основные методы ее решения и возникающие при этом сложности, дается обоснование актуальности выбранной темы, ее научной новизны, теоретической и практической значимости. Первая глава «Теория семантических ролей и автоматическая разметка актантов» состоит из пяти разделов и посвящена теоретическим основам, истории, начиная с работ, опубликованных в период с 2000-х годов по настоящее время, посвященных системам на основе частично управляемого обучения и неуправляемого обучения.

В первой главе также дается характеристика современного состояния концепции семантических ролей для автоматической разметки актантов. Автор диссертационной работы приводит анализ понятия семантической роли, используемого в современной автоматической обработке актантов и основанного на работах Чарльза Филлмора, который ввел понятие семантического падежа в современную лингвистическую теорию и практику и основал проект РгатеХет (лингвистический ресурс, в котором построено системное представление семантических фреймов глаголов английского языка). Автор диссертационной работы опирается на опыт систем автоматической разметки семантических ролей для английского языка с использованием РгагпеХе1, корпуса РгорВапК и подробно рассматривает работы Дэниэла Журафски, Дэниэла Гилдеа, Марты Палмер и других лингвистов, посвященные автоматической разметке актантов с использованием семантических ролей; приводит анализ работ Джеффри Грубера, в которых используется понятие тематического отношения, схожее с понятием семантической роли (или семантического падежа).

Во второй главе «Система автоматической разметки актантов для русского языка» приводится полное описание системы автоматической разметки актантов для русского языка, разработанной в ходе диссертационного исследования. Глава состоит из пяти разделов, особое внимание уделено описанию параметров и модулей системы разметки. Подробно рассматриваются использованные в системе методы машинного обучения, лингвистические свойства, на основе которых происходит классификация, а также ряд технических решений, использованных при реализации системы и работе с исходными данными. Третья глава «Экспериментальная оценка и результаты» посвящена экспериментальной оценке качества разработанной системы на стандартных параметрах, по которым можно определить, насколько хорошо работает система.

Глава состоит из четырех разделов, в которых подробно описываются процедуры тестирования и глобальной оптимизации системы разметки семантических ролей. В рамках диссертационного исследования оценка качества выполнялась на основании тестовой выборки, также в ряде случаев был произведен экспертный анализ результатов. В третьей главе приведены важные наблюдения о том, что «наилучшие результаты достигаются при использовании комбинированных семантико-синтаксических наборов свойств, однако и синтаксических свойств зачастую оказывается достаточно для достижения качества, близкого к максимальному». Автор указывает, что особое значение имеет свойство "синтаксический путь от предиката", которое во многом определяет результат классификации в случаях, когда оно включено в набор признаков, при этом ограничение длины пути оказывает положительный эффект на качество классификации.

В четвертой главе «Выводы», состоящей из трех разделов, подводятся итоги диссертационного исследования и содержатся рекомендации по дальнейшим исследованиям в рассмотренной области и использованию системы разметки семантических ролей. Автор отмечает, что проведенный анализ демонстрирует важность синтаксических свойств для автоматической разметки актантов, а также важность соответствия исходной и целевой предметной областей при использовании дистрибутивных моделей для учета лексического сходства актантов.

Характеристики

Тип файла
PDF-файл
Размер
2,95 Mb
Предмет
Высшее учебное заведение

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов диссертации

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6487
Авторов
на СтудИзбе
303
Средний доход
с одного платного файла
Обучение Подробнее