Диссертация (Автоматическая разметка семантических ролей в русском языке), страница 3
Описание файла
Файл "Диссертация" внутри архива находится в папке "Автоматическая разметка семантических ролей в русском языке". PDF-файл из архива "Автоматическая разметка семантических ролей в русском языке", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Kāraka определяется как семантическоеотношение между глаголом и зависимым именем, которое обусловливаетморфологическую форму имени. Панини использует 6 падежей-kāraka – агент,объект, инструмент, пункт назначения, источник и локус – которым в санскритесоответствуют падежи – номинатив, аккузатив, инструменталис, датив, аблативи локатив соответственно. Соотношение между kāraka и морфологическимипадежами не было однозначным, так, например, в конструкции с пассивнымглаголом агент маркируется инструменталисом, однако сохраняет своюагентивную kāraka-роль. Несмотря на очевидное сходство с понятиемглубинного падежа, падежи-kāraka в системе Панини таковыми не являлись ииспользовались скорее как средство описания объективной реальности.Работы Панини не имели большого влияния на западную лингвистическуютрадицию, хотя и были в целом хорошо известны [Malchukov, Spencer, 2012].Понятие семантической роли, которое используется в современнойавтоматической обработке актантов, основывается на работах Ч.
Филлмора[Fillmore, 1968], который, собственно, и ввёл понятие семантической роли всовременный лингвистический дискурс, и Дж. Грубера [Gruber, 1965], которыйоперировал концептуально схожим понятием тематического отношения.Изначально основной задачей аппарата семантических ролей было описаниеограничений, налагаемых глаголом (или, более широко, предикатом) наколичество и состав аргументов. В ранних версиях порождающей грамматики[Chomsky, 1965] подобные ограничения задавались рамкой субкатегаризацииглагола (см. Прим.
2), которая задавалась отдельно для каждого глагола вкачестве лексической информации.13Kill: [NP kill NP]Drink: [NP drink (NP)]Search: [NP look (for NP)]Пример 2: Рамки субкатегоризацииПодобный подход, однако, был неэкономичным с описательной точкизрения. Кроме того, было отмечено, что существует ограниченное количестворамок субкатегоризации, что семантически сходные глаголы имеют сходныерамки субкатегоризации, и, наконец, что ограничения на рамки и набордоступных для глаголов трансформаций допускают определённые обобщения.В более поздних версиях порождающей грамматики [Chomsky, 1982] дляописания подобных ограничений используется аппарат тета-ролей: каждомупредикату приписывается т.н.
тета-сетка (theta-grid, см. Прим. 3), котораязадаёт ограничения на набор и состав аргументов в терминах тета-ролей(которые в целом соответствуют семантическим ролям). Грамматичностьпредложения затем проверяется на основании тета-критерия: каждой тетароли, указанной в тета-сетке, должен соответствовать один аргумент, икаждому аргументу может быть приписана только одна тета-роль. Данныйподход позволяет делать обобщения о синтаксическом поведении различныхглаголов.give<source(DP), theme(DP), goal(PP)>Пример 3: Тета-сеткаВ то же время следует отметить, что тета-роли представляют собойсинтаксическийконструкт,втовремякаксемантическиеФиллморовском понимании описывают в первуюпредиката.14роливочередь семантикуКлассическая теория семантических ролей, изложенная в [Fillmore, 1968],постулирует наличие набора семантических ролей, обладающих следующимисвойствами: Полнота и уникальность – каждый аргумент глагола имеет ровно однусемантическую роль Единственность заполнения роли – каждая роль может бытьзаполнена только один раз Независимость и атомарность – определение семантической роли недолжно зависеть от конкретного выбранного предиката и от другихролей.
Семантическая роль имеет категориальную природу и неможет быть разделена на компоненты.На основании этих критериев Ч. Филлмор предложил следующийклассический инвентарь ролей: Агенс – одушевленный инициатор события, способный по своей волеего прекратить Пациенс – партиципант, наиболее вовлеченный в событие ипретерпевающий наиболее значительные изменения Бенефактив – участник, чьи интересы наиболее затронуты в ходеситуации Экспериенцер – получатель информации при глаголах восприятия Стимул – источник информации при глаголах восприятия Инструмент – неодушевленный объект, с помощью которогоосуществляется действие, но который при этом не претерпеваетизменений Адресат – получатель сообщения при глаголах речи Источник – место, из которого осуществляется движение15 Цель – место, в которое осуществляется движениеСемантическая роль в классическом подходе характеризуется, с однойстороны, синтаксическим оформлением, а с другой – лексическимиограничениями на заполнение роли.
Одно из наиболее важных свойствсемантическихролейвприкладномотношении–устойчивостьктрансформациям, например:[Иван]Агенс сломал [стол]Пациенс[Стол]Пациенс был сломан [Иваном]АгенсПример 4: Устойчивость семантических ролей к трансформациямВ ходе дальнейших исследований семантических ролей выяснилось,однако, что предложенный Ч. Филлмором инвентарь обладает ограниченнымиописательными возможностями, и что ни одно из указанных выше свойств неявляется абсолютным. Основные проблемы, с которыми столкнулась теория –этопроблемафрагментацииролей[Dowty,1991]ипроблеманеструктурированности ролевого инвентаря [Jackendoff, 1983]. Проблемафрагментации ролей связана с тем, что для повышения описательной силытеории при соблюдении теоретических требований к ролям приходитсявводить новые семантические роли, что, в свою очередь, приводит к снижениюописательной силы теории. Рассмотрим следующие предложения (Прим.
5):[Иван]Агенс готовит [мясо]Пациенс на [огне]Инструмент[Иван]Агенс готовит [мясо]Пациенс [в котле]Инструмент*[Иван]Агенc готовит [мясо]Пациенс [в котле]Инструмент [на сковородке]!Инструмент![Иван]Агенс готовит [мясо]Пациенс в [котле]Инструмент на [огне]??Пример 5: Трудности с разграничением ролей16Для тогочтобы принцип единственности заполнения роли (2)соблюдался, нам в данном случае требуется ввести новую роль. Однако в этомслучае данная роль поступает непосредственно в наш ролевой инвентарь и всоответствии с (3) получает универсальное определение, в результате чегоролевой инвентарь растёт.Другая проблема классической теории семантических ролей – отсутствиевнутренней организации в ролевом инвентаре.
Так, как, например, отмечает Р.Джекендофф на примере глагола come, многие глаголы движения принимают вкачестве семантического аргумента "Путь" в его различных конфигурациях,однако описательных возможностей стандартного инвентаря семантическихролей недостаточно для регистрации этого явления, см.
пример из [Jackendoff,1983]:Pat came [to the library]ЦельPat came [from the cafeteria]ИсточникPat came [to the library]Источник [from the cafeteria]ЦельПример 6: Варианты ролевого маркирования путиВ данном случае для описания ролевого набора глаголов движенияпотребовалось бы либо ввести новую независимую роль Путь (нарушив, темсамым, критерий (3)), либо включить дополнительный уровень иерархии,который свидетельствовал бы о том, что роли "Цель" и "Источник" могутвыступать компонентом "Пути".На сегодняшний день существует три основных подхода к созданиюинвентаря категориальных (т.е.
неделимых) семантических ролей. Первыйподход использует наиболее дробное представление ролей, в котором ролиявляются предикатно-специфическими, т.е. уникальными для каждогопредиката: например, у глагола "убивать" будут представлены роли "тот,17кто убивает", "тот, кого убивают", "орудие убийства" и т.д. При такомподходе описание общих свойств актантов различных глаголов становитсязатруднительным, однако описание лексических ограничений не представляеттрудностей. На другом конце спектра находятся подходы, опирающиеся намаксимально обобщённые роли Актора и Претерпевающего: эти ролиотвечают за большую долю вариативности в синтаксическом поведенииаргументов, и использование крупных ролей открывает возможности длягенерализации, недоступные для более "дробных" инвентарей, в то же времяпонижая внутреннюю семантическую однородность ролей. Наконец, всередине спектра находятся классические ролевые инвентари наподобиепредложенного Ч.
Филлмором. Схема, составленная Р. Ван Валином [Van Valin,1999] демонстрирует соответствие ролей в данных типах инвентарей.Рисунок 1: Иерархия типов семантических ролей (Р. Ван Валин)18Вконтекстеавтоматическойразметкиактантовнаибольшуюпопулярность имеют подходы на основе предикатно-специфических ролей.Связано это, в первую очередь, с тем, что два основных корпуса,использующихся для обучения систем semantic role labeling, используютдробныеролидляописанияглагольнойсемантики.Наибольшейпопулярностью пользуется корпус PropBank [Palmer, Gildea, Kingsbury, 2005], вкотором роли определяются независимо для каждого предиката.
Этообусловлено, как нам кажется, причинами прикладного характера: корпусPropBank обладает наибольшим покрытием среди доступных корпусов,аннотированных семантическими ролями, а также содержит синтаксическуюразметку, что значительно сокращает затраты на разработку системы. Другойпопулярныйресурс–корпуспримеров,сопровождающийлексико-семантический ресурс FrameNet [Baker, Fillmore, Lowe, 1998]. FrameNetописывает значение предикатов в рамках фреймовой семантики: предикатыгруппируются по ситуациям-фреймам, и для каждого фрейма используетсясвой ролевой набор, при этом как фреймы, так и роли допускаютнаследование, т.е. ролевой инвентарь FrameNet структурирован.