Диссертация (1137507), страница 3
Текст из файла (страница 3)
Филлмора[Fillmore, 1968], который, собственно, и ввёл понятие семантической роли всовременный лингвистический дискурс, и Дж. Грубера [Gruber, 1965], которыйоперировал концептуально схожим понятием тематического отношения.Изначально основной задачей аппарата семантических ролей было описаниеограничений, налагаемых глаголом (или, более широко, предикатом) наколичество и состав аргументов. В ранних версиях порождающей грамматики[Chomsky, 1965] подобные ограничения задавались рамкой субкатегаризацииглагола (см.
Прим. 2), которая задавалась отдельно для каждого глагола вкачестве лексической информации.13Kill: [NP kill NP]Drink: [NP drink (NP)]Search: [NP look (for NP)]Пример 2: Рамки субкатегоризацииПодобный подход, однако, был неэкономичным с описательной точкизрения. Кроме того, было отмечено, что существует ограниченное количестворамок субкатегоризации, что семантически сходные глаголы имеют сходныерамки субкатегоризации, и, наконец, что ограничения на рамки и набордоступных для глаголов трансформаций допускают определённые обобщения.В более поздних версиях порождающей грамматики [Chomsky, 1982] дляописания подобных ограничений используется аппарат тета-ролей: каждомупредикату приписывается т.н.
тета-сетка (theta-grid, см. Прим. 3), котораязадаёт ограничения на набор и состав аргументов в терминах тета-ролей(которые в целом соответствуют семантическим ролям). Грамматичностьпредложения затем проверяется на основании тета-критерия: каждой тетароли, указанной в тета-сетке, должен соответствовать один аргумент, икаждому аргументу может быть приписана только одна тета-роль. Данныйподход позволяет делать обобщения о синтаксическом поведении различныхглаголов.give<source(DP), theme(DP), goal(PP)>Пример 3: Тета-сеткаВ то же время следует отметить, что тета-роли представляют собойсинтаксическийконструкт,втовремякаксемантическиеФиллморовском понимании описывают в первуюпредиката.14роливочередь семантикуКлассическая теория семантических ролей, изложенная в [Fillmore, 1968],постулирует наличие набора семантических ролей, обладающих следующимисвойствами: Полнота и уникальность – каждый аргумент глагола имеет ровно однусемантическую роль Единственность заполнения роли – каждая роль может бытьзаполнена только один раз Независимость и атомарность – определение семантической роли недолжно зависеть от конкретного выбранного предиката и от другихролей.
Семантическая роль имеет категориальную природу и неможет быть разделена на компоненты.На основании этих критериев Ч. Филлмор предложил следующийклассический инвентарь ролей: Агенс – одушевленный инициатор события, способный по своей волеего прекратить Пациенс – партиципант, наиболее вовлеченный в событие ипретерпевающий наиболее значительные изменения Бенефактив – участник, чьи интересы наиболее затронуты в ходеситуации Экспериенцер – получатель информации при глаголах восприятия Стимул – источник информации при глаголах восприятия Инструмент – неодушевленный объект, с помощью которогоосуществляется действие, но который при этом не претерпеваетизменений Адресат – получатель сообщения при глаголах речи Источник – место, из которого осуществляется движение15 Цель – место, в которое осуществляется движениеСемантическая роль в классическом подходе характеризуется, с однойстороны, синтаксическим оформлением, а с другой – лексическимиограничениями на заполнение роли.
Одно из наиболее важных свойствсемантическихролейвприкладномотношении–устойчивостьктрансформациям, например:[Иван]Агенс сломал [стол]Пациенс[Стол]Пациенс был сломан [Иваном]АгенсПример 4: Устойчивость семантических ролей к трансформациямВ ходе дальнейших исследований семантических ролей выяснилось,однако, что предложенный Ч. Филлмором инвентарь обладает ограниченнымиописательными возможностями, и что ни одно из указанных выше свойств неявляется абсолютным. Основные проблемы, с которыми столкнулась теория –этопроблемафрагментацииролей[Dowty,1991]ипроблеманеструктурированности ролевого инвентаря [Jackendoff, 1983]. Проблемафрагментации ролей связана с тем, что для повышения описательной силытеории при соблюдении теоретических требований к ролям приходитсявводить новые семантические роли, что, в свою очередь, приводит к снижениюописательной силы теории.
Рассмотрим следующие предложения (Прим. 5):[Иван]Агенс готовит [мясо]Пациенс на [огне]Инструмент[Иван]Агенс готовит [мясо]Пациенс [в котле]Инструмент*[Иван]Агенc готовит [мясо]Пациенс [в котле]Инструмент [на сковородке]!Инструмент![Иван]Агенс готовит [мясо]Пациенс в [котле]Инструмент на [огне]??Пример 5: Трудности с разграничением ролей16Для тогочтобы принцип единственности заполнения роли (2)соблюдался, нам в данном случае требуется ввести новую роль. Однако в этомслучае данная роль поступает непосредственно в наш ролевой инвентарь и всоответствии с (3) получает универсальное определение, в результате чегоролевой инвентарь растёт.Другая проблема классической теории семантических ролей – отсутствиевнутренней организации в ролевом инвентаре.
Так, как, например, отмечает Р.Джекендофф на примере глагола come, многие глаголы движения принимают вкачестве семантического аргумента "Путь" в его различных конфигурациях,однако описательных возможностей стандартного инвентаря семантическихролей недостаточно для регистрации этого явления, см. пример из [Jackendoff,1983]:Pat came [to the library]ЦельPat came [from the cafeteria]ИсточникPat came [to the library]Источник [from the cafeteria]ЦельПример 6: Варианты ролевого маркирования путиВ данном случае для описания ролевого набора глаголов движенияпотребовалось бы либо ввести новую независимую роль Путь (нарушив, темсамым, критерий (3)), либо включить дополнительный уровень иерархии,который свидетельствовал бы о том, что роли "Цель" и "Источник" могутвыступать компонентом "Пути".На сегодняшний день существует три основных подхода к созданиюинвентаря категориальных (т.е.
неделимых) семантических ролей. Первыйподход использует наиболее дробное представление ролей, в котором ролиявляются предикатно-специфическими, т.е. уникальными для каждогопредиката: например, у глагола "убивать" будут представлены роли "тот,17кто убивает", "тот, кого убивают", "орудие убийства" и т.д. При такомподходе описание общих свойств актантов различных глаголов становитсязатруднительным, однако описание лексических ограничений не представляеттрудностей.
На другом конце спектра находятся подходы, опирающиеся намаксимально обобщённые роли Актора и Претерпевающего: эти ролиотвечают за большую долю вариативности в синтаксическом поведенииаргументов, и использование крупных ролей открывает возможности длягенерализации, недоступные для более "дробных" инвентарей, в то же времяпонижая внутреннюю семантическую однородность ролей. Наконец, всередине спектра находятся классические ролевые инвентари наподобиепредложенного Ч. Филлмором. Схема, составленная Р.
Ван Валином [Van Valin,1999] демонстрирует соответствие ролей в данных типах инвентарей.Рисунок 1: Иерархия типов семантических ролей (Р. Ван Валин)18Вконтекстеавтоматическойразметкиактантовнаибольшуюпопулярность имеют подходы на основе предикатно-специфических ролей.Связано это, в первую очередь, с тем, что два основных корпуса,использующихся для обучения систем semantic role labeling, используютдробныеролидляописанияглагольнойсемантики.Наибольшейпопулярностью пользуется корпус PropBank [Palmer, Gildea, Kingsbury, 2005], вкотором роли определяются независимо для каждого предиката. Этообусловлено, как нам кажется, причинами прикладного характера: корпусPropBank обладает наибольшим покрытием среди доступных корпусов,аннотированных семантическими ролями, а также содержит синтаксическуюразметку, что значительно сокращает затраты на разработку системы.
Другойпопулярныйресурс–корпуспримеров,сопровождающийлексико-семантический ресурс FrameNet [Baker, Fillmore, Lowe, 1998]. FrameNetописывает значение предикатов в рамках фреймовой семантики: предикатыгруппируются по ситуациям-фреймам, и для каждого фрейма используетсясвой ролевой набор, при этом как фреймы, так и роли допускаютнаследование, т.е. ролевой инвентарь FrameNet структурирован. Подобныйподход достаточно гибок в теоретическом отношении, т.к. позволяетиспользовать нужный уровень специфичности в зависимости от поставленныхзадач, однако на практике FrameNet крайне неоднороден с точки зренияспецифичности/абстрактности используемых ролей, что затрудняет разработкусистемавтоматическойразметкиактантовнаданномматериалеииспользование их для решения практических задач.Несмотря на продолжающиеся споры о том, какой из подходов позволяетнаиболее адекватно описать семантические роли, кажется достойнымвнимания и то, как исследователи из различных областей лингвистики иразличных лингвистических традиций приходят к крайне похожим выводамотносительно теории семантических ролей и насколько похожими оказываются19конструкты, полученные в результате их теоретических исследований.Параллельносвозникновениеми развитиемфиллморовскойтеориисемантических ролей, призванной решить некоторые из проблем, возникших врамках генеративной грамматики, в Московской семантической школе (МСШ)был предложен аппарат моделей управления, выполнявший во многом схожиефункции, но направленный на решение проблем, связанных с заполнениемсинтаксических и семантических валентностей предиката [Апресян, 1974].В рамках теории МСШ каждой лексеме соответствует толкование.
Втолкование некоторых лексем входят переменные, которые также называютсясемантическими валентностями лексемы (термин "валентность" восходит кработам Л. Теньера [Теньер, 1988]) , сама лексема в этом случае называетсяпредикатом. Предикат не обязательно должен быть глаголом: так, например,семантическими валентностями обладают отглагольные существительные иимена родства (убийство – кем, кого; сын – чей). Кроме того, каждая лексемаимеет набор синтаксических валентностей, определяющих, какие слова иликатегории данная лексема может иметь в качестве вершины и зависимых.Частьсинтаксическихвалентностейобусловленачастеречнойпринадлежностью слова (например, глагол всегда может иметь зависимоенаречие), другие же, однако, являются уникальными для выбранной лексемы исоответствуют семантическим валентностям этой лексемы.Соответствие семантических и субкатегориальных, т.е.
не обусловленныхкатегорией, синтаксических валентностей закрепляется в модели управления(МУ) предиката, которая вместе с непосредственно толкованием характеризуетлексему. Например, толкование и модель управления для глагола "курить"будет выглядеть следующим образом [Мельчук, Жолковский, 1984]:20X курит Y = X вдыхает через рот непосредственно из специальногоустройства Y дым тлеющего в Y-e вещества Z, обычно – табака, и вдыхаетэтот дым – с целью, чтобы это каузировало то, что X испытываетприятное ощущение1=X [кто вдыхает] 2=Y [из какого устройства] 3=Z [какое вещество тлеетсущ. им.п.сущ. в.п.--сущ.