Семантика лексики, обозначающей физические взаимодействия, в онтологическом аспекте
Описание файла
PDF-файл из архива "Семантика лексики, обозначающей физические взаимодействия, в онтологическом аспекте", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
На правах рукописиМАРУШКИНА АНАСТАСИЯ СЕРГЕЕВНАСЕМАНТИКА ЛЕКСИКИ, ОБОЗНАЧАЮЩЕЙ ФИЗИЧЕСКИЕВЗАИМОДЕЙСТВИЯ, В ОНТОЛОГИЧЕСКОМ АСПЕКТЕСпециальность 10.02.21 – прикладная и математическая лингвистикаАВТОРЕФЕРАТдиссертации на соискание ученой степеникандидата филологических наукМосква – 2012Работа выполнена на кафедре теоретической и прикладной лингвистикифилологического факультета ФГОУ ВПО «Московский государственныйуниверситет имени М.В. Ломоносова».Научный руководитель:доктор филологических наук,профессорКобозева Ирина МихайловнаОфициальные оппоненты:Рябцева Надежда Константиновнадоктор филологических наук,зав. Сектором прикладного языкознанияФГБУН «Институт языкознания РАН»,Сичинава Дмитрий Владимировичкандидат филологических наукстарший научный сотрудникФГБУН «Институт русского языкаим.
В. В. Виноградова РАН»,Ведущая организация:ФГОУ ВПО «Российский государственныйгуманитарный университет»Защита состоится 30 мая 2012 года в 14.30 часов на заседании диссертационногосовета Д 501.001.24 при ФГОУ ВПО «Московский государственный университетимени М. В. Ломоносова» по адресу: 119991 ГСП-1, Москва, Ленинские горы,МГУ, 1-й учебный корпус, филологический факультет.С диссертацией можно ознакомиться в библиотеке 1-го учебного корпуса ФГОУВПО «Московский государственный университет имени М.В.
Ломоносова»Автореферат разослан 27 апреля 2012 года.Ученый секретарьдиссертационного советаА.М. БеловАктуальность диссертационного исследования обусловлена тем, что впоследнее время растет популярность использования онтологий для представлениязнаний. В области искусственного интеллекта онтологии обеспечивают поддержкуразнообразных экспертных систем, требующих построения логического вывода илипринятия решений. Кроме того, появляется все больше проектов в русле концепцииSemantic Web, так как недостаток семантизации и доступности Web-контента вИнтернет остается на данный момент серьезной проблемой. Среди огромногоколичества онтологий можно назвать такие известные доступные в сети Интернетресурсы, как CYC, SUMO, Wordnet, онтология Дж. Со́вы и др.
В России заметныеразработки подобного рода ведутся в Москве (АНО ЦИИ, «Авикомп сервисез»),Санкт-Петербурге (коллектив под руководством Т.А. Гавриловой), Новосибирске(коллективы под руководством Ю.А. Загорулько и Н.Г. Загоруйко), а также вКазани и Владивостоке (см. обзор в [Ена, Ефименко, Хорошевский 2011]).Одним из направлений в проектировании онтологий является разработкаресурсов для автоматизированной обработки текстов на естественном языке,которые позволяют построить семантическое представление текста с учетомсодержащихся в нем импликаций [Леонтьева 2006, Лукашевич 2011].
Такиеонтологии моделируют общие понятия и реальный мир в его многообразии исостоят из неформально заданных концептов в виде словарных толкованийописательного характера. Их называют вербальными (verbal ontologies) илиуниверсальными (universal ontologies). Естественный язык как метаязык даетдостаточную свободу и гибкость описания, но одновременно снижает четкость иоднозначность.
Часто концепты обнаруживают зоны пересечения на предметнойобласти, и случается, что в силу расплывчатости определения затруднен выборконцепта при разработке лексической статьи. В данном исследовании мыпредприняли попытку более подробно рассмотреть ограниченную предметнуюобласть – область силовых взаимодействий – и избежать неоднозначности в ееописании. Выбор предметной области, в частности, продиктован тем, что характерсиловых взаимодействий между физическими объектами до сих пор не былотдельным объектом рассмотрения при создании универсальных онтологий (так,например, в онтологии, разработанной С.
Ниренбургом и В. Раскиным, для-1-описания силовых процессов существует недостаточно детально разработанныйконцепт FORCE-APPLICATION).Учитывая вышесказанное, обозначим предмет исследования: им являетсяразработка концептуального представления силовых процессов в их отношении кнаивной языковой картине мира.Объектом исследования являются языковые единицы (прежде всего глаголы),в семантическую структуру которых входят семы ‘сила’, ‘взаимодействие’,‘изменение’,‘каузация’.Врамкахдиссертационногоисследованиярассматриваются только прямые пространственно-физические значения этихединиц, хотя в дальнейшем полученные результаты могут быть использованы дляописания гораздо более широкой сферы взаимодействий.В идеографическомсловаре О.С. Баранова такие единицы попадают в самые разные разделы:ВЗАИМОДЕЙСТВИЕ СИСТЕМ, ДВИЖЕНИЕ МАТЕРИИ, ТВЕРДОЕ ТЕЛО,МЕХАНИЧЕСКИЕ КОЛЕБАНИЯ, ПЕРЕДВИЖЕНИЕ, ДИНАМИКА ДВИЖЕНИЯи пр.Цель исследования – построение фрагмента универсальной онтологии,описывающего силовые процессы между физическими объектами, разработкаформата лексического описания и, наконец, определение основных принципов дляпостроениясемантическогопредставлениятекста,описывающегосиловыепроцессы разной природы.В соответствии с целью исследования обозначим конкретные задачи, которыедолжны быть решены в ходе данной работы:1.
обозначить и исследовать основные типы силового взаимодействия;2. разработать средства их формального описания;3. составить базовую классификацию предикатов силового взаимодействия;4. выделить структуру концептов, составляющих фрагмент универсальнойонтологии;5.построитьфрагментуниверсальнойонтологиисферысиловыхвзаимодействий;6. создать формат лексического описания языковых единиц, обладающихсиловой семантикой;-2-7. разработать алгоритм построения семантического представления входящеготекста на базе онтологии и лексикона.Вышеперечисленные задачи последовательно решаются в главах диссертации.Материалом для исследования послужили данные словарей разных типов,таких, как «Семантический словарь русского языка» под общей редакцией Н.Ю.Шведовой, «Словарь русского языка» под редакцией А.П.
Евгеньевой (МАС),«Идеографическийсловарьрусскогоязыка»(О.С.Баранов),«Русскийассоциативный словарь» (Ю.Н. Караулов, Г.А. Черкасова, Н.В. Уфимцева, Ю.А.Сорокин,В.Н.Ярошинская.),«Русскийсемантическийсловарь:опытавтоматического построения тезауруса: от понятия к слову» (Ю.Н. Караулов, В.И.Молчанов, В.А. Афанасьев, Н.В. Михалев), толковые словари русского языка подредакцией С.И. Ожегова и Н.Ю. Шведовой, Д.Н. Ушакова, «Словарь синонимов исходных по смыслу выражений» (Н. Абрамов), данные лексического ресурсаWordNet, доступных в сети интернет онтологий (CYC, SUMO), а также онтологии,разработанной в рамках теориионтологической семантики [Nirenburg, Raskin2004]. Кроме того, значительное количество проанализированных контекстов былополучено благодаря работе с Национальным корпусом русского языка.В качестве теоретической базы исследования была выбрана теория,разработанная в 1970-е годы американским лингвистом Леонардом Талми, которыйпредложил для описания семантики естественного языка ставшую уже достаточноизвестной понятийную категорию силового взаимодействия (Force Dynamics).
Какутверждает автор, она применима и при описании более широкой области лексики.В работах Талми это хорошо показано, в частности, на примере различныхмодальных глаголов. Следует также отметить, что изучение языковых способовкодирования силового взаимодействия продолжается на материале различныхязыков [Brandt 1992], [Lai & Chiang 2003], [Chun & David A Zubin 1990] и др. Понашему мнению, рассмотренная теория Л. Талми, несмотря на справедливую вомногом критику в ее адрес [Goddard 1998], обладает достаточной объяснительнойсилой и будет полезна при описании языковых значений и деривационныхотношений между лексическими единицами.
Таким образом, именно она взята заоснову в нашем исследовании.-3-Помимо теории Талми, мы будем учитывать и последний масштабный трудЕ.В. Падучевой «Динамические модели в семантике лексики» [Падучева 2004]. Изпредставленных здесь тематических классов, выделенных для глагольной лексики,значительная часть в той или иной степени имеет отношение к понятиям«движение», «физическое воздействие», «перемещение объекта», «каузация», чтопредставляетнепосредственныйинтересдляпредлагаемогоописания.Определенные аналогии с теорией динамики сил прослеживаются в вышедшей втом же году работе Г.И.
Кустовой «Типы производных значений и механизмыязыкового расширения» [Кустова 2004] (см. главу 5 “Семантические моделипроизводных значений глаголов”).В работе были использованы следующие методы: корпусный метод для сбораданных, метод классификации, метод когнитивного моделирования значениялексических единиц, а также метод опроса информантов для верификациинекоторых результатов, полученных путем интроспекции.Научная новизна исследования обусловлена тем, что впервые сфера силовыхвзаимодействий стала объектом отдельного детального описания как частьуниверсальной лексической онтологии. На базе теории Динамики Сил Л. Талмибыл разработан новый принцип формального описания, ориентированный напроекцию данной предметной области в языке.С привлечением языкового материала осуществлена классификация ситуацийсилового взаимодействия и предикатов русского языка с силовой семантикой,которая стала основой для создания фрагмента универсальной онтологии.Онтология насчитывает 10 концептов.Разработанный инструментарий позволил спроектировать онтологию силовыхвзаимодействий не в виде упорядоченного набора «строительных» элементов, а какединуюконцептуальнуюбазудлясозданиялексическихописанийилифактологических высказываний.Помимо онтологической структуры в работе также предложен вариантлексического описания, которое учитывает основные роли и атрибуты ситуацийсиловоговзаимодействия(условияпротеканияситуации,топологическиехарактеристики участников ситуации, направление действия силы и пр.).-4-Предложен общий алгоритм построения семантического представления текстана естественном языке.