Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 28
Текст из файла (страница 28)
Понятие и значение в онтологии MicroKosmos5.6.1 Отражение значений квазисинонимовВ онтологии МикроКосмос проблема квазисинонимов решается за счетобъединения квазисинонимов к одному и тому же понятию онтологии, и описанияособенностей конкретных лексем в словарных статьях словаря.Авторы онтологии приводят пример, что все глаголы изменения в онтологииприписаны одному и тому же понятию Change-event (Nirenburg, McShane, 2004).Особенности слов описываются в словарной статье, например, для глагола увеличить(increase) указывается, что в семантической роли ТЕМА этого глагола должна выступатьСКАЛЯРНАЯ_ВЕЛИЧИНА (например, цена или высота) и указывается, что значениеэтой величины меняется на большее.Если мы обратимся к сайту ресурса, то мы увидим, что ситуация с реализациейизложенных принципов достаточно сложная.
Так, понятию CHANGE_EVENTсопоставлен в лексиконе большой список слов, которые, по мнению авторов онтологии,соответствуют этому понятию, например: acclimatization (акклиматизация –приспособление к другому климату), commerzialization (коммерциализация), contamination(загрязнение), damage (повреждать), deteriorate (ухудшать), improve (улучшать) и многиедругие – для этих слов не было заведено отдельных понятий.В то же время среди нижестоящих по иерархии понятий можно увидетьследующие: ADJUST (адаптировать, приспособить), CORRECT-EVENT (исправление,коррекция), DIVIDE (делить), INTEGRATE (интегрировать), RESTRUCTURE(реструктуризация) и др.Непонятно, почему для одних значений слов были заведены отдельные понятия, адля других нет.
Почему значение слова acclimatization не заслуживает отдельногопонятия, хотя есть важное отношение к климату, биологическим процессам, а значениеслова adjust такой концепт получило?Помимо вопросов последовательности/непоследовательности описания имеются иявные последствия для процедур автоматической обработки текстов.Так, сложной становится процедура установления, какие все-таки слова избольшего списка словарных входов к понятию CHANGE-EVENT, могут рассматриватьсякак синонимы, какие соотношения между этими словами. Невозможно указать отношениемежду асфальтированием и, например, дорожными работами.Кроме того, относительно небольшая величина онтологии приводит к тому, чтопри работе в конкретном приложении и конкретной предметной области многое придетсядоделывать и вводить дополнительные понятия даже для слов, которые уже учтены вонтологии.Таким образом, на наш взгляд, в приведенных примерах из онтологииMikroKosmos проблема квазисинонимов решается путем чрезмерного переобобщения, чтоможет привести к проблемам в реальных предметных областях.
Необходимо выделитьдополнительный уровень понятий, который поможет более четко разделить слова, несваливая их в единый большой мешок.5.6.2. Описание близких значений многозначных слов вонтологии MikroKosmosОсновным правилом, провозглашаемым при работе с близкими значениямимногозначных слов в онтологии MikroKsomos, является правило редукции полисемии,которое заключается в том, что нужно решить, сколько значений словаря можетпредставлять данное словарное значение, и объединить столько значений, скольковозможно так, чтобы осталось как можно меньше разных значений.Принципы для различения значений таковы:106значение-кандидат должно быть отчетливо отличимым от уже описанныхзначений;- необходимо проверять, требует ли значение дополнительного разъяснения, еслииспользовано в коротком предложении.
Если необходим дополнительныйконтекст, чтобы разобраться, какое значение используется, то значение недолжно вводиться, а должно быть отнесено к одному из существующихзначений;- необходимо проверять, имеется ли свойство при описании данного значений,которое заполнено слишком малым числом заполнителей. Если да, то такжелибо значение должно быть отнесено к одному из более общих значений, либоописано в рамках описания многословной конструкции.Казалось бы такая процедура должна снижать проблемы разрешениямногозначности, однако, с другой стороны, эта процедура может привести к нарушениюструктуры онтологии. Именно эту онтологию Н. Гуарино (Guarino, 1998) критикует затрактовку понятия ОКНО одновременно и как артефакта, и как места (см.раздел 5.3.2.).Также Гуарино критикует эту же онтологию за представление понятияКОММУНИКАТИВНОЕ СОБЫТИЕ одновременно как видового понятия для понятийSOCIAL_EVENT (социальное событие) и MENTAL_EVENT (ментальное событие).Как мы уже упоминали, Н.
Гуарино считает, что многозначность в онтологическихузлах не должна быть разрешена. Чтобы соответствовать принципу отсутствиямногозначности узлов, онтология должна иметь различные узлы в различных местахонтологии для таких понятий как WINDOW-ARTIFACT и WINDOW-PLACE, MENTALCOMMUNICATION-EVENT и SOCIAL -COMMUNICATION-EVENT.Отвечая Н.Гуарино, авторы онтологии (Nirenburg, Raskin, 2004: Стр. 129)указывают, что факт того, что английское слово window имеет два значения не имеетрешающего значения при построении онтологии, поскольку не считается, что отношениемежду значениями естественного языка (или точнее значениями все известных языков) ипонятиями онтологии должны иметь однозначное соответствие.В качестве обоснования своей позиции авторы приводят аргумент, что они незнают такого естественного языка, в котором имеющееся слово для понятие WINDOW нереализовывало оба значения: значение отверстия и значение артефакта. Эта семантическаяуниверсалия является сильнейшим аргументом в пользу того, что люди могут совмещатьэти два понятияАвторы онтологии также подчеркивают, что «попытки расщепить онтологическиепонятия на все меньшие однозначные единицы ведет к резкому увеличениюмногозначности, и поэтому делает разрешение многозначности более сложным.
Еслионтология делается менее многозначной, то при работе в приложении, где-то возрастаетнагрузка на обработку многозначности (Там же)».Вместе с тем нужно согласиться с Н. Гуарино в том, что нарушениеонтологической структуры, введение взаимоисключающих отношений понятий, такжепредставляет собой проблему, поскольку, если предполагается использовать описанныеотношения между понятиями для логического вывода, необходимо будет сначалаопределить, применимо ли это отношение для данного контекста, а это означает, чтопроблема выбора значения многозначного слова просто сместилась на другой этап.Кроме того, при рассмотрении разбиения значений на отдельные понятияонтологии нужно учитывать не только существующие в языке однословные единицы, но исловосочетания, которые также нужно автоматически обрабатывать при анализе текста,такие как оконная рама, оконное стекло, отверстие окна (см.
раздел 16.4.3.).-5.7. Понятия и значения в ресурсе FrameNetАвторы ресурса FrameNet уделяют большое внимание рассмотрениювзаимотношения понятий-фреймов и языковых единиц Описывается достаточно большой107набор принципов, который должен регулировать, в каком случае два близких по смыслуслова могут быть отнесены к одному и тому же фрейму, а в каких случаях эти два словадолжны быть разнесены в разные фреймы.Так, все лексические единицы, относящиеся к одному и тому же фрейму, должныиметь одинаковое число фреймовых элементов в имплицитных и эксплицитныхконтекстах. Если число существенных, синтаксически значимых элементов варьируется впредложениях, то фрейм должен быть расщеплен, чтобы отразить это варьирование. Так,систематически по разным фреймам разделяются каузативы (уменьшать) и такназываемые инхоативы (уменьшаться), например, инхоативный фрейм называется«ИЗМЕНЕНИЕ ПОЗИЦИИ НА ШКАЛЕ», а каузативный фрейм «ВЫЗВАТЬИЗМЕНЕНИЕ ПОЗИЦИИ НА ШКАЛЕ» (между ними установлено отношение каузации).Авторы ресурса подчеркивают, что здесь может быть законное возражение, чтоприсутствие агента или причины относится слишком к тонкой лингвистическойинтуиции, и что игнорируется факт, что всякое изменение в мире чем-нибудь каузируется.Предлагаемое обоснование заключается в том, что существуют лексические единицы,которые проявляют либо то, либо другое поведение.
Например, глагол gain имеет толькоинхоативное употребление по отношению к ситуации изменения на шкале, а глагол lowerпозволяет только каузативное использование. Во-вторых, межязыковое сопоставлениепоказывает, что многие языки различают каузативы и инхоативы с помощьюсловообразования.Вместе в одни и те же фреймы группируются лексические единицы, которыесвязаны с различными языковыми реализациями:- пассивные залоги;- видо-временные конструкции;- композиции с экстра-тематическими фреймовыми элементами;- антонимы. Например, прилагательные high and low помещены в фреймPOSITION_ON_A_SCALE (ПОЗИЦИЯ НА ШКАЛЕ).
Подобно этому, глаголыlove and hate относятся к фрейму EXPERIENCER_SUBJ. Однако, такназываемые конверсивы (Cruse, 1986, Апресян, 1995), такие как buy (купить)and sell (продать), которые отражают противоположные точки зрения на то жесамое событие помещаются в разные фреймы, поскольку они имеют разныенаборы участников. Также реверсивные пары привязать, отвязатьописываются в разных фреймах, поскольку соответствуют разным типамдействий.Также объединяются любые различия, возникающие вследствие речевогоконтекста:- дейксис, то есть зависимость от точки зрения говорящего (come vs. go);- диалекты языка (lorry vs.