Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 15
Текст из файла (страница 15)
Например,часто утверждается, что колесо – это часть транспортного средства, но тогда сани неявляются транспортным средством. Однако часто такая ситуация является следствиемтого, что понятие необходимого уровня не лексикализовано в языке. Для данногоконкретного примера WordNet вводит специальное дополнительное понятие {wheeledvehicle} – колесное транспортное средство.Еще одним отношением, установленным для существительных, являетсяотношение антонимии.
Отношение антонимии является отношением между конкретнымисловами, не между синсетами. Кроме того, отношение антонимии не наследуется насинсеты-гипонимы. Предполагается, что отношение антонимии должно быть явнымобразом описано. Примерами отношений антонимии в WordNet являются следующие:победа – поражение, счастье – несчастье, мужчина – женщина.2.3. Описание прилагательных в WordNetПрилагательные в WordNet делятся на качественные прилагательные иотносительные (Miller K., 1998).Семантическое описание качественных прилагательных значительно отличается отописания других основных категорий слов и базируется не на отношении гипонимии, а наотношении антонимии.
Авторы считают, что важность этого отношения для качественныхприлагательных проявляется в психолингвистических тестах: когда человека просятназвать ассоциацию на качественное прилагательное, он чаще всего называет его антоним.Например, самая частая ассоциация на слово good (хороший) – это слово bad (плохой) инаоборот.Важность антонимии для организации качественных прилагательных становитсяпонятной, если учесть, что функцией этих прилагательных является выражение величин55атрибутов, и эти атрибуты обычно являются биполярными. Антонимичныеприлагательные обычно выражают противоположные полюса атрибута.Авторы WordNet подчеркивают, что не всегда противоположные по смыслу словарассматривается носителями языка как антонимы.
Так, например, два близких по смыслуслова heavy (тяжелый), weighty (тяжеловесный) имеют два разных антонима light(легкий), weightless (невесомый). Кроме того, некоторые слова не имеютнепосредственных антонимов, например, слово ponderous (громоздкий). Возможныйантоним - прилагательное light - является безусловным антонимом прилагательного heavy.Если отношение антонимии возникает между выделенными парамиприлагательных, то возникает вопрос, куда отнести такое прилагательное как ponderous.Было принято решение такие прилагательные описывать через отношение сходства содним из тех прилагательных, которые имеют антонимы.Таким образом, качественные прилагательные в WordNet представлены какбиполярные кластеры: центральным является отношение антонимии, для каждого из двухантонимов определены близкие по смыслу прилагательные.
Например, описание парызначений прилагательных slow (медленный, медленно двигающийся) и fast (быстрый,быстро двигающийся) выглядит следующим образом: указана пара антонимов slow (vs.fast), для которых описываются так называемые головные синсеты, приводятсятолкования и примеры. Для каждого головного синсета описываются «сателлитные»синсеты, которые представляют синсеты, семантически близкие соответствующемуголовному синсету (и часто являющиеся его специализациями) такие, как lazy (ленивый,медленно двигающийся), slow-moving (медленно двигающийся) и др.slow (vs.
fast) -- (not moving quickly; taking a comparatively long time; "a slow walker";"the slow lane of traffic"; "her steps were slow"; "he was slow in reacting to the news";"slow but steady growth")=> bumper-to-bumper -- (used of traffic; "bumper-to-bumper traffic")=> dilatory, laggard, poky, pokey -- (wasting time)=> dragging -- (passing painfully or tediously slowly; "the dragging minutes")=> drawn-out -- ((used of speech) uttered slowly with prolonged vowels)=> lazy -- (moving slowly and gently; "up a lazy river"; "lazy white clouds"; "at a lazypace")=> long-play, long-playing -- ((used of records) playing at a slower speed and for alonger time than earlier records)=> slow-moving -- (moving slowly; "slow-moving cars")=> sluggish, sulky -- (with little movement; very slow; "a sluggish stream")Отдельную группу составляют прилагательные цвета.
Все оттенки цветовпредставляются как синсеты-сателлиты к прилагательному colored (цветной), которомупротивопоставлено как антоним прилагательное uncolored (нецветной). Оттенки от белогок черному представлены как семантически близкие синсеты к прилагательному achromatic(бесцветный).Значение относительных прилагательных представлено как отсылка ксоответствующему синсету существительных. Для некоторых прилагательных одно иззначений представлено как качественное прилагательное через антонимическую пару, авторое как относительное прилагательное. Например, для прилагательного agricultural(сельский, сельскохозяйственный) первое значение отсылает к синсету слова agriculture(сельское хозяйство), а второе значение представлено как элемент пары антонимовсельский – городской.56Sense 1agricultural -- (relating to or used in or promoting agriculture or farming; "agriculturalengineering"; "modern agricultural (or farming) methods"; "agricultural (or farm)equipment"; "an agricultural college")Pertains to noun agriculture (Sense 2)=>farming, agriculture, husbandry -- (the practice of cultivating the land or raisingstock)=> cultivation -- ((agriculture) production of food by preparing the land to grow crops)Sense 2agrarian, agricultural, farming(prenominal) -- (relating to rural matters; "an agrarian(or agricultural) society"; "farming communities")=> rural (vs.
urban) -- (living in or characteristic of farming or country life; "ruralpeople"; "large rural households"; "unpaved rural roads"; "an economy that isbasically rural")2.4. Описание глаголов в WordNetДля описания глаголы были разделены на семантические поля. На первом этапебыли отделены глаголы, обозначающие действия и события, от глаголов, обозначающихсостояния. Первая группа глаголов была разделена на 14 семантических полей: глаголыдвижения, восприятия, контакта, коммуникации, соревнования, изменения, познания,потребления, создания, эмоций, обладания, ухода за телом, и глаголы, относящиеся ксоциальному поведению.Авторы WordNet подчеркивают, что границы между группами являютсядостаточно расплывчатыми.
Например, многие глаголы не могут однозначноклассифицированы как глаголы познания или коммуникации (например, подтверждать,судить и др.). Также, например, глагол whistle (свистеть) в предложении «The bulletwhistled past him» (Пуля просвистела мимо него) может классифицироваться и как глаголиздания звука, и как глагол движения. Если такие глаголы представлять как однозначные,они должны относиться к более чем одному семантическому полю.
В WordNet глаголычаще описывались как полисемичные, если обнаруживалось, что они могут быть отнесеныодновременно к разным семантическим полям.Между глаголами в WordNet устанавливается свой набор отношений.Отношение следования (Entailment). Отношение устанавливается междусинсетами глаголов V1 и V2, если из предложения «Someone V1» логически следует«Someone V2».
Например, из того, что «Человек идет», следует, что «Человек делаетшаг», поэтому:Sense 1walk, go on foot, foot, leg it, hoof, hoof it -- (use one's feet to advance; advance by steps)=> step, take a stepДругой пример: из «храпеть» следует «спать», так как из предложения «Онхрапит», следует «Он спит».Отношение тропонимии. Лингвистический тест, который использовался дляопределения гипонимии между существительными, «An x is an y» не подходит дляглаголов, поскольку требует, чтобы x и y были существительными. Поэтомупотребовалось предложить другой лингвистический текст для установления57иерархических отношений между глаголами а также было введено специальное названиеотношения – тропонимия.
Используемый лингвистический тест таков: «To V1 is to V2 insome particular manner» (Делать V1 означает делать V2 особым способом), например,«Mumbling is talking is some particular manner» («Бормотать – это говорить особымспособом»).Отношение тропонимии представляет собой специальный вид отношенияследования.Глагольные иерархии, образованные отношением тропонимии, образуют болееузкую, но более кустистую структуру, чем существительные. В подавляющембольшинстве случаев число уровней иерархии не превышает четырех.Отношение причины.
Отношение причины связывает два глагольных синсета,один из которых может быть назван каузатив, например, давать, а второй результатив(иметь).Кроме того, WordNet устанавливает отношение причины от каузативныхтранзитивных глаголов к соответствующим инхоативным нетранзитивным значениям техже слов. В качестве примеров можно рассмотреть такие глаголы как blacken (чернить –чернеть), develop (развивать – развиваться), break (сломать – сломаться), shrink(сократить – сократиться).Отношение причины систематически представлено среди глаголов перемещения,соединяя каузативное и некаузативное употребление blow (выдуть – выдуться).Отношение причины также может быть рассмотрено как специальный случайследования.
Если V1 необходимо вызывает V2, значит, из V1 также следует V2.2.5. Исследования конкретных проблем представления лексической информации вWordNet и последующие модификации тезаурусаПоявление WordNet и возможность его свободного использования вызвалибольшое число исследований по применению этого тезауруса в самых различныхприложениях автоматической обработки текстов.
Некоторые из этих приложений ирезультаты применения в них WordNet будут рассмотрены в третьей части книги.Большое количество экспериментов привело к массовому выявлению иобсуждению проблем и недостатков WordNet, препятствующих его эффективномуприменению.В данном разделе мы рассмотрим некоторые из таких проблем, возникшиедискуссии, а также изменения в структуре новых версий WordNet, которые были сделаныв результате этих обсуждений.2.5.1.
Отсутствие отношений между частями речиПри разработке WordNet был выдвинут принцип раздельного описания разныхчастей речи. Между различными частями речи, имеющими одинаковое значение, не былоустановлено никаких отношенийТак, например, такие синсеты как adorn1 (украшать) и adornment2 (процессукрашения) не были никак связаны между собой:Adorn1 -- (make more attractive by adding ornament, colour, etc. )Adornment2 -- (the action of decorating yourself with something colorful and interesting)Это вызывало серьезные проблемы в приложениях, поскольку одно и та же мысльмогла быть выражена разными частями речи (Climent и др., 1996).Кроме того, в различных языках для выражения одной и той же идеи могутиспользоваться лексемы разных частей речи. Поэтому иерархии синсетов, построенные наоснове конкретных частей речи, становятся в большой мере зависимыми от естественного58языка разработки, поскольку в некотором естественном языке может не оказатьсявозможности выразить некоторое понятие той или иной частью речи.Начиная с версии WordNet 2.0, в ресурс были введены отношения междуоднокоренными синсетами, относящимися к разным частям речи и связанными междусобой по смыслу.