Главная » Просмотр файлов » Тезаурусы в задачах информационного поиска. Лукашевич (2010)

Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 15

Файл №1185451 Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf) 15 страницаТезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451) страница 152020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 15)

Например,часто утверждается, что колесо – это часть транспортного средства, но тогда сани неявляются транспортным средством. Однако часто такая ситуация является следствиемтого, что понятие необходимого уровня не лексикализовано в языке. Для данногоконкретного примера WordNet вводит специальное дополнительное понятие {wheeledvehicle} – колесное транспортное средство.Еще одним отношением, установленным для существительных, являетсяотношение антонимии.

Отношение антонимии является отношением между конкретнымисловами, не между синсетами. Кроме того, отношение антонимии не наследуется насинсеты-гипонимы. Предполагается, что отношение антонимии должно быть явнымобразом описано. Примерами отношений антонимии в WordNet являются следующие:победа – поражение, счастье – несчастье, мужчина – женщина.2.3. Описание прилагательных в WordNetПрилагательные в WordNet делятся на качественные прилагательные иотносительные (Miller K., 1998).Семантическое описание качественных прилагательных значительно отличается отописания других основных категорий слов и базируется не на отношении гипонимии, а наотношении антонимии.

Авторы считают, что важность этого отношения для качественныхприлагательных проявляется в психолингвистических тестах: когда человека просятназвать ассоциацию на качественное прилагательное, он чаще всего называет его антоним.Например, самая частая ассоциация на слово good (хороший) – это слово bad (плохой) инаоборот.Важность антонимии для организации качественных прилагательных становитсяпонятной, если учесть, что функцией этих прилагательных является выражение величин55атрибутов, и эти атрибуты обычно являются биполярными. Антонимичныеприлагательные обычно выражают противоположные полюса атрибута.Авторы WordNet подчеркивают, что не всегда противоположные по смыслу словарассматривается носителями языка как антонимы.

Так, например, два близких по смыслуслова heavy (тяжелый), weighty (тяжеловесный) имеют два разных антонима light(легкий), weightless (невесомый). Кроме того, некоторые слова не имеютнепосредственных антонимов, например, слово ponderous (громоздкий). Возможныйантоним - прилагательное light - является безусловным антонимом прилагательного heavy.Если отношение антонимии возникает между выделенными парамиприлагательных, то возникает вопрос, куда отнести такое прилагательное как ponderous.Было принято решение такие прилагательные описывать через отношение сходства содним из тех прилагательных, которые имеют антонимы.Таким образом, качественные прилагательные в WordNet представлены какбиполярные кластеры: центральным является отношение антонимии, для каждого из двухантонимов определены близкие по смыслу прилагательные.

Например, описание парызначений прилагательных slow (медленный, медленно двигающийся) и fast (быстрый,быстро двигающийся) выглядит следующим образом: указана пара антонимов slow (vs.fast), для которых описываются так называемые головные синсеты, приводятсятолкования и примеры. Для каждого головного синсета описываются «сателлитные»синсеты, которые представляют синсеты, семантически близкие соответствующемуголовному синсету (и часто являющиеся его специализациями) такие, как lazy (ленивый,медленно двигающийся), slow-moving (медленно двигающийся) и др.slow (vs.

fast) -- (not moving quickly; taking a comparatively long time; "a slow walker";"the slow lane of traffic"; "her steps were slow"; "he was slow in reacting to the news";"slow but steady growth")=> bumper-to-bumper -- (used of traffic; "bumper-to-bumper traffic")=> dilatory, laggard, poky, pokey -- (wasting time)=> dragging -- (passing painfully or tediously slowly; "the dragging minutes")=> drawn-out -- ((used of speech) uttered slowly with prolonged vowels)=> lazy -- (moving slowly and gently; "up a lazy river"; "lazy white clouds"; "at a lazypace")=> long-play, long-playing -- ((used of records) playing at a slower speed and for alonger time than earlier records)=> slow-moving -- (moving slowly; "slow-moving cars")=> sluggish, sulky -- (with little movement; very slow; "a sluggish stream")Отдельную группу составляют прилагательные цвета.

Все оттенки цветовпредставляются как синсеты-сателлиты к прилагательному colored (цветной), которомупротивопоставлено как антоним прилагательное uncolored (нецветной). Оттенки от белогок черному представлены как семантически близкие синсеты к прилагательному achromatic(бесцветный).Значение относительных прилагательных представлено как отсылка ксоответствующему синсету существительных. Для некоторых прилагательных одно иззначений представлено как качественное прилагательное через антонимическую пару, авторое как относительное прилагательное. Например, для прилагательного agricultural(сельский, сельскохозяйственный) первое значение отсылает к синсету слова agriculture(сельское хозяйство), а второе значение представлено как элемент пары антонимовсельский – городской.56Sense 1agricultural -- (relating to or used in or promoting agriculture or farming; "agriculturalengineering"; "modern agricultural (or farming) methods"; "agricultural (or farm)equipment"; "an agricultural college")Pertains to noun agriculture (Sense 2)=>farming, agriculture, husbandry -- (the practice of cultivating the land or raisingstock)=> cultivation -- ((agriculture) production of food by preparing the land to grow crops)Sense 2agrarian, agricultural, farming(prenominal) -- (relating to rural matters; "an agrarian(or agricultural) society"; "farming communities")=> rural (vs.

urban) -- (living in or characteristic of farming or country life; "ruralpeople"; "large rural households"; "unpaved rural roads"; "an economy that isbasically rural")2.4. Описание глаголов в WordNetДля описания глаголы были разделены на семантические поля. На первом этапебыли отделены глаголы, обозначающие действия и события, от глаголов, обозначающихсостояния. Первая группа глаголов была разделена на 14 семантических полей: глаголыдвижения, восприятия, контакта, коммуникации, соревнования, изменения, познания,потребления, создания, эмоций, обладания, ухода за телом, и глаголы, относящиеся ксоциальному поведению.Авторы WordNet подчеркивают, что границы между группами являютсядостаточно расплывчатыми.

Например, многие глаголы не могут однозначноклассифицированы как глаголы познания или коммуникации (например, подтверждать,судить и др.). Также, например, глагол whistle (свистеть) в предложении «The bulletwhistled past him» (Пуля просвистела мимо него) может классифицироваться и как глаголиздания звука, и как глагол движения. Если такие глаголы представлять как однозначные,они должны относиться к более чем одному семантическому полю.

В WordNet глаголычаще описывались как полисемичные, если обнаруживалось, что они могут быть отнесеныодновременно к разным семантическим полям.Между глаголами в WordNet устанавливается свой набор отношений.Отношение следования (Entailment). Отношение устанавливается междусинсетами глаголов V1 и V2, если из предложения «Someone V1» логически следует«Someone V2».

Например, из того, что «Человек идет», следует, что «Человек делаетшаг», поэтому:Sense 1walk, go on foot, foot, leg it, hoof, hoof it -- (use one's feet to advance; advance by steps)=> step, take a stepДругой пример: из «храпеть» следует «спать», так как из предложения «Онхрапит», следует «Он спит».Отношение тропонимии. Лингвистический тест, который использовался дляопределения гипонимии между существительными, «An x is an y» не подходит дляглаголов, поскольку требует, чтобы x и y были существительными. Поэтомупотребовалось предложить другой лингвистический текст для установления57иерархических отношений между глаголами а также было введено специальное названиеотношения – тропонимия.

Используемый лингвистический тест таков: «To V1 is to V2 insome particular manner» (Делать V1 означает делать V2 особым способом), например,«Mumbling is talking is some particular manner» («Бормотать – это говорить особымспособом»).Отношение тропонимии представляет собой специальный вид отношенияследования.Глагольные иерархии, образованные отношением тропонимии, образуют болееузкую, но более кустистую структуру, чем существительные. В подавляющембольшинстве случаев число уровней иерархии не превышает четырех.Отношение причины.

Отношение причины связывает два глагольных синсета,один из которых может быть назван каузатив, например, давать, а второй результатив(иметь).Кроме того, WordNet устанавливает отношение причины от каузативныхтранзитивных глаголов к соответствующим инхоативным нетранзитивным значениям техже слов. В качестве примеров можно рассмотреть такие глаголы как blacken (чернить –чернеть), develop (развивать – развиваться), break (сломать – сломаться), shrink(сократить – сократиться).Отношение причины систематически представлено среди глаголов перемещения,соединяя каузативное и некаузативное употребление blow (выдуть – выдуться).Отношение причины также может быть рассмотрено как специальный случайследования.

Если V1 необходимо вызывает V2, значит, из V1 также следует V2.2.5. Исследования конкретных проблем представления лексической информации вWordNet и последующие модификации тезаурусаПоявление WordNet и возможность его свободного использования вызвалибольшое число исследований по применению этого тезауруса в самых различныхприложениях автоматической обработки текстов.

Некоторые из этих приложений ирезультаты применения в них WordNet будут рассмотрены в третьей части книги.Большое количество экспериментов привело к массовому выявлению иобсуждению проблем и недостатков WordNet, препятствующих его эффективномуприменению.В данном разделе мы рассмотрим некоторые из таких проблем, возникшиедискуссии, а также изменения в структуре новых версий WordNet, которые были сделаныв результате этих обсуждений.2.5.1.

Отсутствие отношений между частями речиПри разработке WordNet был выдвинут принцип раздельного описания разныхчастей речи. Между различными частями речи, имеющими одинаковое значение, не былоустановлено никаких отношенийТак, например, такие синсеты как adorn1 (украшать) и adornment2 (процессукрашения) не были никак связаны между собой:Adorn1 -- (make more attractive by adding ornament, colour, etc. )Adornment2 -- (the action of decorating yourself with something colorful and interesting)Это вызывало серьезные проблемы в приложениях, поскольку одно и та же мысльмогла быть выражена разными частями речи (Climent и др., 1996).Кроме того, в различных языках для выражения одной и той же идеи могутиспользоваться лексемы разных частей речи. Поэтому иерархии синсетов, построенные наоснове конкретных частей речи, становятся в большой мере зависимыми от естественного58языка разработки, поскольку в некотором естественном языке может не оказатьсявозможности выразить некоторое понятие той или иной частью речи.Начиная с версии WordNet 2.0, в ресурс были введены отношения междуоднокоренными синсетами, относящимися к разным частям речи и связанными междусобой по смыслу.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6549
Авторов
на СтудИзбе
300
Средний доход
с одного платного файла
Обучение Подробнее