Главная » Просмотр файлов » Тезаурусы в задачах информационного поиска. Лукашевич (2010)

Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 69

Файл №1185451 Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf) 69 страницаТезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451) страница 692020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 69)

Большойтолковый словарь русского языка дает следующее толкование значения слова «айсберг»:Айсберг – плавучая ледяная гора, отколовшаяся от прибрежного ледника, большая частькоторой находится под водой. Возникает вопрос, стоит ли описывать АЙСБЕРГ как частьледника, как часть океана? По предложенному критерию, если проанализироватьпоследствия разрушения, раскалывания конкретного айсберга, то понятно, что ни в какомледнике изменений не произойдет, окружающее море (океан) также не изменятся, поэтомуотношение понятий АЙСБЕРГ – ЛЕДНИК, АЙСБЕРГ – ОКЕАН должно описываться спомощью других отношений, а не посредством отношений ЧАСТЬ-ЦЕЛОЕ.Рассмотрим другой пример, можно ли использовать отношение ЧАСТЬ-ЦЕЛОЕдля описания отношений между понятиями ГОРОЖАНЕ -ГОРОД, ГОРОДСКОЙ СУД ГОРОД.

Город – это, прежде всего, населенный пункт, поэтому если что-то происходит сего жителями, горожанами, то это имеет воздействие и на город: так, если исчезнут всежители, то город перестанет быть населенным пунктом. Таким образом, если в тезаурусвводится понятие ГОРОЖАНЕ, то от этого понятия к понятию ГОРОД должно бытьустановлено отношение ЦЕЛОЕ.С понятием ГОРОДСКОЙ СУД ситуация иная: есть в городе суд, или нет его,переехал ли этот суд в другой город, само по себе не несет изменений в конкретныйгород.

Поэтому отношение ГОРОДСКОЙ СУД – ГОРОД должно описываться неотношением ЧАСТЬ-ЦЕЛОЕ, а другим отношением, например, отношением ассоциации.Интересно рассмотреть пример из книги (Cruse, 1986), приведенный в п.8.4, о том,что не стоит описывать, отношение между Вестминстерским аббатством и Лондоном как254часть целое, поскольку Вестминстерское аббатство - это здание, а Лондон – этогеографическое место.Но на самом деле, для Лондона как города существенными частями являютсяздания, постройки, которые составляют его существенные части. Если уничтожать зданияв городе, то и сам город может быть уничтожен.

Таким образом, городские зданиядолжны рассматриваться как части города, и, следовательно, Вестминстерское Аббатстводолжно быть описано как часть Лондона.Таким образом, описывая отношения ЧАСТЬ_ЦЕЛОЕ в информационнопоисковых ресурсах, предназначенных для автоматической обработки текстов, мыопираемся на три основных принципа:1) Часть должна быть зависима от целого;2) Уничтожение или изменение части влечет изменение целого;3) Свойство релевантности наследуется от части к целому: если в текстеобсуждается часть, то этот текст обсуждает и целое.Два первых принципа заменяют в тезаурусе для автоматического индексированияправила, установленные стандартами для традиционных информационно-поисковыхтезаурусов: независимость отношения от контекста и соответствие семантических типовчасти и целого.Однако этим принципам соответствуют также свойства, которые зависят от своихносителей, а также роли, зависимые от своих ситуаций.

В качестве примеров такихзависимых свойств можно привести следующие:грузоподъемность – транспортное средство,калорийность – пища,водоизмещение - судно,октановое число - моторное топливо.В качестве примеров зависимых ролей можно привести следующие роли:инвестор – инвестирование,дирижер - дирижирование,дубильщик, дубитель – дубление кожи.Соответственно, такие отношения мы также описываем как ЧАСТЬ-ЦЕЛОЕ.Таким образом, мы описываем как части разнообразные внутренние сущности ихарактеристики объекта, проявляющие зависимость своего существования отсуществования целого объекта.На основе таким образом определенного отношения ЧАСТЬ-ЦЕЛОЕ естественнорешается «теннисная» проблема, возникшая перед разработчиками тезауруса WordNet.Все сущности, относящиеся к той или иной сфере деятельности, описываются как еечасти.ТЕННИСЧАСТЬЧАСТЬЧАСТЬЧАСТЬТЕННИСИСТТЕННИСНЫЙ КОРТТЕННИСНЫЙ МАТЧТЕННИСНЫЙ ИНВЕНТАРЬТакое решение «теннисной» проблемы не требует наложения искусственной ижесткой системы доменов-областей, подобной системе, созданной для WordNet.Как уже было указано, обобщенные части соответствуют разного рода внутреннимхарактеристикам сущности.

Такое решение согласуется, например, с позицией ДжонаСовы (Sowa 2000), который объединяет физические части, участников, стадии, а такжесвойства в одну категорию внутренних сущностей, то есть сущностей исчезновение или255изменений которых меняет структуру или существование другой сущности. Достаточношироко трактуется отношение ЧАСТЬ-ЦЕЛОЕ и в онтологии CYC (см.

п. 8.6.3).17.3.2. Транзитивность отношенияПоскольку в тезаурусе РуТез отношение ЧАСТЬ-ЦЕЛОЕ обуславливаетсядополнительными условиями на зависимость существования части от целого, товозникает вопрос, насколько правомерно рассматривать транзитивность такогоотношения. Как было показано в п.8.4, наложение дополнительных условий натранзитивное отношение может приводить к ограниченному действию этого свойства.Вместе с тем, в число аксиом, которые обычно постулируются для отношенияонтологической зависимости, входит и аксиома транзитивности (Varzi, 2006).

Такимобразом, транзитивны и базовое отношение ЧАСТЬ-ЦЕЛОЕ и дополнительнонакладываемое на него условие, что дает возможность использования этого отношениядля логического вывода в процессе обработки текстов на основе тезауруса РуТез. Такойлогический вывод полезен при решении многих задач информационного поиска, таких какавтоматическое рубрицирование, автоматическое расширение запроса, поиск ответа навопрос.За счет использования транзитивности отношений онтологической зависимостиформируются достаточно длинные цепочки вывода (цепочка слева - направосоответствует отношениям от части к целому):ОБВИНЯЕМЫЙ ПО ДЕЛУ  СУДЕБНОЕ ОБВИНЕНИЕ СУДЕБНЫЙ ПРОЦЕСС  СУДОПРОИЗВОДСТВО  СУДЕБНАЯ СИСТЕМА ПРАВОВАЯ СИСТЕМАДЕНЕЖНАЯ БАЗА  ДЕНЕЖНОЕ ОБЕСПЕЧЕНИЕ ДЕНЕЖНОЕ ОБРАЩЕНИЕ  ДЕНЕЖНАЯ СИСТЕМА ФИНАНСОВАЯ СИСТЕМА  ЭКОНОМИКААПТЕКАРЬ  АПТЕКА  ЛЕКАРСТВЕННОЕ ОБЕСПЕЧЕНИЕ МЕДИЦИНСКАЯ ПОМОЩЬ  МЕДИЦИНА  ЗДРАВООХРАНЕНИЕТакие цепочки интерпретируются следующим образом: если в тексте обсуждаетсяобвиняемый по делу, то этот текст релевантен и таким темам как судебное обвинение,судебный процесс, судопроизводство, судебная система, правовая система.Как видно, отношение ЧАСТЬ-ЦЕЛОЕ с дополнительным условием зависимостиработает не только для таких наиболее часто ассоциирующихся с этим отношением типовсущностей как физические объекты, но и для весьма сложных для описания абстрактныхсущностей.Используемый в настоящее время набор свойств отношения ЧАСТЬ-ЦЕЛОЕ таков:ЧАСТЬ (X,Y)<-> ЦЕЛОЕ (Y, X)ЦЕЛОЕ (X,Y)  ЦЕЛОЕ (Y, Z) -> ЦЕЛОЕ (X, Z) – транзитивность отношенияВЫШЕ (X,Y)  ЦЕЛОЕ (Y, Z) -> ЦЕЛОЕ (X, Z) – наследование отношения ЦЕЛОЕпо отношению ВЫШЕ-НИЖЕ.В настоящее время цепочки отношений ЧАСТЬ-ЦЕЛОЕ используются приприменении тезауруса РуТез в задачах автоматической рубрикации, при расширениизапроса пользователя, поиска ответов на вопросы, разрешении лексическоймногозначности, построении тематического представления текста.Таким образом, при моделировании отношения ЧАСТЬ-ЦЕЛОЕ в тезаурусе РуТезосновными задачами являлись следующие:- обеспечение наследования свойства релевантности от части к целому: если втексте обсуждается часть, то этот текст релевантен и обсуждению целого;256обеспечение транзитивности отношения ЧАСТЬ-ЦЕЛОЕ как основы длялогического вывода в процессе обработки текстов.В качестве основных принципов моделирования был выбран не лингвистическийподход с его опорой на языковые тесты, которые часто неоднозначны и контекстнозависимы, а онтологический анализ отношений, который строится на рассмотренииотношения онтологической зависимости существования понятий и влияния ситуацииразрушения предполагаемой части на состояние целого.-17.3.3.

Как описать отношение ЧАСТЬ-ЦЕЛОЕ,если часть не является зависимойВ случае если понятие-часть может принадлежать нескольким целым, то можноиспользовать несколько возможностей для описания такого отношения, которые обычносвязаны с введением дополнительных понятий.Первый способ подходит в тех случаях, если у исходной части есть подвид,который является зависимой частью исходного целого.Так, например, неправильно описывать в тезаурусе, что ДВИГАТЕЛЬ – это частьАВТОМОБИЛЯ, поскольку не все двигатели являются частями автомобиля.

Необходимоввести дополнительное понятие АВТОМОБИЛЬНЫЙ ДВИГАТЕЛЬ как вид понятияДВИГАТЕЛЬ и описать понятие АВТОМОБИЛЬНЫЙ ДВИГАТЕЛЬ как частьАВТОМОБИЛЯ.Тем же способом можно воспользоваться для описания отношения ДЕРЕВО – ЛЕС:для этого могут быть дополнительно введены понятия ЛЕСНОЕ РАСТЕНИЕ, ЛЕСНОЕДЕРЕВО (ДЕРЕВО В ЛЕСУ).Другим способом является введение обобщающего понятия для всех целых, ккоторым может принадлежать часть и установить отношение между частью и именноэтим целым.Здесь можно привести пример из химии: альдегидная группа входит в такиесоединения как альдегидокислоты, альдегидоспирты и т.п., но имеется такоеобобщающее выражение как альдегидное соединение.

Таким образом, можно ввестипонятие АЛЬДЕГИДНОЕ СОЕДИНЕНИЕ описать как его виды понятияАЛЬДЕГИДОКИСЛОТЫ и АЛЬДЕГИДОСПИРТЫ, а понятию АЛЬДЕГИДНАЯ ГРУППАустановить отношение ЦЕЛОЕ с понятием АЛЬДЕГИДНОЕ СОЕДИНЕНИЕ (рис. 17.2).Альдегидное соединениечастьнижеАльдегиднаягруппаАльдегидокислотынижеАльдегидоспиртыРис. 17.2 Описание взаимоотношений между понятиямиАЛЬДЕГИДНАЯ ГРУППА, АЛЬДЕГИДОКИСЛОТЫ, АЛЬДЕГИДОСПИРТЫВ некоторых случаях можно воспользоваться обоими методами.

Так, для описанияотношения РЕАКТИВНЫЙ САМОЛЕТ – РЕАКТИВНЫЙ ДВИГАТЕЛЬ, может бытьвведено дополнительное понятие АВИАЦИОННЫЙ РЕАКТИВНЫЙ ДВИГАТЕЛЬ и/илидополнительное понятие РЕАКТИВНЫЕ СРЕДСТВА ПЕРЕДВИЖЕНИЯ.При таких операциях ввода дополнительных понятий мы стараемся использоватьте языковые выражения, которые реально существуют в описываемой предметной257области.

Если необходимого языкового выражения не существует, то может быть приняторешение не описывать такое отношение часть-целое.Имеется только одна возможность «смягчения» позиции по поводу описаниязависимых частей, которая возникает в тех случаях, когда некоторая часть входит в целоев подавляющем большинстве случаев, может устанавливаться по умолчанию. В такихслучаях, такое отношение вводится в тезаурус, но помечается специальной пометкой «В»(Лукашевич, Добров, 2001).17.3.4. Сложные случаи описания отношений ЧАСТЬ-ЦЕЛОЕСуществует ряд факторов, усложняющих описание отношений ЧАСТЬ-ЦЕЛОЕ.Одним из таких факторов является возможная отделимость части от целого внекоторый момент времени. Так, например, в широкой общественно-политическойобласти, в состав которой входит как сельское хозяйство, так и сфера торговли, такаяпроблема отделимости возникает с отношением между понятиями ЯБЛОКО и ЯБЛОНЯ.Пока яблоко растет, оно является частью яблони.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
308
Средний доход
с одного платного файла
Обучение Подробнее