Главная » Просмотр файлов » Тезаурусы в задачах информационного поиска. Лукашевич (2010)

Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 26

Файл №1185451 Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf) 26 страницаТезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451) страница 262020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 26)

Пример описания понятия ВИРУСНЫЙ МЕНИНГИТ изонтологии SNOWMED CTИсследование показало, что ресурс содержит 269864 понятия. 196237 понятия неимеют понятий-потомков – понятия-листья. Из 73267 понятий с понятиями-потомками, 23174 понятия (31,5%) имеют только одно понятие-потомок. 8034 понятия имеют более 10непосредственных потомков (11%), и 150 понятий имеют более 99 потомков, что, видимо,связано с недостаточной проработанностью классификации.Каждое понятия, за исключением корня, имеет хотя бы одного родителя.

Числородителей понятия может быть от 1 до 13.Из рассмотренных 377681 пар потомок-родитель, 51% не проявили никакогоразличия между описаниями понятия-потомка и понятия-родителя.В 7226 случаях некоторые роли, присутствующие у понятия-родителя, ненаследовались и не уточнялись в понятии-потомке. В 21799 случаях, хотя у родителя и употомка присутствует одна и та же роль, значения этой роли не являются ниидентичными, не состоят ни в таксономическом отношении, ни в отношении часть-целое.Обычно эта проблема возникает у понятий с множественными родителями: роль, котораяне соответствует роли одного родителя, обычно находит свое соответствие с рольюдругого родителя.98Качественный анализ понятий с одним понятием-потомком показал, что этоявление может быть связано с тремя разными ситуациями:- неполнота описания;- единственное нижестоящее понятие представляет собой гибрид между двумяродительскими понятиями;- понятие-потомок и понятие-родитель не демонстрируют никаких отличий вописании, и, таким образом, скорее всего, нижестоящий класс являетсяизлишним.5.2.

Критерии для ввода нового понятияПри разработке онтологии достаточно сложным вопросом являются критерииввода новых понятий. На практике такие критерии связаны обычно с проверкой того,добавляет ли ввод нового понятия полезную и важную информацию для работыпредполагаемого приложения.Так, в работе (Noy, McGuinness, 2001) указывается, что необходимость введениянового класса для онтологии может возникнуть, если1) у предполагаемого класса есть слот, которого нет у других классов, например,красные вина характеризуются свойством «уровень танина»,2) у предполагаемого класса есть ограничения на слот, отличные от ограниченийдругих классов, например, у класса ДЕСЕРТНЫЕ ВИНА – значение слотаСОДЕРЖАНИЕ _САХАРА – «сладкий»,3) у предполагаемого класса есть специфические отношения.Если в разрабатываемой онтологии для понятия могут быть определены атрибутыпосредством описания слота в фрейме понятия, то может возникнуть вопрос, в какихслучаях нужно определить новый класс (понятие онтологии), а в каких случаях можноввести лишь различные значения атрибута.На примере онтологии вин (Noy, McGuinness, 2001) приводят следующий примеранализа ситуации в случае предполагаемого ввода нового понятия БЕЛОЕ ВИНО впротивовес вводу различных значений слота ЦВЕТ для понятия ВИНО.Авторы работы предлагают проанализировать следующие факторы:- насколько важно БЕЛОЕ ВИНО для предметной области;- если понятия с разными значениями слота становятся ограничениями дляразличных слотов в других классах, то для разделения следует создать новыйкласс.

В противном случае разделение представляется в значении слота;- какова изменчивость свойства, то есть как часто экземпляр класса меняетзначения этого свойства. Если у экземпляра значение свойства постоянно – этоявляется дополнительным критерием для введения отдельного класса с такимзначением свойства.Авторы онтологии MikroKosmos (Nirenburg, Raskin, 2004) излагают сходныепринципы введения нового понятия в лингвистическую онтологию.

Они обращаютвнимание на следующие положения:- желаемый уровень подробности. Если предполагается, что в даннойпредметной области не понадобится то или иное знание об объектах илиситуациях предметной области, то не нужно вводить соответствующиеединицы в онтологию;- понимание того, является ли значение общим для многих языков или являетсясвойственной данному изменению отклонению от языково-независимогозначения;- понимание того, в каких процедурах и процессах работы системы могутвозникнуть проблемы, если не будет добавлено данное понятие.Хорошими основаниями для ввода нового понятия также являются:99-отличие понятия-потомка от понятия-родителя в наборе отношений, не считаяотношения к видовым понятиям;отличие в более чем одном атрибуте;если ограничение на заполнения какого-то слота в свойстве понятия-родителясодержат сложную дизъюнктивную формулу, а вводимое понятие имеетзначительно более строгие ограничения, то такое значение имеет хорошиеоснования для ввода в онтологию в качестве понятия.5.3.

Понятие и значение в лингвистических онтологияхВ процессе разработки лингвистической онтологии, то есть онтологии, котораяразрабатывается для обработки текстов на естественном языке и/или ставит своей цельюадекватный учет существующих языковых значений, возникают практические вопросысоотношения понятий онтологии и представленных в языке значений.Представляется, что при вводе понятий лингвистической онтологии также важнообеспечить выполнение требований к понятиям онтологии, перечисленных в разделе 5.1.,связанных с четкой отличимостью понятия от соседних по иерархии понятий.

Посколькуименно эти требования создают основу для создания последовательного описанияотношений и иерархии онтологии, а также снижают зависимость структуры онтологии отестественного языка, носителями которого создается эта онтология.При этом возникают три основные проблемы, для преодоления которыхнеобходимо иметь четко сформулированные принципы:- проблема отличения понятия от его имени, поскольку непросто отличитьпонятие и его название, если работа ведется с языковыми значениями,- проблема разбиения на понятия совокупности значений близких по смыслуслов – квазисинонимов,- проблема выделения разных понятий для отражения близких значений одного итого же многозначного слова.В следующих подразделах мы подробно рассмотрим эти проблемы.5.3.1.

Разбиение на понятия совокупности значений квазисинонимовКак известно, в любом языке существуют совокупности близких по смыслу слов –квазисинонимов (Апресян, 1995). Несмотря на свою смысловую близость, квазисинонимымогут различаться по понятийному содержанию, сфере употребления, оценочномусодержанию, сочетаемости и др. Неслучайно существует специальный жанрсинонимических словарей (НОСС, 2003), которые подробно разъясняют особенностиупотребления таких синонимов. При этом значения многих квазисинонимов различаютсяне по одному параметру, а по нескольким, видоизменяются в зависимости от контекста.Для многих таких совокупностей квазисинонимов чрезвычайно трудно установитьоднозначное соответствие на других языках, поскольку, чаще всего, на другом языкеданной совокупности квазисинонимов соответствует другая совокупность близких посмыслу слов, которая характеризуется своей системой параметрических различий и,соответственно, своими особенностями.Если при описании соотношений между значениями руководствоватьсяпринципами возможности синонимичной подстановки в одни и те же предложения, какбыло принято при создании Принстонского WordNet (см.

главу 2), то это означает, чтопроизводится попытка построить классификацию сразу по нескольким основаниям,поскольку синонимическая замена слова должна учитывать и понятийный, и стилевой, иоценочный и другие компоненты значения.Понятно, что такое построение иерархии сразу по нескольким основаниямосуществить часто невозможно, все построение становится очень изменчивым при100переходе от языка к языку. Именно в таких ситуациях проявляется серьезная зависимостьпостроенной классификации от языка.Главным компонентом классификации естественно является понятийныйкомпонент значения, который часто очень сложно отделить от других компонентов. Так,например, сколько понятий онтологии оптимально (и на основе каких принципов) следуетсопоставить следующему ряду слов со значением ОШИБКА: ошибка, погрешность,недосмотр, просмотр, ляп, промах, оплошность, осечка, прокол, упущение, недочет, атакже ослышка, описка, опечатка, оговорка.В качестве другого примера может быть рассмотрена группа слов, относящаяся кситуации «Драка» (система значений дана по Большому толковому словарю русскогоязыка - 1998).

Здесь также возникает вопрос, как эта россыпь значений должна бытьотражена в системе понятий онтологии, описывающей ситуацию драки:драться1. бить друг друга, устраивать дракуподраться1. сов. к Драться2. Драться некоторое времяпередраться 1. Поссориться, подраться друг с другом (о двух лицах)2. Подраться (обо всех, о многих)3. Поочередно подраться со всеми, со многими.свалка 5. всеобщая драка, потасовкапотасовка - ссора с дракойпобоище - ожесточенная кровавая дракамордобой - битье по лицупоножовщина - драка с применением ножей.Для снижения зависимости лингвистической онтологии от конкретного языка вработах (Edmonds, Hirst, 2000; Hirst, 2003) предлагается для описания близких по смыслуслов в лингвистических онтологиях ввести еще один уровень представления понятийно-семантический уровень.Понятийно-семантический уровень задает относительно грубую понятийнуюиерархическую систему, которая основывается на денотативных, независимых отконтекста, свойствах значений слов.

Каждому такому понятию поставлен в соответствиенабор синонимов, а их особенности (стилистические, отношение говорящего, коннотациии т.п.) описываются в дополнительных, внутрипонятийных структурах.Авторы работы (Edmonds, Hirst, 2000) подчеркивают, что часто может оказаться,что определить, какие близкие по смыслу слова лучше описать в рамках внутреннейструктуры понятия, а какие разнести в разные понятия, очень непросто. C одной стороны,можно надеяться на интуицию лингвиста. С другой стороны, возможно, взгляд напонятийную структуру с точки зрения другого языка может действительно лучшепроявить границы понятий.Таким образом, лингвистическая онтология, которая хоть и учитываетсуществующие лексические значения, все же должна оставаться онтологией. По общимпринципам организации онтологической иерархии (см.раздел 5.1) ее основные элементы понятия должны иметь четкие, независимые от контекста отличия от соседних понятий.Чем четче эти различия между понятиями, тем более независимой от конкретногоестественного языка становится онтология, несмотря на то, что источником для введениятого или иного понятия могло быть значение слова или выражения в конкретноместественном языке.1015.3.2.

Выделение разных понятий для отражения близких значенийодного и того же словаСложным случаем при разработке лингвистических онтологий является наличие услова нескольких близких по смыслу значений. Поскольку общеизвестно, насколькотяжело системе автоматической обработки текстов бывает разобраться с близкимизначениями слова, то также важно выработать принципы для описания такихсовокупностей близких значений отдельногослова.Как мы видели в разделе 2.5., при применении WordNet были выявлены серьезныепроблемы приложений в связи со слишком большим количеством описанных значений,после чего разработчиками было проведено значительное количество экспериментов, сцелью кластеризации значений, выявлению групп близких значений, позволяющихулучшать качество применения WordNet в автоматической обработке текстов.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее