Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 71
Текст из файла (страница 71)
Напомним пример внешнейконцептуальной зависимости (п.9.2.):гараж концептуально зависит от автомобиляГараж как постройка не перестанет существовать, если в мире исчезнут всеавтомобили, но ее свойство «быть_гаражом» зависит от существования класса сущностей«автомобили».«Физическое» объяснение нашего выбора подтипа отношения внешнейонтологической зависимости связано с тем, что в текстах широких предметных областей,мы больше всего имеем дело не с конкретными сущностями, а с понятиями, концептами,классами, и, обнаружив в тексте то или иное понятие, должны уметь предположитьнаиболее близкие к нему понятия, которые можно использовать для разного родалогического вывода. Такими близкими понятиями как раз и являются понятия, которыеявляются зависимыми от текущего понятия и понятия, от которых это понятиеконцептуально зависит.Отношение внешней концептуальной зависимости является несимметричным, имы используем для его описания отношение несимметричной ассоциации АСЦ1- АСЦ2.Отношение АСЦ1 ведет от зависимого понятия к главному понятию отношенияконцептуальной зависимости, а отношение АСЦ2 является к нему обратным отношением.Возникает правомерный вопрос, насколько сложно, вводя новое понятие втезаурус, онтологию, понять, каковы должны быть отношения концептуальнойзависимости, и правильно, отразить их в ресурсе.Здесь можно рассмотреть два случая.Во-первых, если вводимое понятие базируется на относительно свободнопостроенном многословном выражении, как, например, словосочетание автомобильныйзавод, то одно из слов обычно указывает на родовое понятие (ЗАВОД), а второе слово вчастности может указывать и на отношение концептуальной зависимости.
Действительно,понятие АВТОМОБИЛЬНЫЙ ЗАВОД, не могло бы возникнуть, если бы не было понятияАВТОМОБИЛЬ.Во-вторых, вводимое понятие может основываться на термине, который имеетопределение. Здесь необходимо опереться на отношение онтологической зависимости поопределению, введенное в работе (Fine, 1995) (см. п.9.2).При анализе определений необходимо различать следующие типы понятий,упоминаемых в определении посредством соответствующих слов и терминов:- родовые и видовые понятия,- понятия-части и понятия-целые,- понятия, от которых концептуально зависит определяемое понятие,- другие понятия.Принципы установления родовидовых отношений подробно описаны в главе 6 и п.17.2.1, принципы установления отношений часть-целое - в главе 8 и п. 18.3.1. Дляразличения отношения концептуальной зависимости от отношений с понятиями типа 4)261помогает применение диагностического высказывания, подобного лингвистическимтестам (см.п.2.1):Возникновение понятия С0 зависит от существования понятия С1.17.4.3.
Свойства несимметричной ассоциацииВ настоящее время в приложениях используются следующие свойства отношениявнешней концептуальной зависимости, обозначаемой как несимметричная ассоциация:АСЦ1 (X,Y)<-> АСЦ2 (Y, X)Наследование отношения несимметричной ассоциации на виды и части:ВЫШЕ (X,Y) АСЦ1 (Y, Z) -> АСЦ1 (X, Z)ЦЕЛОЕ (X,Y) АСЦ1 (Y, Z) -> АСЦ1 (X, Z)17.5 Симметричные ассоциации в тезаурусе РуТезСуществует несколько ситуаций, когда оправданно представление отношениймежду понятиями в виде симметричной ассоциации.
При этом предполагается, чтостепень ассоциации между понятиями достаточно высокая, то есть если два понятия С1 иС2 связаны отношением симметричной ассоциации, то тексты, содержащие понятие С1часто релевантны запросам, выражающим понятие С2, и наоборот.Симметричные ассоциации используются для отражения отношения междупонятиями, которые являются взаимозависимыми, но между которыми невозможнопоставить отношение ЧАСТЬ-ЦЕЛОЕ, например,РОДИТЕЛИ – ДЕТИ (СЫНОВЬЯ И ДОЧЕРИ)Другим случаем такого рода является отношение между растением и его плодом вширокой предметной области, когда плод отрывается от своего «материнского» растенияи долго существует отдельно (продается, перерабатывается) (см.
п. 17.3.4):ЯБЛОКО - ЯБЛОНЯСимметричной ассоциацией описывается также отношение между близкими посмыслу понятиями, относящимися к одному и тому же родовому понятию, текстовыевходы которых используются как квазисинонимы.Например,естьблизкиепонятияАВИАЦИОННАЯМЕДИЦИНАиКОСМИЧЕСКАЯ МЕДИЦИНА, также имеется множество контекстов употребленийсловосочетаний авиакосмическая медицина, авиационная и космическая медицина. Внекоторый момент развития тезауруса отношение между такими понятиями может бытьотражено в виде симметричной ассоциации.
В качестве других примеров можно привеститакие пары как МИЛИЦИЯ – ПОЛИЦИЯ, ПОТРЕБИТЕЛЬСКАЯ ЦЕНА – РОЗНИЧНАЯЦЕНА.Наконец, некоторые виды антонимов могут быть представлены в тезаурусе в видесимметричной ассоциации между соответствующими понятиями. Отношениемсимметричной ассоциации представляются обычно отношения между антонимами,содержащими указание на разную степень, меру одного и того же качества, свойстваВ настоящее время используются следующие свойства отношения симметричнойассоциации:АСЦ (X,Y) -> АСЦ (Y, X) - Симметричность отношенияНаследование отношения ассоциации на виды и части:ВЫШЕ (X,Y) АСЦ (Y, Z) -> АСЦ (X, Z)262ЦЕЛОЕ (X,Y) АСЦ (Y, Z) -> АСЦ (X, Z)17.6 Модификаторы отношений: нарушение условий надежностиПомимо основных отношений в тезаурусе РуТез имеются так называемыеотношения с модификаторами, то есть отношения ВЫШЕ-НИЖЕ и ЧАСТЬ-ЦЕЛОЕ могутбыть снабжены дополнительными пометками (напомним, что разработчики EuroWordNetтакже предлагали использование дополнительных атрибутов на отношениях (см.
п.3.2.1.)).В тезаурусе РуТез имеется два вида модификатора отношений:модификатор В (возможно, выполняется по умолчанию) имодификатор А (аспект, точка зрения).Отличие между двумя этими модификаторами следующее: модификатор Виспользуется, когда подавляющее большинство экземпляров понятия имеют такоеотношение, то есть помеченное этим модификатором отношение имеется у данногопонятия по умолчанию. Именно с помощью это модификатора отмечается отношениероли, которую выполняют обычно экземпляры данного понятия (см. гл.
7 и п. 17.2.2.).Модификатор А используется в тех случаях, когда все экземпляры данного понятияимеют то или иное отношение, но это отношение характеризует экземпляр понятиячастично и поэтому может быть не существенным в том или ином контексте.Первоначально родовидовое отношение с модификатором А (ВЫШЕ_А) частоиспользовалось для указания двух родовых понятий при совмещении в одном понятиидвух несколько отличающихся значений, обычно являющихся проявлением такназываемой регулярной многозначности (см.п.2.5.2.1), например, =горная порода= –=строительный камень= (доломит), =шоу= - =театр= (варьете), =растение= – =плод=(вишня) и др., В настоящее время в случае такой регулярной многозначности (см.п.16.4.1.) мы вводим два связанных между собой понятия, и необходимость в отношенииВЫШЕ_А в таких случаях отпадает.Именно посредством отношения ВЫШЕ_А описывается в настоящее времяотношения экземпляр-класс: МОСКВА – СТОЛИЦА, УЧИТЕЛЬ – ДОЛЖНОСТЬ,ГОРОДСКАЯ ЗЕМЛЯ – ГОРОДСКАЯ СОБСТВЕННОСТЬ, ПУДЕЛЬ – ПОРОДА СОБАК.Это не противоречит установленным свойствам отношения ВЫШЕ_А (см.
ниже).Примером применения обоих модификаторов в описании понятия могут служитьотношения понятия ПЕНСИОНЕР. По умолчанию пенсионер – это старый человек,поскольку подавляющее большинство пенсионеров являются пожилыми людьми. Крометого, все пенсионеры являются составными элементами пенсионной системы. Наконец,пенсионер – это также социальный статус, поэтому пенсионеры могут упоминаться вневсякой связи с пенсионной системы – для отражения этого ставится модификатор А.ПЕНСИОНЕРВЫШЕ_ВЦЕЛОЕ_АСТАРЫЙ ЧЕЛОВЕКПЕНСИОННАЯ СИСТЕМАОтношения с модификаторами являются более слабыми отношениями, необладающими свойством транзитивности.Основные свойства отношений с модификаторами таковы:1. Отношения с модификаторами поглощают отношения без модификаторов:ВЫШЕА,В (X,Y) ВЫШЕ (Y, Z) -> ВЫШЕА,В (X, Z)ВЫШЕ (X,Y) ВЫШЕА,В (Y, Z) -> ВЫШЕА,В (X, Z)ЦЕЛОЕ А,В (X,Y) ЦЕЛОЕ (Y, Z) -> ЦЕЛОЕА,В (X, Z)263ЦЕЛОЕ (X,Y) ЦЕЛОЕ (Y, Z) А,В -> ЦЕЛОЕА,В (X, Z)2.
Наследование отношений по отношениям с модификаторами:ВЫШЕА,В (X,Y) АСЦ1 (Y, Z) -> АСЦ1 (X, Z)ВЫШЕА,В (X,Y) АСЦ (Y, Z) -> АСЦ (X, Z)ЦЕЛОЕА,В (X,Y) АСЦ1 (Y, Z) -> АСЦ1 (X, Z)ЦЕЛОЕА,В (X,Y) АСЦ (Y, Z) -> АСЦ (X, Z)3. Отсутствие транзитивности по отношениям с модификаторами17.7. Примеры описания отношений17.7.1. Типовые примеры описания отношенийРассмотрим примеры тезаурусных отношений ассоциации, приводимых встандартах на разработку информационно-поисковых тезаурусов (см. п.1.2.), и покажем,какими отношениями представляются такого рода отношения в тезаурусе РуТез.
Дляудобства изложения повторим примеры ассоциаций из первой главы курсивом. Примерыописаний этих же отношений в тезаурусе РуТез даны прописными буквами.1) научная дисциплина – объект изучения или специалист в этой дисциплине:математика - математикневрология - нервная системаСпециалист по дисциплине описывается как понятие-часть для своей дисциплины,поскольку специалист является концептуально зависимым от дисциплины и являетсянеобходимым внутренним элементом этой дисциплины:МАТЕМАТИКАЧАСТЬМАТЕМАТИКЧасто объект изучения, ни каким образом, не зависит от изучающей егодисциплины, тогда как дисциплина концептуально зависит от своего объекта изучения.Дисциплина не является каким-то существенным элементом функционирования объектаизучения. Поэтому дисциплина связана со своим основным объектом изучениянесимметричной ассоциацией:НЕВРОЛОГИЯАСЦ1НЕРВНАЯ СИСТЕМА2) операции или процессы и их агент или инструментконтроль температуры – термостатохотник – охотаАгент и инструмент некоторого процесса, а также другие специальные названияролей процесса представляют собой существенно важные сущности дляфункционирования этого процесса.
Поэтому, если выполняется условие концептуальноезависимости этого понятия-роли от понятия-процесса (то есть такое же название роли неупотребляется для других процессов), то используется отношение ЧАСТЬ:ОХОТАЧАСТЬОХОТНИККОНТРОЛЬ ТЕМПЕРАТУРЫЧАСТЬТЕРМОСТАТ2643) объекты или процессы и их контрагентырастения – гербицидыЕсли контрагент создан специально для противодействия некоторому объекту илипроцессу, это означает, что он является концептуально зависимым от этого объекта(процесса).