Тезаурусы в задачах информационного поиска. Лукашевич (2010) (1185451), страница 68
Текст из файла (страница 68)
Электролитами являются:- расплавы солей, оксидов или гидроксидов;- растворы солей, кислот или оснований в полярных растворителях;- а также твердые электролиты.ионнойможет показаться основанием, например, для установления отношения, что соль(как химическое соединение) является видом электролита.Однако в таких случаях нужно помнить, что консервант и электролит являютсяролями веществ - вещество становится консервантом или электролитом только, еслипопадает в некоторые условия.
А поваренная соль и соль как химическое соединениеявляются типами веществ.Устанавливая родовидовую связь от типа к роли, мы сообщаем системенекорректное знание, состоящее, например, в том, что любое вещество, относящееся кклассу солей, в любой момент времени своего существования в любой ситуации, являетсяэлектролитом, что далеко не так.Возникает вопрос, можно ли отразить полученную из вышеприведенныхфрагментов информацию, выразив ее набором более «надежных» отношений. В тезаурусеРуТез мы обычно пытаемся применить несколько способов.Во-первых, если мы предполагаем, что в нашей предметной области большинствопримеров того или иного типа будут использованы в некоторой роли, то все-такиустанавливается родовидовое отношение от типа как вида к роли как роду, котороеснабжается пометкой В – что означает « возможно по умолчанию» (см.
п.17.6).Так, например, мы можем установить такое отношение между понятиемСОРБИНОВАЯ КИСЛОТА и КОНСЕРВАНТ, если посчитаем, что это основноеприменение сорбиновой кислоты в нашей предметной области, и вероятность встретить втекстах обсуждение сорбиновой кислоты в других применениях (например, ворганическом синтезе) в нашей области не слишком велико:СОРБИНОВАЯ КИСЛОТАВЫШЕ_ВКОНСЕРВАНТОднако не рекомендуется устанавливать такое отношение между понятиямиПОВАРЕННАЯ СОЛЬ и КОНСЕРВАНТ, поскольку основное применение повареннойсоли совсем другое.
Даже если бы мы установили такое отношение (ввели бы ещепометку для неосновных ролей), то нужно учитывать, что для автоматической системыобработки текстов невозможно качественно учитывать контекст употребления повареннойсоли в тексте, чтобы разобраться, можно использовать это отношение или нет.Таким образом, в некоторых случаях мы все-таки размещаем понятия-роли вышепо иерархии, чем понятия-типы, однако отмечаем такое отношение специальнойпометкой. Мы применяем это отношение только для описания знания о предметнойобласти, которое верно по умолчанию, то есть, с одной стороны, оно может пригодитьсяпри обработке текстов, с другой стороны, относительно редко может привести к ошибкевывода. Для каждого типа может быть описано максимум одно такое отношение, аописания многих понятий-типов не включают такие отношения, поскольку могутвыступать в самых разных ролях.Именно с использованием отношения ВЫШЕ_В может быть отраженокритикуемое Н.
Гуарино отношение яблоко – пища, если будет известно, что в рабочейпредметной области использование в пищу – это основная роль яблок.251В перечисленных в разделе 7.5 способах представления иерархических отношениймежду типами и ролей такое решение соответствует способу 2.1, однако корректируетсядополнительной пометкойНа примере описания понятия ЭЛЕКТРОЛИТ может быть продемонстрированаеще одна возможность описания отношений между ролями и типами в тезаурусе РуТез.Мы можем попытаться ввести дополнительное понятие для ситуации соли в ролиэлектролита. Если это важно для данной сферы, то это наше желание обычноподдерживается и языком предметной области – для такого понятия существует одно илиболее употребительных языковых выражений. И в нашем случае существует и активноупотребляется такое словосочетание как солевой электролит.Таким образом, мы можем ввести понятие СОЛЕВОЙ ЭЛЕКТРОЛИТ и установитьследующие отношения:СОЛЕВОЙ ЭЛЕКТРОЛИТВЫШЕСОЛИВЫШЕЭЛЕКТРОЛИТЫТем самым мы корректно отражаем знание, полученное нами из прочитанногоопределения.
В перечисленных в разделе 7.5 способах представления иерархическихотношений между типами и ролей такое решение соответствует способу 3, однакоиерархии типов и ролей пересекаются не только на примерах понятий, которые относятсяк обеим иерархиям, но в специально введенных понятиях.Если рассмотреть такое решение для отражений отношение между понятиямиРАБОТОДАТЕЛЬ, ЧЕЛОВЕК и ОРГАНИЗАЦИЯ, то нужно ввести два дополнительныхпонятия, например, РАБОТОДАТЕЛЬ-ФИЗИЧЕСКОЕ ЛИЦО и РАБОТОДАТЕЛЬЮРИДИЧЕСКОЕ ЛИЦО.Тогда можно сделать следующие описания (Рис.17.1):РАБОТОДАТЕЛЬ-ФИЗИЧЕСКОЕ ЛИЦОВЫШЕРАБОТОДАТЕЛЬВЫШЕЧЕЛОВЕКРАБОТОДАТЕЛЬ-ЮРИДИЧЕСКОЕ ЛИЦОВЫШЕРАБОТОДАТЕЛЬВЫШЕОРГАНИЗАЦИЯЧЕЛОВЕКРАБОТОДАТЕЛЬРАБОТОДАТЕЛЬФИЗИЧЕСКОЕ ЛИЦООРГАНИЗАЦИЯРАБОТОДАТЕЛЬЮРИДИЧЕСКОЕ ЛИЦОРис.17.1 Отражение взаимоотношений между понятиями-типами(ЧЕЛОВЕК, ОРГАНИЗАЦИЯ) и понятием-ролью (РАБОТОДАТЕЛЬ)Поскольку введение дополнительных понятий может серьезно усложнять описаниепонятий в ресурсе, такой способ используется лишь в тех случаях, когда такиедополнительные понятия действительно используются в предметной области, как в случаепонятия СОЛЕВОЙ ЭЛЕКТРОЛИТ.
Интересно отметить, что введенные дополнительныепонятия РАБОТОДАТЕЛЬ-ФИЗИЧЕСКОЕ ЛИЦО и РАБОТОДАТЕЛЬ-ЮРИДИЧЕСКОЕ252ЛИЦО также имеют реальное основание в правовой области, поскольку отношенияразных типов работодателей с работниками по-разному регулируются законодательством.Понятия-типы ЧЕЛОВЕК и ОРГАНИЗАЦИЯ могут равным образом выступать вомногих ролях, поэтому в тезаурусе РуТез действительно введено такое понятие какСУБЪЕКТ ДЕЯТЕЛЬНОСТИ, как обсуждается в методе 2.1 раздела 7.5, и в качественижестоящих к нему понятий размещены многие ролевые понятия, в которых могутвыступать и примеры понятия ЧЕЛОВЕК, и примеры понятия ОРГАНИЗАЦИЯ.Таким образом, в реальном ресурсе, создаваемом для работы в приложениях вширокой предметной области, приходится применять несколько разных подходов кописанию иерархий типов и ролей, обсуждаемых в литературе как альтернативные.В литературе обсуждаются и более сложные представления для более адекватногоописания взаимоотношений между типами и ролями, однако при создании достаточнобольших онтологических ресурсов важно сохранить относительно простую схемуописания.
Кроме того, сложные схемы описания отношенийзатруднительноиспользовать при автоматической обработке текстов.17.3. Отношение ЧАСТЬ-ЦЕЛОЕ17.3.1. Принципы описания отношенияОдним из важных свойств, которые часто постулируются у отношения ЧАСТЬЦЕЛОЕ, является транзитивность этого отношения. В то же время многие исследователиуказывают на нарушения транзитивности этого отношения. В главе 8 мы подробнообсуждали разные точки зрения, высказываемые по поводу этой проблемы.Если обсуждать наследование свойств по отношению ЧАСТЬ-ЦЕЛОЕ в ресурсе,предназначенном для автоматической обработки текстов в информационно-поисковыхприложениях, то наиболее важной операцией, которую необходимо обеспечить, являетсярелевантность обсуждения частей обсуждению целого.
То есть необходимо описыватьотношения ЧАСТЬ-ЦЕЛОЕ так, что если текст или его некоторый фрагмент посвященобсуждению части, то с большой вероятностью этот текст (или его фрагмент) будетрелевантен и обсуждению целого (Лукашевич, 2007a).Здесь может быть приведено следующее возражение: если в тексте говорится опокупке деталей автомобиля, это не означает, что текст обсуждает покупку автомобиля.Мы этого и не утверждаем.
Ясно, однако, что текст, обсуждающий покупку деталейавтомобиля, релевантен поиску по обобщенному запросу «Автомобили».Важным условием для обеспечения такого наследования, на наш взгляд, являетсязависимость (см. п.8.5) существования части от существования целого. Действительно,если все существование некоторой части связано с существованием целого, то и тексты,обсуждающие эту часть, будут иметь непосредственное отношение и к целому, даже еслиэто целое в тексте явно не упомянуто.Этим требованием мы обеспечиваем выполнение рекомендации тезаурусныхстандартов в том, что описание иерархических отношений должно быть независимо отконтекста их упоминания.
Описание таких независимых от контекста, «надежных»отношений в ресурсах, предназначенных для автоматической обработки текстов, имеетбольшое значение, поскольку в автоматическом режиме часто невозможно использоватьконтекст для подтверждения существования того или иного отношения.Зависимость части от целого не влечет эксклюзивность части по отношению кцелому, то есть того, что у части ровно одно непосредственное целое. Так, например,локоть является частью руки человека, и одновременно частью костной системы, при этомлокоть является зависимой частью и для руки человека, и для костной системы.Накладывая условие зависимости частей от целого, мы не ограничиваем подвидычастей (табл.18.1).253ЧАСТЬ – ЦЕЛОЕавтопилот–летательный аппаратгорбушка–хлебчлен партии–политическая партиячлен предложения–предложениебалкон–зрительный залбородка ключа–ключветка–растениежелезнодорожная ветка–железнодорожный путьперсонаж–сюжетгипотенуза–прямоугольный треугольникголень–ногагондола–аэростатТаблица 18.1.
Примеры отношений ЧАСТЬ-ЦЕЛОЕ из тезауруса РуТез.При таком разнообразии отношений ЧАСТЬ-ЦЕЛОЕ важно отделять этоотношение от других видов отношений. Для этого мы применяем не лингвистическиетесты, которые часто неоднозначны и контекстно зависимы, а используем принципы,упоминавшиеся в п. 8.4. При анализе сложных случаев транзитивности отношенияЧАСТЬ-ЦЕЛОЕ таких, как ручка двери – дверь – дом, а именно: если уничтожение(изменение) предполагаемой части оказывает влияние на предполагаемое целое, то междуними устанавливается отношение ЧАСТЬ-ЦЕЛОЕ, если нет, то данное отношениеописывается с помощью других типов тезаурусных отношений.Рассмотрим, например, понятие, соответствующее слову «айсберг».