Диссертация (1090633), страница 6
Текст из файла (страница 6)
Разработать программное обеспечение для управления БЗ на основемногоуровневых СМ гетерогенных информационных ресурсов.23ГЛАВА 2. РАЗРАБОТКА МАТЕМАТИЧЕСКОГО ОБЕСПЕЧЕНИЯДЛЯ УПРАВЛЕНИЯ БАЗАМИ ЗНАНИЙ НА ОСНОВЕМНОГОУРОВНЕВЫХ СЕМАНТИЧЕСКИХ МОДЕЛЕЙГЕТЕРОГЕНННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ2.1. Обоснование выбора математических методов представления иобработки семантических моделейРеализация задачи сопровождения СУЗ требует развития программныхсредств, в том числе создания высокоуровневых механизмов управления,позволяющих минимизировать изменения кода программного средства, выявлятьподсистемы управления, актуальные для решения конкретной задачи исоответствующим образом интегрировать их к единый решатель задачи.Этап предварительного анализа предметной области включен во все методологии проектирования.
Этот этап носит сложный аналитический характер и заключается в многократном абстрагировании, в результате которого из всего многообразия сторон и свойств сущностей предметной области выделяются наиболеезначимые, релевантные конкретным задачам. Знание предметной области, понимание происходящих в ней процессов, законов, правил и ограничений, являетсянеобходимым условием успешного решения задач проектирования. Этап предварительного анализа ПдО включает: выявление границ описания предметной области, относительно которыхбудет ставиться и решаться задачи пользователя; выбор методов и процедур системно-онтологического анализа; составление детального словаря терминов и его разбиение на подмножества терминов-объектов, терминов-процессов и терминов, именующих задачи иметоды.2.1.1.
Многоуровневые семантические моделиВ связи с тем, что проблемное пространство представляет собой сложную систему, следует рассмотреть вопрос об использовании многоуровневой онтологии.Используем определение многоуровневой онтологии, данное в [35]: «Многоуровневая онтология представляет собой иерархическую систему онтологий в которойкаждый более высокий уровень является метаонтологией, построенной на основепонятий онтологий нижележащего уровня. Так онтология второго уровня определяет систему понятий, используемую при задании онтологий первого уровня – онтологий разделов области. Если предметная область имеет более сложную структуру, то интеллектуальная система должна позволять хранение онтологий разныхуровней общности. Потенциальные преимущества от использования многоуровневых онтологий таковы: получение дополнительных уровней представления информации, которыебудут повторно использоваться для создания следующих уровней;24 получение более компактного представления текста онтологии за счет введения абстрактных терминов-связей между сущностями и использовании их приопределении других терминов».Средством решения проблемы интеграции понятий выступают онтологииболее высокого уровня общности.
Каждый уровень многоуровневойонтологической системы может включать множество онтологических модулей сразличными ролями. Структура каждого унифицирована и включает уровеньопределения типов, уровень определения классификаторов, уровень определениясвязей между классами, уровень классов и уровень объектов классов.На уровне типов задаются типы объектов предметной области. Типпредставлен множеством классов и объектов онтологии типов и связей междуними.
Тип задает способ создания классов и объектов предметной области уровнязнаний и уровня данных. На уровне типов опредены типы решаемых задач иобщие методы решения задач, указанных типов. Выбор типа t определяет выбормножества конструкторов {Constr}, используемых для построения класса илиобъекта типа и установления их структурных связей.
Каждая онтология болеенижнего уровня конкретизирует множество конструкторов. Так, конструкторы,определенные на уровне типов ПрО конкретизируются на уровне классовразделов ПрО, а они, в свою очередь, определяют конструкторы уровняонтологии данных раздела ПрО.Более того, онтология второго уровня определяет свойства всех множествтерминов онтологии первого уровня, поэтому в библиотеке методов решениязадач содержатся более общие методы решения классов задач, спецификациякоторых дана в терминах онтологии второго уровня. Библиотека методовразрабатывается один раз и многократно используется при задании новойонтологии первого уровня и соответствующей ей новой базы знаний.Спецификация задач описывается с использованием терминов моделионтологии первого уровня, а метод решения задачи строится на основеонтологических соглашений, зафиксированных онтологией и определяющихсвязь входных и выходных данных задачи.
Спецификация задачи определяетвходные и выходные параметры задачи и их связи с терминами онтологиипредметной области. Определение входных и выходных параметров задачисостоит в задании их сорта (множества значений).Уровень конструкторов также может быть представлен в видемногоуровневой системы: уровень определения задач; уровень методов решений; уровень решателей; уровень агентов; уровень операций над информационным ресурсом.25Управление информационными ресурсами производится системойуправления знаниями (СУЗ). СУЗ должна поддерживать создание иэксплуатацию онтологических модулей всех уровней, давать возможностьопределения уровня доступа к модулям, т.е.
определять общий или частныйхарактер доступа к ним, регистрировать пользователей и определять права ихдоступа, обеспечивать согласованность и целостность модулей и связей междуними.2.1.2. Разработка языка формального описанияДляпредставленияонтологииСУБЗнеобходимформализм,обеспечивающий описание понятий как проблемной области СУБЗ и ее областизнаний, так и разнообразных семантических связей между ними.
Важнымтребованием к нему является возможность выстраивания понятий в иерархию«общее-частное» и поддержка наследования свойств по этой иерархии. Этотформализм также должен предоставлять возможность задания ограничений назначения возможных свойств объектов – экземпляров понятий онтологии.Формализованное определение предполагает логическую состоятельностьонтологии, т.е.
непротиворечивость, полноту в некотором смысле для некоторогокласса задач и т.д. Онтология выступает, таким образом, как система описаниясистем понятий, т.е. в качестве средства обобщения подходов к формализацииметауровня [36, 37]. Автоматическое получение информации возможно лишь вслучае, если онтология представлена на формальном языке. Для онтологий,написанных на естественном языке или языке математики важна возможностьполучать вручную (измерительные) модели структуры неформализованныхонтологий, по которым далее возможно автоматическое получение информации освойствах онтологий.Для формального описание онтологий, рассматриваемого как структурасвязей между терминами консорциумом W3C был создан стандарт описанияданных RDF (Resource Definition Framework) [38], включающий модель,предназначенную для описания метаданных, и язык описания этой модели.Стандарт RDFпредоставляет достаточно удобную среду формализацииметаданных и сведений о контексте.
RDF является подмножеством языка XML иимеет расширение языка — язык RDF Schema для описания структурыдокументов. Однако RDF — это самый низкоуровневый из существующих языковописания метаданных, поскольку оперирует лишь понятиями связейпримитивных сущностей, например, «объект X владеет субъектом Y». Поэтомуязык слишком сложен для решения задачи представления сложныхсемантических моделей.Более широкими возможностями обладает OWL – язык представленияонтологий [39], одобренный консорциумом W3C и в настоящее времяявляющимся «де факто» основным языком описания онтологий. Синтаксис OWL26является подмножеством языка XML. В отличие от модели RDF в OWLонтологиярассматривается семантическая сеть, узлами которой являются классы ииндивидуалы — экземпляры классов.
Вводится понятие онтологии – контейнера,содержащего граф, представляющий семантическую сеть. Узлы сети связаныотношениями. Такая сеть позволяют реализовать представление о мире, как омножестве сущностей (объектов), характеризуемых некоторым набором свойстви состоящих т между собой в определенных отношениях. Метамодель языка OWL(Web Ontology Language Metamodel)[40] представлена на рисунке 7.Рисунок 7. Объектная модель Web Ontology Language MetamodelИз рисунка 7 видно, что отношения (свойства) подразделяются на два вида:свойства-характеристики (DatatypeProperty) и свойства-связи (ObjectProperty).DatatypeProperty характеризует объекты и классы, приписывая им значенияопределенных типов. Вторые ассоциирует объекты и классы друг с другом. Насвойства могут накладываться ограничения двух видов: глобальные и локальные.К глобальным ограничениям относятся домены (domain) —указание на то какиеклассы и объекты обладать конкретным свойством, и диапазоны (range) —указание на то, какие классы и объекты могут выступать в качестве значенийсвойств.
Локальные ограничения накладываются на свойства в рамкахопределенного класса и могут еще более сужать диапазоны для свойств в рамкахэтого класса, определять мощность свойств и их виды. Кроме возможностейформального описания сети OWL имеет механизмы описания версий онтологии имеханизмы агрегирования данных. Как RDF, так и OWL являются машинно27ориентированными языками, т.е. предназначены не для представления знанийчеловеку, а для обмена знаниями между программными системами.В терминах вербального представления возможно описание абстрактногосинтаксиса любого искусственного языка.
Рассматривая любую онтологию какпредставление информационных ресурсов, можно сделать вывод о том, что втерминах достаточно мощного языка спецификации онтологии может бытьописана любая онтология и в терминах онтологии более высокого уровня могутбыть описаны онтологии менее высокого уровня общности.
В терминахонтологии знаний могут быть описаны базы знаний, а в терминах онтологииданных БД [41].Для возможности разработки и формального представления языков вметамодели ISO24744введены понятия языка, представленное классом Languageи понятие нотации языка, представленное классом Notation. Соответствующаясемантическая модель представлена на рисунке 8.Рисунок 8.
Модель понятия языка и нотацииКласс языка трактуется как набор понятий языка, каждое из которых связаноотношением эквивалентности с классом ModelUnitKind и задает абстрактныйсинтаксис языка. Нотация рассматривается как способ знакового представленияпонятий языка и задает конкретный синтаксис языка.Традиционные методы описания онтологий, в частности, язык OWL,основаны на языках исчислений предикатов, что затрудняет его использование впрограммных системах.