Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 25
Текст из файла (страница 25)
Иерархия понятий.Обозначим сущности второго уровня общим термином «вещество», понимаяпод этим термином совокупность дискретных образований, обладающих массой покоя(т.е. атомы, молекулы и то, что из них построено). Итак, при описании химическихобъектов можно использовать три уровня: система, вещество и кристаллическая(полиморфная) модификация (далее – модификация).
Приведем кратко определенияэтих терминов [156]:Химическая система (элементы, определяющие качественный состав) – система,образованная химическими элементами. Она может быть описана как множествоатомов, образующих химическую систему. Более строго, химическая система совокупность микро и макро количеств веществ, способных под воздействием внешнихфакторов (условий) к превращениям с образованием новых химических соединений.Например, химическая система, в которую входят элементы медь, галлий и теллур,обозначается Cu-Ga-Te.Химическое соединение– однородное вещество постоянного или переменногосостава с качественно отличным от свойств образующих его элементов химическимили кристаллохимическим строением.
Соединение образовано из атомов несколькиххимических элементов, связанных химической связью. На фазовой диаграмме областьгомогенности соединения отделена (при всех температурах и давлениях) от областикомпонентов или твердых растворов на их основе. Элементы в соединении не могутбыть разделены простым механическим способом, а лишь химической обработкой,нагреванием или электрическим током.129Раствор – макроскопически гомогенная смесь двух или более компонентов,состав которой при данных внешних условиях может непрерывно меняться внекоторых пределах.Гетерогенная смесь – механическая смесь разнородных компонентов, в которойпри заданных условиях отсутствует химическое взаимодействие.Кристаллическая (полиморфная) модификация – форма пространственнойорганизации твердого вещества.Указанные выше определения, как и все созданные человеком понятия,являются нечеткими (размытыми).
В связи с этим иногда трудно провести границумежду, например, упорядоченным твердым раствором и соединением т.п.Необходимо отметить, что описание сущностей и их свойств в разных ИС посвойствам веществ происходит с разной степенью детализации. Так, например, в ИС“Диаграмма” описание большинства свойств химических сущностей ведется на уровнехимических систем.
А в ИС “Кристалл” некоторые свойства описываются на уровнехимических веществ (например, температура плавления, растворимость и пр.), анекоторые свойства описываются на уровне конкретных модификаций (например,нелинейнооптические коэффициенты, коэффициенты Селмейера и пр.).Очевидно, что свойства, указанные для химических сущностей на уровнесистем, распространяются на все химические вещества этой системы и ихмодификации.
Аналогично, свойства, заданные на уровне химических веществ,распространяются на все химические модификации этого вещества.Очевидно, что, учитывая наличие в ИС по свойствам веществ разнородныхгетерогенных данных и расчетных подсистем, использование которых возможно тольковрамкахисходныхИС,необходимкомплексныйподходкинтеграцииинформационных систем. При этом интегрированная ИС, построенная по данномумеханизму,должнаобеспечитьконечногопользователявсейинформацией,содержащейся в рамках объединяемых ИС. Для выработки такого подхода необходимоучитывать архитектуру современных ИС по свойствам веществ, что позволит наиболееэффективно решить задачу интеграции информационных систем [157, 285].Как было показано выше при исследовании архитектуры современных ИС посвойствам веществ, серверная часть ИС разделена на две составляющие:база данных информационной системы (БД ИС);Web-приложение информационной системы (Web-приложение ИС).В БД ИС содержится структурированная информация по определенномутематикой ИС разделу предметной области.
Учитывая определенное родство130предметных областей, рассматриваемых нами ИС по свойствам веществ, в них можновыделить общий структурный типаж, согласно которому определенным образомпредставляется вся информация, хранящаяся в различных гетерогенных БД. Посколькув разныхИС рассматриваются различные свойстваобъектов, определенныхспецификой предметной области, достаточно классифицировать эти объекты такимобразом, чтобы информация из всех (или подавляющего большинства) БД в даннойпредметной области “укладывалась” в заданную модель представления информации.Модель представления химических объектов может быть получена при анализепонятий предметной области с учетом структурной особенности различных БД посвойствам веществ.
Как показывает анализ указанной предметной области, информацияпо свойствам объектов в различных ИС предметной области может храниться наследующих трех уровнях:уровень химических систем (определен качественный состав вещества);уровень химических веществ (определен количественный состав вещества);уровень кристаллических модификаций химических веществ.Эта иерархия понятий описывает самый верхний уровень структурнойорганизации предметной области. В ней не учитываются способы получения иобработки соединений, методы их исследования и прочие важные параметры.
Тем неменее, все описываемые в БД объекты предметной области могут быть сведены кодному из трех типов объектов предлагаемой нами классификации (системы, веществаили модификации). Необходимо также определить правила работы с этими объектами.Важнейшим моментом здесь является определение операции сравнения объектов изразныхисточниковинформации.Определениеэтойоперациипозволитинтегрированной системе отличать разные объекты и находить тождественно равныеобъекты в различных интегрируемых ИС, что позволит аккумулировать описаниясвойств данного объекта из различных ИС. Таким образом, появится возможностьработы с различными свойствами данного объекта, содержащимися в различных БДИС. Возможным также станет агрегирование данных из различных источниковинформации, объединенных такой общей моделью.Как уже было отмечено, в БД ИС содержится структурированная информацияпо разделу предметной области, освещаемому ИС.
Причем стоит отметить, чтопользователь обращается к этой информации не напрямую, а через посредника,которым в нашем случае является Web-приложение ИС. Именно оно отвечает запредоставление нужной пользователю информации, преобразуя данные из БД впонятную и удобную для пользователя форму.131Зачастую, наряду со структурированными данными, ИС содержит информациюв неструктурированном виде. Например, это могут быть аналитические обзоры,содержащие текстовое описание в произвольной форме той информации, которая неможет быть структурирована в рамках существующей ИС. Широко распространеныграфические пояснения в виде рисунков и графиков, которые используютсяпрактически повсеместно.
Часто в ИС включаются расчетные подсистемы, которыеосуществляют вычисление каких-либо параметров и вывод результатов пользователю.Например, программа D_Mapper в ИС “Диаграмма” осуществляет подготовкуинформацииофазовыхдиаграммахдлявизуализацииимасштабирования,информационно-расчетная подсистема для компьютерного моделирования процессовжидкофазной эпитаксии [114], разработанная в МИТХТ им. М.В.
Ломоносова,осуществляет расчет и визуализацию процессов жидкофазной эпитаксии на основаниивводимой пользователем информации и данных, содержащихся в БД ИС. Стоитотметить, что функционирование всех расчетных подсистем осуществляется в рамкахWeb-приложения ИС, то есть Web-приложение ИС является своего рода естественныминтерфейсом к расчетным подпрограммам.Итак, подводя некоторые итоги, следует отметить, что существует два классаметодов интеграции современных ИС СНВМ [158]. Первый класс методов заключаетсяв интеграции информационных ресурсов на уровне их гетерогенных источниковинформации (БД). При этом решается вопрос получения данных (в соответствии сзаданными схемами) из разрозненных источников в рамках общепринятой моделиданных,т.е.осуществляетсяреализацияинфраструктурыдляработысинтегрированными данными [159].
Эти данные затем могут быть выведены внеобходимом формате пользователям интегрированной информационной системы илипреобразованы к нужному формату с помощью дополнительных преобразований.Стоит отметить, что преобразованная к нужному формату и агрегированная изнескольких источников информация может являться входными данными дляразличных систем поддержки принятия решений (СППР), таких как программыкомпьютерного конструирования неорганических соединений.Очевидно также, что для того, чтобы предоставить конечным пользователямдоступ к богатым возможностям расчетных подсистем, входящих в составсоответствующих интегрируемых ИС по свойствам веществ, необходимо проводитьинтеграцию на уровне Web-приложений интегрируемых ИС [160, 161].
Таким образом,второй класс методов интеграции заключается в необходимости объединить не самиинформационные источники (БД ИС), а только их пользовательские интерфейсы, из132которых осуществляется доступ к информационно-расчетным подсистемам. Как ужебыло отмечено, такими интерфейсами являются Web-приложения соответствующихинформационных систем. Этот способ, с одной стороны, позволяет не изменятькоренным образом инфраструктуру каждой из отдельных информационных систем, азначит, и наладившуюся технологию администрирования данных (корректировки идобавления информации), а с другой стороны, позволяет конечному пользователюполучить доступ сразу ко всему спектру информации о веществе, хранящейся вразличных ИС СНВМ.Рис.
3.3.2. Методология интеграции ИС СНВМ.Таким образом, при нынешних условиях развития современных ИС СНВМ,необходимаразработкаметодологииинтеграцииИССНВМ.Этоозначаетнеобходимость использования интеграции ИС СНВМ как на уровне данных,содержащейся в гетерогенных информационных источниках ИС (ETL и EII), так и науровне пользовательских интерфейсов ИС (метод EAI). При этом следует особоотметить, что обеспечивается независимость развития отдельных ИС СНВМ, так каксозданные ИС СНВМ продолжают свое развитие, пополняясь информацией ирасширяясь новыми расчетными подсистемами, обеспечивающими дополнительныефункциональные возможности ИС СНВМ.
Предложенная методология позволяетуспешно сочетать в себе все достоинства разработанных и продолжающихэволюционировать ИС СНВМ (рис. 3.3.2). В рамках разработанной методологии133предоставляется как доступ к текущим пользовательским интерфейсам ИС СНВМ исвободное перемещение пользователей между ними, так и богатые возможности посбору и агрегации информации, полученной из гетерогенных распределенныхисточниковданныхпосвойствамвеществ,согласнообщейразработаннойинформационной схеме [141].Рис.