Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 27
Текст из файла (страница 27)
Следует отметить, что изначально при проектировании ИСпо свойствам неорганических веществ, взаимодействие с внешней программной средойне предусматривалось вовсе.Разрешить синтаксические и структурные конфликты можно посредствомвведения общей схемы представления информации и обмена данными, построеннойсогласно описанию предметной области. Как уже было отмечено в главе 3.3, приописании химических объектов можно использовать три уровня: система, вещество икристаллическая модификация (далее, просто, модификация). Указанная иерархияхимических объектов, которая будет рассматриваться в контексте интегрированной ИС,представлена на рис. 3.4.2.Рис. 3.4.2. Иерархия химических объектов, рассматриваемая в контекстеинтегрированной ИС СНВМ.Таким образом, в общую схему предметной области закладывается три типаобъектов, соответствующих химическим сущностям: элементы (или химическаясистема - качественный состав вещества), вещество (количественный состав вещества)и модификация.
Следовательно, все оболочки интегрируемых ИС должны оперироватьэтими тремя типами объектов при ссылке на химические сущности. При этом стоит139учитывать, что если описывается определенная химическая модификация, тоопределена также и химическая система с веществом, модификация которогоописывается. То есть если описание химической сущности ведется на уровнемодификаций, то все вышележащие уровни (вещество и система) тоже описаны.Следует заметить, что обратное неверно. То есть, если описывается химическаясистема, то вещество и модификация четко не определены. Однако необходимопонимать, что при описании сущности на уровне системы, все описанные свойстваавтоматически распространяются на все вещества и модификации, образованные этойсистемой.
Это во многом напоминает наследование в объектно-ориентированномпрограммировании (ООП).Воспользуемся теорией множеств для описания сущностей нашей предметнойобласти. Обозначим множество химических систем как S , множество химическихвеществ как C , а множество химических модификаций как M .
Тогда химическаясистема будет обозначаться как s (где s S ), химическое вещество обозначим через c(где c C ), а химическую модификацию – как m (где m M ).Химическая система s может быть представлена как множество химическихэлементов ei : s {e1 , e2 ,.., en } . Химическое вещество c определяется не толькомножеством химических элементов, но и их количественным вхождением в составвещества, раствора или смеси. Поэтому вещество c может быть представленокортежем ( s, f ) , где s S , аfявляется отображением множества химическихэлементов, которые образуют вещество, на множество пар R * R * , задающихсоответственно минимальное и максимальное вхождение заданного химическогоэлемента в вещество, раствор или смесь c .
То есть**f : ei ( Rmin, Rmax) , гдеR* R {x} . R – множество неотрицательных действительных чисел, а R * – этомножество R , расширенное элементом x . Элемент x служит для обозначениянеизвестного числа, так как при обозначении смесей, где вхождение компонентовможет варьироваться, принято использоватьxдля обозначения неизвестного,**например, Fe1-xSe. Rminи Rmax, соответственно, минимальная и максимальнаяконцентрация химического элемента ei в веществе c .
В случае, когда концентрация** Rmax.конкретного химического элемента ei в веществе c фиксирована, то RminХимическая модификация m может быть представлена кортежем ( s, f , mod) , где s S ,**f : ei ( Rmin, Rmax) , а mod – строковое обозначение модификации вещества,принятое в интегрированной ИС.140Расширим множества C и M , добавив к ним пустой элемент null . То естьnull C , null M . Учитывая то, что химическая сущность описывается только наодном из трех уровней (система, вещество и модификация), и при описании уровня всеверхние уровни определены, а нижние неопределенны – null, любая химическаясущность (система, вещество и модификация) может быть описана тройкой ( s, c, m) ,где s S , c C , m M .Приведем примеры записи химических систем, веществ и их модификаций( s S , c C , m M ):( s, null , null ) - шаблон для записи химических систем;( s, c, null ) - шаблон для записи химических веществ;( s, c, m) - шаблон для записи химических модификаций.Вшаблоныдлязаписихимическихобъектовумышленновноситсяизбыточность, например в шаблоне тройки для записи химических веществприсутствует s , хотя точно такое же множество присутствует в кортеже c .
Так же вшаблоне тройки для записи химических модификаций присутствует s и c , хотя этисущности определены в кортеже m . Эта избыточность в запись вносится в целяхнаглядности, чтобы подчеркнуть наследование в иерархии химических объектов.Как было отмечено, в интегрируемых ИС содержится информация по свойствамхимических объектов. Например, плотность, растворимость, теплопроводность,ширина запрещенной зоны.
При этом для каждой химической сущности в БД ИСнередко содержится несколько записей для описания значения свойства. Этообусловлено несколькими обстоятельствами. Во-первых, информация, содержащаяся вБД ИС, может быть взята из различных источников, при этом данные нередкорасходятся. Это объясняется как различными способами измерения, так и точностьюизмеряющей аппаратуры. Таким образом, в ИС приводится несколько вариантовзначения,например,плотностиразличныхкристаллов.Во-вторых,значениярассматриваемых свойств зачастую зависят от внешних условий, при которыхприводились измерения.
Например, такие параметры как растворимость и шириназапрещенной зоны зависят от температуры, при которой проводились измерения.Другими словами, свойства часто являются функциями от различных аргументов,число которых, строго говоря, не фиксировано. Это означает, что разные свойствамогут иметь разную структуру представления данных.
Более того, одно и то жесвойство в разных ИС может фактически являться функцией от разного числааргументов, и поэтому невозможно будет предложить универсальный формат141представления заданного свойства для всех ИС. Это во многом может быть объясненотем фактом, что при детальном исследовании какого-либо свойства число такихфункциональныхзависимостейотвнешнихпараметровможетвозрастать.Следовательно, если такое свойство будет подробно рассмотрено в некоторой ИС,которая еще не включена в общую интегрированную ИС, то при ее включении в составинтегрированной ИС возникнет проблема согласования форматов представленияуказанного свойства. Таким образом, невозможно заранее предусмотреть всезависимости и заложить их в общий формат представления данных даже отдельновзятого конкретного свойства, не говоря о представлении свойств в целом.Такимобразом,необходимнекоторыймеханизм,позволяющийгибкопредставлять значения свойств в рамках интегрированной ИС.
В настоящее времясуществует общепризнанное средство описания произвольных форматов данных – этоXML (eXtensible Markup Language). С помощью этого языка разметки удобноописывать различные структуры данных, он является межплатформенным форматом иподдерживается большинством языков и библиотек [167]. На сегодняшний деньименно этот язык является тем звеном, которое может служить основой дляобеспечениявзаимодействияразличныхпрограммно-аппаратныхплатформ.Внастоящее время все большее количество информации в современных промышленныхсистемах представляется в формате XML.
Использование XML в качестве форматапредставления и обмена информацией является целесообразным еще и потому, что ониспользуется как основа функционирования Web-сервисов.Таким образом, для разрешения семантических и структурных конфликтовнеобходимо стандартизировать форматы представления описанных химическихсущностей и свойств в рамках интегрированной ИС на языке XML. То есть,необходиморазработатьформатысоответствующихXML-документовдляпредставления химических сущностей, их свойств и другой информации.
Это позволитобмениваться информацией между звеньями интегрированной ИС.3.4.3. Разрешение семантических конфликтовСемантические конфликты во многом являются следствием синтаксических иструктурных конфликтов, рассмотренных выше. Суть семантических конфликтовсостоит в том, что разные ИС для обозначения одной и той же сущности используютразные обозначения. Это так называемые конфликты обозначений (naming conflicts).Следует отметить, что могут встречаться и конфликты шкал и точности (scaling &precision conflicts).142Нередко встречаются и конфликты точности, которые своим происхождениемобязаны различиями в представлении чисел в различных ИС.