Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 37
Текст из файла (страница 37)
Узел DescribeChemicalEntities дает предметному посредникукоманду на добавление в XML-документ с ответом описаний химических сущностей,соответствующихModificationID.глобальнымОписанияидентификаторамсоответствующихSystemID,сущностейSubstanceIDпредставляютиузлыSystemXML, SubstanceXML и ModificationName. В них содержатся описания сущностейсогласноданнымметабазы.ФрагментXML-документа,содержащегоответпредметного посредника на рассмотренный выше запрос приведен на рис. 5.2.11.Рис. 5.2.11. Фрагмент XML-документа, содержащего ответ предметного посредникаинтегрируемой ИС на запрос значений свойств (снимок экрана из Microsoft IE).Как видно из XML-документа на рис.
3.17, предметный посредник вернул ответ,содержащий значения акустооптических свойств для арсенида галлия GaAs.Экспертный рейтинг этой информации равен единице (атрибут Rating узла198“/root/row/PropertyXML/row”химическойсущностиравенв“1.0”).узлах,ВдокументесоответствующихприведеныописанияXPath-выражениям“/root/row/PropertyXML/row/SystemXML”, “/root/row/PropertyXML/row/SubstanceXML”и “/root/row/PropertyXML/row/ModificationName”.Краткие выводыВ главе получены следующие результаты:Выбран подход Local-As-View для обеспечения масштабируемой интеграцииданных из ИС СНВМ на основе метода EII.Разработана логическая и физическая модель данных метабазы для методавиртуальной интеграции данных.Предложен механизм для извлечения наиболее достоверной информации изразнородных ИС СНВМ, основанный на экспертных оценках.Разработаны требования к реализации программных адаптеров интегрированнойИС СНВМ и описаны используемые форматы данных.разработан и программно реализован модуль извлечения (предметный посредник)консолидированных данных интегрированной ИС СНВМ.199ГЛАВА 6.
ИСПОЛЬЗОВАНИЕ ИНТЕГРАЦИИ ПРИЛОЖЕНИЙ ДЛЯИНФОРМАЦИОННОЙ ПОДДЕРЖКИ СПЕЦИАЛИСТОВ ПОНЕОРГАНИЧЕСКИМ ВЕЩЕСТВАМ6.1. Интеграция распределенных гетерогенных Web-приложенийинформационных системКак было отмечено выше, часто ИС по свойствам веществ, наряду соструктурированными данными, содержат информацию в неструктурированном виде.Под неструктурированной информацией здесь понимается информация, которая неможет быть структурирована в рамках схемы данных информационного источникасуществующей ИС. Это могут быть, например, аналитические обзоры, содержащиетекстовое описание в произвольной форме, рисунки, графики, расчетные подсистемы.Как было показано, основная особенность неструктурированной информациизаключается в том, что ее практически невозможно вырвать из контекста ИС, в которойона определена. Так, например, функционирование всех расчетных подсистемосуществляется в рамках исходного Web-приложения ИС.
Более того, не только Webприложение ИС является необходимым своего рода естественным интерфейсом красчетным подпрограммам, но и сами подпрограммы рассчитаны на использованиеструктурированных данных именно из БД своей ИС. Для того чтобы предоставитьпользователю доступ ко всему многообразию неструктурированной информации,необходима интеграция распределенных гетерогенных Web-приложений ИС. По сути,необходимо выполнить EAI-интеграцию существующих Web-приложений ИС.ИнтеграцияWeb-приложенийразличныхИСпосвойствамвеществподразумевает, что пользователь сможет беспрепятственно переходить из WebприложенияоднойинформационнойсистемывWeb-приложениедругойинформационной системы. Это позволит ему получить доступ к информации,содержащейся в различных ИС и пользоваться их расчетными подсистемами.При интеграции ИС на уровне Web-приложений (по сути, на уровне Webинтерфейсов для доступа к ИС) необходимо учитывать, что все Web-приложенияинформационных систем разрабатывались независимо друг от друга.
Это означает, чтовсе они используют собственные механизмы, обеспечивающие безопасность ИС, аименно, реализуют собственные системы, санкционирующие доступ к информациитолько со стороны авторизованных пользователей ИС. При успешной аутентификациипользователь авторизуется Web-приложением ИС и для него создается определенныйконтекст безопасности (зависящий от конкретного Web-приложения), в рамках200которого пользователь получает доступ к ресурсам ИС.
Все пользователи, которые непрошли аутентификацию не авторизуются в ИС и, следовательно, не получают доступк ИС со стороны Web-приложения. Таким образом, для обеспечения информационнойбезопасности ИС, интегрированной на уровне Web-интерфейсов, необходимопредусмотреть механизмы, обеспечивающие безопасные переходы пользователей отодного Web-приложения к другому. Очевидно, что, принимая во вниманиеразнородность объединяемых информационных систем, эти механизмы должныопираться на единые для всех Web-приложений стандарты.
В настоящее время такимистандартами являются протокол HTTP (Hyper Text Transfer Protocol) [155] и интерфейсCGI (Common Gateway Interface) [162]. Именно на этих технологиях долженосновываться механизм, обеспечивающий безопасный переход пользователя изинтерфейса одной ИС в другую.При работе с интегрированной системой необходим также механизм, которыйбы обеспечивал для пользователя не просто переход от одной ИС к другой, но ипозволял бы ему при этом сразу же получать доступ к интересующей его информации.Другими словами, при интеграции ИС на уровне Web-приложений необходимопредусмотретьвозможностьпросмотрарелевантной(поотношениюкпросматриваемой пользователем системе) информации, содержащейся в других ИС.Например, пользователь, просматривая информацию о химической системе In-Sb в ИС“Диаграмма”,должениметьвозможностьознакомитьсясданнымиопьезоэлектрических или нелинейнооптических свойствах соединения InSb из БД“Кристалл”.
То есть очевидным является также то, что при построении распределеннойинтегрированной ИС на уровне Web-интерфейсов, необходимо обеспечить поискрелевантной информации во всех интегрируемых ИС.Таким образом, необходим некоторый координирующий центр, который знает отом, какая информация в каких ИС хранится. То есть должна существоватьцентральнаябазаданных,некоторымобразомописывающаяинформацию,содержащуюся в интегрируемых ИС. Так приходим к понятию “метабаза” –специальная база данных, содержащая справочные сведения о содержимоминтегрируемых ИС, а именно – о химических системах и их свойствах (рис.
6.1.1). Этихсведений достаточно для того, чтобы построить поиск релевантной информации похимическим системам и их свойствам.201Рис. 6.1.1. Метабаза как координирующий центр интегрированной ИС.Формализуемсодержимоеметабазы.Вметабазедолжнасодержатьсяинформация по интегрируемым информационным системам (множество D ), похимическим веществам и системам (множество S ) и по их свойствам (множество P ).Для описания взаимосвязи между элементами множеств D , S и P определимтернарное отношение Wна множестве U D S P . Принадлежность элемента( d , s, p ) отношению W , где d D, s S , p P , интерпретируется следующим образом:“В интегрируемой информационной системе d содержится информация по свойству pхимической системы s ”.Поиск релевантной информации по конкретной химической системе s сводитсяк определению отношения R , являющегося подмножеством декартова произведенияS S (иными словами, R S 2 ). Таким образом, о любой паре ( s1 , s2 ) R можносказать, что система s2 является релевантной системе s1 .
Т.е., чтобы решить задачупоиска релевантной информации в интегрируемых информационных системах,необходимо некоторым образом определить отношение R . Следует отметить, чтоотношение R может создаваться или дополняться компьютером по определеннымправилам. Для решения этой задачи также могут быть привлечены эксперты всоответствующей предметной области (в нашем случае – химии).Отметим, что правила построения отношения R могут быть различными.Одним из вариантов автоматического построения отношения R могут быть следующиеправила:202Для любых множеств s1 S , s2 S , состоящих из химических элементов eij ,s1 {e11 , e12 ,.., e1n }, s2 {e21 , e22 ,.., e2 m } верно, что если s1 s2 (то есть, все химическиеэлементы из системы s1 содержатся в системе s2 ), то ( s1 , s2 ) R .Отношение R симметрично.
Иными словами, для любых s1 S , s2 S верно, чтоесли ( s1 , s2 ) R , то и ( s2 , s1 ) R .Эти два простых правила позволяют построить отношение R . Следовательно,появляется возможность определить множество систем, релевантных заданной. Каквидно из этих правил, отношение R , построенное таким образом, является довольнообщим, так как правила позволяют считать релевантными указанной системе всехимические системы, состоящие из множества элементов, являющихся надмножествомили подмножеством указанной системы (или тем же множеством). Отметим, что такаядовольно вольная трактовка релевантности не всегда является приемлемой. Частонеобходимосчитатьрелевантнымиуказанномувеществу/системе,толькотевещества/системы (и, соответственно, их свойства), которые относятся к той жехимической системе. Иными словами, соответствующие химические системы должнысодержать тот же самый набор химических элементов.
Приведем правило дляавтоматического построения такого отношения R :Для любых множеств s1 S , s2 S , состоящих из химических элементов eij ,s1 {e11 , e12 ,.., e1n }, s2 {e21 , e22 ,.., e2 m } верно, что если s1 s2 (то есть, система s1тождественно равна системе s2 ), то ( s1 , s2 ) R .Заметим, что такое отношение R симметрично автоматически по определению(т.е. для любых s1 S , s2 S верно, что если ( s1 , s2 ) R , то и ( s2 , s1 ) R ).Отметим, что здесь показаны лишь самые простые и очевидные вариантыправил построения отношения релевантностиR . Естественно, что ни одноопределение релевантной информации не может быть универсальным и, следовательно,подходить для решения всех задач по определению релевантной информации враспределенных ИС.
Поэтому на практике целесообразным является заданиенескольких различных отношений релевантности R , которые будем называть классамирелевантности. Соответственно, производить поиск релевантной информации в ИС вразличных случаях можно будет с использованием разных классов релевантности.На практике может возникнуть необходимость использования и более сложныхмеханизмов для определения релевантной информации. Например, само понятиерелевантности можно расширить и на свойства, описываемые в ИС, и даже на сами ИС.203То есть, просматривая информацию по конкретному свойству химического веществаили системы в одной из интегрируемых ИС, фактически имеем информацию,определяемую тройкой ( d1 , s1 , p1 ) .