Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 14
Текст из файла (страница 14)
Стрелками зеленого цветана рисунке отображены потоки информации между звеньями.Рассмотрим разделение функций между звеньями ИС, построенных попринципам этой архитектуры. Сразу следует отметить, что ИС может быть условноразбита на две составные части: это серверная часть и клиентская часть (на основепарадигмы “клиент-сервер”). При этом взаимодействие частей осуществляется сиспользованием глобальной сети Интернет на основе стека протоколов TCP/IP [154].Рассмотрим более подробно структуру клиента. Под клиентом понимаетсяудаленный пользователь информационной системы, взаимодействующий с ней черезсеть Интернет. Следует сразу отметить, что поскольку при разработке ИнтернеториентированныхИСставитсязадачаобеспечениямаксимальнопростогоистандартного программного обеспечения на клиентской части, то принимается решениеобиспользованииИнтернет-браузера.Интернет-браузерявляетсястандартнымкомпонентом ПО в современных персональных компьютерах и, как правило, входит всостав всех распространенных операционных систем (ОС).
Например, во все ОСкорпорации Microsoft по умолчанию встраивается браузер Microsoft Internet Explorer(текущая версия 11). Таким образом, от пользователя ИС не требуется устанавливатьдополнительное ПО, обеспечивающее взаимодействие с рассматриваемыми ИС. Строгоговоря, пользователю достаточно иметь любой распространенный браузер (GoogleChrome, Opera, Mozilla FireFox, Microsoft Internet Explorer, Apple Safari и т.п.) и бытьподключенным к сети Интернет. Этот вариант клиентского ПО в литературе такжечасто называют термином “легкий клиент”, подчеркивая тем самым не только простотуклиентского ПО, но и то, что основная масса всех вычислений возлагается на сервер, аклиент лишь получает готовый результат в виде динамически сгенерированных HTMLстраниц.
В контексте трехзвенной архитектуры программного комплекса клиентскоеПОявляетсязвеном,ответственнымзапредставление(иливизуализацию)обработанной информации для конечного пользователя ИС.Серверная часть информационных систем ИМЕТ РАН взаимодействует сбраузером удаленного клиента через сеть Интернет, используя для этого протоколHTTP [155], являющийся одним из протоколов прикладного уровня стека TCP/IP. Всяосновная обработка информации, равно как и ее хранение возлагается на сервернуючасть ПО (сервер также в таких случаях называют “тяжелым”). Серверная часть можетбыть в свою очередь условно разбита на два звена: звено обработки информации извено хранения информации. Следует сразу отметить, что такое деление далеко невсегда бывает условным, т.к. активно используются сложные сценарии развертывания73информационных систем.
При сложных сценариях развертывания эти два звенавыносятся не только логически, но и физически на разные сервера. Такой прием, надоотметить, активно используется в ИМЕТ РАН, для повышения производительности,масштабируемости и устойчивости функционирующих ИС СНВМ.Рассмотрим кратко звено хранения информации. Когда речь заходит о храненииинформации, как правило, под ПО, реализующим эти возможности, понимают серверабаз данных. В настоящее время, наибольшее распространение получили реляционныесервера БД. Зачастую подобные сервера основываются на системах управления базамиданных (СУБД), предлагаемых крупнейшими разработчиками ПО. Не исключение иИМЕТ РАН, где в качестве серверов БД используются СУБД Microsoft SQL Server 2008x64 (под управлением OC Windows Server 2008 x64) и Oracle 8i (под управлением OCSun Solaris 2.5).В качестве звена обработки информации в современных ИС СНВМ выступаетсервер приложений (или Web-сервер, например, Microsoft IIS, Apache, nginx).
Внастоящее время все современные Web-сервера поддерживают средства динамическойгенерации страниц по запросу пользователя. Это обстоятельство, наряду с богатымивозможностями, предоставляемыми для разработчиков подобным ПО, позволяетрассматривать современный Web-сервер в качестве сервера приложений. Под этим,прежде всего, подразумевается то, что в современных Web-серверах обеспечиваетсяподдержкаодновременногоразмещения(хостинга)несколькихWeb-ресурсов,включающих в себя Web-приложения и Web-сервисы.
Притом возможно какразмещение Web-приложений в изолированных адресных пространствах в рамкахотдельных процессов и даже виртуальных машин, так и обеспечение распределеннойработы одного Web-приложения сразу на нескольких Web-серверах (так называемаяWeb-farm). Это значительно повышает масштабируемость и отказоустойчивостьсовременных Web-приложений. В качестве Web-серверов в ИМЕТ РАН, например,используются сервера на базе технологий Microsoft (это Microsoft Internet InformationServices (MS IIS) 7.0).
Для интеграции Web-серверов и серверов БД используютсяшироко распространенные технологии клиентского доступа к данным (прежде всегоADO, OLE DB и ODBC). Таким образом, по запросу пользователя ИС Web-серверосуществляетдинамическуюгенерацию(сборку)HTML-страницы,обращаясьнепосредственно к серверу БД за информацией, которую необходимо отобразить.742.3.2. Недостатки ИС СНВМРассмотренная выше трехзвенная архитектура не описывает полностью работусовременных ИС СНВМ. Как отмечалось ранее при разработке ИС IRIC, особуюважность имеют информационные структуры, которыми оперирует ИС.
В данномисследовании обзор информационных структур проводится через призму возможностииспользования исследуемых ИС СНВМ для первичной подготовки данных, которыемогутбытьиспользованывкомплексахкомпьютерногоконструированиянеорганических веществ. Более того, исследование текущего состояния и принциповпостроения ИС СНВМ с точки зрения информационных структур, содержащихся в БД,и их семантики, является необходимым условием разработки интегрированной ИС. Наосновеанализапользовательскихинтерфейсовкрупнейшихмеждународныхматериаловедческих комплексов: AtomWork (бывш.
Pauling File, NIMS, Япония),SpringerMaterials(theLandolt-BörnsteinDatabase)быливыявленыследующиенедостатки в построении ИС, затрудняющие поиск информации и дальнейшееиспользование ИС в качестве источников данных для программ компьютерногоконструирования неорганических соединений:отсутствие функций поиска информации по количественному составусоединения,отсутствие функций поиска по значениям физико-химических свойств.Эти недостатки связаны с тем, что рассмотренные ИС СНВМ по сути являютсядокументальными, с некоторыми возможностями поиска по ключевым словам, а нефактографическими, как требуется в СППР при прогнозировании свойств веществ.Поэтому выявленные недостатки можно квалифицировать как системные проблемы вархитектуреданныхИССНВМ,препятствующиеэффективномупоискуматериаловедческих данных. Таким образом, использование подобных ИС СНВМ вкомплексах компьютерного конструирования неорганических соединений невозможно.Выявленные архитектурные недостатки были устранены при разработке авторомнекоторых ИС ИМЕТ РАН, описанных ниже.
Отличительной особенностьюразработанных ИС СНВМ является возможность поиска данных по сложным запросам:запросы с учетом количественного состава и кристаллических модификацийхимических соединений, а так же сложносоставные запросы, связанные с поискомматериалов с учетом нескольких значений свойств, например, твердости и температурыплавления. Эти типы запросов, как правило, не реализованы в материаловедческих ИС,разработанных в других организациях, что затрудняет использование подобных ИС прикомпьютерном конструировании неорганических соединений.752.3.3. Обобщенная структура данных для ИС СНВМПри анализе разнородных ИС СНВМ установлено, что описание сущностей и ихсвойств происходит с разной степенью детализации. Отмечено, что значения свойств,хранимых в разных информационных источниках, определяются, в первую очередь,составомнеорганическихвеществ(наборомобразующихихатомовиихсоотношением).
В свою очередь, физические свойства веществ во многом зависят откристаллической структуры. Анализ информации, содержащейся в ИС СНВМ,присутствующих в каталоге IRIC, позволил составить иерархию химических понятий(рис. 2.3.2.).Обозначив объекты второго уровня общим термином “вещество” получаемтрехуровневую иерархию понятий: система, вещество и кристаллическая модификация.Вся информация о свойствах химических объектов, описываемых в интегрируемых ИССНВМ, может быть представлена на одном из этих трех уровней. Приведеннаяиерархия понятий, являясь, по сути, упрощенной онтологией для рассматриваемой внастоящей работе предметной области, имеет особую важность для построенияинформационных моделей данных как при разработке ИС СНВМ, так и при ихинтеграции (рис.