Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 24
Текст из файла (страница 24)
Например, отсутствие доступа к исходным данным предопределяетиспользование метода интеграции приложений EAI, а требование доступности данныхнезависимо от работоспособности ИС источника данных – применение методахранилищ данных ETL.В табл. 1 приведены критерии сравнения методов интеграции гетерогенных ИСдля подбора наиболее подходящего варианта реализации интеграции для каждогоконкретного случая.При объединении ИС информационные процессы 1–5 (рис.
3.2.1) будутреализованы в различных ИС (множественных ИС источников данных либо вцентральной ИС интеграции) при помощи специализированных программныхкомпонентов (модулей). На основе системного анализа информационных потоковсоставлена обобщенная схема интеграции гетерогенных ИС (рис. 3.2.5). Пунктиром насхеме показаны условные границы интегрируемых ИС.123Рис. 3.2.5. Обобщенная схема интеграции гетерогенных ИС.ИС источников данных могут работать автономно в локальном режиме (верхняячасть схемы). Интеграция приложений EAI требует применения в посредникаинтерфейсов,управляющегопередачейсообщениймеждуинтегрируемымиприложениями на основе метабазы внешних приложений. При этом извлечение иобработка данных выполняются в ИС источников данных, а результаты могут бытьпредставлены как в интерфейсе ИС интеграции, так и в интерфейсах исходных ИС.Интеграция на основе метода хранилищ данных ETL включает модулиизвлечения исходных данных в форматах ИС источников (на основе метабазы внешнихданных), преобразование их к формату хранилища данных и загрузки в локальное124хранилище (на основе метабазы хранилища данных).
Локальное расположение всехмодулей обработки данных требует доступности ИС источников только на моментпервичного извлечения данных.Таблица 3.1. Критерии сравнения методов интеграции гетерогенныхинформационных систем.КритерийЛокальныеБДОбъектинтеграцииОбъемизвлекаемыхданныхETLИсходныеданныеТолькозапрашиваемыепользователемданныеВсе данныеЕМEAIПриложения,Исходные данные обрабатывающиеисходные данныеТолькоТолькозапрашиваемые запрашиваемыепользователемпользователемданныеданныеТребуется, вТребуется,Требуется,полном объеме вчастичный вчастичный вмоментНе имеетсямомент запросамомент запроса кизвлеченияк даннымданнымданныхАктуальны наАктуальностьДанные всегдамоментДанные всегдаДанные всегдаизвлекаемыхактуальныпоследнейактуальныактуальныданныхзагрузкиДолговременное, Долговременное,ХранениеКратковременное, Кратковременное,в собственном в собственномизвлеченныхв оперативнойв оперативнойхранилищехранилищеданныхпамятипамятиданныхданныхФорматОпределяетсяОпределяется Определяется ИСОпределяется ИСизвлекаемых ИС источника ИС источникаинтеграцииисточника данныхданныхданныхданныхданныхВыполняет ИС Выполняет ИСИзвлечениеВыполняет ИСВыполняет ИСисточникаинтеграцииданныхисточника данных источника данныхданныхданныхПреобразованиеВыполняет ИСВыполняет ИСВыполняет ИСформатаинтеграцииисточника данных источника данныхданныхданныхВыполняет ИС Выполняет ИС Выполняет ИСОбработкаВыполняет ИСисточникаинтеграцииинтеграцииданныхисточника данныхданныхданныхданныхВыполняет ИСВыполняет ИС Выполняет ИС Выполняет ИСПредставлениеисточника данныхисточникаинтеграцииинтеграцииданныхи/или интеграцииданныхданныхданныхприложенийДоступ кданнымисточникаПри использовании метода интеграции данных EII исключается трудоемкаястадия разработки и заполнения промежуточного хранилища данных, но требуется125постоянный доступ к ИС источников данных и размещение в исходных ИС адаптеровизвлечения данных и преобразования к единому формату ИС интеграции.При интеграции гетерогенных ИС (в отличие от локальной ИС) необходимареализация процессов внешнего информационного обмена.
На обобщенной схемеинтеграции (рис. 3.2.5) эти процессы представлены стрелками информационныхпотоков,пересекающимиусловныеграницыИС.Такжепроцессыпередачиинформации имеют место при реализации удаленного доступа пользователей кинтерфейсу ИС интеграции.В результате анализа критериев сравнения методов интеграции (табл.
3.1) иобобщенной схемы интеграции гетерогенных ИС (рис. 3.2.5) можно определить рядситуаций, в которых использование одного конкретного метода интеграции являетсяпредпочтительным,либоединственновозможным.Рекомендацииповыборупредпочтительного метода интеграции гетерогенных ИС приведены в табл. 3.2.Таблица 3.2. Рекомендации по выбору предпочтительного метода интеграциигетерогенных ИС.Критерий принятиярешения по выборуметода интеграцииУсловия интеграции гетерогенныхинформационных системРекомендуемыйметод интеграцииВозможность доступа кданным источникаНадежность доступа кданным источникаДоступ к данным отсутствуетДоступ к данным возможенНеобходим постоянный доступПостоянный доступ не требуетсяEAIETL или EIIETLEIIХранение извлеченныхданныхИнтеграция расчетныхподсистем ИСНеобходимо локальное хранениеНе требуетсяТребуетсяНе требуетсяДоступ на ограниченной (платной)основеВозможен полный доступтребуетсяне требуетсяETLEII или EAIEAIETL или EIIОграниченность доступак данным источникаАктуальностьизвлекаемых данныхEII или EAIETLEII или EAIETLТак, если непосредственный доступ к данным ИС источника отсутствует, тоиспользование методов интеграции данных EII и ETL невозможно, а единственнымдоступным способом является интеграция приложений.Постоянный доступ к данным может быть обеспечен (не считая локальных БД)только при использовании метода хранилищ данных ETL.
Работоспособностьинтегрированной ИС на основе методов EII и EAI зависит от доступности ИСисточников данных.126Требование локального хранения данных может быть вызвано не тольконеобходимостью обеспечения постоянного доступа к ним, но и целым рядом другихпричин, например, для организации собственной системы разграничения доступа кданным (по соображениям безопасности, на платной основе и т.д.).Наличие патентованных (или недоступных по другим причинам) алгоритмовобработки данных ограничивает выбор только методом интеграции приложений EAI,поскольку создание равноценного приложения обработки извлеченных данных (врамках интегрированной ИС) по вышеуказанным причинам является невозможным.НевозможностьполногодоступакданнымИСисточникаисключаетприменение метода хранилищ данных.
Платный доступ к данным ИС источникаопределяет высокую стоимость хранилища данных и делает его разработкуэкономически неэффективной.Метод хранилищ данных предполагает локальное хранение не только полногообъема исходных данных, но и различных промежуточных данных (в процессе ихпреобразования для загрузки), поэтому ограниченность ресурсов хранения исключаетприменение этого метода.МетодхранилищданныхETLпредполагаеттакжеопределеннуюпериодичность выполнения процедур извлечения внешних данных и загрузкипреобразованных данных в локальное хранилище ИС интеграции. Если эти процедурыявляются трудоемкими, дорогими, осложнены частой сменой внешних форматовданных и т.д., то это часть может приводить к возможной потере актуальностизагруженных в хранилище данных.Обеспечение полной актуальности данных может быть достигнуто только засчет использования методов EII, либо EAI.
Кроме того, преобразование данных в этихметодах осуществляется в рамках ИС источников данных. Таким образом, сменаформатов исходных данных отражается на интегрированной ИС в минимальнойстепени.Использование метода хранилищ данных (ETL) предлагается для созданияинтегрированного источника данных в рамках одной организации, например, ИМЕТРАН. Это позволит получить максимальную надежность и скорость работы синтегрированными данными со стороны систем компьютерного конструированиянеорганических соединений или других высокоуровневых средств интеграции.Использование метода интеграции данных (EII) предлагается для виртуальнойинтеграции материаловедческой информации между ИС, как правило, относящимися кразныморганизациям,запрещающимфизическоекопированиеданныхили127предоставляющими ограниченный доступ к данным на платной основе. Таким образом,на нижнем уровне (в рамках организации) данные интегрируется с помощью хранилищданных (ETL), а затем на более высоком уровне интеграция осуществляется сиспользованием метода EII (рис.
3.2.6). Отмечается, что возможна реализациямногоуровневой схемы использования хранилищ данных и виртуальной интеграциидля обеспечения требуемой скорости обработки и масштабируемости.Рис. 3.2.6. Методика консолидации данных ИС СНВМ.3.3. Методология интеграции информационных системОтличительной особенностью ИС СНВМ, интегрируемых в настоящей работе,является то, что все они, как правило, являются предметно-ориентированными ипоэтому хранят информацию только о тех веществах и их характеристиках, которыеотносятся к исследуемой предметной области.
Например, ИС по фазовым диаграммамсистем с полупроводниковыми фазами “Диаграмма” и ИС по веществам с особымиакустооптическими,электрооптическимиинелинейнооптическимисвойствами“Кристалл” – проблемно ориентированы на специалистов в области химии иэлектронной техники.Таким образом, в разных информационных системах представлены различныехарактеристики (будем далее называть их свойствами) различных сущностей.
Значениясвойств определяются, в первую очередь, составом неорганических веществ (наборомхимических элементов, входящим в их состав, и их соотношением), а также в128большинстве случаев физические свойства зависят от кристаллической структуры, т.к.в указанных выше ИС содержится информация о твердых фазах. Поскольку ИС тесносвязаны с химией, то сущности в ИС описываются с помощью иерархии понятий(система → вещество → модификация) в виде дерева (см. рис. 3.3.1).Рис. 3.3.1.