Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 23
Текст из файла (страница 23)
Стандартизации подвергаются все подсистемы, входящие в составцентрализованнойсистемы.Всвоюочередь,стандартизацияподсистемиинформационных потоков между ними осуществляется на основе собраннойинформации о взаимодействии всех составных частей, образующих информационнуюсистему [63].3.2.2. Метод интеграции корпоративной информации EIIИнтеграциякорпоративнойинформации–этоинтеграцияданныхизмногочисленных систем в унифицированное, согласованное и точное представление,которое предназначено для изучения и обработки данных.При организации процесса интеграции данных по технологии EII главнымфункциональным модулем является «предметный посредник» (иногда называемыймодулем извлечения), который обеспечивает:Единый интерфейс взаимодействия конечных приложений с источникамиисходной информации.Поиск запрашиваемой информации по исходным базам данных.Агрегацию собранной информации для передачи конечным приложениям.Взаимодействие с источниками хранения исходных данных осуществляется засчет адаптеров – модулей преобразования форматов данных.Схема интеграции разнородных источников данных на основе методаинтеграции корпоративной информации представлена на рис.
3.2.2.118Рис. 3.2.2. Метод интеграции корпоративной информации EIIКонечные приложения инициируют запросы, определяющие характер и объеминтегрируемых данных. Для взаимодействия между предметным посредником иприложениями используется единый, стандартизированный в рамках данной системыинтеграции данных, интерфейс для прикладных программ (Application ProgrammingInterface, API).Предметный посредник определяет, к каким источникам данных необходимообратитьсядляполучениязапрашиваемойинформации.Источникиданныхопределяются на основе информации, содержащейся в метабазе – специальномкаталоге, содержащем описание информации, находящейся в источниках исходныхданных.Определивисточникиинформации,предметныйпередникоправляетконтекстные запросы индивидуально к каждому источнику исходных данных.
Форматзапросов стандартизирован и одинаков для всех источников данных. Для конвертациизапроса в формат взаимодействия с источником данных используется индивидуальныйадаптер.После извлечения (pull), данные агрегируются и передаются конечнымприложениям. На этапе агрегации возможно преобразование и изменение данных,устранение конфликтов данных.С точки зрения конечного приложения взаимодействие осуществляется с единойбазой данных в едином стандартизированном формате.3.2.3.
Метод интеграции на основе хранилищ данных ETLНазвание метода ETL является аббревиатурой от названий функций извлечения(Extract), преобразования (Transform) и загрузки (Load) данных.119Интеграция разнородных источников данных включает в себя предварительноеформирование хранилища данных и последующую работу с данными, размещеннымине в ИС источников данных, а в хранилище данных.Формирование хранилища данных состоит из трех этапов.На первом этапе интегрируемые данные извлекаются из источников данных(source) , в качестве которых могут выступать любые организованные хранилищаданных.
Метод извлечения зависит от структуры и технической реализации источника.Может быть использовано прямое подключение (native connection) к базе данных,запросы к системе (message querying), программный интерфейс (API) и т.д.Взаимодействие является однонаправленным – при извлечении данныхинициатором выступает система синхронизации.
Извлечение производится в пакетномрежиме – через заданные временные интервалы, которые могут зависеть от множествафакторов, включая частоту обновления данных источника и человеческий фактор иотличаться для каждого отдельного источника.При первичном извлечении данные извлекаются из базы данных источника вполном объеме. При последующих извлечениях данных, для оптимизации работысистемы может быть реализован механизм определения изменений данных источника иизвлечениятолькоданных,необходимыхдляактуализацииинформациивпромежуточном хранилище (Staging Area).В результате выполнения первого этапа интеграции по методу ETL системаинтеграции локально сохраняет данные, полученные от источника, в промежуточномхранилище и может применить функции преобразования данных.Навторомэтапе,спомощьюфункцийпреобразования,выполняетсяунификация представления данных промежуточных хранилищ, для создания единойструктуры хранения и организации данных.
На данном этапе выполняются функцииобъединения и слияния или, наоборот, разделения данных; изменения форматапредставления данных – например, реорганизация таблиц и отношений междутаблицами;добавлениеновыхатрибутов;сортировкаифильтрация.Такжеосуществляется анализ и контроль качества и полноты собранных данных, устраняютсяконфликты интеграции данных.По завершении данного этапа, информация в промежуточных хранилищахприводится в единый формат, определяющий взаимодействие сформированной базыданных с инструментальными панелями и программным обеспечением.120На третьем этапе осуществляется загрузка данных в постоянное хранилище(интегрированных) данных. Хранилище данных (warehouse) содержит непосредственноданные и метабазу данных.После выполнения функций загрузки данных формуется база интегрированныхданных, имеющая единую детерминированную структуру и интерфейс, с помощьюкоторого любые модули и приложения могут обращать информации, хранимой в базе.Функции ETL могут одновременно применяться к нескольким базам данныхисточников, либо к группам баз данных источников, в случае однотипности последних.Схема интеграции разнородных источников данных на основе хранилищаданных представлена на рис.
3.2.3.Рис. 3.2.3. Интеграция на основе хранилищ данных ETL.Последующая работа с хранилищем данных не отличается от работы слокальной базой данных. В ИС интеграции на основе хранилища данных реализуютсявсе базовые информационные процессы (рис. 3.2.1) обработки информации.3.2.4. Интеграция корпоративных приложений EAI.Метод интеграции корпоративных приложений EAI вместо непосредственнойинтеграции разнородных данных предполагает интеграцию результатов работы двух иболее приложений (программ), работающих с независимыми друг от друга данными.Метод EAI позволяет автоматизировать процессы работы с разнороднымиданными без необходимости непосредственного обращения к данным и измененияготовых интерфейсов, программ и приложений работы с данными.121Основной задачей в контексте данного метода интеграции является задачаорганизациивзаимодействиямеждуобъединенныминтерфейсомработысприложениями и приложениями источниками – согласования формата, средств испособов передачи данных от одного приложения к другому.Существует несколько наиболее распространённых методов решения даннойзадачи:Использование программных адаптеров (Adapters) для обоих приложений;Использование промежуточного программного обеспечения, ориентированного наобработку сообщений (Message-oriented middleware, MOM);Использование репликатора данных (Data Replication Engine).Программный адаптер является модификацией приложения, обеспечивающейприем/передачу данных в формате понятном как приложению-источнику, так иобъединенному интерфейсу.
Реализация адаптера зависит от конкретного приложения.Использование промежуточного ПО обеспечивает синхронизацию информациимежду приложениями с помощью запросов, передаваемых в асинхронном режиме.Формат передаваемых между приложениями сообщений также должен бытьсогласован.Использование репликаторов обеспечивает синхронизацию данных на уровнебаз данных. При этом непосредственная интеграция приложений не осуществляется.Репликатор отслеживает изменения в базе-источнике и в случае обнаруженияизменений – передает их базе данных, взаимодействующей с объединенныминтерфейсом.Схема интеграции разнородных источников данных на основе методаинтеграции корпоративных приложений представлена на рис. 3.2.4.Иногда при использовании меотда интеграции корпоративных приложений EAIдополнительно уточняется, какие именно корпоративные приложения имеются в виду:относящиеся к одной корпорации или к разным.
В рамках одной организацииинтеграция корпоративных приложений обычно описывается термином BusinessProcess Integration (BPI – интеграция бизнес-процессов). Если же речь идет обинтеграции ИС разных организаций, то такую интеграцию часто называют B2Bинтеграцией (Business-To-Business)122Рис. 3.2.4. Интеграция корпоративных приложений EAI.3.2.5. Обобщенная схема методов интеграции гетерогенных информационныхсистемПоявление каждого из описанных выше методов интеграции обусловленонеобходимостью решения определенного круга задач, которые, независимо от отраслиили характера деятельности возникали перед компаниями и организация с ростомобъемов используемых данных и расширением ИС.В ряде случаев возможно использование единственного варианта интеграцииданных.