Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 19
Текст из файла (страница 19)
СИСТЕМНЫЙ ПОДХОД К ИНТЕГРАЦИИИНФОРМАЦИОННЫХ СИСТЕМ3.1. Методы интеграции гетерогенных информационных систем3.1.1. Актуальность интеграцииВ настоящей диссертационной работе интегрируются информационные системы(ИС) по свойствам веществ и технологий их получения, и в первую очередь – ИС, посвойствам неорганических веществ, используемых в электронике.Прогресс электроники, как наиболее динамически развивающейся отрасливысоких технологий, в значительной степени обусловлен использованием новыхвеществ и химических соединений. В связи с этим, актуальным является решениепроблемы обмена информацией между разработчиками и потребителями веществ,используемых в электронной технике. Традиционная система публикации результатовнаучных разработок: статья – обобщение в виде монографии или справочника несоответствует высоким темпам развития электроники, элементная база которойобновляется каждые полтора-два года. Существенным фактором, усложняющим поискнеобходимой для специалистов информации, является разбросанность данных помногочисленным литературным источникам разного профиля.Современная информационная система для научных работников и инженеров,использующих вещества для электроники, должна обеспечивать оперативностьобновления данных, их достоверность и полноту, а также возможность доступа кинформации из глобальной сети Интернет.
Именно эти принципы положены в основуразработанной в настоящей диссертационной работе распределенной системы базданных по свойствам веществ для электронной техники.Следует отметить, что во всем мире огромные средства тратятся на нуждыинтеграции информационных систем. Так, в 2002 году затраты на интеграциюинформационных систем и оценку качества данных по всему миру составили порядкаодного триллиона долларов США [38]. Следует также отметить, что по даннымForrester, 33% всех компаний в сфере ИТ занимаются интеграцией информационныхсистем [39]. А обзор за февраль 2002 года, проведенный CIO Magazine, показывает, чтосамой высокоприоритетной статьей расходов многие ИТ-компании считают построениеинтегрированных систем (рис. 3.1.1).100Рис.
3.1.1. Наибольшие расходы ИТ-компаний по сферам деятельности.3.1.2. Проблемы при интеграции информационных системСоздание централизованной информационной системы, как правило, являетсясложной задачей даже в рамках одной крупной научно-исследовательской организации.Это обусловлено использованием различных информационных комплексов для сбора ирегистрации данных, а также спецификой и разнообразием исследований.
Поэтомупроблема создания систем интеграции информации, которые бы были способныобъединить всю важную информацию, накопленную исследователями даннойорганизации, является актуальной при создании практически любой централизованнойинформационной системы.Основной задачей при разработке централизованных систем является задачастандартизации. Стандартизации подвергаются все подсистемы, входящие в составцентрализованнойсистемы.Всвоюочередь,стандартизацияподсистемиинформационных потоков между ними осуществляется на основе собраннойинформации о взаимодействии всех составных частей, образующих информационнуюсистему.Следует отметить, что информация в различных информационных системахможет храниться не только в форме распространенных баз данных, но и в других видах.Примером могут служить электронные таблицы (например, Microsoft Excel), CSV(Comma-Separated Values или другие ASCII flat-file), данные в формате XML, бинарныеструктуры данных, специально разработанные для хранения информации [41].
Все этозначительно затрудняет интеграцию информационных систем.101В случае баз данных, использующих различные СУБД, возникает массатрудностей, а именно:Базы данных, использующиеся в различных организациях, построены на основеразличных СУБД (Microsoft SQL Server, Oracle, IBM DB2 и т.д.);Базы данных всегда имеют различную структуру (схему БД) и оперируютразличными данными;Репликация баз данных, требующая полного переноса данных из одной БД вдругую, зачастую затруднительна по техническим и организационным причинам.3.1.3. Методы интеграции ИСЗадача интеграции информации в настоящее время является актуальной длямногих организаций, поскольку позволяет повысить эффективность их работы.
Этимобъясняется большой интерес к данному направлению развития ИТ, и появлениемножества новых программных продуктов от крупнейших компаний, направленных нарешение задач интеграции. Проблема же, однако, заключается в том, разные компаниипо-разному понимают интеграцию и, следовательно, по-разному подходят к решениюзадач интеграции. Следует отметить, что это происходит на фоне еще не вполне четкосформировавшегося,размытоготерминологическогоаппарата.Такимобразом,необходимость разъяснения сути методов интеграции и их преимуществ привела виюле 2001 года к созданию лидерами в области интеграции международногоконсорциума по интеграции (Integration Consortium – IC). Следует отметить, что до мая2004 года у консорциума IC было другое название – консорциум отрасли интеграциикорпоративных приложений (EAI Industry Consortium – EAIIC), которое былоизменено, поскольку консорциум занимался всеми вопросами интеграции, а EAIявляется лишь одним из методов интеграции.
В настоящее время IC – этомеждународная некоммерческая организация, объединяющая в своих рядах более 50компаний из различных стран мира. В работе IC принимают участие не толькопоставщики программного и аппаратного обеспечения и системные интеграторы, но ипотребители методов интеграции, представители научных кругов. Поскольку ICзадумывался как сообщество, целью которого является единение отрасли интеграции,все члены консорциума могут совместно определять проблемы и разрабатыватьрешения. По сути роль консорциума IC в сфере интеграции эквивалентна роликонсорциума W3C в области Web-технологий.В данной работе будем стараться придерживаться термина “метод интеграции”вместо “технологии интеграции”, т.к.
его использование является более уместным при102разработке методологии интеграции. Методология рассматривается как системаметодов исследований, в данной работе методов (или технологий) интеграции. А методявляется набором методик, т.е. совокупностью приемов практической реализации.В настоящее время выделяют три метода интеграции. Это интеграциякорпоративных приложений (Enterprise Application Integration, EAI), интеграциякорпоративной информации (Enterprise Information Integration, EII) и программноеобеспечение для извлечения, преобразования и загрузки данных (Extract, Transform,Load – ETL) [40].Принципы интеграции, заложенные в этих методах, используются для решенияширокого круга задач: от интеграции в режиме реального времени до пакетнойинтеграции, и от интеграции данных до интеграции приложений.
На рис. 3.1.2 показаноположение названных методов по отношению к этим двум типам задач. Дляинтеграции данных в режиме реального времени лучше всего подходит подход EII. Дляпакетной интеграции данных – ETL. А для интеграции приложений, в режимереального времени или пакетном, наиболее подходящим инструментом являетсяприменением метода EAI. Следует отметить, что ни один из существующих насегодняшний день методов интеграции не способен решить все проблемы,возникающие при объединении ИС [40].Рис.
3.1.2. Современные методы интеграции ИС [40].Как было отмечено, в настоящее время происходит не только становлениетерминологической базы в области интеграции, но и развитие самих интеграционныхподходов. Вследствие этого наблюдается некоторая неоднозначность в отношениитого, каковы функции каждого из трех описанных методов, и в каких случаях тот илииной метод должен использоваться. Необходимо четко представлять возможностикаждого метода и определить класс задач, для решения которых подходит каждый из103методов. Для понимания различий в назначении методов интеграции необходимопривести соответствующие определения, учитывающие их назначения [42]:EAI – это метод интеграции, с помощью которого организация добиваетсяцентрализации и оптимизации интеграции корпоративных приложений, обычноиспользуя те или иные формы оперативной доставки информации (push technology),которая управляется внешними событиями (event-driven);ETL – это метод интеграции, который преобразует данные (обычно с помощью ихпакетнойобработки)изоперационнойсреды,включающейгетерогенныетехнологии, в интегрированные, согласующиеся между собой данные, пригодныедля использования в процессе поддержки принятия решений.
Метод ETLориентирован на консолидацию разнородных базы данных в виде, например,хранилища данных, витрины или операционного склада данных;EII – это метод интеграции в режиме реального времени несопоставимых типовданных из многочисленных источников как внутри, так и за пределамиорганизации. Инструменты EII обеспечивают универсальный уровень доступа кданным и используют технологию поиска информации (pull technology) иливозможности работы по запросам.Для более полного понимания этих методов необходимо рассмотреть ихвзаимосвязьврамкахужесуществующейинформационнойинфраструктурыорганизации.