Интеграция автономных источников данных для прогнозирования свойств неорганических веществ (1090500), страница 8
Текст из файла (страница 8)
Смена формата данных в ИС интеграциитребует корректировки метаданных, а также внесения изменений во всемодули (адаптеры) преобразования форматов. Смена формата данных в ИСисточника данных может быть реализована более прозрачно для ИСинтеграции, поскольку требует корректировки только адаптеров ИСисточников данных и не затрагивает метаданные ИС интеграции.ИсточникиданныхизвлечениеданныхПолученные данные висходном форматепреобразованиеформата данныхПромежуточные данные впреобразованном форматепредставлениеданныхДанные дляпользователяМетаданныеРис.
2.4. Диаграмма потоков данных первого уровня декомпозиции2.4. Функциональное моделирование процессов обработки информациипри интеграции данныхДля детализации описания информационных процессов используетсяметодология функционального моделирования IDEF0 [54]. Обобщеннаяфункциональная модель очень близка к обобщенной модели потоков данных,но при дальнейшей детализации используются выразительные возможностифункционального моделирования, в частности, возможность указания ролипри описании взаимосвязей процессов [55].Основными компонентами нотации IDEF0 являются блоки, стрелки идиаграммы.45 Графическая диаграмма – главный компонент модели.
Диаграммысодержат блоки и стрелки.Блок описывает функцию, определяемую как деятельность, процесс,операцию, деятельность или преобразование. Блок изображается в видепрямоугольника, границы которого представляют собой сплошные линии.Внутри каждого блока размещается его уникальное имя и номер.Стрелки идентифицируют данные или материальные объекты. Стрелкаизображаетсяввидесплошнойломанойлинии,состоящейизгоризонтальных и вертикальных отрезков, на одном конце стрелки находитсянаконечник. Каждая стрелка имеет метку. Сторона функционального блока, ккоторой присоединена стрелка, однозначно определяет роль стрелки [56]:• вход – объекты, используемые (расходуемые, преобразуемые) функцией;изображается с помощью стрелки, наконечник которой касается левойстороны функционального блока;• выход – результат выполнения функции; изображается с помощьюстрелки, покидающей правую сторону функционального блока;• управление – условия, необходимые функции, чтобы сформироватьправильный выход; изображается с помощью стрелки, наконечниккоторой касается верхней стороны функционального блока;• механизм – то, с помощью чего осуществляется преобразование входов ввыходы; изображается с помощью стрелки, наконечник которой касаетсянижней стороны функционального блока;Стрелки могут разветвляться.
Если стрелка после точки ветвления неимеет метки, это означает, что стрелка описывает все объекты, заданныеметкой стрелки перед точкой ветвления. Метка стрелки после точкиветвления описывает, какие именно объекты выделяются из множестваобъектов, заданных меткой стрелки до ветвления.Обобщенная функциональная диаграмма процессов интеграции иобработки данных представлена на рис.2.4. Стрелка в роли «управление»начинается от верхней границы диаграммы и указывает на функциональный46 блок.
Стрелки управления представляют собой потоки предписывающей иограничительнойинформации.Обычноонипредставляютсобойсовокупность нормативных и регламентирующих документов. В контекстетехнологий интеграции информационных систем к ним в первую очередьотносятся методы интеграции.Стрелки в роли «механизм» начинаются от нижнего края диаграммы иуказывают на функциональный блок. Стрелки в роли «механизм» описываютлибо некоторые устройства, либо исполнителей, занимающих определенныедолжности или выполняющих определенные функции.
В информационныхсистемах в качестве исполнительных механизмов обычно указываются либопользователи системы (оператор, разработчик, администратор, руководительи т.д.), либо программное и аппаратное обеспечение, реализующееинформационныепроцессы.Вфункциональноймоделитехнологийинтеграции данных в качестве механизмов выступают первичные ИС и ИСинтеграции данных.Рис. 2.4. Обобщенная функциональная диаграмма процессов интеграции иобработки данных.47 Стрелки «запрос данных» и «данные из первичных источников» имеютроль «вход».
Они описывают исходные данные для всего процессаинтеграции и направлены от левого края диаграммы к функциональномублоку.Стрелка «результаты запроса» имеет роль «выход». Она описываетрезультат выполнения процесса и направлена от функционального блока кправому краю диаграммы.Функциональная диаграмма 1-го уровня декомпозиции представлена нарис.
2.5.Онасостоитиз4-хфункциональныхблоков,связанныхотношениями «вход-выход»: результат одного процесса является исходнымиданными для другого. Последовательность блоков задает последовательностьвыполненияинформационныхпроцессов:формированиезапросовкпервичным ИС, извлечение данных, агрегация данных, предоставлениеданных пользователю [57]. Стрелки между блоками описывают передачуинформации между этими процессами. Так, результаты запросов изпервичных ИС являются результатом процесса извлечения данных иисходными данными для процесса агрегации данных. Отметим, что на этомэтапе декомпозиции возникает необходимость описания метаданных. Наобобщенной (родительской) диаграмме эти данные не описаны, поэтомуметаданные представлены туннельной стрелкой.Стрелки с ролью «механизм» характеризуют исполнителей процессов.Так, первичные ИС используются на этапе извлечения данных.
Для описаниясоставных частей ИС интеграции данных используется ветвление стрелки.Так, стрелки, задающие программу - посредник и адаптеры, являются частьюстрелки «ИС интеграции данных».48 Рис. 2.5. Функциональная диаграмма первого уровня декомпозицииГлава 3. Применение технологий интеграции данных длякомпьютерного конструирования неорганических соединений3.1.
Выбор среды реализации интегрированной ИСВыбор среды реализации является важнейшим этапом разработкиинформационнойсистемы,таккаквомногомопределяетусилия,затрачиваемые на реализацию ИС, ее поддержку и сопровождение [58].Наиболееиспользуетсяэффективнымстандартноепредставляетсяпрограммноеподход,обеспечение,прикоторомпозволяющееполностью реализовать функции ИС, при необходимости гибко достраиватьи расширять их. Важное значение придается также возможностям интеграцииразрабатываемой ИС с уже эксплуатирующимися системами.Спектр инструментальных средств для разработки информационныхсистем достаточно велик. Среди крупнейших компаний, предлагающихпрограммные среды для разработки ИС, можно выделить Microsoft, IBM, SunMicrosystems, Oracle, BEA, Computer Associates и др.
Следует отметить, чтофункциональные возможности программ, предлагаемых этими компаниями,весьма близки.Сущенствующие в настоящее время БД по свойствам неорганическихвеществ разрабатывались на различных аппаратных и программных средах,поэтому возможность интеграции разрабатываемой ИС с разнороднымипрограммными средами, применяемыми на других программно-аппаратныхплатформах, имеет первостепенное значение.В качестве базовых критериев выбора среды реализации в работепредложены:• производительность;• безопасность;• надежность;• способность взаимодействовать с разнородными программными средами,применяемыми на других программно-аппаратных платформах;• совокупная стоимость владения.Сравнение производительности программных платформ• Web-сервер Internet Information Server (IIS) на платформе MicrosoftWindows Server 2003• Web-сервер Apache на базе высокопроизводительных коммерческих Unixплатформосновано на результатахотчета, опубликованногонезависимойкомпанией Veritest в апреле 2003 года [59].
В этих тестах сравниваласьпиковая производительность по числу обрабатываемых запросов в секунду,показываемая указанными выше Web-серверами на одном и том жеаппаратном обеспечении. Основной вывод Veritest, приведенный в отчете,гласит, что Web-сервер IIS 6.0 на базе Windows Server 2003 позволяетобслуживать большее число одновременно подключенных пользователей,чем Apache 1.3.23 на базе Red Hat Linux Advanced Server 2.1 и Red Hat Linux8.0 на тестируемом оборудовании, предоставленном компанией HewlettPackard.Дляанализаинформационнойбезопасностипрограммногообеспечения, предоставляемого ведущими производителями, воспользуемсяданными, полученными известной аналитической компанией ForresterResearch [60]. В докладе этой компании информационная безопасностьоценивается по 2-м параметрам: среднее число дней, которое потребовалосьразработчику ПО с момента обнаружения уязвимости в платформе домоментаустраненияуязвимости,иобщееколичествоуязвимостей.Резульаты, полученные Forrester Research, сведены в таблицу 3.1.
Из таблицывидно, что продукты фирмы Microsoft являются лидерами в областиинформационной безопасности.51 Таблица 3.1. Сравнение информационной безопасности основныхпрограммных платформ.ПлатформаОбщее колвоуязвимостейКол-вокритич.уязвимостейКол-во испр.уязвимостейСреднеечисло днейдоустраненияуязвимости1288612825Microsoft22912822857Red Hat28616227557Debian12019782MandrakeSoft 19917611117274SUSEОбщепринятым стандартом кросс-платформенного взаимодействия внастоящее время является сервисно-ориентированная архитектура (ServiceOrientedArchitecture,независимымиSOA).фирмамиСогласноJupiterисследованиям,Research[61]ипроведеннымObjectWatch[62],подавляющее большинство опрошенных специалистов наиболее высокооценили простоту взаимодействия с разнородными программными средами,обеспечиваемую технологическими решениями фирмы Microsoft.Интегральнымпоказателемэкономическойэффективностиприменяемых технологий является совокупная стоимость владения (ССО).Существует несколько методик вычисления этого показателя, разработанныхведущими аналитическими компаниями, но все они нацелены на определениенаилучшего соотношения цена/качество для оборудования и программногообеспечения [63].