Диссертация (1136162), страница 2
Текст из файла (страница 2)
При этом решение проблемы интеграции гетерогенных БД и БМД враспределенных средах интернет/интранет потенциально обеспечивает новоекачество информации, благодаря извлечению знаний из данных.Таким образом, проблема разработки и унификации комплекснойинтеграционной технологии, включающей как математические модели, так ипрограммно-инструментальные средства для поддержки гетерогенных КПК,непосредственно связана с производственно-экономической эффективностьюкорпораций.
Хотя эта проблема находится в центре внимания крупнейшихкомпаний-разработчиков программного обеспечения (ПО) и ведущих научныхколлективов, она еще далека от удовлетворительного решения. Рассматриваемаяпроблема объединяет следующие взаимосвязанные аспекты:• трудности управления обработкой большими, быстро растущими объемамиданных в гетерогенных КПК, во многом обусловленные недостаточноформализуемойсемантикойязыковыхиинструментальныхсредствпроектирования ПО (в т.ч. на основе языка UML);• сложность интеграции теоретически перспективных математических моделейданныхсузконаправленными,инструментальнымисредствами,эмпирическимиподдерживающимипрограммно-«промышленные»6методологии проектирования КПК, приводящая к неадекватным срокам,стоимости или эксплуатационным характеристикам внедрения;• недостаточная унификация моделей, методов и программных средств дляпредставления и управления контентом – гетерогенными данными иметаданными – компонент КПК.Отмеченные технологические сложности разработки гетерогенных КПКносят принципиальный характер, что неоднократно отмечалось в работах такихотечественных исследователей, как А.П.
Ершова, А.А. Ляпунова,В. М. Глушкова, Г. И. Марчука, Г. С. Цейтина, Г. Е. Минца, И. А. Мизина, Э. Х.Тыугу, Л. Т. Кузина, Г. С. Поспелова, Д. А. Поспелова, С. С. Лаврова,И. В. Романовского, В. В. Липаева, Л. Н. Сумарокова, Е. Л. Ющенко,А. С. Нариньяни, В. Э. Вольфегагена, Б. А. Щукина, В. М. Ветошкина,Ю. Ш.
Гуревича,Л. А. Калиниченко,А. А. Стогния,С.Д.Кузнецова,А. Н. Терехова, А. М. Вендрова.Среди зарубежных исследователей рассматриваемую проблематикуразрабатывали Э. Кодд, К. Дейт, Д. Мейер, Х. Дарвен, Дж. Ульман, Дж. Уидом,П. Чен, Э. Дейкстра, М. Шейнфинкель, Х. Барендрегт, А. Черч, Х. Карри,Д. Скотт, Ч. Хоар, М.
Стоунбрейкер, Д. ДеВитт, Г. Гарсиа-Молина, Д. Флореску,Й. Камбаяши, Г. Буч, А. Леви, К. Стрейчи, Н. Руссопулос, Дж. Хиндли,Дж. Селдин, М. Гордон, Л. Карделли, П. Лендин, Дж. Стой, Д. Тернер, Р. Флойд,Дж. Хьюс, С. Пейтон-Джоунс, П. Л. Кюрьен, Дж. Рейнолдс, К. Баркер,Р. Снодграсс, С. Абитебуль, Г. Плоткин, Р. Милнер, М. Броди и др.Систематический анализ трудов перечисленных исследователей привел кформированию основных положений и проведению комплекса исследований посозданию технологии интеграции данных в гетерогенных КПК как совокупностинаучно обоснованных информационно-технологических решений, внедрениекоторых вносит значительный вклад в развитие экономики страны.Технология интеграции данных в гетерогенных КПК понимается каккомплексный подход к созданию и поддержке ИС на основе унификации7представления и управления гетерогенными объектами (мета)данных, которыйобеспечивает:• представление на уровне модели предметной области (ПрО) с учетомпроисходящих в ней изменений и степени детализации (мета)данных;• комплекс моделей и инструментальных средств для интеграции гетерогенныхобъектов (мета)данных (О(М)Д) и управления ими в интернет-среде;• многоуровневую итеративную интеграцию данных в КПК (с учетомвозможности повторной разработки – реинжиниринга).Существующие схемы интеграции данных в программных комплексах наоснове XML и стандартов OMG, MDC, WfMC, ISO/IEC и др., хотя ипредполагают взаимодействие c CASE-средствами (в т.ч.
на основе UML), невполне поддержаны средствами математического моделирования, вследствиечего их семантикаоказывается трудно формализуемой, а методологияпроектирования – разрывной. В то же время, подходы, предложенные OASIS,OMG,OGC,W3C,IBM,Microsoft,Aribaидр.инацеленныенаинтероперабельность, интеграцию гетерогенных данных и единообразныйдоступ к ним из ПО электронной коммерции не достигли индустриальноймасштабируемости в силу недостатка унификации и практической апробации, атакже высокой сложности.Конвергенция XML и гетерогенных РБД привела к интеграциигетерогенных данных для Web-сайтов, СУБД и др.
ПО в интернет-среде в силуотсутствия унифицированных моделей и средств представления метаданных,регламентирующих обращение к данным. При этом, даже с появлением XMLориентированных СУБД остались нерешенными проблемы моделированияотображения РМД Кодда (а в общем случае, ОРМД) в XML-представление, атакже проблемы интеграции данных в гетерогенных КПК, построенных наоснове разнородных ИС, манипулирующих собственными наборами БД.Таким образом, несмотря на разнообразие подходов и стандартовпостроения гетерогенных КПК, на сегодня практически отсутствует единаятехнологическая основа, включающая достаточно универсальное теоретическое8обобщение в форме математических моделей, на которых возможно было быосновать схему практической интеграции данных в КПК.Разработанная технология интеграции данных в гетерогенных КПКориентирована преимущественно на преодоление отмеченных выше проблем.Другой аспект исследования связан с созданием инструментальныхсредств визуальной предметно-ориентированной интеграции (мета)данных вгетерогенных КПК.
Развитие методов разработки таких КПК требуеттехнологического обобщения процессов представления и управления О(М)Д.Потребность в интеграции данных в современных гетерогенных программныхсистемах и КПК становится жизненно необходимой, особенно с учетомсосуществованияразличных,зачастуюпротиворечивыхконцепций,методологий, моделей и подходов. Показательно, что к настоящему временидаже крупным компаниям-разработчикам ПО (Microsoft, IBM, Oracle, SAP, BEAи др.) не удалось выработать единого подхода к интеграции КПК; во многомотсутствует даже стандартизация терминологии.
Проблема унификацииматематических и программно-инструментальных средств интеграции данных враспределенных гетерогенных КПК находится в центре внимания целого ряданаучных коллективов и еще далека от удовлетворительного решения.Анализ технологических особенностей процессов интеграции данных вгетерогенных КПК (различных архитектур и степени структурированности)указывает на необходимость решения следующих вопросов:• разработкиметодовпредметно-ориентированногопредставлениягетерогенных (мета)данных как объекта для анализа и интеграции;• создания обобщенной технологической схемы для представления иинтеграции корпоративного контента с необходимым уровнем детализации;• разработки математических моделей для представления и манипулированиявысокодинамичным корпоративным контентом в интернет-среде;• разработки комплекса программных средств для интеграции и управлениягетерогенным контентом КПК, поддерживающих математические модели.9Анализ выявленной совокупности задач приводит к построениютехнологического комплекса, включающего как математические модели, так исопровождающие их программные средства, предназначенные для обобщенногопредметно-ориентированного представления, интеграции и управления даннымив гетерогенных КПК.Цель диссертационного исследования состоит в разработке технологииинтеграции данных в гетерогенных корпоративных программных комплексах,направленной на повышение эффективности (в смысле сокращения сроков иснижения стоимости) проектирования, реализации и последующего расширенияпрограммных систем рассматриваемого класса и масштаба.При этом основными задачами, решаемыми в работе, являются:1.Создание концептуальной схемы технологии интеграции данных вгетерогенных КПК с реинжинирингом.2.Разработка системы взаимосвязанных математических объектныхмоделей, унифицирующих представление, интеграцию и манипулированиеконтентом.3.Построение модели представления интегрированной схемы данных вКПК на основе семантических сетей с фреймовой визуализацией.4.Построение модели манипулирования контентом гетерогенных КПКна основе абстрактной машины с состояниями и ролевыми соотнесениями.5.Разработка обобщенной архитектурной схемы, унифицирующейпредставление и управление контентом на основе портальной персонализациис ассоциативными связями на уровне объектов данных.6.Созданиесемантическиориентированногоинструментально-технологического программного комплекса, поддерживающего семействоматематических объектных моделей и предназначенного для интеграцииданных в гетерогенных КПК и управления их контентом.7.Разработкаориентированногоинструментальногопредставлениясредстваобъектовдляданныхпредметноприпомощи10семантическихсетейсвозможностямифреймовойвизуализациисредствадляиреинжиниринга гетерогенных КПК.Разработка8.инструментальногосценарно-ориентированного управления контентом гетерогенных КПК с портальнойперсонализацией.Реализация, внедрение и апробация прототипов и полномасштабных9.КПК.Методы исследования, примененные для решения поставленных задач,основанынасинтезепоследовательностей,фундаментальныхтеорииположенийпеременныхобластейтеорииконечныхД.Скотта,теориирезультатеанализасемантических сетей и теории фреймов.Научнаяновизнарезультатовработы.Вдинамических взаимосвязей важнейших факторов, влияющих на развитиеисследуемого класса программных систем, сделан вывод о необходимостисоздания новой технологии интеграции данных в КПК и разработана ее общаясхема.ВотличиеотсуществующихсхемпроектированияИСдляИнтернетсреды, основанных на стандартах и подходах XML, OMG, MDC,WfMC, ISO/IEC и др., созданная в настоящей работе технологическая схемаинтеграцииподдержанаматематическимикакмоделями,инструментальнымичтообеспечиваетсредствами,еетакиметодологическуюнеразрывность и формализуемость, в т.ч.
на семантическом уровне.Разработанный технологический подход к интеграции данных в КПКприводит к практически приемлемым для крупных и сложных ИС значениямважнейших эксплуатационных характеристик, которые до настоящего временинебылидостигнутыпосредствомтеоретическиважныхподходов,предложенных зарубежными коллективами OASIS, OMG, OGC, W3C и др., атакже отечественными научными группами (Л.