Диссертация (1136162), страница 14
Текст из файла (страница 14)
При этом, даже споявлением XML-ориентированных СУБД остались нерешенными проблемымоделирования отображения РМД Кодда (а в общем случае, ОРМД) в XMLпредставление, а также проблемы интеграции данных в КПК, построенных наоснове гетерогенных ИС, каждая из которых манипулирует тем или инымнабором БД.Несмотря на потенциальную возможность реализации целого рядаперспективных архитектурно-технологических возможностей на платформеXML (поддержка метаданных, ограничения целостности, многоуровневоепредставление данных, интеграция гетерогенных данных и др.), до настоящеговремени в рамках этой платформы не существует унифицированной моделиданных, в полной мере поддерживающей объединение гетерогенных КПК.В этой связи весьма важной задачей является разработка функциональнополной технологической схемы интеграции данных в КПК, функционирующихв Web-среде, поддержанной математическими моделями и программнымисредствами для уровней CASE и RAD.
Подходы к построению отдельныхэлементов такой схемы намечены OMG в форме объектной модели документов(DOM), а также модели SAX, разработанной OASIS на основе открытых ирасширяемых интерфейсов типа API [66].75Целый ряд коммерческих РСУБД (IBM DB2, Oracle8i, IBM Informix и др.)был адаптирован для поддержки XML-структур гетерогенных данных.
Крометого, существует немногочисленный класс XML-ориентированных СУБД,включающий Software AG Tamino, ADABAS, а также ряд исследовательскихпрототиповисвободнораспространяемогоПО,манипулирующихнепосредственно XML-документами.Несмотря на множество исследований, имеющих целью обобщениепроблемы интеграции данных в КПК, не было выработано унифицированныхтехнологических схем. Весьма перспективным является также направлениеинтеграции гетерогенных систем с применением как XML-платформы, так итрадиционных технологий РСУБД при разработке КПК.
Важными и пока нерешенными проблемами являются также моделирование и автоматизацияпроцедур верификации гетерогенных ИС в составе таких комплексов.Фрагменты платформы XML становятся де-факто стандартами дляинтеграции гетерогенных данных в КПК, о чем свидетельствуют результатымноголетней деятельности консорциумов W3C, OMG и OASIS.
Эта платформаначинает играть существенную роль в технологиях БД, CASE, объединения ИСи ряде других направлений ИТ.Факторами,сдерживающимиразвитиеперспективныхинтернет-технологий, являются отсутствие унификации концептуально-методологическихоснов разработки и интеграции гетерогенных программных комплексов, а такжеинерционность интернет-среды, содержащей весьма значительные объемыданных.8 Постановка задачи интеграции данных в гетерогенных корпоративныхпрограммных комплексахДля более гибкой и эффективной, чем в условиях реляционных моделейданных, поддержки открытых распределенных интернет-систем, в середине 90х гг. были предприняты попытки построения крупных программных комплексовна базе объектных МД, ОР- и ООСУБД.
При этом обобщения методов и средствсразработкойПОобщегоназначениязарубежомбылиполучены76М.Стоунбрейкером (Ingres, Postgres) [278], [279], Д. Девиттом (Genesis/Exodus)[28], К. Чоу (Cache') [62], а также больших интернет-ИС и БД нового поколения(NASAEOS/DIS(www.eos.nasa.gov),CERNUKHECGridTestbeds(www.globus.orgresearch/ testbeds) и др.).СредиотечественныхразработокследуетуказатьнаработыЛ. А. Калиниченко (интероперабельные программные системы, прежде всего,проект «СИНТЕЗ») [218], [219], а также Л. Т.
Кузина [19], В. Э. Вольфенгагена[20], [21], Б. А. Щукина [84], [85], [86], В. М. Ветошкина [12], [13],Р. М. Когаловского [66], [67], Б. Вольфмана [22] и А. Старыгина [115] (ИС набазе объектно-ориентированных моделей данных) и ряд практическихреализаций, включая объектно-ориентированную ИС «НЕВОД» на основеРСУБД (НПП «РЕЛЭКС», www.relex.ru/rus/products/nevod/).В ходе исследования предметной области гетерогенных, глобальнораспределенных КПК была спроектирована обобщенная технологическая схема,представленная на рисунке 1.2.При этом, в отличие от большинства рассмотренных выше подходов и вразвитие методов концептуального проектирования [20], [21], в качествеинформационной модели предметной области выбран вариант исчисленияобъектов, основанный на синтезе методов конечных последовательностей (аименно, типизированного -исчисления [4], [165], [265]) и теории категорий (вформе категориальной комбинаторной логики [170], [207], [210]).
Модельманипулирования данными для поддерживающего инструментального средствауправления контентом КПК представляется в форме абстрактной машины [168](альтернативные варианты абстрактных машин исследованы в работах [200],[201], [235] и др.), основанной на понятии состояния и функционирующей впространстве декартово замкнутых категорий (д.з.к.) [194], [209], [210], [214],[217], [240], [283]. Особенности семантики манипулирования гетерогеннымиданными моделируются в терминах теории вычислений Д.
Скотта [266-269].В качестве средства визуализации модели интеграции гетерогенных данныхв КПК на уровне объектов и связей используется подход, основанный77на семантических сетях в форме фреймов [153], [186], [236], [246], [259], [260].Важнейшими преимуществами предложенного комплексного теоретическогофундамента являются возможность детального представления, интеграции иуправления данными и метаданными в рамках единой модели, а такжеадекватноеотображениеобъектовисвязейвгетерогенных,слабоструктурированных, высокодинамичных КПК.Семейство языков определения и управления объектами данных иметаданных на основе реляционной алгебры (для ИС) и SQL-стандарта собъектно-ориентированными расширениями (для БД) в распределенной средеинтернет-вычислений представимо в виде специализированной модели О(М)Д,расширеннойпогруженнымисценарноактивируемымихранимымипроцедурами и директивами языка запросов. Трансформация ОРМД с помощьюязыка UML приводит к схеме данных ИС в виде семейства UML-диаграмм, а споддержкой комплекса CASE- и RAD-средств.Манипулирование интегрированной схемой данных КПК на основе ИСуправления контентом (ИСУК) в виде базы метаданных, содержащейограничения на данные и их интерфейсные представления, в соответствии сзапросами, уровнем доступа и персональными предпочтениями пользователяпозволяетпредставитьспектрвозможныхинформационныхсрезов(конкретизаций) в форме отчетов в среде интернет-порталов.Таким образом, интеграция данных в КПК происходит в направлении отпонятий предметной области к реализации в терминах кода программныхмодулей и интерфейсов.
Каждый из этапов процесса интеграции и управленияконтентом КПК является многоуровневым, при этом рассуждения ведутся врамках того или иного универсума, который состоит из множества объектов исоответствующейгетерогенныхимданныхсреды.вКПКДлянаманипулированиякаждомизпредставлениемэтаповиспользуетсясоответствующий универсуму формальный язык, включающий средстваманипулирования языковыми объектами.78Рисунок 1.2.
Общая технологическая схема интеграции данных в КПКНа первом этапе технологической схемы мир рассуждений представляетсобой предметную область, выраженную в терминах естественного языка. Вданном случае объектами предметной области являются понятия естественногоязыка, скажем, понятие “пресс-релиз”. В качестве средства манипулированияязыковыми объектами выступает классическая (булева) логика высказываний.Как статика, так и динамика описания предметной области (с разворачиваниемсобытий по некоторому закону) формализуется в естественно-языковыхтерминах. В последнем случае описание (на естественном языке) объектов(сущностей) предметной области и связей между ними может выходить за рамкиклассической логики, расширяясь до логики высших порядков.
Примерыподобныхлогическихобъектныхсистем и подходы к их построениюрассматриваются в работах Д. Скотта [266-269], П. Лендина [235], Л. Т. Кузина79[19], Э. Х. Тыугу [121], В. Э. Вольфенгагена [287-290], В. Я. Яцука [20], [21],Л. А. Калиниченко [60], [253], Б. А. Щукина [85], а также целого ряда другихроссийских и зарубежных исследователей [98], [127], [175], [194], [209], [210],[214], [220], [240], [283].На втором этапе процесса интеграции данных в КПК происходитконцептуализация, то есть переход от естественно-языкового представленияданных о предметной области к ее математической модели со сменой универсумарассуждений на описание предметной области в терминах концептуальноймодели (КМ) [21], [209], [210], [240], [281], [283] и др.
При этом понятияпредметной области переходят в концепты, а соотнесения на естественном языкезаменяются ролевыми реляторами. В качестве языка описания КМ длястатических предметных областей вполне адекватна классическая логикапредикатов [21].В то же время, моделирование динамики данных ПрО в терминахсостояний представляет собой задачу существенно более высокой сложности иосуществляется в настоящей работе на основе логики высших порядков,построенной на семантических доменах, аналогичных применяемым Д.Скоттом[267-269].
При таком подходе домен является обобщением понятия множества итребует существования неопределенного элемента, а также замыканий длярекурсивных функций и определений. Таким образом, объектная формализацияна этом этапе базируется на логике с тремя допустимыми значениямиистинности, расширяющей классическую логику неопределенным значением.Домены задают диапазоны ограничений для переменных, моделирующихгетерогенные О(М)Д предметной области. Язык определения гетерогенныхО(М)Д формализуется посредством определенных дескрипций [188].Вцеляхповышениянаглядностивосприятияприсохраненииматематической строгости рассуждений и адекватности преобразований врамках данного этапа целесообразно применить специализированный языкописания семантических сетей.
При этом визуализация объектов (мета)данных исвязеймежду нимиосуществляетсяпосредством фреймовой нотации,80основанной на работах Н. Руссопулоса и ряда других исследователей [153], [246],[259], [260]. В рамках нотации объекты данных графически представляются вформе узлов фреймов, а связи – в виде дуг. При таком подходе метаданныеучитывают логические и причинные связи между объектами данных, типы идругие характеристики данных, а также ограничения целостности (например, вформе кванторов или диапазонов значений).