Диссертация (1136162), страница 13
Текст из файла (страница 13)
ERP-систем) и БД, атакже аппаратно-программной совместимости, многоязыковой локализации,автоматизации бизнес-процессов и коллективной обработки данных.Результатысравнительногоанализапортальныхкомплексовсистематизированы в таблицах 1.8 – 1.9.7 Модели данных для интернет-cредыС появлением в конце 80-х гг. службы World Wide Web важнейшимипоказателями глобальной интернет-среды (иначе WWW или Web) являютсяоткрытость в информационное пространство, возможность взаимодействия вреальном времени неограниченного количества компьютеров, и, как следствие,принципиально неограниченная масштабируемость.
Кроме того, интернетсреда потенциально может служить основой для совместного использованияразнородныхмультимедийныхисточниковинформацииотносительнолаконичными средствами (браузер, языки разметки, скрипт-языки и др.) с явнымразделением приложений на клиентскую и серверную составляющие.Как уже отмечалось во введении, весьма значительные объемыгетерогенных данных различной степени структуризации, накопленные винтернет-среде, делают актуальной проблему комплексной интеграции данных вкрупных информационных системах.
При этом преимуществами использования70интернет-среды могут служить как перечисленные выше ее особенности, так идостаточный уровень обеспеченности базисными технологиями и стандартами(РБД, и ОРБД, мультимедийных и географических ИС, UML, OMG CORBA, SunJava и J2EE, Microsoft .NET и др.).В технологическом аспекте следует разделять Web на два поколения –гипермедийный (Web-1) и семантический Web (Web-2). Первое поколение Web(доминировало примерно до 2005 г.) преимущественно ориентировано наподдержкустатическихнерасширяемойразнородныхформатнойразметкойинформационных(HTML),ресурсовидентификациейспоместоположению (URL), а также доступом на основе гиперссылок и не позволяетпроизводить манипулирование метаданными, описывающими их структуру испособы управления ими, а также верификацию данных.
В отличие от него,современная платформа Web 2.0 нацелена на интегрированное использованиегетерогенных данных и информационных ресурсов в глобальной среде ихвзаимодействия (включающей интернет-, интранет- экстранет-, ERP иунаследованные ИС) на основе технологий и моделей БД, а также расширенногоязыка разметки XML, позволяющего конструировать определения и параметрыглобально распределенных гетерогенных информационных структур, а такжесредства построения интерфейсов, запросов, обеспечения их информационнойцелостности, безопасности и др.В основе платформы Web 2.0 находится семейство XML-технологий истандартов,разработанныхконсорциумомW3Cииспользующихвычислительные модели, рассмотренные в разделе Главы 1, посвященномэволюции СУБД и моделям данных.
В этой связи платформа в ряде исследованийназывается платформой XML.В перспективе планируется обобщение стандартов идентификацииинформационных ресурсов с URL до URI (Universal Resource Identifier) ипротоколов взаимодействия с HTTP (HyperText Transfer Protocol) до XMLP (XMLProtocol).71В отношении семантического Web планируется внедрение W3Cстандартовдля определения данных об информационных ресурсах RDF (Resource DefinitionFramework), а также для языка описания онтологий на основе XML (подробнееоб онтологическом моделировании см.
подраздел главы I о методологии IDEF5).Важнейшимнаправлениемразвитияинтернет-технологийиподдерживающих их МД является стандартизация архитектуры функциональнойнадстройки для интеграции и обмена данными в КПК (включая программныеинтерфейсы). Разработанный W3C в этих целях стандарт веб-сервисов включаетобщий архитектурный, языковой (WSDL, Web Service Description Language) ипротокольный (SOAP, HTTP, MIME) аспекты. Концепция веб-сервисов являетсяцентральной для интернет-платформы Microsoft .NET (см.
раздел Главы 1 осовременных интернет-архитектурах) и применяется в настоящей работе дляпостроения семантически ориентированных CASE-средств.ВажнымпринципомплатформыWeb2.0являетсяобеспечениепреемственности с Web-1, прежде всего в отношении языков разметки HTML иXML (первый является конкретизацией второго; корректность интерпретацииобеспечивается посредством определений типов документов DTD – аналоговсхемы БД – формирующих язык интерпретации XHTML).Платформа XML является модульной расширяемой многоуровневой (сфизическим,логическимисемантическимпредставлениями)системойфункционально специализированных языков и стандартов представленияданных и информационных ресурсов с единой концептуально-синтаксическойосновой и поддержкой гетерогенных, в т.ч. (слабо)структурированных(мета)данных на вербальном и формальном уровнях.Платформе XML сопутствует семейство стандартов, получивших названиеокружения XML и включающее фундаментальные (InfoSet, Namespace, XML),структурообразующие (XPointer, XLink), форматирования и трансформации(XSL, XSLT, CSS), представления метаданных (DTD, XML Schema, Relax NG,RDF, RDFS, OWL), языков запросов (XQuery, XPath, XSLT), интерфейсов сприкладным ПО (DOM, SAX), обеспечения преемственности (XHTML, XML72Base), транспорта данных (XML Protocol, XForms, SOAP), идентификацииинформационных ресурсов (URI, URL, URN), информационной безопасности(XML Signature, XML Description), архитектуры функциональной надстройки(XSDL), вспомогательные (Xinclude, Xfragment, Canonical XML, XPath) ивертикальные (MathML, cXML, WML, GML, UBL, XMI и др.) стандарты.Под XML-документом имеется в виду единица информационных ресурсовв глобальной среде вычислений (Web), включающая файлы в формате XML, атакже, возможно, гетерогенные, в т.ч.
слабоструктурированные (возможно,мультимедийные) данные. В этом смысле XML является ЯООД, основанным напринципе самоописываемости ОД, при этом DTD является функциональныманалогом схемы данных в РБД, а XML Schema – ЯООМД.Расширяемость XML обусловлена его метаязыковой природой, а такжеприменением механизма пространств имен (именованных множеств символов)для типов и атрибутов элементов XML-документов. Важной особенностьюстандарта XML является синтаксическое единство его компонент.УнифицированноймоделиданныхдляXMLнесуществует,целенаправленные построения концерном W3C не ведутся в силу весьмавысокой сложности проблематики.Модели данных разработаны лишь для структурных аспектов платформы;создан стандарт документной объектной модели DOM для ее окружения;намечены подходы к моделированию данных в ЯМОД XQuery.Среди подходов к моделированию XML выделяются графовый (в т.ч.
сявной типизацией для XPath) и объектный (в частности, на основе DOM).Архитектура ИС для интернет-среды подробно описана в разделе,посвященном современным архитектурным подходам в интернет-среде (Глава I).Отметим ее многоуровневый характер (разделяют физический (файлы и URI),логический(структурная разметка, ограничения целостности и функцииманипулирования ОД), а также семантический (смысл в контексте предметнойобласти, логический вывод) уровни моделирования); стандарты для уровнейописаны выше.73ВажнойособенностьюXML-платформыявляетсяпринципиальнаявозможность манипулирования гетерогенным – как структурированными, так ислабоструктурированными (не имеющими регулярной структуры, свойственнойнаборам их экземпляров) ОД на основе стандарта XML Schema.
Именно этотстандарт используется в настоящей работе для промежуточного – междуматематически формализованным и CASE-ориентированным – представлениямодели О(М)Д; примеры применения разработанной методологии рассмотреныв Главах 4 и 5. При этом в настоящем исследовании разработанаунифицированнаямодельденотационнойсемантикиманипулированиягетерогенными данными на основе логики описаний (в терминах концептов,ролей и переменных доменов с конструкторами для комбинирования, а такжесемантическими сетями для визуализации) как для предметной области, так и длясреды вычислений. В отличие от предложенной схемы, XML-стандартпредполагает множественные и громоздкие формализации – DTD, RDF, RDFS,OWL, пространства имен и др., которые все еще находятся в стадииформирования. В развитие известных подходов к логике описаний синтаксиса исемантики О(М)Д, важнейшие из которых сформулированы в работах Д.
С.Скотта, Н. Д. Руссопулоса, В. Э. Вольфенгагена, П. Ламбрикса и др., в настоящейработе построены модели как для интеграции данных гетерогенных КПК, так идля организации управления этими данными в интернет-среде. Другимсущественным отличием настоящего исследования является комплекснаятехнология, поддержанная оригинальными инструментальными (CASE- и RAD) средствами, обеспечивающими экономичное (по трудозатратам и стоимостивладения) предметноориентированную визуальную интеграцию распределенныхгетерогенных КПК.Известные на сегодня схемы разработки КПК на основе XML и стандартовOMG, MDC, WfMC, ISO/IEC и др.
(такие как XMI, OIM, CWM, OIF и др.), хотяи предполагают интеграцию c CASE-средствами (в том числе на основе UML),не поддержаны средствами математического моделирования, вследствие чего их74семантика оказывается трудно формализуемой, а технология проектирования –разрывной.В то же время, подходы, предложенные OASIS, OMG, OGC, W3C, IBM,Microsoft, Ariba и др. и нацеленные на интероперабельность, интеграциюгетерогенных ИС и обеспечение доступа к ним в приложениях электроннойкоммерции (cXML, xCBL, UDDI, UBL, ebXML и др.), пока не достиглииндустриальной масштабируемости в силу отсутствия унификации, высокойсложности и недостатка практической апробации.Сосуществование XML и гетерогенных РБД не смогло обеспечить в рамкахинтернет-среды интеграцию гетерогенных данных в Web-сайтах, БД и другихкомпонентах КПК в силу отсутствия унифицированного представленияметаданных, регламентирующих порядок доступа к ОД.