Диссертация (1136162), страница 9
Текст из файла (страница 9)
однозначности полей).Для поддержки обработки данных в гетерогенной распределенной средевычислений современный стандарт SQL/99 включает ОО-расширения РМД (вт.ч. типы данных для больших бинарных (BLOB) и символьных (CLOB) ОД,абстрактные типы данных, массивы, пользовательские функции, метаданные вформе типов строк, предикатные расширения, триггеры, роли пользователей,точки сохранения и рекурсивные типы). Кроме того, стандартизованымоделирование наборов CODASYL, кластеризация данных (как в иерархическойМД), исключительные отношения «многие ко многим», рекурсивные ивыводимые отношения (как в МД независимых логических файлов) с44расширениями в формепользовательских типов, встроенных процедур,пространственных (spatial) данных и др.3.4 Мультимедийные ОРСУБД в среде интернетВнедрение РСУБД привело к улучшению эргономики (usability),графических интерфейсов, клиент-серверных ИС, распределенных БД, а такжепараллельного поиска и добычи (mining) данных в гетерогенных КПК.
Всередине 80-х гг. исследования вопросов развития РМД (совмещение программи данных, поведение, обработка разнородных и мультимедийных БД) привели кпоявлению объектно-реляционных БД (ОРБД) на основе расширений SQL(решения для ООБД пока не нашли широкого практического распространения).Особенностями ОРМД являются унификация процедур и данных, а такжесложное поведение данных, инкапсулированное в расширяемые (за счетпользовательских типов) библиотеки классов (включая пространственные имультимедиа-данные).Поворотным пунктом в развитии МД и СУБД стало появление в середине90-х гг.
глобально доступной среды сетевых вычислений интернет и вебсервисов для обеспечения удаленного доступа к ИС с «унаследованными» БД.Доминирующая архитектура типа клиент-сервер стала поддерживать болеесложную обработку БД, что привело к быстрому росту числа интернет-БД. Сразвитием интернет-архитектуры клиенты (браузеры) и серверы БД былирасширены мини-приложениями (апплетами) для обработки гетерогенныхданных (в т.ч. мультимедиа) и их представлений для различных устройств,поддерживающих современные МД (интернет-приставки к ТВ, мобильныеустройства и др.).В конце 90-х гг.
получили развитие технологии (Active Server Pages, JavaDataBase Connectivity, сервлеты Java,Enterprise Java Beans) и средствапубликации и интеграции данных (Microsoft FrontPage, Allaire ColdFusion,Macromedia DreamWeaver, Oracle Developer/2000) в глобальной среде. Широкоераспространение в среде интернет получили инструментальные средства с45«открытым кодом» (open source), СУБД (Apache, MySQL) и технологии (GCC,CGI) для их применения.
Данная тенденция продолжилась в последующие годы.В настоящее время в интернет/интранет-среде традиционные средстваонлайновой транзакционной (OLTP) и аналитической (OLAP) обработки данныхпостепенно сменяются технологией «точечных продаж» (Point-Of-Sale, POS).Расширяется сфера применения БД электронной коммерции (ecommerce),включающих решения для частных лиц «клиент-клиент» (customer-to-customer,C2C) и «бизнес-клиент» (business-to-customer, B2C), а также для корпораций типа«бизнес-бизнес» (business-to-business, B2B) [135], [136], [182] и др.В XXI веке перспективными направлениями конвергенции БД и интернетявялются интерактивные ИС для мобильных устройств, POS-транзакций,ассоциаций поставщиков продукции и др.
С точки зрения интегральной оценкиСУБД в аспектах МД, сетевых технологий и инструментальных средств можновыделить Oracle Server с поддержкой технологии grid-вычислений, IBM DB2 иMicrosoft SQL Server.В начале 2000-х гг. возник класс постреляционных СУБД (например,InterSystems Cache’ [62]) на основе иерархических многомерных МД,ориентированных на высокопроизводительную обработку транзакций в большихи сверхбольших (терабайтных) БД и масштабируемых корпоративных ИС, в т.ч.в среде интернет. В 2010-х гг. также возник класс noSQL СУБД, негарантирующих согласованного состояния данных (Kassandra, Hadoop, F1 и др.).Несмотря на управление весьма большими объемами данных, эти СУБД неполучили широкого распространения для индустриальных КПК в силу высокойсложности МД и специфических требований к проектированию БД.Распределенныегетерогенныефедеративногоуровнявпосредствомтехнологииглобальнойаппаратно-программныесредекомплексыпотенциальнодляgrid-инфраструктурыреализуемыдоступаквысокопроизводительным вычислительным ресурсам [187] с интегрированнымувеличениеммощноститерабайтныеБДCERNБД(исследовательскиеUKHECGridпрототипыTestbeds,NASAвключаютEOS/DIS46(www.eos.nasa.gov) и др.) [110].
При общей перспективности grid (динамическоераспределение корпоративных вычислительных ресурсов с минимизациейперемещения данных между «узлами», облегчение администрирования ИС),комплекс технологических, юридических и политических проблем (единаяглобальная авторизация, аутентификация и пространство имен, управлениеправами использования ресурсов с привилегиями и приоритетами, защита БД)откладывает индустриальную реализацию КПК на продолжительное время.Такимобразом,формализованныетрадиционныепроцедурыМДпоиска,непозволяютассоциированияиорганизоватьгруппировкигетерогенных (мультимедийных) ОД.
Необходимость интеграции данных ипроцедурманипулированиятрехуровневыеархитектурыимиврасширяеттрадиционныенаправленияхактивныхдвух-исценарно-ориентированных БД (на основе триггеров и хранимых процедур) и потоковработ (с вычислениями по схеме «запрос-ответ»).Развитие МД, ЯМОД семейства SQL и ОРСУБД прогнозируется понаправлениям, связанным с XML, Java-технологиями, мобильными интернет-БД,распределенной обработкой транзакций и ООБД; прототипы стандартовпредложены ODMG (Object Database Management Group, www.odmg.org).Тенденции развития СУБД диктуют необходимость появления новыхметодов анализа и обработки весьма значительных (терабайтных и более)объемов данных, включая крупные научные и корпоративные БД, а такжеразвития технологий анализа поточного ввода, добычи (mining) и организациихранилищ(warehouse)данных,проектированияинтеллектуальныхинформационно-программных комплексов с персонализацией интерфейсов.Несмотря на рост числа примитивных интернет-БД, остается нерешеннымцелый ряд проблем управления ОД в глобальной среде: моделирование новых(пространственных, временных, графических и др.) типов данных, управлениебольшими(петабайтными)гетерогеннымиираспределеннымиБД,персонализированная добыча и анализ данных, интеграция гетерогенных ОД,автоматизация проектирования интернет-БД и ИС [180].47ЗначительныевысоконормализованныхсложностиБДпредставляет(традиционноемасштабируемостьпреобразованиеиерархиинеизбыточных таблиц в плоскую таблицу приводит к существенному падениюпроизводительности при обновлениях, а также к риску нарушения целостностииз-за распределенности и дублирования данных).
Внедрение стандарта SQL/99 вСУБД потенциально позволяет решить проблему масштабируемости за счетпроектирования БД с естественной иерархической структурой без построения IIIнормальной формы и последующей денормализации (побочный эффект состоитв значительной ресурсоемкости реорганизации БД). При этом наиболее легкоадаптируемыми к SQL/99 потенциально оказываются СУБД на основенезависимых логических файлов (Adabas, Focus, Datacom/DB и др.) ииерархические СУБД (SAS System 2000, IBM IMS и др.).Перспективным направлением развития корпоративных и федеративныхСУБД являются облачные и grid-технология, однако проблемы безопасногоуправления данными (персональные данные, коммерческая и государственнаятайна при публикации в интернет и др.) позволяют реализовать их в КПК вближайшем будущем.484 Сравнительный анализ и классификация CASE-средствПод термином CASE имеются в виду инструментально-программныесредства, поддерживающие процессы создания и сопровождения ИС ивключающиеанализиформулированиетребований,проектированиеприкладного ПО и БД, генерацию кода, тестирование, документирование,обеспечение качества, управление конфигурациями (метаданными) и проектами,а также ряд других процессов.Основнымкомпонентомсредствпроектированияиреализациикорпоративного ПО является репозиторий для хранения версий и компонентпроекта ИС и поддержания синхронизации и контроля целостности (полноты инепротиворечивости) (мета)данных при коллективной разработке.
Другимиважными составляющими CASE-инструментов являются графические средстваанализа и проектирования для создания и редактирования моделей программныхкомплексов в форме диаграмм (SADT, IDEF, UML и др.), а также средстваразработкиприкладныхИС,управленияметаданнымиипроектами,документирования, тестирования и реинжиниринга.Реинжиниринг БД (автоматическая генерация ERD по SQL-коду)осуществляется по принципу двунаправленности (FRE, forward and reverseengineering) и включает импорт БД, генерацию и модификацию модели и схемыБД (включая физический уровень) [263].При классифицировании CASE-средств по важнейшему для целейисследования критерию – степени интегрированности (объема поддержки ЖЦИС) – выделим локальные, частично и полностью интегрированные средства(последние связаны общим репозиторием); другими критериями могут служитьстандарты и методологии проектирования, модели ИС и БД, СУБД, а такжепрограммно-аппаратные платформы.49Классификация инструментальных средств по масштабам примененияБудем различать следующие категории CASE-средств:• локальные закрытые (c простыми и расширенными графическиминотациями, для локальных и мелких ИС – до 100 одновременных пользователей– Design/IDEF, ProCap, CASE.Аналитик, ARIS Toolset);•средние открытые (с расширенными графическими нотациями ивозможностью взаимодействия с RAD-средствами, для мелких ИС –ERwin/BPwin, Paradigm Plus);•средние открытые комплексные (с комплексными графическиминотациями и встроенными RAD-средствами, для средних ИС – до 1000одновременных пользователей – S-Designor/PowerBuilder);•крупные открытые комплексные (с комплексными графическиминотациями и встроенными RAD-средствами, для крупных ИС – до 10 тыс.одновременных пользователей – Rational, Designer/Developer, Visual Studio).Классификация CASE-средств по функциональному назначениюCASE-средства применяются как комплексные технологическиеконвейеры для производства корпоративного ПО, а также как инструментарийдля решения исследовательских и проектных задач (анализ предметной области,разработка спецификаций, документирование, планирование и контрольпроекта, моделирование приложений для оперативного и стратегическогопланирования и управления ресурсами и др.).
Наиболее интенсивное развитиекорпоративныхинструментальныхсредствпроисходитвнаправленияхреинжининринга бизнес-процессов (business process reengineering, BPR), т.е. ихперепланирования с целью оптимизации затрат, качества и скоростиобслуживания, а также системного анализа и проектирования, включаяфункциональное, информационное и событийное моделирование новых иэксплуатируемых ИС.Длятрадиционномоделированияиспользуетсябизнес-процессовметодологияSADTнебольших(вформекомпанийIDEF0)иинструментальные средства BPWin и Design/IDEF. Поскольку статическаямодель SADT не отвечает требованиям, необходимым дляреинжиниринга50динамических, гетерогенных корпоративных бизнес-процессов, одной извозможныхальтернативмоделирования(INCOMEявляютсяMobile,CASE-средстваCPN-AMI,динамическогоDesign/CPNидр.),интегрированные с Design/IDEF или DFD на основе модели «раскрашенных»сетей Петри (CPN). Недостатками подхода являются значительные трудозатратыпо ручной коррекции прообраза динамической модели, полученного изстатических SADT-диаграмм, а также ее вариативной оценки в соотнесениии сразличными наборами исходных данных.Предпочтительной альтернативой является развитый в настоящемисследовании подход к моделированию данных с разработкой концептуальныхмоделейипроектированиемКПК(вт.ч.используяCASE-средстваDesignerDeveloper/2000 и последующих версий) с возможностью поэлементнойвариации количественно-оценочных параметров (временные затраты, ресурсыи т.д.) и исследования динамического поведения модели.Для решения задач функционального моделирования ИС на базеструктурного анализа традиционно применяются графические нотации SADT иDFD, причем предпочтение отдается последней как ориентированной напрограммные комплексы (около 90% современных CASE-средств поддерживаютнотацию DFD и лишь 2-3% – SADT).Традиционный подход к событийному моделированию программныхсистем основывается на расширении DFD управляющими потоками ипроцессами,фактическиявляющимисяинтерфейсоммеждуDFDиспецификациями, моделирующими поведение.