Диссертация (1136162), страница 8
Текст из файла (страница 8)
Необходимый уровень наглядности и степенидетализации представления предметной области обеспечивает семействоIDEFнотаций. В то же время, большое количество неформально связанныхграфическихпредставлений(иногдасчастичнымдублированиемфункционального назначения, т.е. семантики) в подходах IDEF («подмодели») и37eEPC («домик» ARIS) затрудняет формализацию больших предметных областейс частой сменой состояний. Кроме того, возникают сложности обеспечениясовместимостикомпонентврамкахединогоподходакграфическойинтерпретации предметной области и среды вычислений.Всеперечисленныенотацииподдерживаютсясовременнымиинструментальными средствами проектирования ПО.
При этом наиболее полнаясовместимость в форме унифицированных интегрированных двунаправленныхCASE- и RAD-средств (например, Oracle Developer) обеспечивается для нотацииUML. Семантика представления ОД в предметных областях и вычислительныхсредах не формализована ни для одной из рассмотренных нотаций.3 Сравнительный анализ моделей данных и поддерживающих СУБДПод управлением данными в КПК имеется в виду совокупность процессовхранения, индексации, поиска, извлечения, анализа и визуализации информации.С точки зрения корпоративной СУБД, модель данных (МД) состоит изправил, формализующих структуры записей (т.е.
набора полей данных),отношений между данными и операций над ними. Под отношениямипонимаются языковые выражения, определяющие основные зависимости междузаписями с разными типами структуры. В зависимости от типа реализацииотношений в МД операции над ними реализуются по схеме «одна запись за одинраз» или «множество выбранных записей».Автоматизированная обработка информации (на основе перфокарт)применялась уже в начале XIX в., а к середине 1950-х гг. накопленные объемыданных позволяли корпорациям ежедневно производить сортировку итабулирование миллионов записей. В конце 50-х гг.
появились болеевысокопроизводительные решения для тиражируемых офисных ИС на основепоследовательныхфайловзаписейданныхсабстракциейоперационных систем и пакетной обработкой транзакций.3.1 Ранние индексные и сетевые СУБДнауровне38В 1960-х гг. возросшая (с переходом на магнитные ленты) информационнаяемкость БД сделала рентабельным использование вычислительной техники вкоммерческих ИС. Необходимость оперативного мониторинга ИС и полученияпроизводственной отчетности привела к появлению в середине 60-х гг. БД синдексно-последовательнымтерминальным(вт.ч.удаленным–телекоммуникационным) доступом к территориально распределенным данным,поиском по номеру записи или ключу и интерактивной обработкой транзакций.В этот период были созданы две важнейшие МД – сетевая (network),разработанная под эгидой комитета CODASYL (Cullinet Software IDMS, 1971;индексная СУБД Software AG ADABAS и др.) и иерархическая (hierarchical, IBMIMS,1968)[66].СогласноэтимМД,доступкБДосуществлялсяманипулированием низкоуровневыми указателями, связывающими записи(блоки данных).
Вследствие зависимости особенностей хранения информации оттипа данных, добавление полей к БД требовало изменений в схеме доступа кданным и их модификации. Своеобразием модели являлась ориентация наобрабатываемые записи данных, а не на структуру БД в целом. Существеннымнедостатком МД была необходимость полного представления пользователя офизической структуре данных (т.е. о метаданных).Интерпретацию условных обозначений характеристик основных МД(таблица 1.1) целесообразно представить отдельной таблицей (таблица 1.2).Таблица 1.1. Характеристики основныхмоделей данныхИс.Модель данныхХарактеристики СетеваяНезависимыйИерархическая логическийфайлРеляционнаяОрганизациязаписиSV,сегментыSV,MV,RGSVA,D,F,MA,D,F,MA,D,F,M,PSV,MV,MD,G, RGОтношения(REL)Запись A,D,F,M39ОперацииОтно- C,D,GO,GM,GN GO,GM,GN(OPS)шениеJ,INT,DIV,UN,DIFJ,INT,DIV,UN,PR, DIFDDLREL,ROREL,RORORODMLOPSOPSREL & OPSREL & OPSТаблица 1.2.
Интерпретация аббревиатур моделей данныхSV = единственное значениеОрганизация MV= множественное значениезаписиMD = множественная размерностьG = группаA = добавлениеD = удалениеЗаписьM = модификацияP = проекцияF = поискОперацииC = установка связиDIS = разъединениеDIV = делениеJ = соединениеP = проекцияGO = получить первыйОтношение GM = получитьэлементGN = получить следующийINT = пересечениеPR = произведениеUN = объединениеDIF = разностьПервые практические решения по исследуемой проблематике былиполучены в тот же период в форме узкоспециализированных корпоративныхпрограммных комплексов для учета материальных ресурсов на основемэйнфреймовых СУБД (IBM SABRE и др.).Существенный недостаток иерархической МД для гетерогенных КПКсостоит в необходимости обновления зависимых данных, порожденныхизбыточностью хранения; в сетевой МД эта задача решена.Один из первых стандартов СУБД на основе сетевой МД был создан в70-х–80-х гг.
Комитетом по системам данных и языкам CODASYL в формепакета документов, определившего спецификации языка манипулированияобъектамиданных(ЯМОД);последующиеНациональным институтом стандартов США ANSI.документыразработаны40Разработанные до этого периода СУБД не имели МД и не учитывали рядасовременных особенностей сетевых корпоративных ИС, в частности, интернеттехнологий.ВнастоящеевремяпримерыиспользованиясетевыхСУБДвкорпоративных проектах крайне редки – заслуживают упоминания IDMS(Computer Associates) и Oracle (ранее VAX DBMS) с SQL-интерфейсами(последняя активно используетсяIntel дляуправления производствоммикропроцессоров).Сетевая и иерархическая МД оказали значительное влияние наформирование стандарта языка запросов к БД SQL/99, расширяющегореляционную МД массивами с внешними ссылками в качестве элементов (что,по сути, соответствует наборам CODASYL).3.2 Реляционная модель Кодда и переход к архитектуре клиент-серверДля ускорения и упорядочения проектирования крупномасштабныхсетевых БД с низкоуровневым интерфейсом в 1970-х гг.
Э.Ф.Коддом предложенареляционная МД (РМД) [166] на основе алгебры отношений с единообразнымпредставлением данных и связей в виде записей, унифицированным ЯМОД иявным разделением логического (схемы) и физического уровней представленияданных.ДонастоящеговремениРМДявляетсядействующимстандартомпроектирования БД.В результате исследований РМД Кодда в сравнении с ранними подходами,в середине 70-х гг. [66] сформировался ряд крупных научных проектов ипоследующих практических реализаций в форме прототипов корпоративныхреляционных СУБД (РСУБД).Исследователями IBM Research (Т.
Кодд, Р. Бойс, Д. Чемберлин) иКалифорнийского университета г. Беркли (М. Стоунбрейкер и др.) былиполучены унифицированные решения в форме динамического ЯМОД QUEL[166] на базе РМД, прототипов (в т.ч. INGRES [279]) и коммерческихфайлсерверных РСУБД (CA Ingres, Sybase, Microsoft SQL Server и др.).41Другим направлением развития РСУБД с ЯМОД SEQUEL стал прототипSystem R (IBM, В. Ким [226]), который привел к появлению ряда коммерческихСУБД (SQL/DS, IBM DB2 [279], Oracle (www.oracle.com), HP Allbase, TandemNon-Stop SQL и др.).В 80-х гг.
с развитием РСУБД, появлением компьютеров класса IBM PC ираспространением файл-серверной архитектуры на базе РМД сформировалисьпрактические решения в форме коммерческих РСУБД для локальных (RIM,RBASE 5000, PARADOX, OS/2 Database Manager, Dbase III, IV, Foxbase, VisualFoxPro, Watcom SQL) и корпоративных (Oracle, Informix, CA Ingress, Sybase идр.) ИС [66], [279], включая отраслевую специализацию (например, сбыт топливав США).СУБДдлясетевыхииерархическихМДполучилиширокоераспространение вплоть до 80-х гг.
(Cullinet Software IDMS и др.) [138], однако к90-м гг., в силу большей стандартизации и эргономичности, стали доминироватьРСУБД и возникло значительное количество крупных «унаследованных» ИС наоснове других МД.С переходом в 90-х гг. научного и бизнес-сообщества к архитектуре типаклиент-сервер интенсивно развиваются более масштабируемые, сложные идорогостоящие индустриальные и корпоративные РСУБД, поддержанные CASEсредствами проектирования ИС (Sybase PowerBuilder, Oracle Developer, MicrosoftVisualBasic и др.), средства корпоративной и офисной обработки данных(Microsoft Excel, Access), стандартизуются технологии доступа к гетерогеннымБД на основе интерфейсов ODBC (Open DataBase Connectivity).
РМД и CASEсредства обеспечивают экономию трудозатрат при разработке КПК вархитектуре клиент-сервер и при параллельной и конвейерной обработке данных(NCR, www.ncr.com). Стандартизации запросов к серверу БД и уменьшенияобъема обмена данными удалось достичь на основе высокоуровневого SQLинтерфейса на основе процедурных расширений ЯМОД (PL/SQL и др.) и ODBC.Кроме того, на основе объектно-ориентированного подхода (ООП) к42проектированию ИС возникли прототипы ООСУБД, включая пост-реляционныеи noSQL системы.Классификация СУБД по МД приведена в таблице 1.3.Таблица 1.3. Классификация СУБД по моделям данных истандартам ANSIМодели данныхНезависимыйСетевая Иерархическая логический РеляционнаяфайлSupraIDMS/RIDSDMS-2Типичные DMSсистемы БД 1100VAXDBMSANSIСоответствие NDLANSISystem 2000IMSInquireDB/2AdabasCA/IngresGIM familyOracleNomadSybaseFocusInformixRamisMSCA Datacom SQLServerModel 204ANSI SQL/99 ANSISQL/86ANSI SQL/89ANSI SQL/923.3 Сетевые диаграммы Бахмана и ER-модель ЧенаПараллельное направление совершенствования МД привело к появлениюиерархии наборов записей, сетевых диаграмм Ч.
Бахмана (General Electric) [138]и ER-МД П. Чена [164] с типами записей и связями между ними. МД и прототипнавигации Ч. Бахмана основаны на методах управления ассоциативнымдоступом и обработки наборов данных и до определенной степени сходны снавигационной моделью интернет и Memex-моделью В. Буша [158]. Развитиемисследований Ч. Бахмана в направлении сокрытия физического уровня данных(в целях безопасности и универсализации) и управления БД на логическомуровне стали ранние транзакционные СУБД, блокировавшие доступ к записям.43Обработка параллельных транзакций в многопользовательской БД былаорганизована посредством механизмов блокировки конкурирующих транзакцийи журналов учета транзакций (восстановление данных производилось на основеархивных копий).СпоявлениемвысокоуровневойER-МДП.Чена(илиМД«сущностьсвязь», 1976 г.) при проектировании БД и ИС стало возможнымабстрагироваться от физического уровня данных (т.е.
структуры таблиц) исосредоточиться на особенностях реализации [164].В 90-х гг. для поддержки РМД компанией IBM был разработан ЯМОД SQL(www.sql.org), формализующий определение структуры БД (в т.ч. ограниченияцелостности), операции над записями и отношениями (в т.ч. выборку),управление правами доступа, обработкой транзакций, а также параллельнымизменением и восстановлением данных.Интеграция SQL с процедурными языками программирования обусловилаобработку по принципу «одна запись за один раз».
Концепция ссылочнойцелостности сетевых ИС CODASYL была реализована в стандарте SQL/89 лишьв конце 80-х гг.Необходимость проектирования гетерогенных ИС стала причиной болеепоздних модификаций SQL/92 (ограничения целостности, многоязыковаяподдержка,полнаяссылочнаяцелостностьидр.)ссохранениемфундаментальных принципов обработки данных (в т.ч.