Диго С.М. Базы данных проектирование и использование (1084447), страница 8
Текст из файла (страница 8)
Сравнительные характеристики настольных и корпоративных СУБД приведены в табл. 1.1.
Таблица 1.1
Критерий | Настольные | Корпоративные |
Простота использования | + | |
Стоимость программного обеспечения | + | |
Стоимость эксплуатации | + | |
Функциональные возможности: администрирование, работа с Интернет/интранет и др. | + | |
Надежность функционирования | + | |
Поддерживаемые объемы данных | + | |
Быстродействие | + | |
Возможности масштабирования | + | |
Работа в гетерогенной среде | + |
Системы обоих классов интенсивно развиваются, причем некоторые тенденции развития присущи каждому из этих классов. Прежде всего, это использование высокоуровневых средств разработки приложений (что раньше было присуще в основном настольным системам), рост производительности и функциональных возможностей, работа в локальных и глобальных сетях и др.
Наиболее известными из корпоративных СУБД являются Oracle, DB2, Sybase, MS SQL Server, Progress и некоторые другие.
Наблюдается связь между классом СУБД и используемой операционной системой. Системы под UNIX позиционируются как корпоративные распределенные системы. Сейчас в этот сектор «пробивается» Windows NT и заменяющая ее Windows 2000.
По ориентации на преобладающую категорию пользователей можно выделить СУБД для разработчиков и для конечных пользователей. Системы, относящиеся к первому классу, должны иметь качественные компиляторы и позволять создавать «отчуждаемые» программные продукты, обладать развитыми средствами отладки, включать средства документирования проекта и другие возможности, позволяющие строить эффективные сложные системы. Основными требованиями, предъявляемыми к системам, ориентированным на конечного пользователя, являются: удобство интерфейса, высокий уровень языковых средств, наличие интеллектуальных модулей подсказок, повышенная защита от непреднамеренных ошибок («защита от дурака») и т.п.
Существует разделение СУБД по поколениям. К первому поколению СУБД относят системы, основанные на иерархической и сетевой моделях (60-70-е гг. XX в.), ко второму поколению - реляционные системы. СУБД третьего поколения, требования к которым были сформулированы в «Манифесте систем баз данных третьего поколения» [38], должны поддерживать сложные структуры данных и более развитые средства обеспечения целостности данных, отвечать требованиям, предъявляемым к открытым системам.
1.3.3. Классификационные группировки, относящиеся к БнД в целом
Следующая группа признаков классификации связана с банком данных в целом. По условиям предоставления услуг различают бесплатные и платные банки данных. Платные БнД, в свою очередь, делятся на бесприбыльные и коммерческие. Бесприбыльные банки данных функционируют на принципе самоокупаемости и не ставят своей целью получение прибыли. Это обычно БнД социально значимой информации, имеющей широкий круг пользователей, или научной, библиотечной информации. Основной целью создания коммерческих банков данных является получение прибыли от информационной деятельности.
Информационные системы различаются по характеру преобладающей обработки информации. В одних в основном реализуется большое число достаточно простых запросов. Такие системы получили название OLTP (On-Line Transaction Processing - системы оперативной обработки транзакций). В других, напротив, требуется сложная аналитическая обработка данных. Для такого класса систем стал использоваться термин OLAP (On-Line Analytical Processing).
Термин OLAP - сравнительно новый и в разных литературных источниках трактуется иногда по-разному. Его часто отождествляют с поддержкой принятия решений (DSS (Decision Support Systems) – системы поддержки принятия решения). А в качестве синонима для последнего термина используют Data Warehousing - хранилища (склады) данных, понимая под этим набор организационных решений, программных и аппаратных средств для обеспечения аналитиков информацией на основе данных из систем обработки транзакций нижнего уровня и других источников.
«Склады данных» позволяют обрабатывать данные, накопленные за длительные периоды времени. Эти данные являются разнородными (и не обязательно структурированными). Для «складов данных» присущ многомерный характер запросов. Огромные объемы данных, сложность структуры, как данных, так и запросов требуют использования специальных методов доступа к информации.
В других источниках понятие системы поддержки принятия решений (СППР) считается более широким. Хранилища данных и средства оперативной аналитической обработки могут служить компонентами архитектуры СППР.
OLAP «в узком смысле» - это системы, которые обеспечивают только выборку данных в различных разрезах. OLAP «в широком смысле», или просто OLAP, включают в себя:
-
поддержку нескольких пользователей, редактирующих БД;
-
функции моделирования, в том числе вычислительные механизмы получения производных результатов, а также агрегирования и объединения данных;
-
прогнозирование, выявление тенденций и статистический анализ.
Естественно, что каждый из этих типов ИС требует специфической организации данных, а также специальных программных средств, обеспечивающих эффективное выполнение стоящих задач.
Для обеспечения быстрой обработки данных при их анализе используются разнообразные приемы. Одним из них является организация данных в виде так называемых многомерных БД (MDD -MultiDimensional Database). Информация в MDD хранится не в виде индексированных записей в таблицах, а в форме логически упорядоченных массивов. Единой общепризнанной многомерной модели храпения данных не существует. В MDD отсутствует стандартизованный метод доступа к данным, и они могут отвечать требованиям специфической аналитической обработки данных.
Сравнительные характеристики систем OLTP и OLAP приведены в табл. 1.2.
Таблица 1.2
Характеристика | OLTP | OLAP |
Преобладающие операции | Ввод данных, поиск | Анализ данных |
Характер запросов | Много простых транзакций | Сложные транзакции |
Хранимые данные | Оперативные, детализированные | Охватывающие большой период времени, агрегированные |
Вид деятельности | Оперативная, тактическая | Аналитическая, стратегическая |
Тип данных | Структурированные | Разнотипные |
Хранилища данных могут быть разбиты на два типа: корпоративные хранилища данных (enterprise data warehouses) и киоски данных (data marts).
Корпоративные хранилища данных содержат информацию, относящуюся ко всей корпорации и собранную из множества оперативных источников для консолидированного анализа. Обычно такие хранилища охватывают целый ряд аспектов деятельности корпорации и используются для принятия как тактических, так и стратегических решений.
Киоски данных содержат подмножество корпоративных данных и строятся для отделов или подразделений внутри организации. Киоски данных часто строятся силами самого отдела и охватывают конкретный аспект, интересующий сотрудников данного отдела. Киоск данных может получать данные из корпоративного хранилища (зависимый киоск), или, что более распространено, данные могут поступать непосредственно из оперативных источников (независимый киоск).
Киоски и хранилища данных строятся по сходным принципам и используют практически одни и те же технологии.
По степени доступности БнД делятся на общедоступные и с ограниченным кругом пользователей.
По охвату БД могут классифицироваться в разных разрезах:
-
территориальный:
всемирный;
страна;
город;
-
временной;
-
ведомственный;
-
проблемный (тематический).
Территориальный и ведомственный признаки классификации могут относиться не только к информации, хранящейся БД, но и к кругу обслуживаемых пользователей.
По характеру взаимодействия с пользователями (кто инициализирует действия) БнД делятся на активные и пассивные.
В пассивных БнД ведущая роль принадлежит пользователю, в активных - система может самостоятельно менять поведение. В последнее время термин «активная база данных» стал часто использоваться для систем, использующих триггеры.
По форме собственности БнД делятся на государственные и негосударственные (частные, групповые, личные).
В литературе встречаются и другие аспекты классификации банков данных, но названные являются наиболее значимыми.
1.4. Выбор СУБД
1.4.1. Тенденции развития СУБД
Рынок СУБД бурно развивается, достаточно широк и разнообразен. Тем не менее, можно выделить некоторые основные тенденции, присущие этому классу программных продуктов.
1. Поддержка разных стилей проектирования (традиционный, объектно-ориентированный, «визуальное» проектирование).
Использование визуальных объектно-ориентированных средств разработки является преобладающей тенденцией.
2. Использование мультимедийных систем. Обработка графических образов. Управление пространственной информацией.
3. Повышение уровня языковых средств. Дружелюбность.
4. Включение в СУБД разнообразных языковых средств, ориентированных на разные категории пользователей.
5. Поддержка решений для реализации хранилищ данных в целях обеспечения процессов принятия решений.
6. Наличие разнообразных сервисных средств (развитая «помощь»: контекстная помощь (Help), электронные учебники, примеры, шаблоны распространенных приложений, «Волшебники» и т.п.).
7. Расширение функциональных возможностей (многофункциональность). Причем расширяется набор, и улучшаются характеристики не только функций, присущих собственно СУБД, но и существенно развиваются возможности получения выходных документов различных видов, функции редакторов (в том числе проверка орфографии и т.п.), передача документов по ЭП, документирование проекта и некоторые другие функции, которые не являются функциями по управлению данными.
8. Многоплатформенность - наличие вариантов «одноименных» СУБД, реализованных для разных операционных систем и разных типов компьютеров. Несмотря на острую конкуренцию операционных систем, иногда бывают периоды бурного развития и широкого распространения какой-то одной из них. Так, например, 1990-е гг. характеризовались массовым выпуском СУБД под Windows для настольных систем. Для корпоративных систем пальму первенства долгое время удерживала UNIX.
9. Рост производительности. Он присущ системам всех классов, но, разумеется, сама производительность для каждого класса систем различается. Наибольшей производительностью обладают СУБД, относящиеся к классу корпоративных систем.
10. Использование более развитых и разнообразных средств обеспечения целостности и безопасности данных.
11. «Интернационализация». Выражается в использовании СУБД ведущих производителей в разных странах мира; со стороны производителя это проявляется в локализациях версий. Поддержка национальных языков (Спецификация NLS - National Language Support).
12. Работа в многопользовательской среде. Распределенность. Работа в гетерогенной среде. Масштабируемость.
13. Открытость системы. Обеспечивается поддержкой определенных стандартов.
14. Преобладающая модель данных - реляционная. Наблюдается повышение «уровня реляционности» данных. Например, многие системы стали поддерживать концепции ключа, вероятного ключа, ссылочной целостности. Само понятие БД, которое не поддерживалось в некоторых популярных СУБД реляционной ориентации, например в xBase-системах, также введено в новые версии этих систем (например, в Visual FoxPro; причем возможно наличие, как изолированных файлов БД, так и объединенных понятием БД. При этом некоторые виды обработки возможны только для файлов, включенных в БД, например, задание ограничений целостности по связи.).
15. Преобладающий язык запросов - SQL. Это тоже говорит о повышении уровня реляционности.
16. Для структурированных БД - увеличение разнообразия типов поддерживаемых полей.
17. Развитие объектно-реляционных и объектно-ориентированных СУБД.
18. Развитие средств обеспечения безопасности данных.
19. Развитие средств упрощения эксплуатации баз данных. Управление базой данных в значительной степени автоматизировано.
20. Повышение качества CASE-средств. Широкое использование CASE-средств в практике проектирования и перепроектирования БнД.