Классификация БиД
ТЕМА 2 КЛАССИФИКАЦИЯ БнД
Изучаемые вопросы:
1. Классификация БД
2. Классификация СУБД
3. Классификация банков данных
Литература: [1], глава 1, [5] глава 2, [12] глава 3.
БнД являются сложными системами, и их классификация может быть произведена как для всего БнД в целом, так и для каждой его компоненты отдельно. Классификация для каждой компоненты может быть проведена по множеству разных признаков.
1. Классификация БД
Рекомендуемые материалы
1) По форме представления информации различают визуальные и аудио системы, а также системы мультимедиа. Эта классификация показывает, в каком виде информация хранится в БД и выдается пользователям: в виде изображения (символьный текст, рисунки, чертежи, фотографии и т.д.), звука или дается возможность использования разных форм отображения информации.
2) По характеру организации данных БД могут быть разделены на неструктурированные (БД в виде семантических сетей), частично структурированные (например, БД в виде обычного текста или гипертекстовые системы) и структурированные (требуют предварительного проектирования и описания структуры БД, только после этого могут быть заполнены данными). Этот признак относится к информации, представленной в символьном виде.
3) Структурированные БД по типу используемой модели данных делятся на иерархические, сетевые, реляционные, смешанные и мультимодельные. Развитие технологий обработки данных привело к появлению постреляционных, объектно-реляционных или гибридных, объектно-ориентированных, многомерных БД.
4) По типу хранимой информации БД делятся на документальные и лексикографические. Среди документальных баз различают библиографические, реферативные и полнотекстовые.
К лексикографическим БД относятся различные словари, классификаторы, рубрикаторы и т. д. Они обычно используются в качестве справочных совместно с документальными или фактографическими БД.
В документальных БД единицей хранения является документ (например, текст закона или статьи). Поиск и выдача документов происходит по их содержанию. Простейший метод поиска базируется на использовании дескрипторов – ключевых слов из проблемной области, характеризующих содержание документа. Их совокупность, выделенная из запроса, сопоставляется с дескрипторами документа («поисковым образцом»). В ответ на запрос пользователя выдается либо ссылка на документ, либо сам документ, в котором он может найти интересующую его информацию.
В системах фактографического типа в БД хранится информация об интересующих пользователя объектах предметной области в виде «фактов» (например, биографические данные о сотрудниках, данные о выпуске продукции производителями и т. п.). В ответ на запрос пользователя выдается требуемая ему информация или сообщение о том, что искомая информация отсутствует в БД.
5) По характеру организации хранения данных и обращения к ним различают локальные и распределенные БД.
Локальная БД – это БД, предназначенная для использования одним пользователем. Локальные БД могут создаваться каждым пользователем самостоятельно, а могут извлекаться из общей БД.
Распределенные БД предполагают возможность одновременного обращения нескольких пользователей к одной и той же информации (многопользовательский, параллельный режим доступа). Физически разные части БД могут быть расположены на разных ЭВМ, а логически, с точки зрения пользователя, они должны представлять собой единое целое.
2. Классификация СУБД
1) По языкам общения СУБД делятся на открытые (используют универсальные языки программирования), замкнутые (собственные языки общения с пользователями) и смешанные.
2) По выполняемым функциям СУБД делятся на информационные и операционные. Информационные СУБД позволяют организовать хранение информации и доступ к ней. Операционные СУБД выполняют достаточно сложную обработку, например, автоматически позволяют получать агрегированные показатели, не хранящиеся непосредственно в БД, и т.д.
3) По сфере возможного применения различают универсальные и специализированные, проблемно-ориентированные СУБД (имеют мощные выразительные средства, чтобы моделировать сложные объекты).
4) По «мощности» СУБД делятся на настольные и корпоративные. Характерными чертами настольных СУБД являются сравнительно невысокие требования к техническим средствам, ориентация на конечного пользователя, низкая стоимость.
Корпоративные СУБД обеспечивают работу в распределенной среде, высокую производительность, поддержку коллективной работы при проектировании систем, имеют развитые средства администрирования и более широкие возможности поддержания целостности. Эти системы сложны, дороги, требуют значительных вычислительных ресурсов.
Таблица 2.1 - Наиболее популярные настольные СУБД
СУБД | Производитель |
Visual dBase | dBase, Inc |
Paradox | Corel |
Microsoft Access | Microsoft |
Microsoft FoxPro | Microsoft |
Microsoft Data Engine | Microsoft |
Таблица 2.2 - Серверные СУБД
СУБД | Производитель |
Oracle | Oracle Corp. |
Microsoft SQL Server | Microsoft |
Informix | Informix |
Sybase | Sybase |
DB2 | IBM |
5) По ориентации на преобладающую категорию пользователей можно выделить СУБД для разработчиков и для конечных пользователей.
Системы, ориентированные на разработчиков, должны:
¾ иметь качественные компиляторы;
¾ позволять создавать «отчуждаемые» программные продукты;
¾ обладать развитыми средствами отладки;
¾ включать средства документирования проекта;
¾ обладать возможностями, позволяющими создавать эффективные сложные системы.
Основными требованиями, предъявляемыми к системам, ориентированным на конечного пользователя, являются:
¾ удобство интерфейса;
¾ высокий уровень языковых средств;
¾ наличие интеллектуальных модулей подсказок;
¾ повышенная защита от непреднамеренных ошибок («защита от дурака») и т. д.
3. Классификация банков данных
1) По условиям предоставления услуг различают бесплатные и платные. Платные делятся на коммерческие и бесприбыльные.
Бесприбыльные БД функционируют на принципе самоокупаемости и не ставят своей целью получения прибыли (научные, библиотечные или социально-значимые БнД).
Основной целью создания коммерческих БнД является получение прибыли от информационной деятельности.
2) По форме собственности БнД делятся на государственные и негосударственные (частные, групповые, личные).
3) По степени доступности различают общедоступные и с ограниченным кругом пользователей.
4) По охвату предметной области БнД могут классифицироваться в разных «разрезах»:
¾ территориальный (всемирный, страна, город и т.д.);
¾ временной (год, месяц, с начала века и т.п.);
¾ ведомственный;
¾ проблемный (тематический).
5) По характеру взаимодействия с пользователем БнД делятся на активные и пассивные. В пассивных БнД ведущая роль принадлежит пользователю. В активных – система может самостоятельно менять поведение.
6) По характеру преобладающей обработки информации различают OLTP - системы (On-Line Transaction Processing) – системы оперативной обработки транзакций (реализуют большое число достаточно простых запросов) и OLAP – системы (On-Line Analytical Processing) – системы аналитической обработки данных (реализуют сложную аналитическую обработку данных) или системы поддержки принятия стратегических решений (СППР).
До середины 90-х годов ХХ в. Под БД понимали статические БД (OLTP). К середине 90-х годов в БД класса OLTP скопилось столько хронологической информации, что объем БД резко возрос, а быстродействие начало падать. Например, в работе деканата чаще всего требуются детальные данные о текущем учебном годе. В то же время в БД хранятся ретроспективные данные и за предыдущие годы. Такие данные необходимы значительно реже и чаще всего в агрегированном виде. Наприме6р, выдать фамилии студентов, которые три последних семестра получали только отличные оценки.
Таблица 2.3 - Сравнение OLTP и OLAP
Характеристика | OLTP | OLAP |
Преобладающие операции | Ввод данных, поиск | Анализ данных |
Характер запросов | Много простых транзакций | Сложные транзакции |
Хранимые данные | Оперативные, детализированные | Охватывающие большой период времени, агрегированные |
Вид деятельности | Оперативная, тактическая, несложная обработка | Аналитическая, стратегическая: прогнозирование, моделирование, анализ и выявление связей, выявление статистических закономерностей |
Тип данных | Структурированные | Разнотипные |
Период хранения данных | До года | До нескольких десятков лет |
Изменчивость данных | Изменяются | Добавляются |
Упорядочение данных | По любому полю | По хронологии |
Объем обрабатываемой информации | Небольшой | Очень большой |
Скорость обработки | Средняя | Если Вам понравилась эта лекция, то понравится и эта - Введение. Очень высокая |
Загрузка | Часто и небольшими порциями | Редко и очень большими порциями |
Отдельные БД могут объединять все данные, необходимые для решения одной или нескольких прикладных задач, или данные, относящиеся к какой-либо предметной области (например, финансам, студентам, преподавателям и т.п.). Первые обычно называют прикладными БД, а вторые - предметными БД (соотносящимся с предметами организации, а не с ее информационными приложениями).
Предметные БД позволяют обеспечить поддержку любых текущих и будущих приложений, поскольку набор их элементов данных включает в себя наборы элементов данных прикладных БД. Вследствие этого предметные БД создают основу для обработки неформализованных, изменяющихся и неизвестных запросов и приложений (приложений, для которых невозможно заранее определить требования к данным). Такая гибкость и приспособляемость позволяет создавать на основе предметных БД достаточно стабильные информационные системы, т.е. системы, в которых большинство изменений можно осуществить без вынужденного переписывания старых приложений.