Кузин А.В., Левонисова С.В. Базы данных (5-е издание, 2012) (1084448), страница 2
Текст из файла (страница 2)
Затем по мере развития техники появилась возможностьобработки текстовой информации на естественном языке.Принципы хранения разных видов информации в АИС аналогичны, но алгоритмы ее обработки определяются характером ин формационных ресурсов. Соответственно различают два классаАИС: документальные и фактографические.Документальные АИС служат для работы с документами на естественном языке. Наиболее распространенный тип документальных АИС — информационно-поисковые системы, предназначенные для накопления и подбора документов, удовлетворяющихзаданным критериям. Эти системы могут выполнять просмотр иподборку монографий, публикаций в периодике, сообщений прессагентств, текстов законодательных актов и т.д.Фактографические АИС оперируют фактическими сведениями,представленными в формализованном виде, и используются длярешения задач обработки данных.Обработка данных — специальный класс решаемых на ЭВМзадач, связанных с вводом, хранением, сортировкой, отбором игруппировкой записей данных однородной структуры.
К задачамэтого класса относятся: учет товаров в магазинах и на складах;7начисление зарплаты; управление производством, финансами,телекоммуникациями и т.п.Различают фактографические АИС оперативной обработки данных, подразумевающие быстрое обслуживание относительно простых запросов от большого числа пользователей, и фактографические АИС аналитической обработки, ориентированные на выполнение сложных запросов, требующих проведения статистической обработки исторических (накопленных за некоторый промежуток времени) данных, моделирования процессов предметнойобласти и прогнозирования развития этих процессов.Таким образом, АИС применяются в следующих областях:• организация хранилищ данных;• системы анализа данных;• системы принятия решений;• мобильные и персональные базы данных;• географические базы данных;• мультимедиа базы данных;• распределенные информационные системы;• базы данных для всемирной сети World Wide Web.1.3. Информационная модель данных и ее составКаждая информационная система в зависимости от назначения имеет дело с той или иной частью конкретного мира, которую принято называть ее предметной областью.
Анализ предметной области является необходимым начальным этапом разработки любой информационной системы. Именно на этом этапе определяются информационны е потребности всей совокупностипользователей будущей системы, которые, в свою очередь, предопределяют содержание ее базы данных. Предметная область конкретной информационной системы рассматривается, прежде всего, как некоторая совокупность реальных объектов, которые представляют интерес для ее пользователей. Примерами объектов предметной области могут служить персональные ЭВМ, программныепродукты и их пользователи.
Каждый из этих объектов обладаетопределенным набором свойств (атрибутов). Так, например, компьютер характеризуется названием фирмы-производителя, идентификатором модели, типом микропроцессора, объемом оперативной и внешней памяти, типом графической карты и т.д.Информационный объект — это описание некоторой сущностипредметной области, т.е. реального объекта, процесса, явления илисобытия. Информационный объект (сущность) образуется совокупностью логически взаимосвязанных атрибутов (свойств), представляющих собой качественные и количественные характеристики объекта (сущности).Между объектами предметной области могут существовать связи, имеющие различный содержательный смысл.
Эти связи могутбыть о б я з а т е л ь н ы м и или ф а к у л ь т а т и в н ы м и (необязательными).Если вновь порожденный объект оказывается по необходимости связанным с каким-либо объектом предметной области, томежду этими двумя объектами существует обязательная связь. В противном случае связь является факультативной.Например, обязательная связь Замещает существует междудвумя объектами СОТРУДНИК и ДОЛЖНОСТЬ в предметнойобласти кадровой информационной системы, т.е.
каждый принимаемый в организацию сотрудник зачисляется на какую-либо должность и не может быть сотрудника, не замещающего какой-либодолжности. В то же время связь Замещает между типами объектовСОТРУДНИК и ДОЛЖНОСТЬ является факультативной, поскольку могут существовать вакантные должности.Совокупность объектов предметной области и связей междуними характеризует структуру предметной области.Множество объектов предметной области, значения атрибутовобъектов и связи между ними могут изменяться во времени. Изменения могут сводиться к появлению новых или исключению израссмотрения некоторых существующих объектов в предметнойобласти, установлению новых или разрушению существующихсвязей между ними. Следовательно, с каждым моментом времениможно сопоставить некоторое состояние предметной области.Информационно-логическая модель (И ЛМ ) — это совокупностьинформационных объектов (сущностей) предметной области и связей между ними.Процесс создания информационной модели начинается с определения концептуальных требований будущих пользователей БД.Требования отдельных пользователей интегрируются в единомобобщенном представлении, которое называют концептуальноймоделью данной предметной области (рис.
1.1). Такая модель отоВнешние модели(индивидуальные представления пользователей)^ Логический уровеньпредставления данныхФ изический уровеньпредставления данныхРис. 1.1. Многоуровневое представление БД9бражает предметную область в виде взаимосвязанных объектов безуказания способов их физического хранения.Концептуальная модель представляет собой интегрированные концептуальные требования всех пользователей к базе данных даннойпредметной области. При этом усилия разработчика должны бытьнаправлены в основном на структуризацию данных, принадлежащих будущим пользователям БД и выявление взаимосвязей междуними.Возможно, что отраженные в концептуальной модели взаимосвязи между объектами окажутся впоследствии нереализуемымисредствами выбранной СУБД, что потребует ее изменения.
Версия концептуальной модели, которая может быть реализованаконкретной СУБД, называется логической моделью.Логическая модель, отражающая логические связи между атрибутами объектов вне зависимости от их содержания и средыхранения, может быть реляционной, иерархической или сетевой.Таким образом, логическая модель отображает логические связимежду информационными данными в данной концептуальной модели.Различным пользователям в информационной модели соответствуют различные подмножества ее логической модели, которыеназываются внешними моделями пользователей.Таким образом, в н е ш н я я модель пользователя представляет собой отображение его концептуальных требований в логической модели и соответствует тем представлениям, которые этотпользователь получает о предметной области на основе логической модели.
Следовательно, насколько хорошо спроектированавнешняя модель, настолько полно и точно информационная модель отображает предметную область и настолько полно и точноработает автоматизированная система управления этой предметной областью.Логическая модель отображается в физическую память, которая может быть построена на электронных, магнитных, оптических, биологических или других принципах.В н у т р е н н я я модель предметной области определяет размещение данных, методы доступа к ним и технику индексированияв данной логической модели и иначе называется ф и з и ч е с к о ймоделью.Информационные данные любого пользователя в БД должныбыть независимы от всех других пользователей, т.е.
не должныоказывать влияния на существующие внешние модели. Это положение отражает первый уровень независимости данных. С другойстороны, внешние модели пользователей никак не связаны с типом физической памяти, в которой будут храниться данные, и сфизическими методами доступа к этим данным. Это положениеотражает второй уровень независимости данных.101.4. Три типа логических моделей баз данныхЯдром любой базы данных является модель данных.
Модель данных — это совокупность структур данных и операций их обработки.По способу установления связей между данными различаютиерархическую, сетевую и реляционную модели.Иерархическая модель позволяет строить базы данных с древовидной структурой, где каждый узел содержит свой тип данных(сущность). На верхнем уровне дерева в этой модели имеется одинузел — корень, на следующем уровне располагаются узлы, связанные с этим корнем, затем узлы, связанные с узлами предыдущего уровня и т.д.При этом каждый узел может иметь только одного предка(рис. 1.2).Поиск данных в иерархической системе всегда начинается скорня. Затем производится спуск с одного уровня дерева на другой, пока не будет достигнут искомый уровень.
Перемещения посистеме от одной записи к другой осуществляются с помощьюссылок.Основные достоинства иерархической модели — простота описания иерархических структур реального мира и быстрое выполнение запросов. Однако не всегда удобно каждый раз начинатьпоиск нужных данных с корня, а другого способа перемещенияпо базе в иерархических структурах нет.Указанный недостаток снят в сетевой модели, где (по крайнеймере, теоретически) возможны связи всех информационных объектов со всеми.В примере, приведенном на рис.
1.3, каждый преподаватель может обучать многих (теоретически всех) студентов и каждый сту-Рис. 1.2. Иерархическая древовидная структура модели БД11Рис. 1.3. Сетевая структура модели БДдент может обучаться у многих (теоретически у всех) преподавателей. Поскольку на практике это, естественно, невозможно, приходится прибегать к некоторым ограничениям.Использование иерархической и сетевой моделей ускоряет доступ к информации в базе данных. Однако, поскольку каждыйэлемент данных должен содержать ссылки на некоторые другиеэлементы, требуются значительные ресурсы как дисковой, так иосновной памяти ЭВМ. Недостаточность основной памяти, конечно, снижает скорость обработки данных.
Кроме того, для таких моделей характерна сложность реализации системы управления базами данных.Реляционная модель (от англ. relation — отношение) была разработана в начале 70-х годов XX в. Кодцом. Простота и гибкостьэтой модели привлекли к ней внимание разработчиков, и уже80-х годах XX в.