Базы данных (780594)
Текст из файла
Общие сведения о базах данных
Понятие «базы данных» возникло в 60-х годах, наиболее бурное развитие этого направления пришлось на 70-е годы. Тогда же сложился, в основном, и теоретический фундамент этого направления. Состояние вычислительной техники в то время заметно отставало от теоретических разработок, и это не позволило в полной мере оценить их значимость. Последующее увлечение мини- и микро-ЭВМ оттеснило на второй план тематику, связанную с централизованным хранением и коллективным использованием больших массивов данных. Однако история повторяется: микро-ЭВМ, объединенные в сети, быстро достигли, а затем и превысили возможности старых «больших» машин, накопленные данные стали востребованы многочисленными пользователями, и это вновь возродило интерес большим базам данных.
Осознание в 60-х годах проблемы обработки больших объемов данных определилось всей логикой развития информатики. На первых этапах основные усилия были направлены на создание сносной вычислительной техники, после чего, по сути, и появилось настоящее программирование. Разработка теоретических основ программирования позволила оснастить программистов качественным инструментарием, что в свою очередь привело к появлению большого количества программ, особенно прикладных, дающих возможность не только обрабатывать текущую информацию, но и накапливать ее. С момента осознания проблем, связанных с хранением и обработкой больших объемов информации, начинается информатика, ориентированная на пользователя. Информацию необходимо интерпретировать с точки зрения некоторой предметной области – это вызвало появление экспертных систем, базирующихся на понятии искусственного интеллекта.
Термин «база данных» трактуется далеко не однозначно. Существует, по крайней мере, два его аспекта: бытовой и технический. На бытовом уровне под базой данных понимают информационную систему, в основном, справочную. Говорят: «Я купил базу данных адресов Москвы» или что-то в этом роде. Технический вариант относится к особой структуре организации данных. Она характеризуется своей теорией, методологией, технологией и практикой.
База данных (БД) - это совокупность связанных данных конкретной предметной области, в которой определения данных и отношений между ними отделены от процедур.
База данных есть совокупность данных, организованных в соответствии с некоторой концептуальной моделью данных, которая описывает характеристики этих данных и взаимоотношения между соответствующими им реалиями, и которая предназначена для информационного обеспечения одного или более приложений.
Термин «концептуальная модель»относится к наиболее общему формализованному описанию предметной области, включающему описание объектов БД и связей между ними.
Определяя базы данных как среду хранения данных, отделѐнную от процедур, мы подразумеваем, наличие специальных программных средств доступа к данным – систем управления базами данных (СУБД).
Система управления данными – комплекс программно-аппаратных средств, обеспечивающих доступ к БД и управление данными.
Система управления данными – программная система, предназначенная для создания и хранения базы данных на основе некоторой модели данных, обеспечения логической и физической целостности содержащихся в ней данных, надѐжного и эффективного использования ресурсов, предоставления к ней санкционированного доступа для приложений и конечных пользователей, а также для поддержки функций администратора баз данных.
Существует множество признаков БД, в соответствии с которыми может быть проведена их классификация.
1. По форме представления информации БД делятся на визуальные БД, аудиосистемы и средства мультимедиа. Информация, хранимая в БД, может быть представлена в виде разном виде – в виде изображений (рисунки, чертежи и схемы, фотографии, движущиеся изображения, анимация), звука и т. д.
2. По характеру организации данных БД могут быть неструктурированными, частично-структурированными и структурированными.
Неструктурированными называются БД, информация в которых представлена в виде так называемых семантических сетей. Частично-структурированные БД содержат информацию в виде текста. В структурированных БД перед заполнением их данными должна быть предварительно описана модель их структуры. В зависимости от типа используемой модели структурированные БД делятся на иерархические, сетевые, реляционные, постреляционные, многомерные и объектно-ориентированные.
3. По типу хранимой информации БД делятся на документальные, фактографические и лексикографические.
Документальные БД являются частично-структурированными и ориентированы, главным образом, на хранение текстовых данных в различных форматах. Информационной единицей в документальных БД является документ-текст. Среди этих моделей выделяют библиографические, реферативные и полнотекстовые модели. Лексикографические модели организованы на принципах организации словарей и содержат в себе определенные языковые конструкции. Основное назначение этих моделей – использование в системах-переводчиках. Фактографические модели являются структурированными и в зависимости от способа структуризации делятся на теоретикографовые (иерархическая и сетевая модели), теоретикомножественные (реляционная, постреляционная и многомерная) и объектно-ориентированные.
4. По характеру организации хранения данных БД бывают персональными и распределенными.
Персональные БД предназначены для одного конкретного пользователя. Распределенные БД предполагают возможность одновременного обращения к данным со стороны множества пользователей.
СУБД так же, как и БД, делятся на ряд категорий.
1. По языкам общения СУБД делятся на открытые и замкнутые.
В открытых СУБД работа с данными осуществляется с использованием распространенных общепринятых универсальных языков программирования. В замкнутых СУБД используют собственные языки. Смешанные СУБД сочетают в себе частично свойства открытых и замкнутых СУБД
2. В зависимости от количества звеньев СУБД бывают одно-, двух- и трехзвенными.
Категоризация СУБД по этому принципу соответствует понятию архитектуры БД. В однозвенной БД единственным звеном является клиент. При двухзвенной архитектуре появляется новое звено – сервер БД, которое функционально предназначено для обеспечения части функций логического управления данными и их визуализации. Роль клиента заключается в обеспечении удобного с его точки зрения способа отображения данных. В трехзвенных СУБД появляется сервер приложений, который фактически является промежуточным звеном между клиентом и сервером БД. Его назначение заключается в обеспечении управления данными (клиент полностью освобождается от этого) и обеспечении связи клиента с сервером БД.
3. В зависимости от физического расположения различают локальные и сетевые СУБД.
Локальная СУБД целиком размещается на компьютере пользователя. Если таких пользователей несколько, то каждый из них должен иметь свою локальную копию СУБД. Сетевые СУБД делятся на файл-серверные, клиент-серверные и распределенные.
В файл-серверной модели как СУБД, так и БД, как правило, размещаются на одном компьютере, который называется файлсервером. Пользователи получают доступ к информации со своих персональных компьютеров (клиентские места) посредством развертывания локальной сети.
Таким образом, между локальными и файл-серверными вариантами принципиальных различий нет. Клиент-серверные СУБД являются фактически двухзвенными, поскольку в этом случае часть СУБД размещается на сервере БД. Эта часть СУБД отвечает за получение запроса от клиента, отыскание в данных нужной информации и передачу ее клиенту. Распределенные СУБД могут размещаться на десятках и сотнях серверов БД.
4. По выполняемым функциям СУБД делятся на информационные и операционные.
Информационные СУБД обеспечивают хранение данных и доступ к ним. Операционные СУБД предназначены для более сложной обработки информации, например, для проведения вычислений с привлечением данных, не содержащихся в БД.
5. В зависимости от сферы использования различают универсальные и специализированные СУБД.
6. По мощности СУБД делятся на настольные и корпоративные.
К настольным СУБД предъявляются невысокие требования с точки зрения технических средств и стоимости. Корпоративные СУБД предназначены для распределенной обработки данных и имеют, в частности, развитые средства автоматизированного администрирования и обеспечения целостности.
Структура базы данных
Язык описания данных (ЯОД) – средства описания данных в БД и связей между ними. Средствамиэтого языка описывается структура БД, форматы записей, пароли, защищающие данные.
Язык манипулирования данными (ЯМД) – язык для выполнения операций над данными, позволяющий менять их строение.
Для различных СУБД реализация этих уровней языков может быть различной. В одних случаях ЯОД и ЯМД требует составления пользователем программы полностью “вручную”, в других (что отражает современную тенденцию) в СУБД присутствуют средства визуальной (зримой, наглядной) разработки программ. Для этого в современных СУБД имеются редакторы экранных форм, отчетов. “Кирпичиками” (инструментами) таких редакторов являются поля различных видов (поля ввода, поля вывода, вычисляемые поля), процедуры обработки различных типов (формы ввода, таблицы, отчеты, запросы). На основании созданных пользователем объектов программы – генераторы формируют программный код на языке конкретной машины или на промежуточном языке.
Структура простейшей базы данных
Если даже в базе нет никаких данных (пустая база), то это все равно полноценная база данных. Этот факт имеет методическое значение. Хотя данных в базе и нет, но информация в ней все-таки есть – это структура базы, которая определяет методы занесения данных и хранения их в базе. Простейший «некомпьютерный» вариант базы данных – деловой ежедневник, в котором каждому календарному дню выделено по странице. Даже если в нем не записано ни строки, он не перестает быть ежедневником, поскольку имеет структуру, четко отличающую его от записных книжек, рабочих тетрадей и прочей писчебумажной продукции.
Базы данных могут содержать различные объекты. Основными объектами любой базы данных являются ее таблицы. Простейшая база данных имеет хотя бы одну таблицу. Соответственно, структура простейшей базы данных тождественно равна структуре ее таблицы.
Структуру двумерной таблицы образуют столбцы и строки. Их аналогами в простейшей базе данных являются поля и записи. Если записей в таблице пока нет, значит, ее структура образована только набором полей. Изменив состав полей базовой таблицы (или их свойства), мы изменяем структуру базы данных и, соответственно, получаем новую базу данных.
Свойства полей базы данных
Поля базы данных не просто определяют структуру базы – они еще определяют групповые свойства данных, записываемых в ячейки, принадлежащие каждому из полей. Ниже перечислены основные свойства полей таблиц баз данных на примере СУБД Microsoft Access.
Имя поля – определяет, как следует обращаться к данным этого поля при автоматических операциях с базой (по умолчанию имена полей используются в качестве заголовков столбцов таблиц).
Тип поля – определяет тип данных, которые могут содержаться в данном поле.
Размер поля – определяет предельную длину (в символах) данных, которые могут размещаться в данном поле.
Формат поля – определяет способ форматирования данных в ячейках, принадлежащих полю.
Маска ввода – определяет форму, в которой вводятся данные в поле (средство автоматизации ввода данных).
Подпись – определяет заголовок столбца таблицы для данного поля (если подпись не указана, то в качестве заголовка столбца используется свойство Имя поля).
Значение по умолчанию – то значение, которое вводится в ячейки поля автоматически (средство автоматизации ввода данных).
Условие на значение – ограничение, используемое для проверки правильности ввода данных (средство автоматизации ввода, которое используется, как правило, для данных, имеющих числовой тип, денежный тип или тип даты).
Сообщение об ошибке – текстовое сообщение, которое выдается автоматически при попытке ввода в поле ошибочных данных.
Обязательное поле – свойство, определяющее обязательность заполнения данного поля при наполнении базы.
Пустые строки – свойство, разрешающее ввод пустых строковых данных (от свойства Обязательное поле отличается тем, что относится не ко всем типам данных, а лишь к некоторым, например к текстовым).
Индексированное поле – если поле обладает этим свойством, то все операции, связанные с поиском или сортировкой записей по значению, хранящемуся в данном поле, существенно ускоряются. Кроме того, для индексированных полей можно сделать так, что значение в записях будут проверяться по этому полю на наличие повторов, что позволяет автоматически исключить дублирование данных.
Поскольку в разных полях могут содержаться данные разного типа, то и свойства у полей могут различаться в зависимости от типа данных. Так, например, список вышеуказанных свойств полей относится в основном к полям текстового типа. Поля других типов могут иметь или не иметь эти свойства, но могут добавлять к ним и свои. Например, для данных, представляющих действительные числа, важным свойством является количество знаков после десятичной запятой. С другой стороны, для полей, используемых для хранения рисунков, звукозаписей, видео клипов и других объектов OLE, большинство вышеуказанных свойств не имеют смысла.
Типы данных
Таблицы баз данных, как правило, допускают работу с гораздо большим количеством разных типов данных. Так, например, базы данных Microsoft Access работают со следующими типами данных.
Текстовый – тип данных, используемый для хранения обычного неформатированного текста ограниченного размера (до 255 символов).
Числовой – тип данных для хранения действительных чисел.
Поле Мемо – специальный тип данных для хранения больших объемов текста (до 65 535 символов). Физически текст не хранится в поле. Он храниться в другом месте базы данных, а в поле храниться указатель на него, но для пользователя такое разделение заметно не всегда.
Дата/время – тип данных для хранения календарных дат и текущего времени.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.