1_mt11-ИОРиИ Курс лекций_2015 (Презентации лекций), страница 4
Описание файла
Файл "1_mt11-ИОРиИ Курс лекций_2015" внутри архива находится в папке "Презентации лекций". Документ из архива "Презентации лекций", который расположен в категории "". Всё это находится в предмете "информационное обеспечение разработок" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "информационное обеспечение разработок" в общих файлах.
Онлайн просмотр документа "1_mt11-ИОРиИ Курс лекций_2015"
Текст 4 страницы из документа "1_mt11-ИОРиИ Курс лекций_2015"
Суть предложенной информационной модели заключается в том, что объекты предметной области представляются в виде двумерных таблиц, называемых «отношениями», каждая таблица соотносится с объектом или взаимосвязанным набором данных («сущностью»), между таблицами, в случае, когда один объект является частью другого, определяют и устанавливают связи, отражающие отношения между этими объектами. Каждая строка таблицы содержит информацию о конкретном объекте (экземпляре сущности), столбцы таблицы являются свойствами (атрибутами) сущности.
К таблице, используемой в качестве отношения реляционной базы данных, предъявляют определенные требования.
Отношение – двумерная таблица, обладающая следующими свойствами:
-
В строках располагается информация о сущности.
-
В столбцах содержатся данные об атрибутах сущности.
-
В ячейках размещаются только одиночные значения.
-
Значения записей столбца имеют один тип данных.
-
Каждый столбец имеет уникальное имя в пределах таблицы.
-
Таблица не может содержать двух идентичных (одинаковых) строк.
-
Порядок следования столбцов и строк не имеет значения.
Терминология реляционной модели БД:
Социальная группа | Параметр 1 | Параметр 2 | Параметр 3 |
Теоретики БД: | таблица | строка | столбец |
Разработчики модели БД: | отношение | кортеж | атрибут |
Программисты: | файл | запись | поле |
Ключ – один или несколько столбцов отношения, идентифицирующих строку. Уникальный ключ однозначно определяет одну-единственную строку. Неуникальный ключ может указывать на несколько строк. Композитный ключ – ключ, построенный на двух или более атрибутах. Первичный ключ представляет сущности таблицы во всех ее связях. Для обеспечения быстрого доступа к данным по значению первичного ключа строятся индексы. Суррогатные ключи – искусственные ключи, не имеющие отношения к характеристикам сущности.
При изменении данных в таблицах отношений могут возникать ситуации, называемые «аномалиями модификации». Аномалия удаления возникает тогда, когда при удалении строки из отношения теряется информация о двух и более сущностях. Аномалия вставки проявляется в том, что при вставке новой строки необходимо добавить информацию о двух и более сущностях.
Классический подход к проектированию реляционных баз данных
Классическое решение задачи проектирования реляционной базы данных заключается в обоснованном принятии решений о том, из каких отношений должна состоять БД и какие атрибуты должны быть у этих отношений.
При проектировании базы данных решают две основных проблемы:
-
Проблему логического проектирования баз данных. Каким образом следует отобразить объекты предметной области в абстрактные объекты модели данных, чтобы это отображение не противоречило структуре предметной области и было эффективным и удобным для использования.
-
Проблему физического проектирования баз данных. Как обеспечить эффективность выполнения запросов к базе данных (т.е. как с учетом особенностей конкретной СУБД, расположить данные во внешней памяти, разложить их на отдельные файлы и дополнительные структуры (например, индексы), чтобы повысить скорость работы с информацией, в том числе и при множественном доступе).
Технологически, рассматриваемый подход к процессу проектирования логической модели БД осуществляется следующим образом:
-
На основе имеющихся представлений о предметной области в виде одного или нескольких отношений, предлагается некоторый набор возможных схем отношений, обладающих наилучшими свойствами с точки зрения разработчика.
-
Осуществляется анализ предложенных схем и производится выбор наиболее удачной схемы, которая станет приоритетной и будет использована за основу при разработке БД.
-
Выбранная модель данных подвергается процессу нормализации имеющихся отношений путем последовательных приближений к удовлетворительному набору схем отношений. При этом каждая следующая нормальная форма описания отношений в схеме должна обладать более лучшими свойствами, чем предыдущая.
Каждой нормальной форме, в которой могут находиться отношения БД, соответствует определенный набор ограничений. Отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений. Отношение в первой нормальной форме является базовым для классической реляционной модели данных, и соответствует тем требованиям, которые были впервые сформулированы Э.Ф.Коддом.
В теории реляционных баз данных определена следующая последовательность нормальных форм: первая нормальная форма (1NF); вторая нормальная форма (2NF); третья нормальная форма (3NF); нормальная форма Бойса-Кодда (BCNF); четвертая нормальная форма (4NF); пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF).
Метод нормализации основан на декомпозиции отношения, находящегося в предыдущей нормальной форме на два или более отношения, каждое из которых удовлетворяет требованиям новой нормальной формы. При этом соблюдаются следующие требования:
-
Каждая следующая нормальная форма устраняет недостатки предшествующей и совершенствует модель отношений.
-
Каждая следующая нормальная форма сохраняет свойства предыдущих нормальных форм.
Процесс нормализации отношений базируется на фундаментальном в теории реляционных баз данных понятии функциональной зависимости между атрибутами.
Функциональные зависимости
Функциональная зависимость
В отношении R атрибут Y функционально зависит от атрибута X (X и Y могут быть составными) в том и только в том случае, если каждому значению X соответствует в точности одно значение Y: R.X --> R.Y.
Поле В таблицы отношения функционально зависит от поля А той же таблицы в том и только в том случае, когда в любой заданный момент времени для каждого из различных значений поля А обязательно существует только одно из различных значений поля В.
Полная функциональная зависимость
Функциональная зависимость R.X --> R.Y называется полной, если атрибут Y не зависит функционально от любого точного подмножества X.
Поле В находится в полной функциональной зависимости от составного поля А, если оно функционально зависит от А и не зависит функционально от любого подмножества поля А.
Транзитивная функциональная зависимость
Функциональная зависимость R.X --> R.Y называется транзитивной, если существует такой атрибут Z, что имеются функциональные зависимости R.X --> R.Z и R.Z --> R.Y и отсутствует функциональная зависимость R.Z --> R.X.
Неключевой атрибут
Неключевым атрибутом называется любой атрибут отношения, не входящий в состав ключа (в частности, первичного).
Взаимно независимые атрибуты
Два или более атрибута взаимно независимы, если ни один из этих атрибутов не является функционально зависимым от других.
Многозначные зависимости
В отношении R (A, B, C) существует многозначная зависимость R.A -->> R.B в том и только том случае, если множество значений B, соответствующее паре значений A и C, зависит только от A и не зависит от С.
Поле А многозначно определяет поле В той же таблицы, если для каждого значения поля А существует хорошо определенное множество соответствующих значений В.
Основные принципы нормализации
Классический подход к проектированию реляционных баз данных основывается на декомпозиции отношений с целью их нормализации.
1. Первая нормальная форма (1НФ)
Отношение R находится в первой нормальной форме (1НФ), когда оно удовлетворяет требованиям, сформулированным к понятию «отношения», т.е., в ячейках этой таблицы содержатся одиночные значения, столбец имеет в пределах таблицы уникальное имя и единый тип данных, нет повторяющихся строк.
2. Вторая нормальная форма
Отношение R находится во второй нормальной форме (2НФ) в том случае, когда находится в 1НФ, и каждый из неключевых атрибутов полностью зависит от всего ключа.
Табл.1. СЕКЦИИ (КодСтудента, Секция, Плата)
КодСтудента | Секция | Плата |
110 | плавание | 150 |
110 | футбол | 110 |
111 | волейбол | 120 |
111 | плавание | 150 |
122 | бокс | 100 |
112 | шахматы | 100 |
Первая нормальная форма подвержена аномалиям вставки и удаления. Так, для табл.1 при удалении студента «122 » будет потеряна информация о плате в секции «бокс » и нельзя ввести данные о новой секции, пока в нее не будет записан студент. Основной причиной возникновения аномалий является функциональная зависимость атрибутов не от всего ключа, а только от его части. В данном случае Плата зависит только от Секции (Секция->Плата).
3. Третья нормальная форма
Отношение R находится в третьей нормальной форме (3НФ), если находится во 2НФ и каждый неключевой атрибут не является транзитивно зависимым от первичного ключа.
Табл.2. ПРОЖИВАНИЕ (КодСтудента, Общежитие, Плата)
КодСтудента | Общежитие | Плата |
100 | №9 | 120 |
110 | №4 | 110 |
111 | №9 | 120 |
121 | №4 | 110 |
132 | №8 | 100 |
142 | №5 | 100 |
Для табл.2 также при удалении студента с кодом «142 » будет потеряна информация о плате в общежитии «№5 » и нельзя ввести данные по отсутствующему общежитию, пока не будет добавлен студент. В данном случае имеют место функциональные зависимости КодСтудента→Общежитие и Общежитие→Плата, образуя транзитивную зависимость КодСтудента→Общежитие→Плата.
Основной причиной возникновения аномалий является транзитивная зависимость неключевых атрибутов от первичного ключа.
УСТРАНЕНИЕ: декомпозиция отношения на два новых отношения СТУДЕНТ-ПРОЖИВАНИЕ (КодСтудента, Общежитие) и ОБЩЕЖИТИЕ-ПЛАТА (Общежитие, Плата)
На практике третья нормальная форма схем отношений достаточна в большинстве случаев, и приведением к третьей нормальной форме процесс проектирования реляционной базы данных обычно заканчивается. Однако иногда полезно продолжить процесс нормализации.
4. Нормальная форма Бойса-Кодда
Отношение R находится в нормальной форме Бойса-Кодда (БКНФ) в том и только в том случае, если каждый детерминант является возможным ключом.
Табл.3. НаучныйРуководитель (КодСтудента, УчебныйКурс, Преподаватель)
КодСтудента | УчебныйКурс | Преподаватель |
100 | Физика | Бойль |
110 | Химия | Клапейрон |
111 | Физика | Мариотт |
121 | Физика | Бойль |
133 | Биология | Дарвин |
133 | Химия | Клапейрон |
Требования к отношению «НаучныйРуководитель» :
-
Студент может посещать один или несколько учебных курсов.
-
На учебном курсе может быть несколько преподавателей.
-
Каждый преподаватель может осуществлять научное руководство над студентом только в рамках одного учебного курса.
Определение: Детерминант – любой атрибут, от которого полностью функционально зависит некоторый другой атрибут.
Для табл.3: при удалении студента с кодом «133 » будет потеряна информация об учебном курсе «Биология » и нельзя ввести данные по отсутствующему учебному курсу, пока не будет добавлен студент.