1626434812-e667f6b6e7e69d3a0798830a58e9075b (844135), страница 20
Текст из файла (страница 20)
96 Базы данных. Интеллектуальная обработка информации Например, ЧЕЛОВЕК = МУЖЧИНА ~ ЖЕНЩИНА МУЖЧИНА г~ ЖЕНЩИНА = О Указанные операции реализуют достаточно общие механизмы порождения новых и, как правило, более абстрактных типов и требуют регламентированного продолжения исходных отношений СТАНСЕ-ОГ и 1Б-А. Кроме того, возникающие типы сами могут иметь представление в виде композиции других типов, Следовательно, описанный арсенал средств моделирования позволяет представлять достаточно сложные структуры предметных областей. 5.3.4. Ограничения целостности Определив структуру ПО, нужно задать инвариантные свойства состояний и их последовательностей, т.е. выразить семантику ПО. Уже исходные отношения выражают часть семантики, так как указывают соотношения между объектами и их множествами, которые должны выполняться в каждый момент времени.
Введение операций над типами расширяет эти возможности, поскольку соотношения, которые должны выполнятъся между результатами выполнения операций в любом состоянии, также отражают часть семантики. Еще один способ состоит в указании минимальных представлений внутри заданного представления. Инвариантные свойства возможных состояний ПО называют ограничениями целостности, поскольку нарушение этих ограничений приводит либо к противоречиям, либо к неадекватности концептуальной модели. Примером одного из ограничений целостности является требование того, чтобы один и тот же студент не был включен в разные группы. Такое ограничение можно записать следующим образом: о я Т, о, е Т,, о, е Т„папае(о) ПЧЗТАХСЕ-ОГ паше(о,), пате(о) 11ЧБТАИСЕ-ОР пате(а,) о,— -о, Совокупность явно сформулированных ограничений целостности вместе с множеством типов Э и отношениями 18-А, МТАИСЕ-ОГ и СОМРО1ЧЕ1ЧТОЕ называют концептуальной схемой предметной области.
Синтез концептуальной модели производится при помощи ряда методик. Одной из наиболее популярных семантических моделей данных является модель "Сущность-Связь" [21, 23] или "Объект-Отношение" [20] [разный перевод английского Еп1йу-Ке1апопй|р). Часто ее кратко называют ЕК-моделью. 5.4. Ей.-модель Модель была предложена Петером Пин-Шеи Ченом в 1976 г. (см.[23]). На использовании разновидностей ЕК-модели основано большинство современ- Глава 5. Семанпичесное люделирование в базах данных 97 УЧИТСЯ В СОСТОИТ ИЗ СТУДЕНТ ГРУППА Рис.
5.2. Пример связи между сущностями Данная диаграмма может быть интерпретирована следующим образом: Каждый СТУДЕНТ учится только в одной ГРУППЕ; ных подходов к проектированию баз данных (главным образом„реляционных), Моделирование предметной области базируется на использовании графических диаграмм„включающих небольшое число разнородных компонентов. В связи с наглядностью представления концептуальных схем баз данных Ей-модели получили широкое распространение в системах САЯЕ, поддерживающих автоматизированное проектирование реляционных баз данных. Далее изложено краткое описание основных положений данной модели, приведенное в работе ~2Ц.
Базовыми понятиями ЕК-модели являются сущность, связь и атрибут. Суи~нос~пь — это реальный или воображаемый объект, информация о котором представляет интерес, В диаграммах ЕК-модели сущность представляется в виде прямоугольника, содержащего имя сущности. При этом имя сушпости— это имя типа, а не некоторого конкретного объекта — экземпляра этого типа. Каждый экземпляр сущности должен быть отличим от любого другого экземпляра той жс сущности. Связь — это графически изображаемая ассоциация, устанавливаемая между двумя сущностями. Эта ассоциация всегда является бинарной и может существовать между двумя разными сущностями или между сущностью и сй же самой ~рекурсивная связь).
В любой связи выделяются два конца (в соответствии с парой связываемых сущностей), на каждом из которых указывается имя конца связи, степень конца связи ~сколько экземпляров данной сущности связывается), обязательность связи (т.е. любой ли экземпляр данной сущности должен участвовать в данной связи). Связь представляется в виде линии, связывающей две сущности или ведушей от сущности к ней же самой. При этом в месте "стыковки" связи с сущностью используются трехточечный вход в прямоугольник сущности, если для этой сущности в связи могут использоваться много экземпляров сушности, и одноточечный вход, если в связи может участвовать только один экземпляр сущности.
Обязательный конец связи изображается сплошной линией, а необязательный — прерывистой линией. Как и сушность, связь — это типовое понятие, все экземпляры обеих пар связываемых сущностей подчиняются правилам связывания. На рис. 5.2. приведен пример изображения сущностей и связи между ними, Базы данных. Интелчектуальная обработка «нформацин Любая ГРУППА состоит из одного или более СТУДЕНТОВ. На следующем рисунке изображена сущность ЧЕЛОВЕК с рекурсивной связью, связывающей ее с ней же самой. Рис.
5З. Пример рекурсивной связи Лаконичной устной трактовкой изображенной диаграммы является следующая: Каждый ЧЕЛОВЕК является сьшом одного и только одного ЧЕЛОВЕКА; Каждый ЧЕЛОВЕК может являться отцом для одного или более ЛЮДЕЙ (" ЧЕЛОВЕКОВ" ). Атрибутом сущности является любая деталь, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности. Имена атрибутов заносятся в прямоугольник, изображающий сущность„под именем сущности и изображаются малыми буквами, Например: имя возраст пол Рис.
5.4. Изображение сущности с ее атрибутами Уникальным идентификатором сущности является атрибут„комбинация атрибутов, комбинация связей или комбинация связей и атрибутов, уникально отличающая любой экземпляр сущности от других экземпляров сущности того же типа. Как и в реляционных схемах баз данных, в ЕК-схемах вводится понятие нормальных форм, причем их смысл очень близко соответствует смыслу реляционных нормальных форм. Заметим, что формулировки нормальных форм ЕК- схем делают более понятным смысл нормализации реляционных схем.
Мы при- Глава 5. Семантическое моделирование в базах данных ведем только очень краткие и неформальные определения трех первых нормальных форм. В первой нормальной форме ЕК-схемы устраняются повторяющиеся атрибуты или группы атрибутов, т.е. производится выявление неявных сущностей, "замаскированных" под атрибуты. Во вп>арой нориальной форне устраняются атрибуты, зависящие только от части уникального идентификатора.
Эта часть уникального идентификатора определяет отдельную сущность. В третьей нормальной фор1>е устраняются атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности. Мы остановились только на самых важных понятиях Ей-модели данных.
К числу более сложных элементов модели относятся следующие: Лодтипы и супертипы сущностей. ЕК-модель позволяет задавать отношение 13-А между типами. При этом если Т, Б-А Т,(где Т, и Т, — типы сущностей), то Т, называется подтипом Т„а ҄— супертипом Т,. Т.е. существует возможность наследования типа сущности, исходя из одного или нескольких супертипов. Связи ".чногие-со-л>ногин>".
Иногда бывает необходимо связывать сущности таким образом, что с обоих концов связи могут присутствовать несколько экземпляров сущности (например, все члены кооператива сообща владеют имуществом кооператива). Для этого вводится разновидность связи "многие-сомногими". Уточняемые степени связи. Иногда бывает полезно определить возможное количество экземпляров сущности, участвующих в данной связи (например, служащему разрешается участвовать не более чем в трех проектах одновременно).
Для выражения этого семантического ограничения разрешается указывать на конце связи ее максимальную или обязательную степень. Каскадные удале»ия зкзе1>пляров сущностей. Некоторые связи бывают настолько сильными (конечно, в случае связи "один-ко-многим"), что при удалении опорного экземпляра сущности (соответствующего концу связи "один") нужно удалить и все экземпляры сущности, соответствующие концу связи "многие". Соответствующее требование "каскадного удаления" можно сформулировать при определении сущности. Домены.
Как и в случае реляционной модели данных, бывает полезна возможность определения потенциально допустимого множества значений атрибута сущности (домена). Эти и другие, более сложные элементы модели данных "Сущность-Связь", делают ее существенно более мощной, но одновременно несколько усложняют ее использование. Конечно, при реальном использовании Ей.-диаграмм для проектирования баз данных необходимо ознакомиться со всеми возможностями. Базы Данных. Ин~пеллоктуаллнан обработка информации 5.5. Проблема преобразования концептуальной модели ПО в схему Бд Наиболее часто на практике семантическое моделирование используется на первой стадии проектирования базы данных.
Его результатом, как правило, является концептуальная модель предметной области, выраженная в терминах используемой семантической модели (например, ЕК-модели). При переходе к следуюшсму этапу — этапу моделирования схемы БД вЂ” перед разработчиком возникает проблема выражения концептуальной модели ПО в терминах применяемой модели данных (например, реляционной). В работе ~21] приводится описание трех подходов к решению этой проблемы. Первый подход состоит в ручном преобразовании концептуальной модели ПО в схему БД, выполняемом согласно методикам, в которых достаточно четко оговорены все этапы такого преобразования.