Введение в базы данных
Описание файла
Документ из архива "Введение в базы данных", который расположен в категории "". Всё это находится в предмете "базы данных" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Онлайн просмотр документа "Введение в базы данных"
Текст из документа "Введение в базы данных"
-34-
228147-86659.doc .doc При поддержке:
www.MMOnline.ru | Документ: | 228147-86659.doc.doc |
Автор документа: | Д. Кальченко | |
Замечания, советы, рекомендации: | Р. Сафин | |
Дата создания | 05.12.2000 22:35:00 | |
Последняя редакция: | 26.12.2000 02:09:00 AM |
Введение в базы данных
Кумсков Михаил Иванович
Москва 2000 г.
Механико-математический факультет МГУ.
Материалы для подготовки к экзамену по курсу научно-естественного содержания: «Введение в базы данных».
Осенний семестр. 2000 г.
Содержание:
-
БД. Корпоративные Информационные Системы. Моделирование общих процессов. История развития БД. (+)
-
Сетевые и иерархические БД. Их плюсы и минусы. DDL, DML и DCL. (+)
-
Реляционные базы данных и их сравнения с навигационными (сетевыми и иерархическими). Основные понятия. Нормализация. РБД. (+)
-
SQL, оператор Select. Создание таблиц.(– +)
-
Классы и объекты. Особенности и характеристики ОО программирования клиентской части БД.(+.)
-
Rational Unified Process. Описание жизненного цикла UC. Основные процессы и их характеристики.(+)
-
Основные диаграммы UML. Формулирование требований на UC в виде Rational Case.(+)
-
Rational Rose – прямое и обратное проектирование. UC и БД.(+ .)
-
Восстановление данных в БД. Линейная модель, скользящий контроль.(+ –)
-
Деревья решений при восстановлении данных. Алгоритмы кластерного анализа.(– .)
-
Эволюционные и генетические алгоритмы при восстановлении данных. Факторный анализ. (– +)
-
Структурные объекты в БД. Поиск на совпадение и поиск подструктур.(– +)
-
Основы Java в БД в интернете.(+)
-
Тестирование БД. (+)
Рекомендованная литература и дополнительные материалы
Литература:
-
Мартина Грабер «Введение в SQL»
-
Мейрс «Теория реляционных баз данных», мир 1987 г.
-
Фаулер «Краткое введение в UML»
-
Буч, Якобсон, Рамба «UML. Руководство пользователя».
-
Валкевич «Стратегии клиент сервер»
-
Сайман «Стратегические направления БД»
-
Мишель Жамбю «Иерархический кластерный анализ», Финансовая статистика 1988 г.
-
Дж. Мартин «Базы Данных в вычислительных системах» Мир. 1978, 1980 г.
Много литературы в электронной форме можно найти на сайте Citrorum по адресу:
http://www.citforum.ru/
Электронную версию книги Грабера можно скачать с ftp сервера MMOnline, находящегося по адресу:
http://www.mmonline.ru/
-
БД. Корпоративные Информационные Системы. Моделирование общих процессов. История развития БД.
Базы Данных
-
Бизнес аналитик
-
Системный аналитик
-
Пользователь
-
Администратор данных
-
Разработчики (программисты)
-
Системный администратор БД.
UML – означает Unified Modeling Language - Унифицированный Язык Моделирования. Естественно возникает вопрос: что это язык. Краткий ответ прост UML – это стандартная нотация визуального моделирования программных систем, принятая консорциумом Object Managing Group (OMG) осенью 1997г., и на сегодняшний день она поддерживается многими объектно-ориентированным CASE продуктами, включая Rational Rose 2000.
Разработка фирмы Rational (сайт http://www.rational.com/)
Конкурент http://www.cai.com/ фирма http://www.platinum.com/
CASE – средства (Computer Aid Software Engine)
Информационная модель корпорации.
Существует логический и физический уровни.
-
(логический уровень) система управления БД, описание структур данных используемых в прикладных программах
-
(физический уровень) совокупность структур данных хранящихся на разных носителях.
Объектная модель
Реляционная модель
Иерархическая модель данных
Сетевая модель (70% объемов информации)
Объектно-реляционная модель
Вычислительная техника развивается с точки зрения вычислений.
С середины 60 IBM стала получать заказы от корпоративных заказчиков. БД использовались для перевода бумажных карточек на ЭВМ.
Вначале БД были на магнитных лентах, но в 70-х начался переход на дисковые терминалы. Очень удобно стало обрабатывать информацию. И БД стали корпоративными ресурсами. Известно, что 80% фирм потерявших свои БД – обанкротились.
Закон Грова:
Если вы покупаете машину в 2 раза дороже, то мощность больше в 4 раза. Фирмы объединялись с целью закупки и использования оборудования для хранения и обработки своих БД.
У фирмы IBM была следующая легендарная серия:
64 г. – IBM 360
70 г. – IBM 370
EC-ЭВМ – это повтор IBM 360 (клонирование).
Когда появились Мини ЭВМ, базы данных можно было переводить мейнфреймов на персоналки.
В середине 90-х появилась технология клиент-сервер.
Середина 90-х взрыв развития сетевых технологий
и стала 3-х слойная (уровневая) архитектура работы с БД:
-
ПЭВМ – клиент (тонкий)
-
Сервер – бизнес уровень
-
Сервер БД
Сервер приложений
Но встали проблемы обновления и модификации – это проблема, которая свойственна БД.
B2B – бизнес ту бизнес
B2C – бизнес ту клиент
База данных – набор связанных карточек.
Электронную картотеку можно создать в виде файла.
Проблема в том, что когда нужно что-то добавить – вводится еще одна таблица, а БД призвана облегчить перевязку данных.
Плюсы БД:
-
Информация вводится один раз и доступна всем (каждый раз свежая и актуальная информация)
-
Файлы закрываются целиком, а в БД можно закрывать записи.
-
Каждый файл – картотека.
-
Информация в БД – доступна всем разработчикам и облегчается архивирование
-
Разграничение доступа.
-
Разграничение логической и физической структуры, при изменении физического положения файла – изменений вносить не надо, так как всем занимается СУБД.
-
Сетевые и иерархические БД. Их плюсы и минусы. DDL, DML и DCL.
-
DDL – Data Definition Language (язык описания данных)
– на этом языке задается, какие есть карточки, и какие в них есть поля.
-
DML (Data Manipulation Language)
– это конструкции языка, показывающие что искать, где обновлять, удалять поля.
-
DAL (Data Access Language)
– определяет доступ по чтению, изменению, удалению.
Что такое иерархическая модель?
Рассмотрим следующий пример:
Другая возможность связывание в виде дерева:
клиент
заказ
компонентнт
продавец
товар
Когда делается заказ, менеджер получает комиссионные, поэтому необходимо учитывать, кто из продавцов каким заказом занимался.
Мы должны сделать навигацию.
Вопрос: а почему клиент наверху? Может, необходимо было делать другую структуру?
Раньше проводились исследования, какие пользователи, какие данные, какие частоты доступа. А после этого решали, какое дерево строить.
– Это все иерархический подход. Если конструирование правильное, то он самый лучший.
Методика обследования Use Case моделирование.
Другой вариант решения проблемы – строить новое требование, с другим корнем, но это построение на логическом уровне. Такое дерево называется схемой БД. Мы должны заранее прописывать все связи между картотеками.
Следующие развитие навигационных моделей: сетевая модель
- когда картотеке соединяются в виде графа
Если к плохо сконструированной сетевой модели добавлять таблицы, то работать будет все хуже и хуже…
-
Реляционные базы данных и их сравнения с навигационными (сетевыми и иерархическими). Основные понятия. Нормализация. РБД.
Cold в 1970 году предложил реляционную модель данных.
Вместе с нею был введен язык работы с реляционными базам данных: SQL.
SQL (Обычно произносится как "Сиквэл") является Структурированным Языком Запросов. Это - язык, который дает вам возможность создавать и работать в реляционных базах данных, которые являются наборами связанной информации сохраняемой в таблицах.
За реляционной моделью стояла четкая математическая модель.
Существую две архитектуры.
-
Клиент-сервер.
-
Файл-сервер.
FoxBASE, Paradox, Clarion (Clipper) – не архитектура КС, а архитектура ФС.
Запрос к серверу можно делать и SQL, но это не архитектура К-С, это архитектура Файл-сервер, что и происходит при работе этих БД.
В чем различия?
В архитектуре ФС передаются все таблицы, а их обработка происходит на клиенте (гоняются огромные данные, чаще всего по локальной сети). Решения на основе ФС практически не поддаются масштабированию. Так как при увеличении запросов увеличиваются нагрузки на сеть.
А в архитектуре КС по SQL запросу возвращается только результат, вся обработка происходит на сервере:
Клиентская машина
SQL
Только результаты
Общепринятое определение | Реляционное отношение |
Таблица | Отношение (нет порядка картежей) |
Строка таблицы (запись) | Картеж |
Столбец (элемент записи) | Атрибут |
Область определения элемента записи | Домен |
Ключ – набор атрибутов, однозначно определяющий картеж.
Первичный ключ – минимальный набор атрибутов являющихся ключом.
Иногда вводят специальный атрибут для идентификации (поле id).