Введение в базы данных (1176852)
Текст из файла
-34-
228147-86659.doc
При поддержке:
www.MMOnline.ru | Документ: | 228147-86659.doc.doc |
Автор документа: | Д. Кальченко | |
Замечания, советы, рекомендации: | Р. Сафин | |
Дата создания | 05.12.2000 22:35:00 | |
Последняя редакция: | 26.12.2000 02:09:00 AM |
Введение в базы данных
Кумсков Михаил Иванович
Москва 2000 г.
Механико-математический факультет МГУ.
Материалы для подготовки к экзамену по курсу научно-естественного содержания: «Введение в базы данных».
Осенний семестр. 2000 г.
Содержание:
-
БД. Корпоративные Информационные Системы. Моделирование общих процессов. История развития БД. (+)
-
Сетевые и иерархические БД. Их плюсы и минусы. DDL, DML и DCL. (+)
-
Реляционные базы данных и их сравнения с навигационными (сетевыми и иерархическими). Основные понятия. Нормализация. РБД. (+)
-
SQL, оператор Select. Создание таблиц.(– +)
-
Классы и объекты. Особенности и характеристики ОО программирования клиентской части БД.(+.)
-
Rational Unified Process. Описание жизненного цикла UC. Основные процессы и их характеристики.(+)
-
Основные диаграммы UML. Формулирование требований на UC в виде Rational Case.(+)
-
Rational Rose – прямое и обратное проектирование. UC и БД.(+ .)
-
Восстановление данных в БД. Линейная модель, скользящий контроль.(+ –)
-
Деревья решений при восстановлении данных. Алгоритмы кластерного анализа.(– .)
-
Эволюционные и генетические алгоритмы при восстановлении данных. Факторный анализ. (– +)
-
Структурные объекты в БД. Поиск на совпадение и поиск подструктур.(– +)
-
Основы Java в БД в интернете.(+)
-
Тестирование БД. (+)
Рекомендованная литература и дополнительные материалы
Литература:
-
Мартина Грабер «Введение в SQL»
-
Мейрс «Теория реляционных баз данных», мир 1987 г.
-
Фаулер «Краткое введение в UML»
-
Буч, Якобсон, Рамба «UML. Руководство пользователя».
-
Валкевич «Стратегии клиент сервер»
-
Сайман «Стратегические направления БД»
-
Мишель Жамбю «Иерархический кластерный анализ», Финансовая статистика 1988 г.
-
Дж. Мартин «Базы Данных в вычислительных системах» Мир. 1978, 1980 г.
Много литературы в электронной форме можно найти на сайте Citrorum по адресу:
http://www.citforum.ru/
Электронную версию книги Грабера можно скачать с ftp сервера MMOnline, находящегося по адресу:
http://www.mmonline.ru/
-
БД. Корпоративные Информационные Системы. Моделирование общих процессов. История развития БД.
Базы Данных
-
Бизнес аналитик
-
Системный аналитик
-
Пользователь
-
Администратор данных
-
Разработчики (программисты)
-
Системный администратор БД.
UML – означает Unified Modeling Language - Унифицированный Язык Моделирования. Естественно возникает вопрос: что это язык. Краткий ответ прост UML – это стандартная нотация визуального моделирования программных систем, принятая консорциумом Object Managing Group (OMG) осенью 1997г., и на сегодняшний день она поддерживается многими объектно-ориентированным CASE продуктами, включая Rational Rose 2000.
Разработка фирмы Rational (сайт http://www.rational.com/)
Конкурент http://www.cai.com/ фирма http://www.platinum.com/
CASE – средства (Computer Aid Software Engine)
Информационная модель корпорации.
Существует логический и физический уровни.
-
(логический уровень) система управления БД, описание структур данных используемых в прикладных программах
-
(физический уровень) совокупность структур данных хранящихся на разных носителях.
Объектная модель
Реляционная модель


Иерархическая модель данных
Сетевая модель (70% объемов информации)
Объектно-реляционная модель
Вычислительная техника развивается с точки зрения вычислений.
С середины 60 IBM стала получать заказы от корпоративных заказчиков. БД использовались для перевода бумажных карточек на ЭВМ.
Вначале БД были на магнитных лентах, но в 70-х начался переход на дисковые терминалы. Очень удобно стало обрабатывать информацию. И БД стали корпоративными ресурсами. Известно, что 80% фирм потерявших свои БД – обанкротились.
Закон Грова:
Если вы покупаете машину в 2 раза дороже, то мощность больше в 4 раза. Фирмы объединялись с целью закупки и использования оборудования для хранения и обработки своих БД.
У фирмы IBM была следующая легендарная серия:
64 г. – IBM 360
70 г. – IBM 370
EC-ЭВМ – это повтор IBM 360 (клонирование).
Когда появились Мини ЭВМ, базы данных можно было переводить мейнфреймов на персоналки.
В середине 90-х появилась технология клиент-сервер.
Середина 90-х взрыв развития сетевых технологий
и стала 3-х слойная (уровневая) архитектура работы с БД:
-
ПЭВМ – клиент (тонкий)
-
Сервер – бизнес уровень
-
Сервер БД
Сервер приложений
Но встали проблемы обновления и модификации – это проблема, которая свойственна БД.
B2B – бизнес ту бизнес
B2C – бизнес ту клиент
База данных – набор связанных карточек.
Электронную картотеку можно создать в виде файла.
Проблема в том, что когда нужно что-то добавить – вводится еще одна таблица, а БД призвана облегчить перевязку данных.
Плюсы БД:
-
Информация вводится один раз и доступна всем (каждый раз свежая и актуальная информация)
-
Файлы закрываются целиком, а в БД можно закрывать записи.
-
Каждый файл – картотека.
-
Информация в БД – доступна всем разработчикам и облегчается архивирование
-
Разграничение доступа.
-
Разграничение логической и физической структуры, при изменении физического положения файла – изменений вносить не надо, так как всем занимается СУБД.
-
Сетевые и иерархические БД. Их плюсы и минусы. DDL, DML и DCL.
-
DDL – Data Definition Language (язык описания данных)
– на этом языке задается, какие есть карточки, и какие в них есть поля.
-
DML (Data Manipulation Language)
– это конструкции языка, показывающие что искать, где обновлять, удалять поля.
-
DAL (Data Access Language)
– определяет доступ по чтению, изменению, удалению.
Что такое иерархическая модель?
Рассмотрим следующий пример:
Другая возможность связывание в виде дерева:
клиент
заказ
компонентнт
продавец
товар
Когда делается заказ, менеджер получает комиссионные, поэтому необходимо учитывать, кто из продавцов каким заказом занимался.
Мы должны сделать навигацию.
Вопрос: а почему клиент наверху? Может, необходимо было делать другую структуру?
Раньше проводились исследования, какие пользователи, какие данные, какие частоты доступа. А после этого решали, какое дерево строить.
– Это все иерархический подход. Если конструирование правильное, то он самый лучший.
Методика обследования Use Case моделирование.
Другой вариант решения проблемы – строить новое требование, с другим корнем, но это построение на логическом уровне. Такое дерево называется схемой БД. Мы должны заранее прописывать все связи между картотеками.
Следующие развитие навигационных моделей: сетевая модель
- когда картотеке соединяются в виде графа
Если к плохо сконструированной сетевой модели добавлять таблицы, то работать будет все хуже и хуже…
-
Реляционные базы данных и их сравнения с навигационными (сетевыми и иерархическими). Основные понятия. Нормализация. РБД.
Cold в 1970 году предложил реляционную модель данных.
Вместе с нею был введен язык работы с реляционными базам данных: SQL.
SQL (Обычно произносится как "Сиквэл") является Структурированным Языком Запросов. Это - язык, который дает вам возможность создавать и работать в реляционных базах данных, которые являются наборами связанной информации сохраняемой в таблицах.
За реляционной моделью стояла четкая математическая модель.
Существую две архитектуры.
-
Клиент-сервер.
-
Файл-сервер.
FoxBASE, Paradox, Clarion (Clipper) – не архитектура КС, а архитектура ФС.
Запрос к серверу можно делать и SQL, но это не архитектура К-С, это архитектура Файл-сервер, что и происходит при работе этих БД.
В чем различия?
В архитектуре ФС передаются все таблицы, а их обработка происходит на клиенте (гоняются огромные данные, чаще всего по локальной сети). Решения на основе ФС практически не поддаются масштабированию. Так как при увеличении запросов увеличиваются нагрузки на сеть.
А в архитектуре КС по SQL запросу возвращается только результат, вся обработка происходит на сервере:
Клиентская машина
SQL


Только результаты
Общепринятое определение | Реляционное отношение |
Таблица | Отношение (нет порядка картежей) |
Строка таблицы (запись) | Картеж |
Столбец (элемент записи) | Атрибут |
Область определения элемента записи | Домен |
Ключ – набор атрибутов, однозначно определяющий картеж.
Первичный ключ – минимальный набор атрибутов являющихся ключом.
Иногда вводят специальный атрибут для идентификации (поле id).
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.