Теория и практика построения баз данных (1088289), страница 148
Текст из файла (страница 148)
Системы с совместным использованием файлов также состоят из компьютеров, объединенных в сеть, и, подобно клиент-серверной архитектуре, сеть обычно является локальной, а компьютеры — персональными. Основное различие между системами с совместным использованием файлов и клнент-серверными системами состоит в том, что серверньш компьютер предоставляет меньшее количество услуг компьютерам пользователей.
Сервер, который в ланном случае называется файловым сервером (61е зегчег), а не сервером базы данггы г (с)агаЬазе эегчег), предоставляет доступ к файлам и другим ресурсам. Следовательно, как СУБД, так и прикладные программы должны быть установлены на пользовательских компьютерах. В системе распределенной обработки базы данных одггу и ту же базу данных обрабатывает множество компьютеров. Есть несколько тшюв распределенных баз данных: разлеленная и нереплицировапная, неразделенная и реплицированная и разделенная и реплицированная. В обгцем случае, чем больше степень разделения и репликации, тем болыпе гибкость, независимость и надежность.
С другой стороны, ггозрастают временные затраты и увеличивается сложность управления и обеспечения безопасности. Существует три способа обработки распределенных баз данных: загрузка данных только для чтения, выделение специализированного компьютера для обновления базы данных и обновление ланных множеством компьютеров. При распределенном обновлении возникает три типа конфликтов: потеря уникальности, потеря обновлений из-за параллельных транзакций и обновление стертых данных. Если удаление допускается более чем на одном компьютере, эти проблемы необходимо решать. Координация распределенных атомарных транзакций сложна и требует двухфазного сохранения.
Для решения этих проблем предназначены такие технологии, как 01 Е ОагБЬпгед Тгапзассгоп Яегчег и Епгегрпзе 1ача Веаггз. С появлением мощных персональных компьютеров стала возможна загрузка значительных объемов данных предприятия на компьютеры пользователей для локальной обработки. Пользователи могут запрашивать загруженные ланные и составлять на их основе отчеты, пспользуя установленные на своих машинах СУБД. В большинстве случаев пользователям не разрешается обновлять и возврагцать гганггые, поскольку это может привести к потере целостности данных. Даже если загружаемые данные не обновляются и не возвращаются, могут возникать проблемы координации данных, согласованности, контроля доступа и компьютерной преступности.
Для публикации загруженных данных можно использоватычеЪ-сервер. Оперативная аналитическая обработка данных (0) АР) — это новый способ представления информации. Данные изображаются в кубах, имеющих оси, измерения, меры, слои и уровни. Оси описывают физическую структуру представления — строки и столбцы.
Измерения — это характеристики данных, откла- 686 Глава 17. Совместное использование данных предприятия Вопросы 1 группы 687 дываемые вдоль осей. Меры — это отображаемые значения данных. Слоями называ|отся атрибуты куба (измерения или меры), которые должны оставаться постоянными в прелставлении. Уровень — это атрибут измерения, описываюший его положение в иерархии. Термин куб относится как к семантической структуре, используемой лля интерпретации данных, так и к конкретной материализации данных в такой семантической структуре.
В листинге 17.1 показан олин пз способов определения структуры, а в листинге 17.2 — один из способов определения материализации структуры куба. ВОЕАР (реляционная 01 АР), М01.АР (многомеряая 01 АР) и Н01.АР (гибридная 01.АР) представляют собой трп разновидности оперативной аналитической обработки данных.
Сторонники КОЕАР говорят, что реляционной СУБД с некоторыми расширениями лостаточно для удовлетворения вычислительных требований 01 АР, сторонники М01 АР возражают, что для этих целей необходим специализированный многомерньш процессор, а сторонники Н01.АР заявляют, что нужно использовать и то и другое. Компания М)сгозой создала расширения ОЕЕ Г)В и АОО для ОЕАР. ОЕЕ РВ для ОЕАР включает объект, называемый набором данных; обьектвая модель АГ)0 МР содержит новые объекты, позволяющие обрабатывать наборы ланных так же, как н наборы записей.
В 0111се 2000 и Ъ'!поотчз 2000 была добавлена Главная служба таблиц. Архитектура М)сгозо(г переносит значительную часть ОЕАР-обработки на клиентские компьютеры; будет ли это приемлемо для обработки данных на серверах предприятий, пока неизвестно. Информационное хранплише — это хранилище данных предприятия, предназначенное для упрощения принятия управленческих решений. В информационном хранилище содержатся выдержки пз рабочих баз данных, файлы, изображення, записи, фотографии, внешние данные и другая информация. Информационное хранилище предоставляет доступ к этим ланным в формате, удобном для пользователей.
Компонентами информационного хранилища явля1отся средства извлечения данных, выдержки данных, метаданные, одна или несколько СУБД, разработанное на предприятии программное обеспечение для управления дапнымп, программы доставки данных, аналитические средства, курсы обучения пользователей и консультирующий персонал. Типичные требования к информационному хранилншу включают создание запросов и отчетов с переменной структурой, группировку данных по задаваемым пользователем критериям, параметрическое разбиение данных, графическое отображение результатов и интеграци|о со специализированными программами.
В ходе создания и эксплуатации информационных хранилищ приходится решать несколько важных проблем. Прежде всего, при объединении данных из различных источников результат может содержать несогласованности из-за различия временных характеристик и доменов исходных данных. Далее, в информационном хранилище, как правило, имеется большое количество прикладных программ, относяшихся к разным областям. Пользовательские интерфейсы этих программ могут значительно различаться, экспорт и импорт данных между ними может осушествляться некорректно, а получить техническую поддержку может быть трудно. Еше одна проблема — отсутствие средств управления самим информационным хранилищем.
Организация может быть вынуждена самостоятельно разрабатывать программное обеспечение для управления нереляционными данными и поддержания соответствующих метаданных. Разработка такого программного обеспечения япляется сложной и дорогостояшей. Наконец, многие запросы к информационному хранилишу имеют необычную природу; такие запросы трудно выполнить.
В связи с этим многие организации разработали информационные хранилиша с ограниченной областью охвата, называемые информационными лавками. Данные являются важнейшим активом организации, который обеспечивает поддержку как деловых операций, так и принятия управленческих решений.
Задача отдела администрирования данных состоят пе только в охране и защите информационных активов, но и в обеспечении пх эффективного использования. Одной из наиболее важных функций отдела администрирования данных является документирование содержимого информационных активов организации. Это сложная задача, поскольку данные хранятся во множестве различных форматов и разбросаны по всей организации. Отдел администрирования данных должен помогать в установлении организационных стандартов на имена и форматы элементон данных, а также в определении прав и обязанностей по обработке. Наконец, поскольку данные представляют собой олин из видов ресурсов, пользование ими может быть источником власти, поэтому отдел администрирования данных должен иметь дело с органпзационнымп и политическплш вопросами.
Специфические функции отдела адмшшстрнрования данных включа|от продвижение его услуг, выработку стандартов организации данных и назначение распорядителей данных, выработку правильной политики в отношении данных и создание форума для разрешения конфликтов. Все этп функции направлены на то, чтобы увеличить отдачу от инвестиций в информационные активы предприятия. Вопросы ! группы 1. Перечнсл те архитектуры, ° ользуеьые.ля обработки но пользова тельских баз данных. 2.
Нарцсуйте архитектуру системы удаленной обработки. Укажите, какие компьютеры и программы входят в ее состав, и объясните, на каком компьютере работает каждая из программ. 3. Почему пользовательский интерфейс приложений удаленной обработки обычно ориентирован на текст и примитивен7 4. Нарисуйте архитектуру клиент-серверной системы. Укажите, какие компь1отеры и программы входят в ее состав, и объясните, на каком компьютере работает каждая пз про~рамьь Глава 17. Совместное использование данных предприятия Вопросы ! группы 689 24.
25. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 5. Какие типы компьютеров используются в клиент-серверных системах? 6. Сколько серверов имеет клиент-серверная система? Каковы ограничения, касающиеся серверов? 7. Нарисуйте архитектуру системы с совместным использованием файлов. Укажите, какие компьютеры и программы вхолят в ее состав, и объясните, на каком компьютере работает каждая из програлгьс 8. Объясните, чем буде~ отличаться обработка слелуюшего Я11.-запроса в кли- ент-серверной системе и системе с совместным использованием файлов; 5ЕЬЕСТ ИмвСтудечга, НаэваниеПредчега ГРОМ СТУДЕНТ, УСПЕВАЕМОСТЬ 'чНЕРЕ СТУДЕНТ.НомерСтудента = УСПЕВАЕМОСТЬ НомерСтудента АИО УСПЕВАЕМОСТЬ.Оценка = '5' Будем предполагать, что база данных имеет две таблицы; СТУДЕНТ (НомерСтудечта, ИияСтудента, ТелефонСтудента) УСПЕВАЕМОСТЬ (НомерПредиета, НомерСтудента, Оценка) Объясните, почему системы с совместным использованием файлов редко используются в приложениях, обрабатывающих транзакции с больнгиыи объемами данных.
Дайте опрелеления терминов разделение и релликация в контексте прило- жений распределенных баз данных. Объясните разницу между вертикальным и горизонтальным фрагментами. Объясните, чем различаются четыре типа баз данных на рис. 17.6. Перечислите и опишите три способа обработки распределенной базы данных. Опишите три типа конфликтов, возникающих при распрелеленном обнов- лении. Каково назначение двухфазного сохранения? Опишите в общих чертах проблему координации обработки загруженных баз ланных.
Опишите в общих чертах проблему согласованности при обработке загруженных баз данных, Опишите в общих чертах проблему контроля доступа при обработке загруженных баз данных. Почему прп обработке загруженных баз данных сушествует повышенный риск компьютерных преступлений? Нарисуйте компоненты системы, использующей зтеЬ-сервер для публикации данных. Что такое куб ОЕАР? Приведите пример, отличный от показанного в табл. 17.2. Объясните разницу между осью и измерением в 01.АР. Что такое мера куба 01.АР? 26.