Хомоненко А.Д., Цыганков В.М., Мальцев М.Г. - Базы данных. Учебник для высших учебных заведений (6-е изд.) - 2009 (960530), страница 54
Текст из файла (страница 54)
9.1. Сильносвязанные вычислительные системыСлабосвязанныемногопроцессорные вычислительные системы, или системы без совместного использования ресурсов, представляют собой совокупность компьютеров, объединенных в единую систему быстродействующейсредой передачи информации (рис. 9.2). Процессоры поддерживают связьдруг с другом путем передачи сообщений. Примерами слабосвязанных многопроцессорных систем являются: система Teradata, которая может иметь свыше 1000 процессоров и тысячи дисков, и система Gamma, работающая на Inteli P S C / 2 Hypercube с 32 узлами, каждый из которых имеет собственный диск.Для названных задач из указанных классов параллельных систем предпочтительными чаще оказываются слабосвязанные системы.Во-первых, в системах с разделением ресурсов требуется сложная операционная система (использующая часть ресурсов), отслеживающая и разрешающая конфликты из-за обращения к совместно используемым ресурсам.Кроме того, в них при добавлении нового процессора замедляется работа9 За*.
541258Часть 2. Проектирование и использование БДостальных процессоров. В однопроцессорных системах основной причиной снижения производительности для многозадачного и многопользовательского режимов работ с базами данных являются операции загрузки и выгрузки кэш-памяти.Во-вторых, системы с массовым параллелизмом, по-видимому, ожидает большое будущее, нов настоящее время они не имеют массового применения из-за высокой стоимости компонентовкомпьютеров и сложной организации вычислительного процесса.Основным достоинством слабосвязанных выВнешняя памятьчислительных систем является легкость наращивания числа процессоров до сотен или даже тысячбез существенных помех в их работе. В системах сРис. 9.2. Слабосвязаннаявычислительная системаразделением памяти максимальное число процессоров пока составляет 32. Системы без совместного и с п о л ь з о в а н и я р е с у р с о в п о з в о л я ю т д о с т и ч ь почти л и н е й н о г оускорения и расширяемости при обслуживании сложных реляционных запросов и транзакций.Еще одним достоинством слабосвязанных вычислительных систем является высокая надежность и простота управления процессом обработки информации.
Кроме того, подсистемы связи в них не должны иметь высокую производительность, как в системах с совместным использованием ресурсов.Достичь высоких временных показателей обработки данных в слабосвязанных вычислительных системах удается благодаря использованию реляционной модели. Реляционный запрос хорошо подходит к параллельномувыполнению: из операторов над отношениями можно составить параллельный граф потоков данных.Основными методами распараллеливанияобработки данных являются: конвейеризация и разнесение обработки. Конвейеризация состоит в выделении стадий выполнения операций над данными базы и распределении отдельных стадий по обрабатывающим узлам вычислительной системы. Разнесенный параллелизм возможен в случаях, когда допускается разделение (разнесение) источников данных и независимая их обработка.В параллельных реляционных С У Б Д используются оба вида распараллеливания (часто одновременно), причем существенно больший эффект можетдать второй из них.Факторами, ограничивающими использование конвейеризации, я в л я ются: незначительное число этапов подавляющего числа реляционныхоператоров, а также эффект «перекоса», состоящий в различной трудоемкости этапов выполняемых операций.
Выигрыш от разделения данных также9. Дополнительные вопросы применения баз данных259может быть различным - в зависимости от правильности выбора используемых алгоритмов и методов (кольцевое разделение, с хэшированием, наоснове диапазона значений, на основе частоты обращения к кортежами т. д.).В реализации параллельных систем баз данных имеются следующие нерешенные проблемы:• обеспечение высоких временных характеристик при смешанной нагрузке;•оптимизация параллельных запросов;• выбор оптимальных методов физического проектирования баз данных(разделение данных, выбор индексов для таблиц и т. д.);• разработка методов и средств реорганизации данных в режиме on-line;• исследование алгоритмов конвейеризации и т. д.При организации распределенных информационных систем применяютболее совершенные схемы обеспечения целостности совокупности БД. Так,вместо двухфазной фиксации транзакций (когда во всех узлах системы синхронно фиксируется начальное и конечное состояния всех БД), применяется, например, асинхронное тиражирование данных (подраздел 4.3).9.2.
Перспективы развития СУБДАнализ современных СУБД и реализованных на их основе приложенийпозволяет предположить следующие направления их развития:1) поиск более совершенных моделей представления и типов данныхв базах;2) разработка новых архитектур СУБД;3) расширение областей применения БД;4) улучшение сервиса конечных пользователей, администраторов и разработчиков.В рамках первого направления представляют интерес СУБД, поддерживающие несколько моделей или одну интегрированную модель и позволяющие удобно программировать вычисления, обрабатывать символьную и графическую информацию, работать со знаниями, аудио- и видеоинформацией, осуществлять доступ к распределенной информации, организовывать телеконференции, обучение и выполнять другие операции.На пути к решению этой проблемы находится попытка поддержки вомногих современных С У Б Д различных типов двоичных данных и типагиперссылка.Новые архитектуры СУБД.
Современные информационные системыв ряде случаев требуют от СУБД возможности хранить и обрабатывать данные объемом порядка Петабайтов (Petabyte - 1013 байтов). Несмотря назначительный рост возможностей по объему магнитных и магнитоопти-260Часть 2. Проектирование и использование БДческих дисков, вряд ли их будет достаточно для информационных систем,работающих со сверхбольшими объемами данных. В связи с этим говорято необходимости организации нового уровня иерархии носителей - «третичной памяти».
Устройствами третичной памяти могут быть устройствав виде стоек магнитных дисков или лент с автоматически сменяемыминосителями.Примером такого устройства является буферная система VSM (VirtualStorage Manager - менеджер виртуальной памяти) корпорации StorageTek.Система VSM накапливает данные и сохраняет их на жестких дисках в буфере данных, где они складируются в виде виртуальных томов на магнитныхлентах (до 100 ООО виртуальных томов на каждом дисковом буфере).
Максимальная скорость передачи данных пользователя - до 45 Мбайтов/с.Еще одним примером является система CD Storage System корпорацииCompaq Computer. Она предоставляет сетевым пользователям доступ к данным на компакт-дисках, размещенных в корпусе фирмы Micro DesignInternational. Всего может быть до семи блоков (корпусов), каждый из которых вмещает по семь приводов компакт-дисков. Объем памяти каждого блока - до 4,5 Гбайтов. Можно установить до 49 дисководов на сервер и управлять ими как одним логическим диском.К новым областям применения СУБД можно отнести следующие двакласса задач: обработки сверхбольших объемов информации и распределенной обработки информации в сетях ЭВМ.Примером системы, решающей одну из задач первого класса, является проектируемая информационная система наблюдения Земли EOS (Earth ObservingSystem), основным элементом которой является база данных EOSD1S (EOSData and Information System - система данных и информации).Примерами задач второго типа являются задачи поиска и отбора информации в Интернете, организации коллективного проектирования втерриториально разнесенных организациях, обмена материальными, инф о р м а ц и о н н ы м и , д е н е ж н ы м и и д р у г и м и ресурсами с э л е к т р о н н ы моформлением.Если брать качество сервиса в широком смысле, то перспективные СУБДпозволят решать стоящие прикладные задачи с лучшим качеством.
Для этогоони будут опираться на более совершенную элементную базу (повышениеобъема хранимых данных, увеличение производительности обработки запросов), иметь более совершенную программную организацию (распределенная обработка, безопасность хранимой информации, защита прав собственности), обладать более гибкими и удобными интерфейсами для программистов, пользователей и администраторов БД.Осознание необходимости хранения в базах данных не только информации о предметной области, но и информации разработчиков приложений привела к тому, что некоторые крупные фирмы (Oracle, Microsoft) заявили о9. Дополнительные вопросы применения баз данных261скором появлении программных продуктов управления метаданными объектно-ориентированных репозиториях.
Такие репозитории полезны администраторам БД в управлении метаданными, а также разработчикам, таккак позволяют при разработке приложений многократно использовать готовые компоненты.Одним из новых требований в области информационных технологий является обеспечение безостановочной работы. С одной стороны, возможности компьютеров, а с другой - конкуренция привели к тому, что некоторыеинформационные системы работают непрерывно. Появился так называемый«стандарт готовности», который определяется как возможность пользователя совершать интерактивное обновление данных 24 часа в сутки, 7 дней внеделю, 52 недели в год. Часто безостановочный режим работы называют«7*24-» или «24*365-работой». Это означает, что в каждый день года в любое время пользователю доступны информационные ресурсы, без скидок навыходные и праздничные дни.Такой уровень качества прикладных систем, использующих БД, помимомер повышения надежности и устойчивости непрерывной работы, выдвигаети новые требования к организации обслуживания систем.