Диго С.М. Базы данных проектирование и использование (1084447), страница 63

Файл №1084447 Диго С.М. Базы данных проектирование и использование (Диго С.М. Базы данных проектирование и использование) 63 страницаДиго С.М. Базы данных проектирование и использование (1084447) страница 632018-01-122018-01-12СтудИзба

Диго С.М. Базы данных проектирование и использование

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 63)

Основные проблемы, возникающие в системах с тиражированием, связаны с поддержкой согласованности состояния всех копий. Существует множество схем проведения обновления копий в РБД.

По моменту внесения изменений в реплики различают синхронное и асинхронное тиражирование.

Асинхронное тиражирование (называемое также тиражированием с промежуточным хранением) реализует схему, при которой обновление всех копий баз данных может проводиться неодновременно. При таком методе поддержки логической целостности распределенной базы данных имеет место некоторая рассинхронизация состояния локальных баз данных во времени, т.е. изменение состояния одной локальной базы данных отстает от изменения другой локальной базы данных по времени.

Асинхронность обмена данными в целом ряде случаев вполне допустима, и при этом удается обойти, в частности, проблему ограниченной пропускной способности и недостаточной надежности сети. Если один сервер системы, требующий обновления тиражируемых данных, выходит из строя, то система продолжает работать с остальными, при этом обновление данных на сбойном сервере после восстановления его работоспособности произойдет автоматически, т.е. ошибка на одном узле глобальной сети не повлияет на работу остальных узлов.

Механизм асинхронного тиражирования данных особенно актуален при работе в глобальной сети с недостаточно надежными и быстродействующими каналами связи. Например, при использовании телефонных линий связи механизм двухфазной фиксации транзакции практически нереализуем, поскольку все оборудование одновременно в работоспособном состоянии почти никогда не находится.

Асинхронное тиражирование может быть периодическим или апериодическим. Периодическое тиражирование выполняется через заданные интервалы времени. Время выполнения очередных циклов тиражирования выбирается исходя из частоты возникновения изменений и их интенсивности, ограничения на допустимое время рае-синхронизации состояний источника и приемника, объема данных, передаваемых в единичном цикле тиражирования, и максимально допустимой загрузки коммуникационных ресурсов и некоторых других факторов.

Момент выполнения апериодического тиражирования определяется обычно каким-либо событием (такой механизм называется также тиражированием по событиям) и может быть реализован, например, через механизм процедур или триггеров.

В случае синхронного тиражирования предполагается завершение транзакции только после успешной модификации всех копий. Синхронное тиражирование использует механизм двухфазной фиксации (2РС) - Two-Phase Commit: основная система связывается с подчиненными копиями баз данных и одновременно вносит в них изменения, блокируя соответствующие записи. Если хотя бы одна из таких копий недоступна, изменения не выполняются. Поскольку механизм двухфазной фиксации предъявляет высокие требования к системе и снижает степень автономности узлов, то он в технологии тиражирования используется не часто.

Чтобы как-то компенсировать недостатки синхронного тиражирования, используют тиражирование во времени, близком к реальному, которое заключается в том, что сразу после завершения транзакции на основном узле изменения автоматически передаются тиражируемым копиям. Но при данном виде тиражирования в случае недоступности одного из узлов изменения хранятся до восстановления связи с получателем. Такая схема создает меньшую загрузку сети и подходит для приложений, не требующих строгой синхронности копий данных.

Наиболее жестким критерием согласованности является критерий полной эквивалентности копий, который требует, чтобы по завершении транзакции все копии логического элемента данных были идентичны. Такая технология синхронизации не позволяет достичь одной из основных целей применения технологии тиражирования - повышения производительности за счет обеспечения большей автономности отдельных частей системы - и поэтому используется в системах с тиражированием редко.

Типичный протокол тиражирования, обеспечивающий сериализуемость по критерию полной эквивалентности копий, известен под названием Read-Once/Write-All (ROWA) - одно чтение, запись во все копии. Операция чтения в этом протоколе сводится к чтению одной какой-либо копии (вопрос о том, из какой именно копии будет выполняться чтение, может решаться из соображений эффективности). Каждая операция записи в логический элемент данных отображается на множество операций записи в физические копии этих элементов.

Протокол ROWA прост, но он требует доступности всех копий элемента данных, для того чтобы транзакция была завершена. Сбой на одном из узлов приведет к дублированию транзакции, что снижает доступность данных.

Было предложено несколько альтернативных алгоритмов, смягчающих требования ROWA относительно одновременности внесения изменения во все копии.

Реплики в РБД с тиражированием могут быть равноправными и неравноправными. Чаще всего они являются неравноправными. В этом случае одна из реплик считается основной. Даже При наличии неравноправных реплик возможны ситуации, при которых корректировать разрешается любую реплику, но часто изменения позволено вносить только в основную реплику, а другие реплики доступны пользователям только по чтению. Такая схема тиражирования называется тиражированием из основного узла (primary site). При этом данные асинхронно копируются из основной в иные реплики.

Поскольку при такой схеме тиражирования предъявляются повышенные требования к сохранности основной реплики и надежности функционирования основного узла, то иногда вышеописанную модель дополняют горячим резервированием (failover) основного узла. В этом случае основной узел тиражирует изменения как на подчиненные узлы, так и на узел с резервной копией. Если основной узел выходит из строя, то владельцем данных становится резервный, который с этого момента выполняет все его функции.

Одной из технологий, которые могут использоваться, если изменения вносятся в локальные реплики, является тиражирование слиянием (merge replication). Суть метода заключается в том, что операции выполняются на удаленном компьютере, который может быть даже полностью отключен от компьютерной сети. Автономная СУБД записывает все операции с данными и их очередность. Затем в определенный момент автономный компьютер связывается с издателем (сервером, на котором корректируется БД, подлежащая дальнейшему тиражированию) и согласовывает с ним свои данные, пересылая издателю последовательность операций, проведенных в удаленной базе данных. При возникновении конфликтов они разрешаются с помощью различных алгоритмов.

В некоторых системах функции формирования «эталонной» базы и рассылки реплик конечным пользователям (подписчикам) распределены между разными узлами системы. В этом случае после слияния издатель передает изменения на сервер-дистрибьютер для дальнейшего распространения по подписчикам.

Тиражирование слиянием обеспечивает максимальную автономность удаленной базы данных.

При использовании этого, метода могут возникнуть коллизии, которые необходимо себе хорошо представлять и предотвращать их разнообразными средствами, как техническими, так и организационными.

Кроме того, существуют так называемые поточные модели тиражирования (workflow). В этой модели владелец данных меняется динамически: данные могут обновляться на различных узлах, но в любой момент времени такими полномочиями обладает только один из них. Узлы последовательно обновляют принадлежащие им данные и тиражируют изменения на всю систему.

Некоторые системы позволяют любым узлам с тиражируемыми копиями одновременно обновлять их. Такая модель называется моделью с произвольным обновлением данных. В этом случае возможно возникновение конфликтов между отдельными репликами, и необходим развитый механизм выявления и разрешения этих конфликтов, предотвращающий потерю целостности данных. При этом могут использоваться разнообразные алгоритмы разрешения возникающих коллизий. В некоторых системах реализован какой-либо один из возможных алгоритмов, в других - имеется возможность выбора из нескольких вариантов.

Еще одним критерием классификации механизмов тиражирования является признак того, кто является инициатором обновления реплик. Внесение изменений в реплики может инициироваться рабочими станциями. Такой процесс обновления называется обновлением по запросу. Обновление может выполняться как по определенному графику, так и вручную.

Другой подход заключается в том, что инициатором проведения изменений является сервер (принудительная рассылка тиража). Такая рассылка может осуществляться либо в момент появления изменений (немедленное тиражирование), либо по графику (через заданный интервал, в указанное время).

Немедленное тиражирование (называемое также тиражированием по событиям) означает, что сразу после завершения транзакции на основном узле изменения автоматически передаются тиражируемым копиям.

Метод, при котором считывание данных проводится удаленными узлами из основных, называется вытягиванием изменений, а метод, заключающийся в выгрузке данных на узлы с копиями,- выталкиванием изменений.

Обновление содержания реплик может быть обеспечено следующими способами:

копированием моментального снимка базы данных;
копированием и выполнением очереди подтвержденных издателем транзакций;
копированием изменений из журнала БД.

Моментальный снимок базы данных (snapshot) отражает состояние базы данных в целом или ее фрагмента на момент получения снимка. При копировании моментального снимка базы данных часто передаются не только собственно данные, но и дополнительная служебная информация, например идентификаторы столбцов и строк.

В процессе тиражирования транзакций (transactional replication) от издателя к подписчикам передаются не данные, а операции над ними. Само обновление происходит на рабочей станции. Передачу транзакций можно использовать только в том случае, когда в автономной базе данных уже хранится копия основной БД. При использовании этой схемы периодически необходимо выполнять и полную синхронизацию данных, которая выполняется по методу тиражирования моментального снимка данных. Тиражирование транзакций лучше всего использовать, когда объем базы данных велик, а операций над ними выполняется немного.

В БнД вообще, а в распределенных - особенно одной из важнейших задач является обеспечение целостности баз данных, в том числе восстановление баз после их разрушения. Для этих целей используются журналы изменений баз данных - протокол, в котором регистрируются в хронологическом порядке исходные и обновленные состояния всех записей базы данных, модифицированных в процессе исполнения транзакций. Ведение журнала обеспечивается многими СУБД и применяется при процедурах восстановления.

В случае обновления на подписчике (immediate updating subscribers) тиражирование инициируется издателем. Как только издатель подтверждает транзакцию, он сообщает дистрибьютеру о том, что данные изменены. Дистрибьютер забирает подтвержденную транзакцию и рассылает ее подписчикам. Если во время завершения транзакции связь между дистрибьютером и издателем была прервана, то транзакция записывается в очередь и будет передана дистрибьютеру, как только связь восстановится. Дальнейшее распространение данных выполняет дистрибьютер либо принудительно, либо по запросу. Транзакции проводятся только через издателя.

10.6. Обеспечение целостности и безопасности данных в РБД

10.6.1. Особенности обеспечения целостности в РБД

Существует ряд проблем обеспечения ограничений целостности распределенной БД, помимо тех аспектов, которые присущи любым БД:

возможность одновременного доступа нескольких пользователей к одной и той же информации (особенно если эти обращения к БД - корректирующие);
физический разброс отдельных частей БД по разным компьютерам;
разнотипность источников информации.

Первая проблема имеет место в любых РБнД, вторая - если база данных является распределенной, третья - если система является гетерогенной.

Первая группа проблем в области обеспечения целостности в распределенных БнД обусловлена в основном возникновением опасности искажения данных при их одновременной корректировке разными пользователями. В зависимости от способа организации БД проблема приобретает специфические черты, обусловленные используемой технологией обработки данных. Так, проблема обеспечения целостности данных будет по-разному решаться при корректировке единой централизованной БД, при работе с несколькими разными копиями БД (репликами) или при работе с распределенной базой данных, отдельные части которой не дублируют друг друга.

Возможны разные схемы обеспечения целостности данных при выполнении корректирующих обращений в многопользовательском режиме:

запрещение корректировки информации, если ее корректирует другой пользователь (блокировка);
корректировка разных копий информационных единиц и последующее устранение возникающих коллизий.

Если СУБД предоставляет возможность выбора способа обеспечения целостности при многопользовательских обращениях, то на результат этого выбора будут влиять многие факторы, в том числе:

степень конкуренции при выполнении корректирующих обращений - насколько часто возникает ситуация одновременной корректировки одной и той же информационной единицы;
ограничения на время реакции системы,
требования к актуальности и непротиворечивости данных в каждый момент времени;
характеристика технических средств.

Вторая группа проблем обеспечения целостности в распределенных системах вызвана распределением данных и, как следствие, распределением процедур их обработки, т.е. это проблемы, обусловленные именно разнесением данных на разные узлы системы.

Как известно, существует два подхода к обеспечению целостности в распределенных информационных системах - строгая целостность (tight consistency) и нестрогая целостность (loose consistency). Первый вариант гарантирует целостность данных в любой момент времени, например, с помощью двухфазного протокола фиксаций (2РС). Обеспечение строгой целостности требует высокого качества коммуникаций, поскольку все узлы должны быть постоянно доступны. Второй подход допускает наличие временной задержки между внесением изменений в публикуемую базу и их отражением на узлах подписчиков.

Протокол двухфазной фиксации транзакции состоит в последовательном прохождении базы данных в процессе выполнения транзакции через два этапа. Первый этап (первая фаза) - выполнение синхронизированного захвата всех объектов данных, к которым имело место обращение от имени транзакции. Объекты данных захватываются на всех серверах. На втором этапе (во второй фазе) либо происходят все изменения на всех серверах, либо, в случае хотя бы одной ошибки, происходит откат к состоянию, в котором находилась база данных до выполнения первого этапа.

Характеристики

Тип файла

Документ

Размер

11,48 Mb

Материал

Диго С.М. Базы данных проектирование и использование

Тип материала

Книга

Предмет

Базы данных

Высшее учебное заведение

РТУ МИРЭА

Список файлов книги

digo-s.m.-bazy-dannyh-proektirovanie-i-ispolzovanie-1895531434-1515745387.rar

Диго С.М. Базы данных проектирование и использование.doc

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.