Диссертация (Модели процессов согласования реплик в базах данных NoSQL)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Модели процессов согласования реплик в базах данных NoSQL". PDF-файл из архива "Модели процессов согласования реплик в базах данных NoSQL", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
2СодержаниеСодержание ..............................................................................................................................................2Введение ...................................................................................................................................................5Глава 1. Анализ существующих методов оценки показателей качества согласования реплик вбазах данных NoSQL ............................................................................................................................101.1. Тенденции развития рынка Больших Данных (Big Data) ......................................................101.2. Реляционные базы данных и хранилища NoSQL ...................................................................111.2.1.
Преимущества и недостатки реляционных баз данных .................................................111.2.2. Преимущества и недостатки баз данных NoSQL ............................................................141.2.3. Классификация баз данных NoSQL..................................................................................171.3. Функции согласования реплик в базах данных NoSQL ........................................................181.3.1.
Размещение реплик записей БД в кластере и обеспечение их согласования приобновлении записи ...........................................................................................................................191.3.2. Влияние параметров N, W, R на показатели согласования реплик ...............................241.3.3. Ведение версий реплики и их согласование ....................................................................271.3.4. Согласование реплик после устранения сбоя или отказа в узле ...................................311.4.
Анализ существующих моделей и методов оценки показателей качествафункционирования баз данных NoSQL ..............................................................................................321.4.1. Анализ методов повышения качества согласования данных.........................................321.4.2.
Анализ моделей и методов оценки характеристик согласования реплик NoSQL .......371.4.3. Анализ методов оценки показателей отказоустойчивости в базах данных NoSQL ....391.5. Постановка задачи .....................................................................................................................41Выводы по 1-й главе.........................................................................................................................43Глава 2. Разработка моделей процессов согласования реплик в базах данных NoSQL .................452.1.
Разработка моделей процессов согласования реплик при обновлении какой-либо записибазы данных ...........................................................................................................................................452.1.1. Преобразование Лапласа-Стилтьеса.................................................................................462.1.2. Разработка модели процесса согласования реплик в конечном счете ..........................472.1.3.
Разработка модели процесса строгого согласования реплик .........................................512.1.4. Преобразование Лапласа-Стилтьеса функции распределения вероятностей времениобновления i-й реплики ...................................................................................................................552.2. Анализ моделей процессов согласования реплик при обновлении какой-либо записи базыданных ....................................................................................................................................................592.2.1. Анализ моделей согласования реплик в конечном счете ...............................................592.2.2.
Анализ модели строгого согласования реплик ...............................................................622.3. Разработка модели процесса ведения версий записи ............................................................642.3.1. Ведение вектора часов в базах данных NoSQL ...............................................................6432.3.2. Вариант 1 модели – время обработки версий записи клиентом зависит от текущегочисла этих версий .............................................................................................................................662.3.3. Анализ варианта 1 модели ведения версий записи .........................................................702.3.4. Вариант 2 модели - время обработки версий записи клиентом зависит от числаобновлений, выполненных ранее другими клиентами .................................................................712.3.5.
Анализ варианта 2 модели ведения версий записи .........................................................742.3.6. Анализ стационарности и эргодичности модели ведения версий записи ....................752.4. Разработка моделей отказов и восстановления доступа к записи в базах данных NoSQL 772.4.1. Аналитическая модель отказов и восстановления доступа к записи в базах данныхNoSQL 772.4.2. Имитационная модель отказов и восстановления доступа к записи в базах данныхNoSQL 782.4.3.
Оценка времени восстановления узла в базах данных NoSQL......................................802.4.4. Анализ и сравнение аналитической и имитационной моделей отказов ивосстановления доступа к записи в базах данных NoSQL ...........................................................84Выводы по 2-й главе.........................................................................................................................89Глава 3. Анализ адекватности моделей ...............................................................................................913.1.
Описание экспериментальной установки ...............................................................................913.2. Анализ адекватности модели (1) процесса согласования реплик в конечном счете ..........933.2.1. Подготовка эксперимента 1...............................................................................................933.2.2. Проведение экспериментов и оценка адекватности модели (1) ....................................953.3. Анализ адекватности модели (2) процесса строгого согласования реплик .......................1003.3.1.
Подготовка эксперимента 2.............................................................................................1003.3.2. Проведение экспериментов и оценка адекватности модели (2) ..................................1023.4. Анализ адекватности модели (3) процесса ведения версий записи ...................................1063.4.1.
Подготовка эксперимента 3.............................................................................................1063.4.2. Проведение эксперимента и анализ адекватности модели (3) .....................................110Выводы по 3-й главе.......................................................................................................................113Глава 4. Разработка инструментального средства анализа процессов согласования реплик вбазах данных NoSQL ..........................................................................................................................1144.1. Подсистема для работы с моделями согласования реплик .................................................1144.2.
Подсистема для работы с моделью ведения версий записи ................................................1184.3. Подсистема для работы с моделями отказов и восстановления доступа к записи ...........122Выводы по 4-й главе.......................................................................................................................124Глава 5. Использование разработанных моделей и инструментального средства на этапепроектирования информационной системы .....................................................................................1265.1. Описание предметной области...............................................................................................1275.2. Обоснование выбора технологии NoSQL .............................................................................1315.3.
Анализ вариантов баз данных NoSQL для реализации аналитического модуля ..............1325.4. Построение структуры хранилища данных аналитического модуля .................................13545.5. Оценка показателей производительности, согласования реплик и отказа в доступе кзаписи базы данных ............................................................................................................................1405.6. Выбор параметров репликации сегментов хранилища........................................................144Выводы по 5-й главе.......................................................................................................................145Заключение ..........................................................................................................................................147Литература ...........................................................................................................................................1495ВведениеАктуальность.
В последние несколько десятилетний в области обработкиданных доминировали реляционные СУБД. В таких системах данные хранятся ввиде таблиц, они также предполагают наличие схемы базы данных. Но присоздании больших систем (Big Data) с использованием реляционных СУБДразработчики стали испытывать значительные затруднения: 1) осложниласьпроцедура агрегирования данных, т.к. это требует чтения записей из большогочисла связанных таблиц (возникла проблема потери соответствия), 2) возниклопротиворечиемеждунеобходимостьюхранениябольшихобъемовнеструктурированных данных и необходимостью их как-то структурироватьпосредством разработки схемы базы данных, 3) для хранения больших объемовинформации необходимо покупать дорогие специализированные аппаратнопрограммные комплексы параллельных систем баз данных (Teradata, Sun OracleDatabase Machine и др.), 4) при наличии большого числа узлов возникаетпроблема обеспечения требуемой отказоустойчивости системы.Как попытка решить накопившиеся проблемы реляционных баз данныхпоявились альтернативные средства хранения и обработки данных, получившиеназвание «базы данных NoSQL».
Пионерами в этой области выступили двекомпании: Google и Amazon. В БД NoSQL для обеспечения высокойотказоустойчивостииспользуетсямногократнаярепликация(копирование)записей. Но базы данных NoSQL обладают недостатком: в этих системах неподдерживается режим ведения транзакций и блокировок, поэтому возникаетпроблема согласования реплик.