Отзыв оппонента (Модели процессов согласования реплик в базах данных NoSQL)
Описание файла
Файл "Отзыв оппонента" внутри архива находится в папке "Модели процессов согласования реплик в базах данных NoSQL". PDF-файл из архива "Модели процессов согласования реплик в базах данных NoSQL", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
отзыв официального оппонента Кузнецова Сергея Дмитриевича на диссертацию Цвященко Евгения Васильевича с<Модели процессов согласования реплик в базах данных ХоБ(~Ь», представленную на соискание ученой степени кандидата технических наук по специальности 05.13.17 — «Теоретические основы информатики» Актуальность темы диссертации В последние годы при создании информационных систем (в основном, аналитических), связанных с обработкой данных большого объема (В1я Па1а) и основанных на использовании традиционных ЯЯЬ-ориентированньгх СУБД, разработчики сталкиваются с рядом проблем: возникают трудности при агрегировании данных и при обработке слабоструктурированных данных; трудно обеспечить отказоустойчивость системы с большим числом узлов и т.д.
СУБД категории Ыоб( 6 позволяют полностью или частично устранить имеющиеся проблемы, но онн не поддерживают АСЮ-транзакции, из-за чего возникает другая проблема: обеспечение согласования данных. В среде ЫоЯЯЬ эта проблема решается с помощью разных приемов: используются механизмы слабого и строгого согласования реплик; применяется метод сведения нескольких версий записи к одной версии на основе анализа причинно-следственных связей; реализуется автоматическое восстановление реплик записей после устранения сбоя системы.
На этапе проектирования системы на основе использования СУБД ХоБЯЬ важно уметь оценивать показатели разных видов согласования, т.к. это позволяет избежать ручного подбора большого числа параметров хранилища данных на этапе наладки системы и необходимости натурного моделирования экстремальной нагрузки на систему. Поэтому разработка адекватных математических моделей и программных средств, позволяющих оценивать показатели согласования реплик и использовать их при проектировании, является актуальной задачей. Анализ содержания диссертации Во введении обоснована актуальность решаемой задачи разработки математических моделей процессов согласования реплик в базах данных ХоБЯЬ.
Сформулирована цель работы, показаны ее научная новизна и практическая ценность. В первой главе автор определяет виды согласования реплик: согласование в процессе обновления записи БД; за счет ведения версий записи; восстановления после сбоя. Он показывает, что, несмотря на большое разнообразие СУБД категории 1ЧоБЯ1 и наличие разных способов реализации репликации (тазгег-з1аче, ппя), режим согласования реплик в процессе обновления записи (в конечном счете, строгая согласованность) определяется соотношением параметров М, %, К, которые задаются явно или оцениваются на основе других параметров системы 1таблица 1.1 диссертации). В первой главе автор приводит достаточно подробный критический обзор публикаций, посвященных методам повьппения качества согласования данных, разработке моделей и методов оценки характеристик согласования реплик Хоб( Ь, методам оценки показателей отказоустойчивости ЫоБЯЬ.
На основе критического анализа этих публикаций им сформулированы задачи исследования. Во второй главе разрабатываются математические модели, позволяющие оценивать показатели согласования реплик. Для согласования реплик в процессе обновления записи автором получены новые аналитические выражения для расчета вероятностей чтения необновленной записи из базы данных ХоБЯЬ (для режима согласования в конечном счете), а также выведено выражение для преобразования Лапласа-Стилтьеса, позволяющее вычислять характеристики случайного времени ожидания начала чтения записи из обновленного кворума серверов (для режима строгого согласования реплик). В отличие от существующих подходов к оценке показателей согласования реплик в конечном счете в полученных формулах учитывается интенсивность чтения записи БД на фоне ее обновления 1формулы получены для случая равномерного распределения по репликам потока запросов на чтение записи).
Выражения, выведенные для режима строгого согласования реплик, аналогов не имеют. Полученные аналитические выражения были выведены с использованием математического аппарата преобразований Лацласа-Стилтьеса и производящих функций, т.е. достаточно строго обоснованы. Основываясь на механизме ведения вектора часов, автор разработал новую имитационную модель процесса согласования разных версий записи, сохраняемых в БД при одновременной работе разных пользователей с этой записью. Модель разработана для двух вариантов расчета времени обработки <р этих версий. Она позволяет оценить характеристики случайного времени согласования версий (сведения нескольких версий записи к одной) и случайного числа версий записи в базе данных. Последнее важно, т.к. в СУБД ХоБОЬ возникают проблемы, связанные с ведением большого числа версий записей (уменьшается производительность, увеличивается вероятность потери версий).
Здесь имитационный подход обоснован, т.к. в аналитической модели практически невозможно описать сложные корреляционные зависимости между количеством клиентов, числом версий записи и временем их обработки. Следует также подчеркнуть особенность этой модели: здесь не требуется хранить сами образы версий записи. Это делает модель компактной и быстрой. В диссертации разработана аналитическая модель отказов и восстановления доступа к записи в базе данных ХоЯЯЬ.
Это — модифицированная «модель ремонтника». Новым здесь является то, что модель позволяет рассчитать вероятность отказа доступа с учетом наличия М реплик записи базы данных и разных режимов автоматического копирования данных на восстановленный узел. Достоверность аналитической модели проверялась путем ее сравнения с имитационным аналогом. В третьей главе приводятся результаты натурных экспериментов, подтверждающие адекватность разработанных моделей согласования реплик в процессе обновления записи и модели согласования версий записи. Натурные эксперименты выполнены в облачном кластере с изменяемым числом узлов (до 24). Часть результатов была использована для адаптации моделей, а другая — для оценки адекватности.
Получена сравнительно небольшая средняя относительная погрешность для аналитических моделей согласования реплик в процессе обновления записи, которая не превышает 8;4. Для имитационной модели согласования версий записи погрешность моделирования не превьппает 4',4. Это позволяет сделать вывод об адекватном (достоверном) отражении в разработанных моделях реальных процессов согласованияреплик.
В четвертой главе диссертации описывается разработанное инструментальное средство анализа показателей согласования реплик (АПСОР) в СУБД ХоЯЯЬ. Это средство имеет удобный и интуитивно понятный интерфейс и позволяет получать результаты моделирования без знания детальных особенностей работы моделей. Для использования имитационных моделей АПСОР автоматически генерирует текст модели и запускает среду моделирования. В питой главе приведены результаты внедрения разработанных автором моделей и инструментального средства на этапе проектирования информационной системы «Надзор за заболеваемостью — ХоЯЯЬ». Рассматривается случай экстремальной нагрузки на систему, когда использование традиционных СУБД становится затруднительным, На основании модельных экспериментов и требований заказчика производится выбор параметров репликации базы данных Юа1с. Приведенные результаты свидетельствуют о практической значимости работы.
Выводы по результатам анализа диссертации По результатам выполненного анализа содержания диссертации можно сделать следующие выводы: 1. Основным научным результатом работы является разработка новых математических моделей: модели согласования реплик в процессе обновления записи (согласованность в конечном счете и строгая согласованность), модели процесса согласования версий записи, модели отказов и восстановления доступа к записи в СУБД ХоБЯЬ. Эти модели обоснованы, т.к. полученные аналитические выражения строго доказаны, а имитационные модели разработаны на основе описания реальных процессов.
2. Модели согласования реплик в процессе обновления записи и процесса согласования версий записи являются достоверными, т.к. при принятых предпосылках погрешность моделирования составила 4-8','о. Это свидетельствует об адекватном отражении в моделях процессов согласования реплик, выполняемых ХоБЯЬ. 3. Модели и инструментальное средство внедрены на практике. Это подтверждает практическую ценность работы. Полученные рекомендации являются обоснованными, т.к. они были получены с использованием адекватных моделей. 4. Основные результаты диссертационной работы опубликованы в 15 статьях, из которых 9 — в журналах из списка ВАК РФ. Работа апробирована на четырбх международных конференциях. Статья, поданная на международную конференцию РРР 2016, цитируется в библиографической базе данных ссорив.
5. Автореферат полностью отражает содержание диссертации. б. Стиль изложения текста диссертации соответствует требованиям, предъявляемым к научным публикациям. Замечания по диссертационной работе 1. Модель процессов согласования реплик в конечном счете получена для случая равномерного распределения по репликам потока запросов на чтение записи. Это затруднит использование модели, если интенсивность запросов для разных реплик будет различной. 2. В диссертации рассмотрен только оптимистический подход к обеспечению согласованности версий записей, хотя в ХоБЯЬ применяется и пессимистический подход (шаз1ег-з1и~е), предотвращающий возникновение конфликтов обновления. В диссертации не выполнено сравнение этих подходов. 3.
В модели отказов и восстановления доступа к записи в базе данных ХоБЯЬ предполагается, что все реплики распределены по разным узлам. В реальности некоторые реплики могут располагаться на одном узле. В разработанной модели этот случай не учитывается. 4. Натурные эксперименты проводились в облачной среде, в которой используются виртуальные узлы. Для сети с физическими узлами анализ адекватности моделей не проводился. Заключение по работе Анализ представленных на отзыв материалов позволяет заключить, что диссертационная работа, выполненная Цвященко Е.В, является законченной научно-квалификационной работой, в которой решена научная задача разработки математических моделей процессов согласования реплик в базах данных ХоБЯЬ, Считаю, что работа соответствует пункту 9 Положения о порядке присуждения ученых степеней, утвержденного постановлением Правительства Российской Федерации от 24 сентября 2013 года № 842 «О порядке присуждения ученых степеней», удовлетворяет требованиям, предъявляемым к диссертациям на соискание ученой степени кандидата наук, а автор диссертации, Цвященко Е.В., заслуживает присуждения ученой степени кандидата технических наук по специальности 05.13.17 — «Теоретические основы информатики».
Официальный оппонент Кузнецов Сергей Дмитриевич, доктор технических наук, профессор, главный научный сотрудник Института системного программирования Российской академии наук. РФ, 109004, г. Москва, ул. А. Солженицына, дом 25. Тел. +7 (495) 912-5б-59 (доб. 412), е-гпа11: 1гох1ос®1зргаз.го, жеЬ-сайт: 1йр://и и и.1зргаз.пь' Кузнецов С.Д. Подпись д.т.н., профессора, главного научного сотрудника Института системного программирования РАН Кузнецова С.Д.
заверяю. Ученый секретарь ИСП РАН кандитат физико-математических наук Пакулин Н.В. 7У ~~~~~~ 201б .