Отзыв ведущей организации (Модели процессов согласования реплик в базах данных NoSQL)
Описание файла
Файл "Отзыв ведущей организации" внутри архива находится в папке "Модели процессов согласования реплик в базах данных NoSQL". PDF-файл из архива "Модели процессов согласования реплик в базах данных NoSQL", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
УТВЕРЖДАЮ: Директор Федерального исследовательского центра «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН) И.А. Соколов ОТЗЫВ ведущей организации - Федерального исследовательского центра «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН) на диссертацию Цвященко Евгения Васильевича «Модели процессов согласования реплик в базах данных 1чо$0Е», представленную па соискание ученой степени кандидата технических наук по специальности 05.13,17 — «Теоретические основы информатики».
Актуальность работы. Диссертационная работа Цвященко Е. В. относится к области разработки методов и средств проектирования нетрадиционных (нереляционных, называемых еще Хо$01) баз данных. Ввиду лавинообразного роста объемов и разнообразия данных в различных областях человеческой деятельности в последнее десятилетие, 1ЧоЯОЕ системы управления базами данных получили большое распространение, в том числе и на российском рынке. Такие системы позволяют развертывать масштабируемые базы данных, преодолевая ограничения по объему и разнообразию данных, налагаемые многими традиционными, реляционными СУБД. Масштабирование баз данных требует их развертывания на кластерах из большого количества узлов с поддержкой репликации 1хранения нескольких копий) данных.
Конкретной актуальной задачей исследования является разработка математических моделей процессов согласования реплик в базах данных Мо301. Под согласованием реплик понимается поддержка тождественности данных в различных копиях одной и той же записи при обновлении данных, согласовании версий данных, восстановлении данных после сбоя. МоЯОЬ СУБД обычно не поддерживают в полной мере традиционные свойства транзакций (атомарность, согласованность, изолированность, долговечность), а используют специальные приемы для согласования записей и их реплик.
На стадии проектирования МоБОЬ-системы часто возникает задача определения параметров для большого числа записей БД, влияющих на качество согласования. Ручной подбор значений таких параметров на огромных объемах данных является очень трудоемкой и дорогостоящей операцией. Поэтому разработка математических моделей, которые позволяют получить оценку показателей согласования реплик еще на этапе проектирования информационной системы ХоЯОЬ и подобрать значения требуемых параметров, является актуальной задачей.
Научная новизна работы заключается в разработке следующих оригинальных математических моделей: 1) аналитической стохастической модели процесса согласования реплик в конечном счете (ечепша1 сопз1з1епсу), позволяющей оценить вероятность чтения устаревших данных в процессе распространения обновлений реплика; рассматривается синхронный и асинхронный способ распространения изменений; 2) аналитической стохастической модели процесса строгого согласования реплик, которая позволяет оценить характеристики случайного времени ожидания начала чтения записи из обновленного кворума серверов; 3) имитационной модели процесса ведения версий записи, позволяющей получить характеристики случайного числа версий записи в 1Чо80Ь базе данных и времени их обработки; 4) аналитической стохастической и имитационной моделей процесса отказа и восстановления доступа к записи БД, позволяющих оценить влияние числа реплик записи базы данных и режимов их восстановления на вероятность отказа в доступе к этой записи.
Практическая ценность. Для практического использования полученных теоретических результатов разработано инструментальное средство анализа баз данных МоБОЬ„позволяющее оценивать на этапе проектирования информационной системы показатели согласованности реплик в процессе их обновления, ведения версий записи, отказов и восстановления доступа к записи БД. Получен акт о внедрении разработанных моделей и инструментального средства в процессе проектирования информационной системы «Надзор за заболеваемостью — Хо$0Ь».
Обоснованность и достоверность основных научных положений. выводов и результатов, представленных в диссертации, базируется на методах теории массового обслуживания, используемых при разработке моделей процессов обработки запросов в базах данных ХоЯОЬ, а также на сравнении полученных результатов теоретических расчетов с данными экспериментов. Для оценки адекватности моделей были выполнены серии экспериментов в облачной среде. В диссертации приводятся спецификации алгоритмов прикладных программ, которые выполняли функции клиентов по работе с записями базы данных 1Чо$0Ь Юа1с.
Был проведен анализ адекватности следующих моделей процессов: согласования реплик в конечном счете (синхронный способ распространения обновлений), строгого согласования реплик, ведения версий записи. Для каждой модели изменялось число реплик и интенсивность поступления требований на чтение. Средняя относительная погрешность модели согласования реплик в конечном счете составила 7.86"о, модели строгого согласования реплик — 7.42;4, модели ведения версий записи— 4%. Значимость результатов исследований заключается в том, что выполненные в работе теоретические исследования позволяют анализировать показатели согласования данных баз данных ХоЯОЬ и принимать обоснованные решения на ранних этапах их проектирования.
Представляется важным дальнейшее развитие прикладных методов математического моделирования для оценки времени выполнения запросов к базам данных Хо80Ь, включая системы, поддерживающие технологию Маркедисе и другие модели распределенных вычислений. Это даст возможность прогнозировать время обработки больших объемов данных и избегать серьезных ошибок при проектировании систем обработки больших данных. В качестве рекомендации по использованию результатов диссертации считаем целесообразным внедрять разработанные инструментальные средства в процессы проектирования информационных систем на основе Хо$01 баз данных в организациях, где накапливаются большие объемы данных, требующих обработки: Сбербанк РФ, Яндекс, Ма11.ти и т.д.
Отдельные положения диссертации и разработанное инструментальное средство могут быть использованы в учебном процессе при проведении занятий по дисциплинам, связанным с технологиями обработки больших данных в высших учебных заведениях. Общая характеристика работы. Работа выполнена в МГТУ им Н.Э. Баумана и состоит из введения, пяти глав, заклкзчения и списка использованных источников.
По структуре и объему замечаний нет. Диссертация аккуратно оформлена, содержание изложено грамотным научным языком. По стилю изложения замечаний нет. Основное содержание диссертационной работы Цвященко Г. В. опубликовано в 15 печатных работах, из них 9 — в журналах, рекомендованных ВАК РФ. Материалы диссертации докладывались на 5 международных конферециях. Лично автором опубликовано 4 работы в журналах, рекомендованных ВАК РФ, а также 4 работы в материалах конференций.
Автореферат правильно отражает основные результаты, полученные в диссертационной работе. Замечания по работе. По работе Цвященко Е. В, имеются отдельные замечания. 1) В разделе 1.3.1. «Размещение реплик записей БД в кластере и обеспечение их согласования при обновлении записи» не рассмотрен подход к размещению и обновлению реплик «главный-подчиненный с несколькими главными»(пщ111- тазгег). 2) Утверждение диссертанта «11оказано, что математические модели, необходимые для оценки показателей согласования реплик, либо отсутствуют, либо являются неадекватными» (приведенное в п.
5 выводов по главе 1) представляется слишком сильным. В работе не проведен анализ некоторых существующих методов моделирования репликации и непротиворечивости в Мо801. СУБД, например, основанных на сетях Петри 1Казпа Ояпап, Р1е1го Р1алхоПа. Мос1ейшд Кер11саг1оп 1п Хо801. Ва1азгогев. ОЕЯТ 2014, 1 МСБ 8б57, рр.
194 — 209, 20141„статистическом анализе моделей 1% 1.ш, Яоп Хдиуеп, 1айп баппогга, Мппгаяг Ка1пап Капгпап, 1пг1гап11 Сирга, апг1 1озе Мезе8пег. Опапг1гагюе Апа1уяз о1 Сопявгепсу 1п МоЯО1. Кеу-ча1ие 81огев. ОЕБТ 2015, 1.МСЯ 9259, рр. 228-243, 20151. Заключение, Указанные замечания не снижают значимость теоретических и практических результатов, полученных Цвященко Е. В. Также эти замечания не снижают положительную оценку диссертационной работы.
Диссертация, в соответствии с требованиями «Постановления Правительства Российской Федерации о порядке присуждения ученых степеней» от 24.09,2013 г. № 842 является законченной научно-квалификационной работой, в которой предложены методы и средства решения актуальной научной задачи - разработки моделей процессов согласования реплик в базах данных 1ЧоЯ~1., позволяющих анализировать показатели согласования реплик на этапе проектирования информационных систем, и соответствует пунктам 1, 2 и 12 паспорта специальности 05.13.17 — «Теоретические основы информатики». Таким образом, Цвященко Евгений Васильевич заслуживает присуждения ученой степени кандидата технических наук по специальности 05.13.17 — «Теоретические основы информатики». Отзыв обсужден и утвержден на заседании секции Ученого совета ИПИ РАН Федерального исследовательского центра «Информатика и управление» Российской академии наук, протокол № 5 от 27 октября 2016 г.
Ученый секретарь ИПИ РАН ФИЦ ИУ РАН, доктор технических наук В. Н. Захаров го1б .. Заведующий лабораторией ФИЦ ИУ РАН, доктор физико-математических наук, профессор ак. . " Л. А. Канна канна 201б Председатель секции Ученого совета ИПИ РАН ~12ЙЦ $$У РАН Заслуженный деятель науки РФ, доктор технических наук, профессор И. Н. Синицин 2016 г. Наименование организации: Федеральное государственное учреждение Федеральный исследовательский центр "Информатика и управление" Российской академии наук. Адрес: РФ, 119333, г. Москва, ул. Вавилова, д.
44, корп. 2 Е-та11: А~ тнка!нтт Сайт: 12пр:буебАА Ае.!ъ ся~:.гц,' '1'ел.: +7 (499) 135-62-60 .