Диссертация (1149731), страница 3
Текст из файла (страница 3)
Методология работы основана на обобщении, индукции и дедукции, математическом моделировании, анализе и синтезе теоретического и практического материала. В работе использовались методы исследования операций;методы теории баз данных; методы теории алгоритмов; принципы построенияархитектур программных систем; практика программной инженерии.Степень разработанности темыСледующие аспекты темы были проработаны исследовательским сообществом к моменту начала работы над темой диссертации. Алгоритмы контролируемого приближенного выполнения отдельных задач анализа данных и ограниченных классов запросов описаны во многих статьях.
Методы оптимизациидля точного выполнения запросов проработаны в классической теории баз данных. Модели стоимости реляционных операций используются в оптимизаторахзапросов современных СУБД. Концепции качества данных исследованы главным образом для структурированных данных. Задачи многокритериальной ипараметрической оптимизации исследованы в контексте точного выполнениязапросов. Архитектуры, существующих систем оптимизации и приближенногоисполнения сценариев анализа данных, поддерживают работу с ограниченнымиклассами запросов и методов приближенного выполнения.Научная новизна работыВозможности контролируемого приближенного выполнения запросов в системах анализа данных проработаны нами для сценариев общего вида. В контексте приближенного выполнения запросов возникает ряд новых задач оптимизации, которые были решены в этой работе.Расширенная модель стоимости операций, предложенная в работе, формализует связь между количеством вычислительных ресурсов и качеством результата приближенных вычислений и лежит в основе последующей оптимизациизапросов, допускающих приближенное выполнение.В работе поставлена и решена задача распределения ограниченного коли-12чества вычислительных ресурсов между операциями в плане приближенноговыполнения сложного сценария анализа данных.Разработано решение специфической бикритериальной задачи оптимизации запросов, допускающих приближенное выполнение, основанное на компактном представлении зависимости оптимального плана от ограничений на исполнение запроса.В рамках исследования разработана архитектура системы, которая реализует исполнение сложных сценариев анализа данных при ограничениях навычислительные ресурсы, отличительной чертой которой является ее расширяемость: алгоритмы и модели не привязаны к конкретным парадигмам анализаданных и специфическим неоднородным распределенным архитектурам.Теоретическая и практическая значимость работыТеоретическою ценность для дальнейших исследований представляют обзор и классификация методов и систем оптимизации и приближенного выполнения сценариев анализа данных, алгоритм распределения ресурсов на основеточного теоретического решения задачи и подход к бикритериальной оптимизации запросов, допускающих приближенное исполнение.Разработанная теоретическая модель и предложенная архитектура системы оптимизации и приближенного выполнения запросов может быть использована для расширения систем анализа данных возможностью контролируемого учета ограничений на вычислительные ресурсы и качество результата.
Этопозволяет реагировать на потребность аналитиков в своевременном получениирезультата и в работе в реальном времени.Разработанные теоретические модели, алгоритмы и экспериментальнаясреда могут быть использованы для прототипирования прикладных систем анализа больших данных в различных предметных областях, например, при финансовом мониторинге, социологическом и экономическом анализе.13Достоверность и обоснованностьДостоверность и обоснованность результатов работы подтверждается использованием строгого математического аппарата, доказательствами лемм,подтверждением теоретических положений вычислительными экспериментами.Апробация работы и публикацииМатериалы работы докладывались и обсуждались на всероссийских имеждународных конференциях:1) 15-ая Восточно-европейская конференция "Advances in Databases andInformation Systems"(20-23 сентября 2011 г., Вена, Австрия)2) Семинар аспирантов в рамках 16-й Восточно-европейской конференции"Advances in Databases and Information Systems"(17-20 сентября 2012 г.,Познань, Польша)3) 16-ая Восточно-европейская конференция "Advances in Databases andInformation Systems"(17-20 сентября 2012 г., Познань, Польша)4) 10-ыйКоллоквиуммолодыхисследователей"SpringResearchersColloquium on Databases and Information Systems"(30-31 мая 2014 г.,Великий Новгород, Россия)5) 19-ая Восточно-европейская конференция "Advances in Databases andInformation Systems"(9-11 сентября 2015 г., Пуатье, Франция)Полученные результаты прошли апробацию на научном семинаре «Проблемы современных информационно-вычислительных систем» под руководством д.
ф.-м. н., проф. В. А. Васенина (25 ноября 2014 года), на семинареМосковской Секции ACM SIGMOD (26 февраля 2015 года), а также неоднократно на семинарах группы исследования методов организации информациии кафедры Информационно-аналитических систем в Санкт-Петербургском Государственном Университете.Все результаты диссертации опубликованы в 9 научных работах [16–24] и1 переводе [25]. Из них: 1 публикация [22] представлена в журнале, входящем в14утвержденный приказом Минобрнауки России от 25 июля 2014 г. №793 переченьрецензируемых научных журналов, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук; 3 статьи [17,19,25] есть в индексах Web of Science и 8 работ [16–20,23–25]опубликованы в рецензируемых зарубежных журналах, включенных в Scopus.1) Yarygina A., Novikov B.
Bi-objective optimization for approximatequery evaluation // 19th East European Conference on Advances inDatabases and Information Systems and Associated Satellite Events(ADBIS 2015) / Ed. by Tadeusz Morzy, Patrick Valduriez, LadjelBellatreche et al.— Communications in Computer and InformationScience (CCIS).— Springer Berlin Heidelberg, 2015.— P. 153–161.(А.С. Ярыгиной принадлежит сведение общей задачи оптимизации к бикритериальной и параметрической, разработка алгоритма, проведение вычислительных экспериментов; Б.А. Новикову принадлежит общая постановка задачи и обоснование ее актуальности)2) Yarygina A., Novikov B.
A prototype architecture for approximaterealtime query optimization and processing // The Tenth SpringResearchers Colloquium on Databases and Information Systems2014.— 2014.— P. 24–31. (А.С. Ярыгиной принадлежит детальная проработка архитектуры системы анализа данных; Б.А.
Новикову принадлежит общая постановка задачи и обоснование ее актуальности)3) Yarygina A., Novikov B. Optimizing resource allocation forapproximate real-time query processing // Computer Science andInformation Systems.— 2014.— Vol. 11.— P. 69–88. (А.С. Ярыгиной принадлежит доказательство лемм, идея и реализация алгоритма,проведение вычислительных экспериментов; Б.А. Новикову принадлежитобщая постановка задачи и обоснование ее актуальности, формальная модель качества)4) Ярыгина А. Методы выполнения и оптимизации приближен-ных запросов в неоднородных системах // Программирование.—2013.—Vol. 39.— P.
33–44.155) YaryginaA. Execution and optimization techniques forapproximate queries in heterogeneous systems // Programmingand Computer Software.— 2013.—Vol. 39, no. 6.—— P. 309–317.6) Novikov B., Vassilieva N., Yarygina A. Querying big data //Proceedings of the 13th International Conference on ComputerSystems and Technologies.— CompSysTech ’12.— New York, NY,USA : ACM, 2012.— P. 1–10. (А.С. Ярыгиной принадлежит проработкаалгебраических свойств операций и соотношений между ними; Б.А. Новикову принадлежит концептуальная модель исполнителя декларативныхсценариев; Н.С.
Васильевой обоснование актуальности задачи в контекстеанализа больших данных)7) Yarygina A., Novikov B. Optimizing the resource allocation forapproximate query processing // Advances in Databases andInformation Systems / Ed. by Tadeusz Morzy, Theo Harder, RobertWrembel.— Vol. 186 of Advances in Databases and InformationSystems.— Poznan, Poland : Springer Berlin Heidelberg, 2012.—P. 297–308. (А.С. Ярыгиной принадлежит анализ литературы, реализация алгоритма, проведение вычислительных экспериментов; Б.А. Новикову принадлежит общая постановка задачи и обоснование ее актуальности,формальная модель качества, идея алгоритма)8) DolmatovaO., Yarygina A., Novikov B.















