Главная » Просмотр файлов » Диссертация

Диссертация (1149731), страница 7

Файл №1149731 Диссертация (Методы и средства эффективного выполнения сценариев аналитической обработки данных на основе оптимизации и приближенных вычислений) 7 страницаДиссертация (1149731) страница 72019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 7)

Например,при поиске изображений по подобию, пользователь редко может уточнить в запросе, по какому набору критериев следует искать близкие изображения. Неточность данных может быть вызвана, например, ошибкой журналиста при анализе потока новостей или естественной погрешностью сенсора. С другой стороны,приближенное выполнение запросов позволяет найти баланс между временемвычислений и качеством ответа на запрос, что является существенным при массовой обработке больших объемов данных.Как правило, в исследованиях рассматриваются приближенные алгоритмы, реализующие те или иные операции, или разрабатываются подходы, основанные на использовании операций усечения объемов обрабатываемых данных,ведущие к неточному ответу на запрос.Предлагаемые методы приближенного выполнения запросов можно также классифицировать на конфигурируемые и прерываемые.

В первом случаевремя выполнения запроса фиксируется заранее, и система строит фиксированную стратегию приближенного построения ответа на запрос. Прерываемыеподходы позволяют пользователю отслеживать качество результата в процессевычислений и останавливать выполнение операции или запроса.1.2.2.1. Понятие качестваОбсуждение приближенного выполнения запросов невозможно без учетакачества данных и информации, полученной в результате приближенных вычислений. Работа [53], например, посвящена детальному исследованию этогопонятия.Задача построения единой модели оценки качества результата выполнениязапросов при интеграции нескольких информационных систем рассматривается30в [54].

Авторы выделяют критерии качества, зависящие от источника данных(понятность, репутация, надежность, своевременность), запроса (полнота, количество) и атрибутов качества (доступность, цена, согласованность, время ответа, точность, релевантность). В статье предложена единая система численнойоценки выбранных критериев качества и разработан подход к поиску лучшихисточников данных и планов выполнения запроса, состоящий из трех фаз. Напервом этапе сокращается вычислительная сложность второго этапа за счетисключения источников данных низкого качества на основе соответствующихкритериев. На второй фазе генерируются все корректные планы выполнениязапроса. На последнем этапе просматривается все пространство планов и наоснове критериев качества выбирается оптимальный.1.2.2.2.

Приближенное выполнение запросовВ литературе принято различать приближенное (основанное на случайныхвыборках) и частичное (основанное на операции поиска лучших объектов) выполнение запросов [55]. Эти подходы являются ортогональными и не исключают их совместное применение, хотя это влечет значительное усложнение задачиоценки ошибки привносимой приближенным выполнением запроса.Учет ограничений на время выполнения сложных SQL запросов рассматривается в [55].

В предложенной вычислительной модели пользователь вместес обычным SQL запросом определяет верхнюю границу времени выполнениязапроса и характер ожидаемого неточного ответа: приближенный или частичный.Методы приближенного выполнения запросов, основанные на случайныхвыборках, вейвлетах или прогнозах, рассматривались в контексте больших хранилищ данных и распределенных сетей в [56–59].Специфическая задача приближенного выполнения запросов в среде webрешается в [60].

Авторы предложили модель приближенного выполнения запросов к RDF данным, которая позволяет не только эффективно строить неточныйответ, но и затем итеративно его улучшать при необходимости.1.2.2.3. Приближенное выполнение операцийКласс операций агрегирования, рассмотренный в [61], можно рассматривать как класс операций расширенной алгебры, основанный на операции объ-31единения в классической модели. Эта операция строит объединение двух списков объектов с оценками, где для объектов, имеющихся в обоих списках, вычисляется агрегированная оценка. Авторы [62] предлагают приближенный алгоритм выполнения операции агрегирования и приводят вероятностные оценкикачества получаемого результата.

В [63] также рассматривается приближенноевыполнение этой операции в случае, когда вычисление результата может бытьпрервано пользователем. Авторы предлагают методы оценки качества результата, построенного на промежуточных этапах выполнения операции.В статье [64] предложено несколько алгоритмов приближенного выполнения соединения на основе подобия с последующим выбором лучших объектов.Важно отметить, что в данной работе анализируется применимость приближенных алгоритмов в различных окружениях, в зависимости от стоимости вычисления предиката и стоимости получения объекта из потока аргументов.Авторы [9] обсуждают применение операций поиска лучших объектов ивыборки по оценке с целью улучшения эффективности выполнения запросов.В работе [65] авторы предлагают методы оценки необходимого количествакортежей, получаемых на вход в порядке убывания оценок операцией соединения с поддержкой ранжирования.Оптимальные алгоритмы реализации соединения по точному предикату сранжированием и последующим поиском лучших объектов предложены в [66].Данные алгоритмы могут быть основой быстрого и неполного вычисления ответа на запрос.Баланс между качеством и временем вычислений при обработке потоковданных исследуется в [67, 68].1.2.3.

Оптимизация запросов в расширенных алгебрахМетоды оптимизации запросов, рассмотренные в разделе 1.1.2, являютсяосновой высокой производительности традиционных СУБД и должны быть пересмотрены в контексте новых систем аналитической обработки данных в средераспределенных неоднородных информационных ресурсов.321.2.3.1. Алгебраические тождестваПространство планов при оптимизации запросов в первую очередь формируется за счет эквивалентных преобразований выражений алгебры.Расширенные языки запросов часто накладывают ограничения на оптимизацию, так как специфические наборы операций по сравнению с реляционнойалгеброй обладают менее широким набором эквивалентных преобразований запросов, формирующих пространство планов выполнения запросов [7]. Например, расширенные операции, изменяющие оценки объектов, не коммутируют соперацией сортировки по оценке.Авторы [7] предлагают два альтернативных пути решения проблемы, тоесть расширения набора эквивалентных преобразований выражений расширенной алгебры.

Первое основано на разработке наборов операций или специальных ограниченных операций, которые сохраняют свою выразительнуюспособность языка, но обладают более богатым пространством эквивалентныхпреобразований планов. Второй подход является более интересным в контексте приближенного выполнения запросов, поскольку основан на использованииприближенных преобразований выражений алгебры.

В этом направлении важно иметь способ оценки ошибки вносимой преобразованиями такого рода, например, при использовании приближенного алгоритма реализующего операциюили отсечений промежуточных результатов.Тем не менее, расширенные языки запросов обладают рядом точных алгебраических тождеств, применимых при оптимизации запросов [8, 9]. В [9] обсуждается точное преобразование алгебраического выражения с соединением ипоследующей выборкой объектов на основе порога на значение оценки в эквивалентное ему с предварительной дополнительной выборкой.

Также рассматривается аналогичное преобразование с операцией поиска лучших объектов, котороев общем случае не является точным. Эквивалентные преобразования, основанные на совместном применении операций поиска лучших объектов, выборкиобъектов по порогу на значение оценки и операции объединения демонстрируют, что множество эквивалентных преобразований выражений расширеннойалгебры не только сократилось, как показано в [7], но и пополнилось.Аналогично с [9] в [10] выводятся алгебраические соотношения для выражений с операцией соединения и последующей выборкой по порогу или споследующим поиском лучших объектов.

Авторы также рассматривают экви-33валентные преобразования выражений с операцией соединения и последующейвыборкой, которые корректны на ограниченном подмножестве предложеннойрасширенной алгебры, например, при отказе от использования пользовательских весов и ограниченной семантике оценок. В статье также выведено алгебраическое тождество с операцией объединения и выборки, корректное при техже упрощениях модели.В [12] доказывается, что предложенная операция мультимедиа соединенияне коммутативна и не ассоциативна, что накладывает ограничения на оптимизацию запросов на основе рассмотренной алгебры.

Это связано со спецификойрасширенной операции соединения, которая для каждого объекта из первогоаргумента строит набор объектов из второго аргумента, находящихся в егоокрестности по подобию. Тем не менее, авторы предлагают использование коммутативной и ассоциативной операции симметричного соединения и последующей фильтрации и рассматривают примеры оптимизации запросов на основесоответствующих алгебраических равенств.1.2.3.2.

Модели стоимостиРазработка моделей стоимости лежит в основе создания оптимизатора запросов, специфицированных на новом расширенном высокоуровневом декларативном языке [8, 48]. Важно отметить, что разрабатываемые оценки должныучитывать распределенный характер среды выполнения запросов. Несмотря напроработанность этой тематики, модели стоимости для специфических операций, расширяющих реляционную алгебру, и алгоритмов их реализующих, например, в распределенной среде, требуют проектирования и анализа. В [48]рассматривается метод оценки размера результата выполнения операции, основанный на случайных выборках. Модели стоимости, основанные на оценкеселективности операций расширенной алгебры, предложены в [8].Авторы [69] предлагают систему, полностью интегрирующую операцию соединения с поддержкой ранжирования в реляционные базы данных. Системаоснована на расширении алгоритма динамического программирования новымметодом перечисления планов выполнения запросов и их исключения из рассмотрения.

В работе приведена вероятностная модель оценки размера входныхаргументов операции соединения с ранжированием и соответствующая модельстоимости.34В одной из наших работ [20] описана абстрактная расширенная модельстоимости, которая позволяет формализовать и реализовать для последующегоиспользования, связь между количеством вычислительных ресурсов, выделенным на приближенное исполнение операции, и качеством результата. На базерасширенной модели стоимости строилось дальнейшее диссертационное исследование.1.3. Адаптивное выполнение запросовНеобходимость иметь дело с неточностью оптимизации запросов в традиционных системах управления базами данных привела к развитию адаптивныхметодов выполнения запросов.

Характеристики

Список файлов диссертации

Методы и средства эффективного выполнения сценариев аналитической обработки данных на основе оптимизации и приближенных вычислений
Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7021
Авторов
на СтудИзбе
260
Средний доход
с одного платного файла
Обучение Подробнее