Предсказание потребления процессорного времени в виртуальных средах (1187413), страница 2

Файл №1187413 Предсказание потребления процессорного времени в виртуальных средах (Предсказание потребления процессорного времени в виртуальных средах) 2 страницаПредсказание потребления процессорного времени в виртуальных средах (1187413) страница 22020-09-112020-09-11СтудИзба

Предсказание потребления процессорного времени в виртуальных средах

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 2)

Гораздо более современные исследования характеристик нагрузки проводились на основании данных, собранных Google в своем дата-центре 2011 году [25]. Эта работа такжеопирается на данные из [25].9Глава 2. Математические сведенияВ этой главе даны описание методов прогнозирования, подходов встатистике и машинном обучении, на которые будет опираться дальнейший текст.2.1Регрессионные моделиОсновной целью регрессионных моделей является предсказаниезначений зависимых переменных с помощью независимых.

Для этогопроизводится поиск функции, которая бы наилучшим образом приближала истинное условное математическое ожидание зависимых переменных при каждом допустимом наборе значений независимых переменных.Эта функция может иметь различный вид. В случае линейной регрессии,предсказываемое значение зависимой переменной равно линейной комбинации зависимых переменных, а обучение состоит в поиске оптимальногонабора коэффициентов линейной комбинации.

Регрессионная модель может строится как на основании некоторого совместного распределениявсех переменных, так и без наличия генеративной модели данных.Для этой цели, в моделях Бокса — Дженкинса временной ряд моделируется белым шумом, пропущенным через линейный фильтр специального вида. Эти модели имеют широкое применение в самых разных областях. Их важной особенностью является последовательный характер.Новое значение ряда моделируется как линейная комбинация прежнихзначений и прежних ошибок предсказания.

Из-за этого, каждое новоепредсказание зависит от, вообще говоря, всех прежних значений ряда иошибок. Такая последовательная природа моделей Бокса — Дженкинсаприводит к тому, что, как правило, предсказание осуществляется на продолжении ряда, на котором происходила оценка коэффициентов модели.Входами регрессионной модели могут быть не только предсказанияи истинные значения предсказываемого ряда, но и любые их производ-10ные, например оценка текущей волатильности ряда. Кроме того, оптимизируемая модель сама может рассматривать функции из более шикорого класса, чем исключительно линейные.

Увеличение выразительнойспособности имеет свою цену: растёт риск переобучения, а также теряется возможность проводить статический анализ получаемых моделей.Риск переобучения снижается, если используется большое количестводанных. Существуют методы, уменьшающие риск переобучения, такиекак регуляризация значений параметров, перекрёстная проверка (crossvalidation), метод случайных подпространств, и др.2.2Распределения случайных величин2.2.1Функция правдоподобияФункция правдоподобия в математической статистике — это совместное распределение выборки из параметрического распределения,рассматриваемое как функция параметров.

Для оптимизации параметров распределений, в работе будет максимизироваться логарифм функции правдоподобия. Метод максимального правдоподобия выбирает такое распределение из параметрического семейства, в котором имеющаясявыборка наиболее вероятна.2.2.2Распределение ЛапласаВ дальнейшей работе, распределение Лапласа применяется дляописания распределений будущих значений потребления процессорноговремени. Его плотность изображена на графике 2.1, и задаётся выражением:(|, ) = exp (−| − |)211Рисунок 2.1 — Плотность распределения ЛапласаВ работе используется усечённая версия распределения Лапласа, вкоторой реализация заведомо находится на отрезке [0, 1]. После зануления вероятности вне единичного отрезка, функцию плотности необходимо отнормировать.

Для этого используется разница функции распределния в точках 1 и 0. Функция распределения:⎧⎨ 1 exp (( − )) ,< (|, ) = 2⎩1 − 1 exp (−( − )) , ≥ 22.3Искусственные нейронные сетиИскусственная нейронная сеть – это вычислительная модель, используемая в машинном обучении. В простейшем варианте модели, ковходным признакам поочерёдно применяются параметризованные линейные функции, и нелинейные функции, называемые функциями активации. Для оптимизации параметрлов линейных преобразований, мини-12мизируется определённая функция потерь. Зачастую, в качестве функции активации применяется tanh.Как показывается в [26], искусственные нейронные сети могут служить универсальным аппроксиматором для широкого класса функций.Они предоставляют высокую гибкость в определении модели.

Фактически, в качестве искусственной нейронной сети можно определить произвольный параметризированный граф вычислений, тем самым задатьжелаемую структуру модели. Веса искусственной нейронной сети, какправило, оптимизируются с использованием метода обратного распространения ошибки [27].2.3.1Различные приёмыВысокая выразительная способность искусственных нейронных сетей повышает риск переобучения (черезмерно детальное описание тренировочных примеров, с потерей обобщения модели на контрольные данные).

Для борьбы с переобучением применяется ряд приёмов.Один из простых способов борьбы с переобучением является ранняя остановка процесса обучения, когда ошибка на выделенной валидационной выборке начинает расти. Другим распространённым приёмомявляется затухание весов (weight decay), который на каждой итерацииуменьшает значения оптимизируемых параметров. На практике, затухания весов добиваются 2 -штрафом на веса сети [27].Dropout – весьма мощный метод регуляризации нейронных сетей[28].

Он представляет из себя отдельный слой нейронной сети, которыйв процессе обучения зануляет долю случайно выбранных входов. Внеобучения, слой масштабирует свой вход, чтобы сохранить ожидаемоесреднее значений выхода dropout-слоя, а значит и входа последующегослоя. Как было замечено в [29], dropout можно рассматривать как экономичный способ реализовать ансамбль большого числа нейнонных сетей,работа которых усредняется. Уменьшение взаимозависимостей весов, и13устойчивость ансамбля моделей, позволяют повысить качество предсказаний на шикором классе задач.Ещё один приём, уже не относящийся к борьбе с переобучением,но существенно ускоряющий обучение: Batch Normalization [30]. Цельюэтого метода является нормализация входов слоя нейронной сети.

Изменение среднего и дисперсии выходов некоторого слоя глубокой нейроннойсети приводит к тому, что дальнейшие слои оказываются неприспособленными к получению таких входов, и им требуется дообучение. Этот эффект усиливается с увеличением числа слоём. Если используются фунции активации с горизонтальными асимптотами (как tanh), то выходыочередного линейного отображения могут попасть в далёкую от нуляобласть, где градиент близок к нулю, что может практически заморозить "насыщенный"(saturated) нейрон. Batch Normalization отслеживаетсреднее и дисперсию входных признаков, нормирует на них проходящиечерез слой данные, и подбирает среднее и дисперсию производимых выходов (обучаемые параметры слоя).2.3.2Вариационные нейронные сетиСуть вариационного подхода заключается в замене точечного предсказания целым распределением.

Предсказание параметров оцениваемого распределения можно производить при помощи нейронной сети, что иприводит к вариационным нейронным сетям. Переход от точечных оценок к распределениям влечёт необходимость использовать не оценки точности, вроде среднего квадрата ошибки, а оценки близости вероятностных распределений, вроде расстояния Кульбака – Лейблера.142.4Метод Монте-КарлоВообще говоря, вычисление распределения функции от случайных величин может быть сложной задачей, но существует одна простаяи мощная альтернатива. Можно сгенерировать реализаций случайной величины 1 , . . . , , из них получить реализации рассматриваемойфункции (1 ), .

. . , ( ), и на основании эмпирического распределениязначения функции делать интересующие вычисления. Методы МонтеКарло широко используются в статистике и машинном обучении [27].2.4.1Интергирование методом Монте-КарлоДля примера, можно довольно просто оценить математическоеожидание значения любой функции от случайной величины. Для этогосгенерируем реализаций , посчитаем среднее арифметическое значений функции на примерах, что и даст оценку математического ожидания. То есть∫︁1 ∑︁ ( )E [ ()] = ()()d ≈ =1где ∼ ().

Такой приём называется интегрированием методомМонте-Карло. Увеличивая количество используемых реализаций , теоретически можно произвольно увеличивать точность оценки.2.4.2Использование выборки по значимостиХотя простым интегрированием методом Монте-Карло можно получить произвольную точность оцениваемой статистики, такой подходможет потребовать неоправданно много примеров.

Например, если оценивается вероятность некоторого крайне маловероятного события, то15столь же малая доля реализаций попадёт в рассматриваемую областьвероятностного пространства. В данной работе встретился именно такойслучай.К счастью, в таком случае можно существенно увеличить точнооценки, используя меньшее число реализаций. Идея состоит в генерировании реализаций случайной величины не из изначального распределения, а из некоторого распределения (). В идеале, () должно бытьпропорционально ()(), но для корректности метода это не обязательно.

Суть выборки по значимости заключена в следующей выкладке:∫︁E [ ] =∫︁ ()()d =1 ∑︁()()d ≈ ( ) ()() =1)где ∼ (), = (( ) . называются весами значимости (importanceweights).В итоге, усреднее происходит для другой функции с иначе распределённым аргументом. Так как аргумент новой функции распределёнуже согласно (), вероятность получения значимых для интеграла реализаций можно увеличить, и тем самым увеличить точность оценки.16Глава 3. Обзор существующих работВ этой главе рассмотрены результаты работ, изучавших методыпредсказания потребления ресурсов в виртуальных средах, в особенностипроцессорного времени.

Приведённые сведения основываются на обзоре[31].3.1Регрессионные моделиРезультаты, изложенные в работе Dinda от 1999 года [12] и расширенные в его же работе 2000 года, предсказывают процессорную нагрузку на машину (хост) в распределенных системах с помощью моделей Бокса — Дженкинса: AR, MA, ARMA, ARIMA и ARFIMA (см. 2.1).Кроме моделей Бокса — Дженкинса, в статье рассматривались ещетри примитивных метода, с которыми производилось сравнение: среднее значение на предыдущем интервале – BM («simple windowed-meanpredictor»); среднее как долгосрочное предсказание – MEAN («long-termmean predictor»); и экстраполяция последнего значения – LAST. Точность прогноза определялась среднеквадратичным отклонением.В работе были получены следующие результаты:– нагрузка предсказуема («consistently predictable»);– линейные модели являются достаточно мощными, чтобы предсказывать нагрузку– MA – модели показали плохие результаты, а остальные модели семейства показали схожие результаты в терминах среднеквадратичных ошибок, поэтому более сложные модели (ARMA,ARIMA, ARFIMA), требующие громоздких вычислений, былиотвергнуты– AR показал себя гораздо лучше, чем BM и LAST– Накладные расходы в AR(16) пренебрежимо малы17– После всех исследований и тестирований, в статье рекомендуетсяиспользовать AR с порядком больше 16Среди работ, связанных с предсказанием потребления процессорного времени уже отдельными нагрузками, большинство рассматривалоразного рода линейные модели.

Характеристики

Тип файла

PDF-файл

Размер

912,38 Kb

Материал

Предсказание потребления процессорного времени в виртуальных средах

Тип материала

Выпускная квалификационная работа (ВКР)

Предмет

Дипломы и ВКР

Высшее учебное заведение

МФТИ (ГУ)

Список файлов ВКР

predskazanie-potreblenija-processornogo-vremeni-v-virtualnyh-sredah.rar

Предсказание потребления процессорного времени в виртуальных средах.pdf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.