Динамическое управление питанием в задаче динамического управления ресурсами вариации планировщика и эксперименты (1187399), страница 2
Текст из файла (страница 2)
Максимальная рабочая частота, ввидусказанного выше, выражается какF=1, гдеLtL — максимальное количество последовательно соединённых элементов.На программном уровне, DVFS представляется:1) сборщиком метрик активности устройства в предыдущие интервалывремени.2)управляющейпрограммой,осуществляющейпредсказаниезагруженности и оптимальной конфигурации устройства.3)CPUFreq — драйвером, осуществляющим работу с аппаратнымобеспечением.82.2. Источники и вклад в энергопотребление.В соответствии с докладом Intel Labs[9], основной вклад вэнергопотребление ФМ вносит CPU, а также, в меньшей степени,оперативная память и потери, связанные с эффективностью питания.Однако, ввиду широкого применения DVFS и энергосберегающих техник[10], современные ФМ могут потреблять менее 30% своей пиковоймощности в энергосберегающих состояниях, таким образом, находясь вдинамическом диапазоне 70% от пиковой мощности - суммарный вкладCPU в энергопотребление уменьшается.
В противоположность этому,динамические диапазоны мощности остальных серверных компонентовстановятся уже: менее 50% для оперативной памяти (DRAM), 25% дляжестких дисков, 15 % для сетевых коммутаторов и незначительная частьдля остальных компонент. Причина заключается в том, что процессорподдерживает активное энергосбережение, в то время как остальныекомпоненты могут быть только полностью или частично отключены. В тоже время, затраты производительности на переходы между активными инеактивными состояниями являются существенными. К примеру, жесткийдиск в режиме глубокого сна почти не расходует мощности, но переход вактивное состояние создаёт задержку, превышающую в 1000 раз задержкудоступа в активном состоянии.
Неэффективность элементов сервера натаких переключениях приводит к узким динамическим диапазонам общеймощности: если сервер полностью свободен, он потребляет более 70%пиковой мощности. В текущей работе ряд элементов системы исключён иззадачи DPM, а их энергопотребление считается статическим: хранилищеинформации (образов VM, конфигураций и прочих данных) подключаетсяотдельно,сетевыемаршрутизаторыикартыФМработаютдинамической оптимизации методом «sleep»-«doze»[11] и т. д.
С другой9безстороны , такое построение обеспечивает минимизацию времени живоймиграции ВМ в ходе последней, о чём сказано в разделе 3.Итак, задача локального DPM фокусируется, в первую очередь, надинамическом энергопотреблении CPU: либо профилированием черезсчитывание соответствующих модель-специфичных RAPL-счетчиков [12],либо соответствии с моделью энергопотребления по загруженностиопределяется оптимальное состояние.2.2.1. Модель динамического энергопотребления CPU.Для разработки эффективных политик энергосбережения и пониманиявклада последнего в общую эффективность системы, важно создатьадекватную модель динамического энергопотребления. На основании такоймодели можно будет получать актуальные значения энергопотреблениянепосредственно во время работы. Как указано выше, одним из путейрешения является использование встроенных счетчиков для мониторингаэнергопотребления и сбора статистики. Отталкиваясь от полученныхданных, можно определить модель.
Тем не менее, данное решение требуетсбора данных от каждой ФМ.Авторыработы[13]определилистрогоеотношениемеждузагруженностью CPU и общим энергопотреблением. Их идея заключаетсяв том, что энергопотребление ФМ растёт линейно вместе с ростомзагруженности CPU от уровня энергопотребления в состоянии простоя доуровня при полной загруженности:P=Pidle + ( Pbusy − Pidle ) u , гдеP- искомое значение, Pidle - потребление простоя, Pbusy - потреблениепри полной загруженности,u— загруженность. Авторы такжепредлагают экспериментальную нелинейную модель:P=Pidle + ( Pbusy − Pidle ) ( 2u − ur ) , где10r— экспериментальная калибровочная постоянная, большинствеслучаев близкая к 1.
В соответствии с исследованиями авторов на большомнаборе различных нагрузок, линейная модель даёт ошибку менее 5%, анелинейная — менее 1% при правильном выборе r (рис.1). Такие точныерезультаты объясняются фактом основополагающего потребления CPU,существенно более узкими диапазонами энергопотребления остальныхкомпонент ФМ, а также скоррелированностью активности компонент снагрузкой CPU.Рис. 1. Мощность энергопотребления в зависимости от загруженности[13].В данной работе автор использует представленную выше линейнуюмодель, а также результаты экспериментальной калибровки аппаратногообеспечения с помощью SPECpower[14].
Также представляет интересработа [15], в которой авторы предлагают методы предсказания нагрузок на11основании регрессионных моделей. Также автором была разработанасистема сбора метрик энергопотребления через модель-зависимые RAPLсчетчики, доступная на GitHub [16].3. Построение DRS-DPM.3.1. Виртуализация: «за и против».Широкие возможности гибкого использования вычислительных системпредоставляетвиртуализация[1][4][17].Выделениеиизоляциявычислительных ресурсов, окружений, инфраструктуры и сервисов,обеспечениеотказоустойчивостиимасштабирования—основныефункции облачной системы — реализуются благодаря виртуализациифизических ресурсов, либо ядра операционных систем в случаеконтейнеров [18]. Ресурсом задачиDRS-DPM в описании такой системыявляется виртуальная машина (ВМ), потребляющая некоторые физическиересурсы (CPU, RAM, Network bandwidth) ФМ.Наряду с получением колоссальных преимуществ виртуализации,разработчикиполитикиалгоритмовDRS-DPMвстречаютрядограничений:- трудности учёта и построения моделей затрат на живую миграцию ВМмежду ФМ [1].- особенности конфигурации конкретных облачных инфраструктур (кпримеру, жесткая привязка ВМ к ФМ или существование специфичныхподгрупп в группах ВМ и ФМ).- прогнозирование энергии, потребляемой ФМ, требует построения ивнедрениясредствпрофилированияпроизводительностииэнергопотребления, зачастую вносящих высокие накладные расходы[1].- вариативность нагрузки в зависимости от загруженности ВМ[1] —12различноепрограммноеобеспечениенаВМвыдаётнагрузкинеоднородного характера [1][4], что усложняет модель системы.
Требуется,в первую очередь, ввести эффективные метрики, независимые от характеранагрузок [4].-высокуюсложностьобщейзадачиоптимизации,котораябезконкретизации некоторых свойств системы и ограничений по нагрузкамявляется NP-трудной задачей.Автор и др. в обзорной работе [1] разделяет задачу DPM на локальную,решаемую на ФМ, и глобальную, решаемую на уровне всей системы.Авторы работы [4] называют задачу DRS-DPM задачей динамическойэнергоэффективной консолидации ВМ.3.2.
Подзадачи DRS-DPM.Для практического решения задачи и обеспечения децентрализации,DRS-DPM разбивается на несколько подзадач:1. ОпределениеперегруженностиФМ:локальныйпланировщикопределяет потенциальную перегруженность ФМ с целью недопущенияSLAV. По достижению перегруженности некоторые ВМдолжнымигрировать с текущей ФМ.2.
ОпределениенедогруженностиФМ:локальныйпланировщикустанавливает нижнее значение нагрузки на ФМ, по достижении которойвсе ВМ должны мигрировать с текущей ФМ, с последующим переводомпоследней в энергосберегающее состояние или выключение в ходе работылокального DPM.3. Выбор ВМ для миграции: определяются ВМ, которые должнымигрировать.4. Выбор нового расположения ВМ,ВМ отобранных в предыдущей подзазаче.Далее происходит осуществление живых миграций.13Ряд предлагаемых ранее решений [1][4][5] обуславливал тесноевзаимодействие глобального и локального планировщиков в подзадачах:глобальный планировщик обязан контролировать весь диапазон ФМ, надкоторым осуществляется оптимизация, а также полное расположение ВМна ФМ, в том числе и осуществлять выбор ВМ для миграций[1].Рис. 2.
Архитектура системы и управление миграциями через гипервизор (VMM).ВМ 1 выбрана к миграции с ФМ 1 и ВМ 2 выбрана к миграции с ФМ 2в ходе работы локального планировщика. Передача списков ВМглобальному планирощику с целью поиска новых расположений.С целью обеспечения распределённости и упрощения анализа,подзадачи1-3даннойработырешаютсясредствамилокальногопланировщика ФМ. В ходе решения 4, локальный планировщиквзаимодействуетсглобальным,предоставляяпоследнемусписокмигрируемых ВМ. Общая диаграмма работы локального планировщика вподзадачах 1-3 приведена на рис.
3.14Рис. 3. Диаграмма работы локального планировщика в подзадачах 1-3.1 — задача определения перегруженности ФМ.2 — задача определения недогруженности ФМ.3 — задача выбора ВМ для миграции.Такимобразом,глобальноконтролируетсялишьдинамическиизменяющееся подмножество мигрирующих ВМ, а не всё расположение,что упрощает решение (рис. 2).После осуществления миграций и перевода системы в новоесостояние,локальныйDPMнаФМкоординируетуровеньэнергопотребления с новой нагрузкой, переводит процессоры ФМ вразличные C, P, T — состояния.Таким образом, новое состояние системы представляет собой минимальновозможное число активных ФМ, благодаря увеличению плотностиупаковки ВМ, и максимально возможной поддержки производительности исоответствия QoS.153.3.
Определение перегруженности ФМ.Подзадача определения перегруженности ФМ является важнейшей вобеспечении соответствия QoS. Данный подраздел описывает ряд подходовк решению данной проблемы, описывает важные свойства решенияотносительно миграций ВМ, а также даёт теоретическое обоснованиеэффективности онлайн-алгоритмов решения.Решения,приводимыевработе,соответствуютсоставляющейлокального планировщика, диаграмма работы и взаимодействия сглобальным планировщиком которого приведена на рис. 3.3.Рис. 4.
Диаграмма обработки перегруженности ФМ.3.3.1.Нестационарныеалгоритмов.16нагрузки:поископтимальныхонлайн-В реальных компьютерных системах алгоритм управления не имеетполных данных о поведении подконтрольных компонент, ровно как и обудущей нагрузке и событиях. Таким образом, мы сталкиваемся с онлайнпроблемой — задачей, вход и выход которой связываются различнымипроцессами в реальном времени.
Один из способов поиска онлайналгоритмов решения таких задач — соревновательная теория алгоритмов[19]. Сначала находится оптимальный офлайн-алгоритм, затем строитсяонлайн-алгоритм, в какой-то степени «конкурирующий» с ним поэффективности.Определение. Алгоритм А называется c-соревновательным оптимальномуофлайн-алгоритму OPT , если∀ I ∃a , c : A ( I ) ⩽c OPT ( I ) +a , I — конечнаявходная последовательность событий.Приведём формулировки некоторых задач, возникающих при решенииDRS-DPMдлявиртуализованнойсистемы,ипостроенияонлайналгоритмов их решения.3.3.1.1. Оптимальный онлайн-алгоритм: задача Миграции единичнойВМ.Данный подраздел посвящён соревновательному анализу подзадачиэнергоэффективной и производительной консолидации ВМ. Пусть имеетсяФМ и M ВМ, размещённых на ней.
Время дискретно и разделено на Kкадров, где каждый кадр длится 1 секунду. Поставщик ресурсов расходуетC p t p , гдеС ресурсов на энергозатраты ФМ:Cpэнергозатрат в единицу времени,tpиспользованиехарактеризуютсяресурсовВМ- стоимость— период. Ресурсы ФМ ивтерминахпроизводительности CPU.ВМ исполняет динамические нагрузки, следовательно, нагрузка CPU17также варьируется динамически. В случае, если ФМ предоставляетнедостаточно ресурсов CPU относительно текущего спроса всех ВМ,случаетсяSLAVмеждупоставщикомипользователем.C v t v гдерегламентируется затратами поставщика:CvSLAV- стоимостьSLAV-затрат в единицу времени, t v — период SLAV.