Диссертация (1090594), страница 10
Текст из файла (страница 10)
Соответственно, для обеспечения необходимой точности, модели наоснове СМО должны учитываться характер сетевого трафика, процессыобслуживанияираспределениязаявок,модельдолжнаотражатьвариативность числа узлов системы [81], чего не всегда удаётся достичь напрактике.Имитационная модель, по сравнению с аналитической, обладает рядомпреимуществ. Имитационное моделирование позволяет [82]: производитьпараметров;многократноеизмерениеинтересующихнас63 осуществлять полный контроль всех параметров исследуемойсистемы,свозможностьютекущеймодификацииалгоритмаповедения исследуемой системы.В результате чего, имитационное моделирование обладает одним изважнейшихкачеств,позволяющихприменятьданныйподходдлямоделирования сложных динамических систем – универсальностью [83].Так как построение имитационной модели сложного комплексаосновываетсянапринципахиерархическогомногоуровневогомоделирования [83], необходимо определить базовую модель, которая будетпроста в реализации.
Соответственно, выделим следующие модели РВК:1. Базовая модель – распределённый вычислительный комплекс сгомогенным составом узлов, линий связи.2. Глобальнаямодель(3-гоуровня)–распределённыйвычислительный комплекс с гетерогенным составом узлов, линийсвязи.Разработанная система была построена таким образом, чтобыпроизвести оценку различных сценариев работы РВК, посредством фиксацииили изменения ряда системных атрибутов, которые были описаны впредыдущих разделах.Одним из важнейших параметров, учет которых необходим вразрабатываемой системе, является модель загрузки вычислительного узлакомплекса.
В настоящий момент многими исследователями [84] признаётсянеобходимость учёта характеристик нагрузки и её характера, а такжеалгоритмовбалансировкипроизводительностисистемы.нагрузкиТак,дляправильнойбольшинствооценкипредшествующихисследователей предполагали [85], что построение модели вычислительнойнагрузки возможно на основе собранных статистических данных. Однакоданный подход не лишён ряда недостатков и ограничений.64Существеннымнедостаткомтакогоподходаявляетсятообстоятельство, что в зависимости от условий сбора статистических данных(время, период сбора и т.д.) собранная выборка может не давать всю полнотухарактеравычислительнойнагрузки.Стоитотметить,чтосборстатистических данных может приводить к лишним накладным расходам. Врезультате чего, остро встаёт проблема создания моделей, лишённыхуказанных недостатков и дающих результаты, которые коррелируют срезультатами, полученными на практике.Вданномдиссертационномисследованииузловаянагрузкапредставлена в виде нелинейной динамической системы, описываемойуравнением (2.1).С целью приближенности к реальным условиям эксплуатации,тестирование разработанного алгоритма производилось на глобальноймодели, с различным набором параметров, описанных выше.
В качествеосновных алгоритмов балансировки нагрузки были выбраны следующиеалгоритмы: алгоритм балансировки со случайным распределением задач(англ. randomized load balancing algorithm), циклический алгоритм (англ.Round-Robin), алгоритм наименьшего количества соединений (англ. LeastConnection), прогностический алгоритм на основе метода экспоненциальногосглаживания(exponentialsmoothing)иразработанныйвданномдиссертационном исследовании прогностический алгоритм на основе методаквазилинеаризации.После описания основных требований к системе, была произведена еёразработка. Структура системы представлена на рисунке 3.1.65Рисунок 3.1 — Функциональная схема разработанной системы[114]В качестве входных параметров используется готовый набор целевыхпараметров (модель узловой нагрузки, тип сетевого протокола, структурафайловой системы, применяемый алгоритм балансировки и т.д.). Далее,перед каждым запуском системы, происходит анализ входных параметров, сцелью выявления необходимости конфигурирования системы под каждыйконкретный набор параметров.
Если пользователь пытается запуститьсистему без изменения параметров, например при повторном запускепредыдущейчастимоделирования,тозапускосуществляетсябезпереконфигурирования системы. Далее, генератор осуществляет генерациюмодели с соответствующим набором параметров, после чего происходитзапуск модели. После запуска системы имитационного моделированиявозможен контроль хода выполнения работы, с помощью логированияосновных контролируемых параметров. В результате работы системы66происходит сбор требуемых статистических данных и их дальнейшаяфильтрация. Фильтрация полученных данных необходима для выявлениятолькосущественныхдляисследованияданных.Далеепроисходитинтерпретация полученных отфильтрованных данных. С целью удобстваанализа полученных данных, существует возможность их преобразования вудобный к восприятию вид (графики, таблицы).В таблице 3.1 приведены параметры эксперимента для исследуемогоРВК с различными характеристиками.67Таблица 3.1Структура файловойсистемыАлгоритмнагрузкиХарактер узловойданных (Mbit/s)Скорость передачиСетевой протоколсистемыКоличество узловМодель№ экспериментаФиксируемые параметры распределённого вычислительного комплексаRandom/ Leasted110TCP/IP100ОднородныйLoaded/гомогенныйexponential(распределениеsmoothing /Пуассона)прогностическийБездисковая, собщимфайловымсервером / слокальнымидискамиметодВ виденелинейной210TCP/IP100системы(ПрогностичесГлобальнаякая модель)Random/ LeastedLoaded/exponentialsmoothing/прогностиБездисковая, собщимфайловымсервером/ слокальнымидискамический методRandom/ Leasted310UDP100ОднородныйLoaded/гомогенныйexponential(распределениеsmoothing /Пуассона)прогностиБездисковая, собщимфайловымсервером/ слокальнымидискамический методRandom/ Leasted410UDP100В видеLoaded/нелинейнойexponentialсистемыsmoothing /(Прогностичеспрогностикая модель)ческий методБездисковая, собщимфайловымсервером/ слокальнымидисками683.3.
Анализ полученных результатов3.3.1. Расчёт индекса безразмерной ошибки прогнозирования ианализ производительности работы разработанного алгоритмаВ качестве критерия производительности прогнозирования методомквазилинеаризации предложено использовать оценку индекса безразмернойошибки (англ. NDEI) По своей сути, NDEI является нормированным корнемсреднеквадратичной ошибки модели (англ. RMSE). Соответственно, индексбезразмерной ошибки рассчитывается какNDEI RMSEsdt ( yt )(3.1)1 1 t T2RMSE ( yt yˆ t ) 2 T t 1(3.2)Формула (1) может быть переписана следующим образом:NDEI 11 t T ( yt yˆ t ) 2 ,sdt ( yt ) T t 1(3.3)где sdt ( yt ) - стандартное отклонение;Для обеспечения основы анализа было произведено сравнение методапрогнозирования на основе предсказательной динамической модели сметодомэкспоненциальногосглаживания.Дляполучениянаборастатистических данных была запущена разработанная имитационная модельглобально распределённого вычислительного комплекса с различнымнабором фиксируемых параметров, которые описаны ниже.
Количествоузлов системы было фиксированным и составило N=10. На вход тестовойсистемыпоступалонаобслуживаниеn=104запросов(наборформирования временного ряда), которые требовалось обработать.для69Дляанализауровняадаптацииразработанногоалгоритмаквозникающей нагрузке могут применяться различные метрики, такие каккоэффициент вариации, стандартное отклонение и коэффициент Джини. Дляоценки уровня дисбаланса вычислительной нагрузки в системе, былрассчитан коэффициент вариацииCV где,(3.4)- стандартное отклонение нагрузки; - среднее значение нагрузки.Результаты эксперимента систематизированы в таблице 3.2.Таблица 3.2Результаты анализа производительности разработанного метода№ТеоретическоеТеорет.Факт.узла(среднее(среднеечислопредсказанное)предсказанное)заданийчисло заданийчислоЧислоNDEI es NDEI q CVesзаданийCVq(среднее(среднеепо узлуизмеренийисследуемогопараметраметодомметодомпо узлуэкспоненциальногоквазилинеаризаэкс.)кваз.)xesxqсглаживанияции17407457500,0700,0350,1350,033181729809729760,0320,0150,0220,016242437056977000,0380,0140,0350,012181741200121012070,20190,200,4400,387303151075107910780,19050,2870,4080,421262661085109811070,20280,0700,4460,074262779769619500,4870,1020,5420,125242481380133213500,4680,1580,650,243343591105110410900,1150,1280,2030,1772727107828027920,0670,1020,1270,1242019СреднееСреднееCV=0,28CV=0,1670На основе собранных в ходе эксперимента данных был произведенрасчёт отношения стандартного отклонения к среднему по всем узлам, чтопозволило оценить уровень вычислительного дисбаланса в ходе работысистемы.На рисунке 3.2 показан баланс вычислительной нагрузки взапросах, обрабатываемых распределённой системой на всём периоде работысистемы.Рисунок 3.2 — Распределение нагрузки в зависимости от времениработыОднако,дляоценкикачествапрогнозированияметодомквазилинеаризации, использование таких оценок как индекс безразмернойошибки и среднеквадратичной ошибки модели в некоторых случаях бываетнедостаточно.
На практике, для этих целей, часто применяют совокупностьрасчёта стандартного отклонения и интервальную оценку для исследуемогопрогнозного параметра. В отличие от точечной оценки параметра, методпостроения доверительного интервала статистической величины нагрузкиявляется хорошим способом проверки не только точности, но и надёжности(качества) прогнозирования разработанной модели, по сравнению с другимимоделями, например ARIMA.Для построения доверительных интервалов характерно использованиебольших доверительных вероятностей (порядка 0,9; 0,95;0,99).