Диссертация (1155093), страница 3
Текст из файла (страница 3)
Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2016)(Томск, 2016 г.); Девятнадцатая международная научная конференция «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN-2016) (Москва, 2016 г.); I Международная научная конференция «Конвергентные когнитивно-информационные технологии» (Москва,2016 г.).Соответствие паспорту специальности. Диссертационное исследование выполнено в соответствии с паспортом специальности 05.13.17 «Теоретические основы информатики» и включает оригинальные результаты в области исследования информационных процессов и требований их пользователейк показателям эффективности, в области разработки моделей информационныхпроцессов, разработки общих принципов организации телекоммуникационныхсистем и оценки их эффективности.
Таким образом, диссертационное исследование соответствует следующим разделам паспорта специальности 05.13.17«Теоретические основы информатики»: п. 2 (Исследование информационныхструктур, разработка и анализ моделей информационных процессов и структур), п. 16 (Общие принципы организации телекоммуникационных систем иоценки их эффективности).Личный вклад. Результаты, касающиеся разработки моделей и их анализа, представленные в диссертации, получены автором самостоятельно, приего непосредственном участии разработаны программные средства.Публикации. Основные результаты по теме диссертационного исследования изложены в 8 печатных изданиях [75–82], из которых 2 — изданы в журналах, рекомендованных ВАК РФ [75; 78].12Глава 1. Построение моделей массового обслуживания для системоблачных вычислений1.1Показатели эффективности системы облачных вычисленийОблачные вычисления в настоящее время представляют собой высокопроизводительную вычислительную среду, доступ к которой удаленному пользователю предоставляется посредством интернет-сервисов.
Интерес к системамоблачных вычислений объясняется множеством преимуществ их использования(доступность, гибкость, масштабируемость, легкость в управлении, сравнительно низкую стоимость внедрения), а также потребностью коммерческих и научных организаций в мощной вычислительной инфраструктуре для выполнениясложных ресурсоемких расчетов при сравнительно небольших затратах [83].Спрос на облачные вычисления в совокупности с возможностью перехода от одного поставщика облачных услуг к другому без каких-либо серьезныхзатрат для пользователя приводит к высокой конкуренции среди облачных провайдеров. В этой связи особую важность приобретает оптимальный подбор основных показателей качества функционирования облачных систем, которые, содной стороны, должны удовлетворять всем требованиям соглашения о качестве оказываемых услуг (Service Level Agreement, SLA) и, с другой стороны, неприводить к избыточным затратам со стороны провайдера.Одним из важнейших показателей качества обслуживания в облачной системе является время отклика.
Под временем отклика подразумевается время,в течение которого обрабатывается пользовательский запрос, иными словами,время, которое проводит пользователь в ожидании ответа системы на его запрос. В контексте решения кластерных задач, которые характеризуются высоким уровнем параллелилизма, запрос считается выполненным сразу после обработки последнего из составляющих запрос подзапросов, поэтому время откликаопределяется как максимум из времён пребывания подзапросов в системе.
Кроме того, одним из эффективных способов снижения времени отклика являетсяотправка одной и той же задачи нескольким вычислительным машинам, а затем — ожидание самого раннего ответа. В таком случае время отклика будет13представлять собой минимум из времён пребывания всех экземпляров задачи всистеме [84].Наряду с таким важным показателем качества обслуживания, как времяотклика системы, в последнее время особое внимание уделяется времени, проведённому подзапросами в буфере синхронизации, т.е.
времени между окончанием обслуживания первого и последнего подзапроса, в том числе в контекстепроведения параллельных вычислений [4]. Данная тенденция объясняется тем,что чем больше время сборки запроса, тем больше должен быть размер самогобуфера. Т.е. пока не будет обработан последний подзапрос одного запроса, всеего составляющие будут находиться в буфере, в который одновременно будутпопадать подзапросы следующих поступивших в систему запросов. По мереувеличения количества вычислительных машин или типов подзапросов должен увеличиваться и размер буфера. В этой связи также приобретает особуюважность подбор оптимальных параметров функционирования системы, минимизирующих время синхронизации без потери качества обслуживания.Для того чтобы оценить основные показатели качества функционирования системы и использовать эти оценки либо при выборе того или иного поставщика облачных услуг, либо при проектировании облачного центра, необходимополучить выражения для основных вероятностных характеристик исследуемыхслучайных величин, т.е.
как минимум — для математического ожидания и дисперсии.Современные облачные системы проектируются, как правило, масштабируемыми, что подразумевает под собой то, что по мере увеличения спроса увеличиваются выделяемые ресурсы. Но при этом возникает проблема недостаточного использования ресурсов, поскольку их распределение обычно происходитв соответствии с пиковой нагрузкой, которая может длиться в течение короткого промежутка времени.
Затем происходит переход в состояние простоя, нопри этом потребляемая мощность может по-прежнему составлять около 50% отпиковой, что вызывает значительные потери энергии.Вообще говоря, методы повышения энергетической эффективности и энергосбережения можно условно разделить на три категории: «воздействие» наповедение пользователей, изменение рабочей нагрузки, перенастройка ресурсов [8–12; 85]. Если говорить о первом подходе, то положительный опыт внедрения мер стимулирования потребителей к энергосбережению имеется, в част-14ности, у энергетических компаний. Применение системы тарификации, предполагающей значительное снижение стоимости электроэнергии в периоды низкойактивности, например, ночью, побуждает потребителей к использованию электричества хотя бы отчасти в ночное время, что в свою очередь, приводит квыравниванию рабочей нагрузки.
Идея же второго — заключается в использовании дополнительного устройства между сервисом и пользователем, котороеизменяет интенсивность входящего трафика посредством буферизации: увеличивает продолжительность «спящего» режима и удлиняет периоды высокойзагрузки [85]. Однако у этих двух методов имеется существенный недостаток,который заключается в снижении качества оказываемых услуг, что являетсянарушением SLA.Одним из способов реализации третьего подхода является динамическаяактивация виртуальных машин [5–7]. Иными словами, регулируется количестворесурсов (серверов, машин) в зависимости от текущей нагрузки [8–12]. Правильное определение необходимого количества ресурсов для выполнения задачи сучетом текущей рабочей нагрузки и технических требований является сложнойзадачей.
Это обусловлено тем, что, с одной стороны, выделение большего числавиртуальных машин, чем необходимо, ведет к большим затратам для пользователя, а с другой стороны, выделение меньшего, чем требуется, объема ресурсов,ведет к нарушению соглашения об уровне обслуживания.Таким образом, поскольку для поставщиков облачных услуг одним изважнейших показателей производительности системы является энергоэффективность, то для уменьшения числа срабатываний системы управления масштабированием применяется, в том числе и гистерезисный подход [55–65].
Т.е.для системы устанавливаются пороги, определяемые значениями заранее заданных векторов, и в зависимости от того, сколько заявок находится в системе,активируется или останавливается соответствующее тому или иному порогучисло дополнительных приборов. Активация виртуальных машин происходитнемгновенно, поэтому при моделировании облачного центра будем учитыватьэтот аспект, тем самым увеличивая реалистичность рассматриваемой модели иобеспечивая более глубокий анализ производительности современных облачныхцентров.Заметим, что в условиях предложенной модели число одновременно запущенных процессов активации дополнительных приборов ограничивается только15общим количеством приборов.
Однако в ситуации, когда общее количество приборов принимает достаточно большое значение, исследование исходной моделиможет сильно осложниться из-за соответствующего значительного увеличенияпространства состояний. Поэтому в данных обстоятельствах целесообразнее свычислительной точки зрения может быть анализ модели, аппроксимирующейисходную, т.е. в качестве приближения исходной модели мы можем рассмотретьсистему с ограничением на одновременное число активаций дополнительныхприборов. Анализ исходной и упрощенной моделей является вполне оправданным благодаря многообразию моделей развертывания систем облачных центров.1.2Обзор систем параллельного обслуживания заявокОдним из способов анализа параллельной обработки сложного пользовательского запроса с использованием возможностей облачных вычислений является применение систем параллельного обслуживания заявок [37–40], в англоязычной же литературе используется термин «система массового обслуживания fork-join» [4; 18; 31].
Указанная система является естественной модельюдля многих других реальных систем. В этой связи подробно рассмотрим её,родственные ей системы и основные их характеристики.Общая идея функционирования системы fork-join (рис.1.1) заключается в следующем: на вход поступает поток заявок (запросов) 1 ,2 ,..., в момент поступления в точке «расщепления» (англ. fork point) заявка , = 1,∞разделяется на родственных заявок (подзапросов): 1 = 1 , 2 =2 ,..., = , каждая из которых отправляется в очередь на обслуживание к серверам с номерами 1,2,...,, соответственно. Предполагается, чтозапросы имеют одну и ту же структуру и каждый сервер предназначен длявыполнения конкретных задач: подзапрос может обслуживаться только на-м сервере, = 1,. Обработанные подзапросы попадают в буфер синхронизации, где дожидаются родственных им подзапросов. В момент поступленияпоследнего родственного подзапроса одного из запросов происходит их синхро-16низация, т.е.