Диссертация (1155093), страница 7
Текст из файла (страница 7)
тип I — распределение типа Гумбеля, которое ещё иногда называютдважды экспоненциальным:() () = exp(−−−),(1.26)342. тип II — распределение типа Фреше:() () =⎧⎪⎨ 0, [︃⎪⎩ exp −(︁−)︁−]︃ < ,, ≥ ,(1.27)3. тип III — распределение типа Вейбулла:[︃]︃⎧)︁(︁⎪⎨ exp − −, < ,() () =⎪⎩0, ≥ ,(1.28)где , > 0 и > 0 — параметры. Распределения типа II и III приводятся к рас(︀)︀ (︀)︀пределению типа I с помощью преобразований ln(() − ) и − ln(() − ) ,соответственно, поэтому в основном акцент делается на распределении типаГумбеля, плотность распределения которого имеет вид:() () = −1 −−(︀− )︀exp − − .(1.29)а математическое ожидание и дисперсия равны:[() ] = + , 22,[() ] =6где ≈ 0.577721 — это постоянная Эйлера-Маскерони.
При = 0 и = 1получается стандартная форма распределения типа I — распределение Гумбеля:(︀)︀() () = exp − − ,(︀)︀() () = exp − − − .(1.30)В [26] упоминается об установленной связи между свойствами генерального распределения () и типом предельного распределения. Полученные условия, которым, вообще говоря, удовлетворяют далеко не все распределения (например, распределения с «тяжелыми хвостами»), являются необходимыми идостаточными для сходимости к одному из трёх типов семейств экстремальныхзначений и касаются поведения теоретической функции распределения ()при больших или малых значениях , когда речь идёт об экстремальных значениях случайных величин.
Причём экстремальные значения могут иметь пре-35дельные распределения разного типа даже при одинаковых исходных распределениях. К распределениям, которые удовлетворяют условию сходимости ктипу I можно отнести экспоненциальное, логистическое и нормальное, к типуII — распределение Коши, а к типу III — распределения, сконцентрированныена части числовой оси, ограниченной сверху [26]. Так, в [35] было показано,что распределение максимального значения () в выборке из случайных величин с экспоненциальным распределением с параметром = 1 приближается краспределению Гумбеля в его стандартной форме с ростом объёма выборки, т.е.() ≈ ln + ,[() ] ≈ [] ≈ 2 /6,[() ] ≈ ln + ,(1.31)где — это случайная величина с распределением Гумбеля с функцией распределения из (1.30), математическим ожиданием [] = и дисперсией[] = 2 /6.Отметим, что для случая, когда каждая порядковая статистика имеетстандартное распределение экстремальных значений типа I из (1.30) математическое ожидание максимума вычисляется по формуле [26]:[() ] = + + ln .(1.32)Произвольное распределение.
Рассмотрим обобщение вывода в [28] для аппроксимации моментов максимума случайных величин с произвольным распределением [52]. Рассмотрим случайную величину = max(1 , 2 ), где — неотрицательные и независимые с функциями распределения (), а () — этоПЛС этих функций распределения, = 1,2. Тогда математическое ожидание можно выразить следующим образом:[] = [1 ] + (2 > 1 ) · [2 − 1 |2 > 1 ] =∫︁∞= [1 ] + 1 ()2 () · [2 − 1 |2 > 1 ].0Пусть 1 и 1 — первые два момента случайной величины 1 , а 2 и 2 —случайной величины 2 . Тогда, если 1 — экспоненциальная, то[2 − 1 |2 > 1 ] =2.2236Далее окончательно получаем следующую аппроксимацию:2 1 (−12 )[ ] = 1 +,22которая фактически является точным результатом для случая, когда обе случайные величины 1 и 2 имеют экспоненциальное распределение.
Таким образом, в общем случае, когда речь идёт о случайных величинах, необходимо аппроксимировать ПЛС функции распределения максимума ( − 1) случайных величин. Поэтому допустим, что уравнение (1.22) применимо не только к экспоненциальным случайным величинам.
Обозначим (,, ) среднеезначение максимума случайных величин с математическими ожиданиями−1 = (1 ,..., ), = (−11 ,..., ) и вторыми моментами = (1 ,..., ). Тогда (,, ) можно выразить рекуррентно:11 ∑︁ ( − 1,/ , / ) + (−1) (/ , ), (,,) = =12(1.33)где = 2,.., и (1,1 ,1 ) = 1/1 . Если же все случайные величины имеютодинаковые распределения со средним = и = для 1 ≤ ≤ , то (,,) =1 +( − 1).2Результаты моделирования для оценки точности приближения приведены в [28], а также в [29] с использованием уравнения (1.17).
Рассматриваютсяследующие распределения: распределение Эрланга 2-го, 3-го и 4-го порядков(2 , 4 , 4 ) и распределение Парето с функцией распределения следующего вида: () = 1 − ( + )− , > 2для = 4 и = 5. Условие > 2 необходимо для того, чтобы первые двамомента были конечными, = и = −1, так что = 1 и = 2+2/(−2).Погрешность аппроксимации выражений (1.33) и (1.17) мала и для 2 ,но быстро увеличивается, начиная с = 16, для 3 и 4 .
Интересно, что обауравнения дают точные результаты для распределения Парето, а последнееуравнение даёт более точные результаты в обоих случаях.37Границы моментов порядковых статистик. Если математическое ожидание и дисперсию генерального распределения обозначить и 2 , соответственно, то справедливо [33; 34]:и −1[() ] ≤ + √2 − 1(1.34) −1[(1) ] ≥ − √.2 − 1(1.35)Поэтому в [33; 34] для максимума н.о.р.с.в. () была предложена аппроксимация следующего вида:где[() ] ≈ + (),(1.36) −1() ≤ √.2 − 1(1.37)Заметим, для экспоненциального распределения справедливо, что () =√ − 1, а для равномерного распределения выполняется: () = 3( −1)/( + 1) [31].
Если же математическое ожидание равно нулю, а стандартное квадратическое отклонение равно единице, то, очевидно, [() ] ≈ ().Знак равенства в выражении (1.37) имеет место для н.о.р.с.в. ( , = 1,) сфункцией и плотностью распределения следующего вида: () =где(︁ 1 + )︁1/(−1),√− (︁ 1 + )︁1/(−1)−1 () =,√2 − 1≤ ≤ 2 − 1, −1 −1= √.2 − 1Для симметричного распределения () = 1 − (−) справедливо:(︀2−2)︀ ]︃1/22(1−1/−1 )[, max ] ≤.22 − 1[︃Для аппроксимации ожидаемого значения максимума н.о.р.с.в. с нормаль√︀ным распределением в работе [27] используется () = 2 ln() в формуле38(1.36), т.е.:[() ] ≈ + √︀2 ln().Более точная аппроксимация дана в [26]:]︃√︀ln(ln()) − ln(4) − 2√︀2 ln() −.[() ] ≈ + 2 2 ln()[︃(1.38)Стоит отметить, что в уравнении (1.38) существует некоторый сдвиг (смещение), который корректируется путём вычитания 0.1727 −0.2750 из выражения вскобках в (1.38) [104]. Таким образом, имеем:1.64492 2[() ] ≈.2 ln()Аппроксимация на основе границ моментов порядковых статистик.
Наоснове формулы (1.36) в [30] для случайной величины времени отклика былопредставлено приближение:[,max ] ≈ [1, max ] + 1, max () ().(1.39)где [1, max ] и 1, max обозначают математическое ожидание и среднее квадратическое отклонение времени отклика СМО //1 с коэффициентом загрузкисистемы . Напомним, что если времена обслуживания подзапросов распределены по произвольному закону () [52], то(2)[1, max ] = +,2(1 − )где =∫︀∞(), 0(2)=∫︀∞(1.40)2 (), = .
определяется из (1.39) при = 00и () = 1 следующим выражением:, max − , = √(2) − 2, max(1.41)∫︀∞= [1 − ()] — математическое ожидание максимума н.о.р.с.в.0с функцией распределения (). Легко показать, что для экспоненциального39распределения = − 1, а для распределения экстремальных значений√ = 6 ln()/ [26]. Сравнительный анализ полученного приближения и результатов имитационного моделирования при заданном распределении времениотклика может быть использован для получения выражения () [30]: () =[, max ] − [1, max ].
1, max(1.42)Так, например, для fork-join системы с двумя ветвями //1 из выражения(6) следует, что 2 () = 1 − /4.1.3Постановка задачи исследованияОблачные вычисления — это эволюционная технология, которая даёт своим пользователям возможность для маневренности и гибкости и отличаетсяот традиционных тем, что обеспечивает решение многих проблем, в том числесвязанных с экономичным способом оплаты только за использованные услуги.Но нельзя не сказать о том, что наряду со многими преимуществами использования этой технологии существуют и некоторые трудности.
Например,проблема принятия облачных сервисов в связи с неопределенностями, присутствующими в «облаке». В частности, проблема безопасности, нарушение которой может привести к снижению ценности и актуальности информации, неговоря уже про угрозу ее достоверности. Кроме того с огромным ростом использования облачных сервисов, распределение ресурсов для обслуживания запросов стало сложной задачей, и в этой связи вопросы повышения энергоэффективности выходят на первый план.
Более того увеличение спроса на облачныевычисления привело к сильной конкуренции между облачными провайдерами.Поэтому в борьбе за пользователей вопрос снижения стоимости услуг стоит нена последнем месте. Одним из способов решения этой задачи является экономияденежных средств благодаря энергосбережению за счет эффективного планирования использования ресурсов, а именно за счет гистерезисного управлениявыделяемыми ресурсами, а также параллельной обработки большого объемаданных.40Таким образом, для того, чтобы достичь поставленных целей, которые были сформулированы во введении, в диссертационной работе необходимо решитьследующие задачи:1. Построение и исследование системы облачных вычислений в виде системы массового обслуживания с параллельной обработкой заявок.2.
Анализ вероятностно-временных характеристик системы массового обслуживания с параллельной обработкой заявок, таких как среднее время отклика и дисперсия времени синхронизации.3. Разработка рекуррентного алгоритма расчета оценки времени откликадля модели системы облачных вычислений с гистерезисным управлением подключением виртуальных машин.4. Разработка рекуррентного алгоритма расчета оценки времени откликадля модели системы облачных вычислений с гистерезисным управлением подключением виртуальных машин с ограничением на одновременное число активаций.41Глава 2. Анализ системы характеристик системы массовогообслуживания с параллельной обработкой запросов2.1Особенности модели системы облачных вычислений срасщеплением запросов.Рассмотрим облачный центр, состоящий из нескольких физических машин, которые резервируются пользователями в порядке поступления запросови могут использоваться совместно для их обработки посредством метода виртуализации (рис.
2.1). В систему поступают сложные запросы пользователей,содержащие несколько задач (подзапросов), для обработки каждой из которыхтребуется одна виртуальная машина. Запрос считается выполненным, т.е. пользователь получает отклик системы, после обработки всех его подзапросов (синхронизация происходит мгновенно). Функциональная схема облачной системы,используемой для решения описанных выше задач, представлена на рисунке2.2.вмвмДиспетчерзадач...БуферсинхронизациивмПользовательРисунок 2.1 — Схема облачного центраДля моделирования облачного центра будем использовать fork-join систему массового обслуживания с ветвями типа / /1, = 1,.Времена пребывания подзапросов в системе с расщеплением являются зависимыми случайными величинами в силу общих моментов поступления.
По-42скольку точное выражение для времени отклика в fork-join системе в случае > 2 неизвестно, и возможность его получения остается под вопросом [18; 20],то в качестве её аппроксимации будем использовать независимых параллельно функционирующих систем массового обслуживания / /1, = 1,.Использование такого приближения представляется возможным не толькоисходя из естественных интуитивных соображений, но и благодаря тому, чтовыражения для маргинальных вероятностей числа подзапросов -го типа, =1,, в исходной fork-join системе совпадают с выражениями для стационарныхвероятностей в системе //1 [78], что и будет показано далее.Однако важно заметить, что сложности из-за зависимости между временами поступления подзапросов в систему не мешают точному анализу системыв случае с бесконечным числом приборов в каждой из подсистем.
В данныхусловиях становится возможным получить точное решения не только для времени отклика, но и для стационарного распределения числа подзапросов в системе [37–42].Как уже было упомянуто ранее, точного решения для распределения числа подзапросов , = 1, в fork-join системе не было найдено. Но при этомдля случая пуассоновского входящего потока и экспоненциальных времён обслуживания можно получить явные выражения для маргинальных вероятностей [78].Рассмотрим систему массового обслуживания с независимыми параллельно работающими приборами (виртуальными машинами или серверами),каждый из которых имеет накопитель неограниченной емкости.