48639 (588587), страница 4
Текст из файла (страница 4)
Рисунок 9 – Граф состояний одного модуля
Для того, чтобы найти эти характеристики, нам надо знать интенсивности всех потоков событий, переводящих модуль (элемент) (не всего комплекса программ, а именно модуль) из состояния в состояние (см. рис.9). Тогда численность каждого состояния Xk(t) можно представить как сумму случайных величин, каждая из которых связана с отдельным (i–тым) модулем, а именно: равна единицы, если этот модуль в момент времени t находится в состоянии k, и равна нулю, если не находится в этом состоянии:
(0)
Очевидно, для любого момента времени t общая численность состояния k равна сумме случайных величин (1):
.
По теореме сложения математических ожиданий и теореме сложения дисперсий получаем:
(0)
Найдем основные характеристики – математическое ожидание и дисперсию – случайной величины , заданной выражением (1). Эта величина имеет два возможных значения: 0 и 1. Вероятность первого из них равна pk(t) – вероятности того, что модуль находится в состоянии k (так как программные модули одинаковы, то для всех эта вероятность одинакова). Ряд распределения каждого из случайных величин
один и тот же и имеет вид:
возможное значение (xj): | 0 | 1 |
вероятность (pj): | 1–pk(t) | pk(t) |
Математическое ожидание случайной величины, заданное таким рядом, равно:
А дисперсия:
Подставляя эти вероятности в формулы (2), найдем математическое ожидание и дисперсию численности каждого состояния Xk(t):
(0)
(0)
Таким образом, нам удалось для любого момента времени t найти математическое ожидание и дисперсию численности состояния k. Зная их, можно для любого момента времени t указать ориентировочно диапазон практически возможных значений численности:
Итак, не определяя вероятностей состояний программной системы S в целом, а опираясь только на вероятности состояний отдельных модулей, можно оценить, чему равна для любого момента времени t численность каждого состояния. Если мы знаем вероятности всех состояний одного модуля p1, p2, …, pn, как функции времени, то нам известны и средние численности состояний m1, m2, …, mn и их дисперсии D1, , D2, …, Dn.
Таким образом, поставленная задача сводится к определению вероятностей состояний одного отдельного модуля. Эти вероятности, как известно, могут быть найдены как решение дифференциальных уравнений Колмогорова. Для этого нужно знать интенсивности потоков событий (интенсивности запросов от клиентов и интенсивности восстановлений), переводящих каждый модуль из состояния в состояние.
Заметим, что вместо дифференциальных уравнений для вероятностей состояний удобнее писать уравнения непосредственно для средних численностей состояний, что видно из (3).
2.3.2 Модель с заменой вероятностей состояний на средние численности состояний
Пусть программа S состоит из N одинаковых модулей (или потоков) и граф состояния каждого модуля представлен на рисунке:
Рисунок 10 –Граф состояний модуля
В начальный момент времени t = 0 все модули находятся в состоянии 1.
Непосредственно по графу (см. рис. 10) составляем уравнения Колмогорова для вероятностей состояния;
(0)
Умножим левую и правую части каждого из уравнений (5) на число модулей N и введем в левых частях N под знак производной, а также учтем (3), тогда:
(0)
В системе уравнений (6) (которые называются уравнениями динамики средних) неизвестными функциями являются уже непосредственно средние численности состояний (точнее математические ожидания численности состояний). Как видно, эти уравнения составлены по тому же правилу, что и уравнения для вероятностей состояний. Поэтому их можно было составить сразу, минуя промежуточный этап.
Очевидно, что для каждого момента времени t средние численности состояний удовлетворяют нормировочному условию:
(0)
И поэтому одно (любое) из уравнений системы (6) можно отбросить. Отбросим, например, третье уравнение из (6), а в остальные уравнения вместо m3 подставим выражение согласно (7):
.
Тогда окончательно получим:
(0)
Эту систему нужно решать при начальном условии: t = 0; m1 = N; m2=m3=m4=0.
Решение такой системы дифференциальных уравнений (а для стационарного режима – системы алгебраических уравнений) легко провести на ЭВМ методом численного интегрирования.
Предположим, что это осуществлено и нами получены четыре функции m1(t), m2(t), m3(t) и m4(t). Найдем дисперсии численностей состояний D1(t), …, D4(t).
Из (3) и (4) следует:
,
где k = 1, … – число состояний модуля(0)
Зная математические ожидания и дисперсии численности состояний, мы получаем возможность оценить и вероятности различных состояний системы в целом, то есть вероятность того, что численность какого–то состояния будет заключена в определенных пределах. Действительно, так как число модулей N в программной системе велико, то по закону больших чисел можно полагать, что численность k–го состояния приближенно распределено по нормальному закону. И, следовательно, вероятность того, что случайная величина Xk (численность k–го состояния) будет заключена в границах от до , будет выражаться формулой:
, где (x) – функция Лапласа.
2.3.3 Модель для случая N модулей–клиентов
Распространим модель на наиболее часто встречающийся на практике случай, когда каждый модуль–клиент находится в одном из двух состояний: рабочем или нерабочем.о в нерабочем состоянии.
Пусть к серверу может обращаться N клиентов, порождающих N потоков. Каждый поток может находиться в одном из двух состояний:
1 – рабочий;
2 – не рабочий (обнаружена ошибка).
Переход модуля из состояния 1 в состояние 2 происходит под действием потока данных (запросов) с интенсивностью ; среднее время восстановления (обнаружения и исправления ошибки в модуле) модуля равно
.
Составим уравнения динамики средних и решим их при условии, что в начальный момент все модули находятся в рабочем состоянии.
Граф состояний каждого модуля имеет вид, показанный на рисунке:
Рисунок 11 – Граф состояния модуля
где: = N’ так как при исправлении ошибки в одном модуле, ошибка мгновенно исправляется во всех остальных модулях тоже;
m1(t) – среднее число функционирующих модулей в момент времени t;
m2(t) – среднее число не функционирующих программных модулей (потоков) в момент времени t.
Уравнение динамики средних будет:
(0)
И начальное условие m1(0) = N при t = 0.
Учтем, что для любого момента времени t выполняется нормировочное условие, из которого следует что:
(0)
Подставляя (1) в первое уравнение из (10), получим:
Решением этого уравнения будет:
(0)
Из (11) и (12) находим m2(t):
(0)
При t имеем стационарный режим:
;
.
Построим на графике функции m1(t) и m2(t).
Для случая программной системы с большим количеством программ N, будет всегда больше . Это означает, что среднее количество работающих модулей m1 всегда будет больше среднего числа неработающих модулей m2. Причем в этом случае = N’ и при N :
,
Отсюда можно сделать вывод, что чем больше пользователей системы (и чем больше количество потоков N), тем она надежнее или тем быстрее станет надежной.
Рисунок 12 – Графики m1(t) и m2(t)
Определим дисперсию численностей состояний из (9):
Очевидно, что дисперсии численности первого и второго состояния будут одинаковыми: D(t) = D2(t) = D1(t).
При t
График функции D(t) изображен на рисунке:
Рисунок 13 – График D
Например, в стационарном состоянии для N=200, = 2 запроса/сутки и суток получим следующие значения:
– число работающих модулей.
Вообще говоря, для полноты картины в модели нужно учесть, что интенсивность потока ошибок const, и уменьшается со временем, так как количество ошибок в программе уменьшается на единицу с интенсивностью и стремиться к некоторому постоянному уровню. Например,
Вообще, если быть более строгим в рассуждениях, то мы имеем дело фактически с одним объектом, который после каждого исправления становится новым объектом с новым количеством ошибок (не обязательно меньшим) и это говорит о том, что в данной системе нет отсутствия последействия, то есть процесс не пуассоновский, а, следователь:но, и не марковский. Поэтому, вообще говоря, нужно брать процесс Эрланга второй степени и применять метод приведения процесса к марковскому (метод псевдосостояний), описанный в [11]. Этот метод в работе не рассматривается из–за его сравнительной сложности и из–за того, что этим эффектом можно пренебречь при большом количестве состояний клиентов и/или большом количестве программ–клиентов, а также учитывая то предположение, что новый объект (новая программа) появляется мгновенно после исправления в ней ошибки.
2.3.4 Модель для случая const
Итак, процесс работы клиент–серверного ПО зависит от количества исправленных в ней до этого ошибок. То есть от интенсивности потоков событий, переводящих элемент из состояния в состояние, зависят от того сколько элементов было в системе в данном состоянии. Чем большее количество раз ПО было на доработке (исправление ошибок в нем), тем меньше поток ошибок в будущем. Считаем, что ошибки исправляются корректно, то есть при исправлении не вносятся новые ошибки или вносятся, но гораздо реже, чем исправляются. При этом уменьшается интенсивность потока событий, переводящий каждый элемент (модуль или поток или процесс) ПО из состояния «исправен» (работоспособен) в состояние «неисправен».
Предложенный подход позволяет построить достоверную модель численности состояний ПО, исходя из этого предположения. Итак, пусть система S состоит из большого числа N однородных элементов (модулей или потоков одного модуля), каждый из которых может быть в одном из двух состояний:
1 – работоспособен (работает);