Е.С. Вентцель, Л.А. Овчаров - Задачи и упражнения по теории вероятностей (1115276), страница 48
Текст из файла (страница 48)
Можно доказать, что для этих начальных условийМпроцесс накопления информации X(t) будет распределен по закону Пуассона для любого момента времени t и для любого видафункции \(t) (интенсивности поступления информации), но дляэтого интенсивность исключения единиц информации \х должнабыть постоянной.При постоянных Хи|ли£—>оов системе будет устанавливаться стационарный режим накопления информации, который, есте356ственно, не будет зависеть от начальных условий: mx—Dx== х/м,.10.35. Рассматривается процесс производства ЭВМ определенного вида. Интенсивность производства ЭВМ \{t) представленана графике рис. 10.35, а.
Эта интенсивность линейно возрастает втечение первого года производства от 0 до 1000 ЭВМ в год, затемтри года производство сохраняется на уровне 1000 ЭВМ в год, после чего ЭВМ снимается с производства. Средний срок эксплуатации ЭВМ 5 лет. Считая все потоки событий простейшими, определить математическое ожидание и дисперсию числа ЭВМ, находящихся в эксплуатации в любой момент времени tР е ш е н и е .
Интенсивность производства ЭВМ0 при t <0;kt при 0 < * < 1;\(t) =X при 1 < t < 4;0 при t > 4,где к = 1000 1/год2; X = 10001/год.Найдем решения уравнений (10.34.1) и (10.34.2) для участкавремени 0 < t < 1 и при условии, что [л = 0,2 1/год для любых участков t> 0. Уравнение (10.34.1) при этих условиях имеет видdmx(t)dtkt-[imx(t).Решая это уравнение для начального условия гпх(0) = 0, получаемтх(г)=:Л-(е-^- 1 + Mi) = 25000 е-*/5 - 1 + - ]5JПо истечении одного года в эксплуатации будет в среднемтх(1) = 25 000(е~1/5 - 1 + 0,2) = 468 ЭВМ. Заметим, что если быЭВМ имели неограниченный срок службы, то их к концу года было бы в эксплуатации 500 ЭВМ.Уравнение (10.34.2) при тех же условиях имеет видdDx(t) /dt = lOOQfc + 0,2m x (t) - 0,4ц,(ОРешая это уравнение для начального условия Dx (0) = 0, получаем Dx (t) = mx (t) = 25 000 (e~ i/5 - 1 + t / 5). По истечении одного года дисперсия числа ЭВМ, находящихся в эксплуатации, будет равна Dx = 468; ох = 21,6.
Число ЭВМ, находящихся вэксплуатации по истечении года, будет приближенно подчиненонормальному закону с характеристиками тх = 468; ох =21,6.357На участке времени 1 < t < 4 соответствующие уравнения будут иметь видitdtИхнужнорешатьприначальныхусловиях:mx(l) = Dx(1) = 468. Решение этих уравнений было найдено в задаче 10.34, откудаm,(0 = ^ , ( l ) e - , l ( ' - 1 ) + - ( l - e - ^ ' - 1 ) )(1<*<4);М-Dx(t) = mx(t).Найдем значение тх (£) для * = 4:33Ш х (4) = тЛ1)е- ^ + - ( 1 - е - ^ ) = 2513.МТаким образом, среднее число ЭВМ, находящихся в эксплуатации к концу четвертого года выпуска, будет равно 2513. Обратимвнимание на то обстоятельство, что к этому времени было выпуЩ100001123аEfc£fc)&I ^(i)\1 \x2{t) I1 \i3(t)[ik(t)\1 [iM(t)бmx(t)35003000h2500Г2000 h1500 b12 34 5 6 7 8 9вРис.
10.3535810 t, годыщено в среднем 3500 ЭВМ. Следовательно, в среднем за четырегода было исключено из эксплуатации 987 ЭВМ.На участке времени t > 4 будет иметь место процесс «чистойгибели», граф состояний которого показан на рис. 10.35, б.Дифференциальные уравнения для математического ожидания и дисперсии процесса чистой гибели в общем случае имеютвидdmx(t)~— j ^ = - & * ( * ) А (0;dtdD (t)°°dtfcoь*ниеДля нашего случая \ik (t) = k\i, следовательно, получим уравнеdmx(t)= -J2k\ipk(t)= -[imx(t),dtk=oкоторое нужно решать при начальном условии тх (4) = 2513.
Решение этого уравнения будет иметь видm,(*) = m , ( 4 ) e - ^ ' - 4 ) ( t > 4 ) .Так как Dx(4) = тх(4) и р, = const, то Dx(t) = mx(t) на участкевремени t > 4.На рис. 10.35, в показана зависимость mx(t) — среднего числаЭВМ, находящихся в эксплуатации от времени t На этом же графике пунктирной линией показана зависимость от t среднего числа выпущенных ЭВМ к моменту времени t10.36. Рассматривается процесс накопления терминов в динамическом словаре (тезаурусе) при функционировании автоматизированного банка данных (АБД). Сущность процесса в том, чтотермины заносятся в словарь по мере их появления в той информации, которая вводится в АБД.
Например, в АБД автоматизированной системы управления производством (АСУП) могут в качестве терминов заноситься наименования организаций, с которымиданное предприятие поддерживает производственные отношения.Динамический словарь наименований таких организаций будетнакапливаться в АБД АСУП по мере появления этих наименований в единицах информации, вводимых в АБД.В каждой единице информации, поступающей в АБД, в среднем встречается х терминов словаря, а интенсивность поступления единиц информации в АБД \(£). Следовательно, интенсивность потока терминов словаря в информации, поступающей в359АБД, будет Х(£) = х М О - Предполагается, что поток терминовсловаря является пуассоновским.
Число терминов словаря п является конечным и неслучайным, хотя, возможно, и неизвестнымзаранее. Все термины словаря могут находиться в единице информации с одинаковой вероятностью, а в словарь заносятся естественно лишь те термины, которые до сих пор еще не встречались в единицах информации. Требуется найти математическоеожидание и дисперсию числа терминов, накопленных в динамическом словаре.Р е ш е н и е .
Обозначим X{t) число терминов, накопленных вдинамическом словаре. Очевидно, что случайный процесс X(t)есть процесс «чистого размножения» с конечным числом состояний п, граф состояний которого представлен на рис. 10.36. Для нахождения интенсивности \k(t) (к = 0,1,... ,п — 1) введем в рассмотрение гипотезу о том, что процесс находится в состоянии s^н^н\\(t)Х*.^)Ч(*)Vi(*)iРис.
10.36вероятность этой гипотезы по определению равна рк (t). В предположении, что эта гипотеза имеет место, интенсивность потока новых (еще не занесенных в динамический словарь) терминов будет\k(t) = \(t)2—!L=\(t) 1 - П)ПДифференциальные уравнения (10.0.24) и (10.0.25) примутвид:^_£x(o[i-*k(.)-x(.)-2*fil*W i ( ioj*i)к=0£Гпat{п)пк)dt-2mx(t)\(t)(10.36.2)\(t) 1 - - + 2k\{t) 1 h. п)к=оп)к ^ ( * ) = Х ( 0 - М 0 — - 2 \ ( 0 Dx(t)1-ПппНайдем решение этих уравнений для простейшего случая, когдаX (t) = X = const; n = const; mx (0) = Dx (0) = 0,(-Л*(10.36.3)mx(t) = n 1; ]immx(t) = n)/—•оо360Dx(t) = n 1 - е"-Aten= mx(t)e-h" :liml> x (t) = 0.(10.36.4)Обратим внимание на то, что функция тх (t) монотонно увеличивается, стремясь в пределе к п, в то время как функция Dx(t)равна нулю при £ = 0и£—>оои достигает своего максимума принекотором значении tm, которое можно найти из условияdDx{t)/dt = 0(t>0).Отсюда-^„0,5 = е «""' -+tm &0,7п /X.При этом значении tm максимальная дисперсия max Dx(t) «г« п (1 - е - 0 ' 7 ) е - 0 ' 7 = п 0,25; ох (tm ) = 0,5л/^, а максимальное значение коэффициента вариации ох (tm ) / тх (tm ) = 1 / л/ткЕсли известна интенсивность X потока терминов словаря вединицах информации, поступающих в АБД, и общее число терминов га, то можно с достаточной точностью определить среднеевремя £н, потребное для накопления 95 % объема динамическогословаря: 1 - е п " = 0,95, откуда tH « Зга / X.Если п неизвестно (что чаще всего на практике имеет место),то можно найти оценку га величины га следующим образом.
Длямоментов времени т 1? т 2 , т 3 , . . . , тДт,- < т г + 1 ) определяют фактические количества накопленных терминов в словаре mv m 2 ,...,т{. Полагаем эти величины приближенно равными средним количествам накопленных терминов: тг =п (1 - е" Х т , / п )(г = 1, 2,... ,Z).Решая это уравнение относительно га, находим I значений nv га2,...,n/ для соответствующих пар значений: (т1,т1)] ( т 2 , т 2 ) ; .
. . ;( т / > т / )• Оценкуганаходим по формулеU=iJ10.37. Для условий предыдущей задачи найти время £н заполления словаря на 95 % и вероятность того, что через два года посленачала накопления словаря он будет содержать не менее 90 % всехтерминов, если общее число терминов га = 100 000, в год в АБДвводится 100 000 документов и каждый документ содержит всреднем 1,5 термина.Р е ш е н и е . Найдем интенсивность потока терминов словаря вединицах информации, вводимых в АБД:361X = 100000 .1,5 = 150000 1/год.Величина tu определяется из выражения t н = Зп / X == 3-100 000:150 000 = 2 года.
Для определения вероятности того,что через два года после начала наполнения словарь будет содержать не менее 90 % всех терминов, нужно прежде всего найтитх(2) и Dx{2) [см. формулы (10.36.3) и (10.36.4)]: тх(2) == 100 000 х (1-е - 1 ' 5 " 2 ) = 0,95 • 100 000 = 95 000; ДД2) = 95 000-0,05 == 4750; ах (2) = 68,9.Заметим, что максимальная дисперсия Dx(tm) = 0,25n = 25 000;a,(* m ) = 15&Число терминов в словаре в момент времени t = 2 года естьслучайная величина Х(2), приближенно распределенная по нормальному закону с найденными выше характеристиками; поэтомуР{Х(2)>0,9п} « 1 , так как т,,.
-Зах >0,9п.10.38. Рассматривается более общий случай функционирования динамического словаря АБД. Первое усложнение по сравнению с условиями задачи 10.36 состоит в том, что максимальноечисло терминов словаря п не является постоянным, а зависит отвремени t n(t) (в случае с динамическим словарем названий организаций это означает, что общее число организаций со временемизменяется: увеличивается или уменьшается).Кроме того, введенные в динамический словарь термины по истечении некоторого случайного времени исключаются из словаря всвязи с тем, что сам термин устаревает.