Советов Б.Я., Яковлев С.А. Моделирование систем (2001) (1186219), страница 55
Текст из файла (страница 55)
Очевидно, что требования получения более хороших оценок и сокращения затрат ресурсов являются противоречивыми и при планировании машинных экспериментов на базестатистического моделирования необходимо решить задачу нахождения разумного компромисса между ними.Из-за наличия стохастичности и ограниченности числа реализаций N в общем случае Ё^Е. При этом величина Е называетсяточностью (абсолютной) оценки:вероятность того, что неравенство|Е-Ё|<е,(6.6)выполняется, называется достоверностью оценки2 = Р{|Е-Ё|<Б}.(6.7)Величина Е 0 =Е/Е называется относительной точностью оценки,а достоверность оценки соответственно будет иметь вид0=Р{|(Е-Ё)/Е|<£ О }.Для того чтобы при статистическом моделировании системыS по заданвым Е (или Е0) и Q определить количество реализацийN или, наоборот, при ограниченных ресурсах (известном N) найтинеобходимые Е и Q, следует детально изучить соотношение (6.7).Сделать это удается не во всех случаях, так как закон распределениявероятностей величины |Е—Ё| для многих практических случаевисследования систем установить не удается либо в силу ограниченности априорных сведений о системе S, либо из-за сложностивероятностных расчетов.
Основным путем преодоления подобныхтрудностей является выдвижение предположений о характере законов распределения случайной величины Ё, т. е. оценки показателяэффективности системы S.Рассмотрим взаимосвязь точности и достоверности результатовс количеством реализаций при машинном эксперименте, когда в качестве показателей эффективности Е выступают вероятность р,математическое ожидание а и дисперсия аг.Пусть цель машинного эксперимента с моделью Мм некоторойсистемы S — получение оценки р вероятности появления р=Р(А)некоторого события А, определяемого состояниями процесса функционирования исследуемой системы S.
В качестве оценки вероятности р в данном случае выступает частость p=m/N, где т — числоположительных исходов.228Тогда соотношение (6.7), связывающее точность и достоверность оценок с количеством реализаций, будет иметь видР {\p-m/N]<E} = Q, Р {p-E<m/N<p+E}=:Q.(6.8)Для ответа на вопрос о законе распределения величины p=mjNNпредставим эту частость в виде p=m/N—(l/N) £ xit так как колиi= lчество наступлений события А в данной реализации из N реализаций является случайной величиной £, принимающей значения х 1 = 1с вероятностью р и х2=0 с дополнительной вероятностью 1— р.Математическое ожидание и дисперсия случайной величины £, будуттаковы:М[^] =х1р+х2(1-р)=1р+0(1-р)=р;D№ =(x1-M)[Z\)2P+(x2-M№(l-p)=(l-p)2p++(0-p)i(l-p)=p(l-p).ТогдаM\p\ = M[mlN\ = (llN)M\ % xA =(\/N)NM[^p.Это соотношение говорит о несмещенности оценки р для вероятности р.
С учетом независимости значений величин х, получимВ Й = Д [ т ^ = (1/^)/) Г £ х,1=(1/Л*ДОК]=р(1-/0/МВ силу центральной предельной теоремы теории вероятностей[или ее частного случая — теоремы Лапласа, см. (4.8)] частостьm/N при достаточно больших N можно рассматривать как случайную величину, описываемую нормальным законом распределениявероятностей с математическим ожиданием р и дисперсиейр(\ —p)/N. Поэтому соотношение (6.8) с учетом (4.8) можно переписать так:Р {,-.<=<,+.ЦФ.
(^L{NJWPQ-P)0А-ФОJto.\y/p(i-p)^W)Учитывая, что Ф0 (—z) = 1 — Ф0 (z), получим2Ф0 (в VX/VP^P)^1 + Ql Фо(е y/N/y/p(l-p))= (l + 0 / 2 = q>.Тогдав л/ЛГ/л//>(1-/») = /„229где t9 — квантиль нормального распределения вероятностейпорядка р=(1 + 0 / 2 ; находится из специальных таблиц [18, 21].В результате точность оценки р вероятности р можно определить какe = t9Jply^)iN,т. е. точность оценки вероятностей обратно пропорциональнау/Й.Из соотношения для точности оценки е можно вычислить количество реализацийN=tlp(l-p)lE2,(6.9)необходимых для получения оценки р с точностью е и достоверностью Q.Пример 6.7.
Необходимо рассчитать количество реализаций N при статистическом моделировании системы S, когда в качестве показателя эффективности используется вероятность р при достоверности (2=0,95 (Гф = 1,96) и точности £=0,01; 0,02;0,05. Так как значения р до проведения статистического моделирования системы5 неизвестны, то вычислим множество оценок JV ДЛЯ диапазона возможных значенийр, т. е. от 0 до 1, с дискретом 0,1. Результаты расчетов с использованием выражения(6.9) представлены в табл.
6.4. Из таблицы видно, что при переходе от р**0,1 (0,9)к ,р=0,5 количество реализаций N возрастает примерно в три раза, а при переходе от£=0,05 к £=0,01 количество реализаций N возрастает примерно в 25 раз [4].Таблица 6.4Вероятностьр0,10,20,30,40,5(0,9)(0,8)(0,7)(0,6)0,5)0,05140250330380390Точность я0,0290015002100230024000,0136006200840094009800При тактическом планировании машинного эксперимента, когдарешается вопрос о выборе количества реализаций N, значение р неизвестно.
Поэтому на практике проводят предварительное моделирование для произвольно выбранного значения N0, определяютp0=mlNQ, а затем по (6.9) вычисляют, используя вместо р значениеPq, необходимое количество реализаций N. Такая процедура оценкиN может выполняться несколько раз в ходе машинного эксперимента с некоторой системой S.При отсутствии возможности получения каких-либо априорныхсведений о вероятности р использование понятия абсолютной точности теряет смысл.
Действительно, можно, например, предварительно задать точность результатов моделирования е = 0,01, а искомая р в результате окажется хотя бы на порядок ниже, т. е./?<0,001. В таких случаях целесообразно задавать относительную230точность результатов моделирования е0. Тогда соотношение (6.9)примет видN=tlp(l-p)/(ph2Q) = tl(l-p)Kelp).(6.10)Соотношение (6.10) наглядно иллюстрирует специфику статистического моделирования систем, выражающуюся в том, что дляоценивания малых вероятностей р с высокой точностью необходимо очень большое число реализаций N.
В практических случаях дляоценивания вероятностей порядка 10~ целесообразно количествореализаций выбирать равным 10 . Очевидно, что даже для сравнительно простых систем метод статистического моделированияприводит к большим затратам машинного времени.Другим распространенным случаем в практике машинных экспериментов с моделью Мм является необходимость оценки показателей эффективности Е системы S по результатам определениясреднего значения некоторой случайной величины. Пусть случайнаявеличина £, имеет математическое ожидание а и дисперсию с2.В реализации с номером i она принимает значение х,.
В качествеоценки математического ожидания а используется среднее ариф_Nметическое x=(l/N) £ х,.В силу центральной предельной теоремы теории вероятностейпри больших значениях N среднее арифметическое х будет иметьраспределение, близкое к нормальному с математическим ожиданием а и дисперсией a2/N. Для математического ожидания а точностьоценки E=t9a/y/N, а количество реализацийN= фг2/е2, или N= 1\еЦг\аг).(6.11)Аналогично, если в качествепоказателя эффективности Е систе2мы S выступаетдисперсияа,ав качестве ее оценки используетсявеличина S2, то математическое ожидание и дисперсия соответственно будутM[S2] = (N-l)a2/N;D[S2]=(ji^-^)/N,где цА — центральный момент четвертого порядка случайной величины.Для дисперсии а2 точность оценки E=t(fl •>J(ji4, — o*)jN.Отсюда количество реализаций будетN=t*(nt-a*)/t2,или N=tl[(nJa*)-\]/e%.(6.12)Для частного случая, когда случайная величина имеет нормальное распределение ц4.
= 3а4; получим N —l\2air\г2=2t2^&\.Таким образом, на основании соотношений (6.9) — (6.12) можно231сделать вывод, что количество реализаций при статистическом моделировании существенно зависит от дисперсии оцениваемой случайной величины. Поэтому выгодно выбирать такие оцениваемыепоказатели эффективности Е системы S, которые имеют малыедисперсии.Проблема уменьшения дисперсии оценок характеристик процессафункционирования моделируемых систем. Таким образом, с проблемой выбора количества реализаций при обеспечении необходимойточности и достоверности результатов машинного экспериментатесно связана и третья проблема, а именно проблема уменьшениядисперсии.
В настоящее время существуют методы, позволяющиепри заданном числе реализаций увеличить точность оценок, полученных на машинной модели Мм, и, наоборот, при заданной точности оценок сократить необходимое число реализаций при статистическом моделировании. Эти методы используют априорную информацию о структуре и поведении моделируемой системы. S и называются методами уменьшения дисперсии.Рассмотрим в качестве иллюстрации метод коррелированныхреализаций (выборок), используемый в задачах сравнения двух илиболее альтернатив. При исследовании и проектировании системыS всегда происходит сравнение вариантов Sh z=l, к, отличающихсядруг от друга структурой, алгоритмами поведения и параметрами.Независимо от того, как организуется выбор наилучшего варианта системы S (простым перебором результатов моделированиясистемы Si или с помощью автоматизированной процедуры поиска), элементарной операцией при этом является равнение статистически усредненных критериев интерпретации [18, 21, 29, 33, 53].Сравниваемые статистические показатели Е, вариантов моделируемой системы Sh i = l , к, полученные на машинной модели Мм,можно записать в виде средних значений E,—M[q], i—l, к, критериев г},, характеризующих систему S„ или в виде средних значенийфункции этих критериев fj(ql), /=1—, k,j=\, L.