Разработка математических моделей оценки рисков на основе малых выборок экспертных оценок (1187421), страница 5
Текст из файла (страница 5)
Такой выборпозволяет разделить интервал (a,b) на N+2 интервала, что помогает вгруппировке близких друг к другу оценок.Другими словами, если уэкспертов схожее мнение, то при таком разбиении оценки с большейвероятностью попадут в один интервал разбиения. В самом худшем случаемы можем получить равномерное распределение точек, когда каждая34оценка вносит вклад только в свой интервал. Но даже в этом случаеполучается распределение с явновыраженной модой(cм. рис 4).Рис.4 Плотность распределения для оценок 6.0, 6.4, 6.8Если же имеется группа близких друг к другу оценок, то на некотороминтервале плотность будет существенно выше(см.
рис 5):Рис.5 Плотность распределения для оценок 5.7, 6.6, 6.7, 6.8354.3. Получение агрегированного значения рискаВернемся теперь к исходной задаче(см. 4.1). Мы получили оценкудля как плотности распределения некоторой случайной величины,характеризующей оценки экспертов о величине ожидаемого ущербарискового события i. Таким же способом может быть получена и оценкадля , однако это не единственный способ.
Плотность распределения для может быть выражена, например, через распределение Пуассона, какколичество рисковых событий произошедших за определенный временнойпромежуток .Таким образом величина покажет ожидаемуювеличину потерь за время . Нужно учитывать, что подобная информацияне всегда доступна и известна, поэтому для оценки величины можновоспользоваться предложенным выше методом экспертных оценок.Теперь остается получить итоговую оценку .Будем исходитьиз предположения, что и случайные величины с известнымираспределениями.Будем искать величину через плотностьраспределения произведения двух случайных величин.
Для нахожденияэтой оценки существуют несколько способов:∙ Аналитический метод∙ Метод Монте-Карло4.3.1. Аналитический методРассмотрим аналитический способ получения функции плотностираспределения.Если имеются две случайные величины X и Y сопределяемыми плотностями распределения и , то плотностьпроизведения = , можно найти по формуле:∞Z () = () (/)−∞1||(4.3.24)36В нашей задаче мы работаем кусочно-заданными функциями плотностираспределения. Такую функцию можно переписать в виде: () = 1 ,1 () + 1 ,1 () + · · · + , ()⎧⎪⎨ , ∈ ( ; ) , () =⎪⎩0, ̸∈ ( ; ) (4.3.25)(4.3.26)Тогда выражение 4.3.24 примет вид:Z[︃ Z∑︁∑︁∑︁⃒⃒⃒ 1 ⃒|| ⃒]︃1 =||=1=1=1∈( , )⃒⃒[︃ ]︃[︃]︃⃒ ⃒ ∑︁∑︁∑︁∑︁ ⃒⃒== [ ] ⃒(4.3.27) [ ]⃒⃒ ⃒ () ==1 (/)=1∈Δ *Δ=1=1∈Δ *Δгде ∆ * ∆ - декартово произведение интервалов ( ; ) и ( ; ).Если предположить,что одна из случайных величин имеетраспределение Пуассона ( () =− Γ() )с параметром , тогда выражение4.3.24 можно переписать в следующем виде:ZZ () =∑︁=1 (/)1 =||∑︁=1− 1 =Γ() ||(4.3.28)Чтобы вычислить интеграл из 4.3.28, нужно использовать числовыеметоды, что увеличивает трудоемкость задачи.4.3.2.
Метод Монте-КарлоДля того чтобы избежать вычисления сложных интегралов принахождении функции плотности распределения по формуле 4.3.24,можно воспользоваться числовыми методами, а в частности методомМонте-Карло.Так как мы знаем плотности распределения случайных величин X иY, то можем сгенерировать сколь угодно большую выборку для каждой37из них, затем выполнить попарное перемножение и построить плотностьраспределения произведения по результирующей выборке.Для кусочно-непрерывного распределения будем генерировать выборкуследующим образом.
Предположим, что размер выборки равен = 106 .Вероятность того, что случайная величина примет значение из интервала( , ) равнаZ , () = ( − ) () =(4.3.29)Таким образом,чтобы получить выборку с заданной плотностьюраспределения 4.3.25, для каждого интервала ( , ) нужно с помощьюгенератора псевдослучайных чисел получить = чисел.В итогеполучится репрезентативная выборка из N элементов.Далее нужно получить выборку такого же размера для случайнойвеличины Y и произвести попарное перемножение.384.4.
Программная реализацияДля реализации предложенного алгоритма была написана программа,которая принимает на вход оценки, а на выходе строит графики дляэмпирических плотностей распределения и для плотности произведения.Например, предположим что заданы оценки от экспертов величиныущерба 7.6,7.7, 8.5, 8.6, 8.7, 8.8 и вероятности рискового события: 0.55, 0.60,0.84, 0.86, 0.87, 0.90.Рис. 1 Оценка плотности распределения ущербаОценка для плотности распределения ущерба представлена нарисунке 1.На этом же графике построена плотность нормальногораспределения по выборочному среднему и выборочной дисперсии. Видно,что если имеется явное разделение мнений(многомодальность), то оценкапри помощи гауссианы не является корректной.39Рис.
2 Оценка плотности распределения вероятностиЕсли предположить, что и для оценки вероятности имеется некотороеразделение мнений(рисунок 2), то построенная оценка будет существенноотличаться от нормального распределенияРис. 3 Агрегированная оценкаПостроенную оценку плотности, можно использовать, например, дляполучения доверительных интервалов.В 3.2.2 предлагается строитьдоверительный интервал для математического ожидания, где леваяи правая границы интервала вычисляются как − 3 и + 340соответственно, следуя правилу трех сигм [14].
Если оценки заданы черезвещественные числа, для вычисления математического ожидания можновоспользоваться выборочным средним:1 ∑︁¯= =1.(4.4.30)Такая оценка является состоятельной при → ∞.Если жеколичество оценок невелико, то выборочное среднее, даже при известномтипе распределения, может существенно отличаться от математическогоожидания.Выборочная дисперсия также не может являться точной оценкой,потому как при вычислении используется выборочное среднее:1 ∑︁¯¯ 2=( − ) − 1 =1(4.4.31)Для построения оценок для математического ожидания и дисперсии,лучше воспользоваться их формальными определениями:+∞Z [] = ()(4.4.32)( − [])2 ()(4.4.33)−∞+∞Z[] =−∞Докажем, что построенная агрегированная оценка является болееточной, чем оценка через выборочное среднее.Для этого проведемчисленный эксперимент. Будем генерировать выборки различного размераи вычислять математическое ожидание и дисперсию при помощи формул4.4.30, 4.4.31 и 4.4.32, 4.4.33.
Далее вычисляем ошибку в сравнении систинным значением момента случайной величины. Эксперимент нужнопровести достаточно большое число раз и затем усреднить полученнуюошибку. Результаты представлены в таблице 1.41N345678910111213¯ 0.135 0.116 0.103 0.095 0.087 0.082 0.077 0.072 0.069 0.066 0.064˜ 0.102 0.093 0.086 0.081 0.077 0.073 0.070 0.066 0.064 0.062 0.059¯ 0.100 0.077 0.063 0.054 0.048 0.044 0.040 0.037 0.035 0.033 0.032˜ 0.048 0459 0.042 0.040 0.037 0.036 0.034 0.033 0.031 0.030 0.029Table 1. Сравнение оценок для математического ожиданияВидно, что при уменьшении элементов в выборке оценка для математическогоожидания и для дисперсии точнее, чем при построении через выборочноесредние.Более того предложенный метод,позволяет получитьсостоятельные оценки, потому как при неограниченном увеличенииразмера выборки, оценка для матожидания и дисперсии сходится кистинному. На рисунке 4 и 5 показано, насколько ошибка выборочногосреднего больше ошибки при построении через функцию распределения.Рис.
4 Функция разницы ошибок для мат. ожидания42Рис. 5 Функция разницы ошибок для дисперсииМожно также построить сравнительный график ошибки двух методовдля математического ожидания и дисперсии(рисунок 6,7):Рис. 6 Сравнение ошибок для мат. ожидания43Рис. 7 Сравнение ошибок для дисперсииНа графиках 6,7 синяя линия иллюстрирует ошибку для предложенногометода, красная для оценки через выборочное параметры.Видно,что оценка построенная через плотность распределения является болееустойчивой при уменьшении N и для математического ожидания и длядисперсии, причем для второго момента различие довольно существенное.445.
ЗаключениеВ работе предложен метод, который позволяет по небольшомуколичеству экспертных оценок получить величину агрегированного ущербаили риска. Основные преимущества данного метода:∙ Метод находит оценку на основе малой выборки в среднем лучше,чем оценка через выборочные параметры∙ Метод позволяет учитывать априорную информацию∙ Метод "распознает" моды в выборке∙ Метод работает без предположений о типе распределенияКроме того, в изложенном методе имеются дополнительные возможностидля оптимизации:∙ Функция ядра в 4.2.10 может быть выбрана оптимальным образом взависимости от количества элементов, параметров и . Однако дляэтого необходимо делать предположения о типе распределения. Ядропрямоугольной формы может быть интерпретировано как априорнаяоценка от эксперта как интервал изменения оцениваемой величины.∙ Параметры и также могут быть подобраны при помощивычислительного эксперимента для выборок из различных типовраспределенийТакие оптимизации позволят получить еще более точную оценку,несмотря на то, что предложенный алгоритм показывает результатылучше, чем оценка, полученная при помощи параметрического метода.45Список литературы1.A Guide to the Project Management Body of Knowledge:PMBOK(R) Guide 5th Edition.