Разработка математических моделей оценки рисков на основе малых выборок экспертных оценок (1187421), страница 4
Текст из файла (страница 4)
. оценки M экспертов о вероятности рискового события. Требуется длязаданного уровня доверия получить агрегированную оценку величиныриска как произведение = * , где - некоторая усредненнаяоценка ожидаемых потерь, - вероятность этого события. Будем считать,что оценки и являются некоторыми вещественными числами, ипотребуем, чтобы было представлено в виде некоторой функциираспределения.4.2. Получение агрегированной оценки величины ущербаПредположим, что у нас есть некоторая выборка 1 . . .
оценок отэкспертов i-го рискового события. Будем искать агрегированную оценкув форме некоторой функции плотности распределения. Восстановлениетеоретической модели распределения вероятностей, которой соответствуютвыборочные данные — представляет собой основную задачу математическойстатистики. Если закон распределения, которому соответствует выборкабыл бы известен, никаких бы трудностей с получением оценок параметров,а также их доверительных интервалов не возникало.Однако, такаяситуация практически невозможна в данной задаче.Вместе с тем,ситуации, когда закон распределений известен лишь отчасти, например,исходя из каких-либо априорных сведений о природе данных, вполнераспространены.
В этом случае, как правило, предполагается, что законраспределения описывается функцией (или плотностью) распределения25определенного вида, зависящей от одного или нескольких параметров.Если это так, то основная задача статистики сводится к получениюнаиболее точных оценок этих неизвестных параметров. Таким образом,имеет место параметрическая задача оценки (функции плотности)распределения.Если же характер распределения, которому принадлежат выборочныеданные достаточно сложен, а априорные сведения о нем отсутствуют, тодля решения этой задачи можно использовать два подхода: использоватьдостаточно общие модели распределений, зависящие от параметров, илинепараметрические методы оценки распределений.Непараметрические методы являются более общими, чем параметрические,потому что не используют априорную информацию о функциональномвиде восстанавливаемого теоретического распределения. Дополнительноезнание, пусть даже некоторой общей информации о типе распределения, томожно сказать что параметрические методы обладают большей точностью,если априорные предположения о виде распределения верны.В нашей задаче будем считать, что априорных знаний о типераспределения оценок у нас нет, поэтому будем использовать непараметрическиеметоды.
Будем также предполагать, что количество экспертов невелико.Так как информация, заложенная в малой выборке, ограничена, тодля повышения эффективности оценивания необходимо привлекатьдополнительную информацию, которая содержится в априорных данныхо случайной величине. В качестве таких данных может выступать:∙ интервал (, ) изменения X, т.е. : ∈ (, )∙ характеристики случайной величины такие как мат. ожидание , идисперсия ∙ класс распределения с точностью до неизвестного параметра 26В нашей задаче мы можем заранее определить некоторый интервализменения случайной величины, потому что мы оцениваем реальныевеличины, которые имеют некоторые физические ограничения. Например,ущерб не может быть отрицательным или больше некоторого достаточноразумного значения.
Моменты случайной величины и класс распределениянам обычно неизвестно.Запишем оцениваемую функцию плотностираспределения в следующем виде: () = 0 () + * ()(4.2.1)где 0 () априорная компонента и * () эмпирическая компонента,построенная по выборке экспертных оценок.4.2.1. Эмпирическая плотность распределенияБудем искать состоятельную, несмещенную и эффективную оценкуплотности распределения. Для построения искомой функции воспользуемсятеоремой о том, что любую кусочно-непрерывную функцию () наинтервале действительной оси можно представить в виде:Z () = ()(, )(4.2.2)(, ) = lim (, )(4.2.3)где (, ) - дельта функция в точке ;(, ) - дельтообразная→∞последовательность данной точки являющейся центром интерваладлиной 2Дельтообразная последовательность функций может использоватьсядля аппроксимации кусочно-непрерывной функции:Z* () ≈ () = () (, )(4.2.4)27Если функция (, ) непрерывна по аргументам и , то функция * () является непрерывной иZ*lim () = lim→∞ () (, ) = ()→∞(4.2.5)Заменим дискретный параметр на непрерывный ≥ 0 и будемрассматривать дельтообразную функцию трех переменных (, , ), длякоторой справедливо соотношение:(, ) = lim (, , )→∞(4.2.6)Примером подходящей дельтообразной функции может служитьфункция определяемая выражением:(, , ) = ()[−1( − )2 ]22(4.2.7)Из условия нормировки для (, , ) получаем:∞Z(︂() =)︂−11 2[− ]2(4.2.8)−∞Аппроксимацию кусочно-непрерывной функции () можно осуществитьконечным рядом функций (, , ).
Для этого определим значения ()в точке = c окрестностью ∆. В соответствии с 4.2.5 для ∈ [ −Δ2 , +Δ2 ]]получаем: () ≈ * () = ()(, , )∆Обозначим ( )∆=(4.2.9)∆ , тогда итоговое выражение дляаппроксимации можно записать в виде:*=∑︁* ( ) ==1∑︁(, , )∆(4.2.10)=1При этом* ≡ 0, ̸∈ [ −∆∆, +], = 1, 2, . . . , 22(4.2.11)28Будем считать, что если искомая плотность распределения вероятностей () - хотя бы кусочно-непрерывная на интервале U, то формально дляпостроения * () по реализациям можно использовать выражение4.2.11.Таким образом,оценка * () может быть представлена каклинейная сумма дельтообразных функций (, , ), определенных нареализациях случайной величины, каждая из которых представляетсобой "элементарную" -плотность в некоторой окрестности .показано что в качестве можно принятьΔ2 ,В [5]т.е.
в качестве непрерывногопараметра дельтообразной функции принимается половина интервала ееобласти определения. Тогда обозначая ∆ = и (, , ) = () (, ),получаем эмпирическую оценку плотности в следующем виде:* ()= ()∑︁ (, )(4.2.12)=1Из условия нормировки для функции плотности распределения получаем:(︂ Z() =)︂−1 (, )−Рис.1 Эмпирическая плотность распределения(4.2.13)29Рассмотрим получение эмпирической функции плотности распределенияна конкретном примере.Пусть в результате экспертного оцениванияполучены оценки от трех экспертов: 8,0; 8,2; 8,8. Оценим эмпирическуюплотность, описывающую агрегированное мнение экспертов.
Положим, = 1/ = 1/3, = 0.4, а ядро:⎧⎪⎨1, ∈ ( − ; + ) (, ) =⎪⎩0, ̸∈ ( − ; + )(4.2.14)Тогда по формуле 4.2.13 :(︂ 0,4Z)︂−1 (, )() ==1= 1, 250, 8(4.2.15)−0,4Просуммировав ядра (, ) для всех i, с амплитудами 1,25 и весами 1/3,получаем:⎧⎪⎪⎪0, 41, ∈ (7, 6; 7, 8)⎪⎪⎨* () = 0, 83, ∈ (7, 8; 8, 6)⎪⎪⎪⎪⎪⎩0, 41, ∈ (8, 6; 9, 2)(4.2.16)30Рис.2 Итоговая эмпирическая плотность распределенияНетрудно убедиться, что для построенной функции достаточнохорошо выполняется условие нормировки.4.2.2. Полная оценкаПри наличии априорной информации мы можем улучшить получившуюсяэмпирическую оценку.Для этого нужно понять как априорнаяинформация влияет на итоговый результат.Будем считать, что чембольше у нас точек в выборке, тем больше вклад эмпирической оценкив итоговую, т.е.при бесконечном увеличении N, вклад апориорнойкомпоненты стремится к нулю.
Тогда итоговую оценку можно переписатьв виде: * () = 0 () + (1 − )* (),(4.2.17)31где =1 +1Случай, когда = 0 соответствует полному отсутствиюаприорных данных, что имеет место при традиционном подходе к анализувыборок.Предположим, что нам известен интервал изменения итоговойвеличины ущерба (, ). Тогда в качестве априорной компоненты оценкиможно рассматривать функцию равномерного распределения:⎧⎪⎨ 1 , ∈ (, )−0 () =⎪⎩0, ̸∈ (, )(4.2.18)Рассмотрим теперь получение итоговой оценки на примере. Предположим,что у нас есть оценки от трех экспертов: 8,0; 8,2; 8,8 и достоверноизвестно, что интервал изменения ущерба [6,0; 10,0]. Если рассматриватьпрактические ситуации, то верхний и нижний пределы интервала могут,например, описывать минимальные и максимальные размеры штрафов,формально закрепленных в законодательных актах.Примем, что = 1/ = 1/3, = 1/( + 1) = 1/4, а =1 +2 ( − )=0, 8.
Априорную компоненту находим по формуле 4.2.18:0 () =11== 0, 25; ∈ (6, 0; 10, 0) − 10 − 6(4.2.19)Теперь строим * (). Вычисляем амплитуду () по формуле 4.2.13:(︂ 0,8Z() =)︂−1 (, )=1= 0, 6251, 6(4.2.20)−0,8Тогда эмпирическая плотность распределения принимает следующий вид:⎧⎪⎪⎪0, 21, ∈ (7, 2; 7, 4)⎪⎪⎪⎪⎪⎪⎪0, 42, ∈ (7, 4; 8, 0)⎪⎪⎨* () = 0, 63, ∈ (8, 0; 8, 8)(4.2.21)⎪⎪⎪⎪⎪⎪0, 42, ∈ (8, 8; 9, 0)⎪⎪⎪⎪⎪⎪⎩0, 21, ∈ (9, 0; 9, 6)32Вычисляя полную оценку по формуле 4.2.17 получаем:⎧⎪⎪⎪0, 06, ∈ (6, 0; 7, 2)⎪⎪⎪⎪⎪⎪⎪0, 22, ∈ (7, 2; 7, 4)⎪⎪⎪⎪⎪⎪⎪0, 38, ∈ (7, 4; 8, 0)⎪⎪⎨ * () = 0, 54, ∈ (8, 0; 8, 8)⎪⎪⎪⎪⎪⎪0, 38, ∈ (8, 8; 9, 0)⎪⎪⎪⎪⎪⎪⎪0, 22, ∈ (9, 0; 9, 6)⎪⎪⎪⎪⎪⎪⎩0, 06, ∈ (9, 6; 10.0)(4.2.22)Рис.3 Итоговая плотность распределенияЛегко проверить, что построенная плотность распределения с достаточнойточностью удовлетворяет условию нормировки.Таким образом, мы построили плотность распределения по выборкес тремя экспертными оценками, представленными всего одним числовым33параметром, но с учетом, однако, некоторых априорных знаний о ширинеоцениваемого интервала.Если нам неизвестен априорный интервал изменения случайнойвеличины, то для его построения можно воспользоваться правилом трехсигм [14], что позволит построить более качественную оценку (с точкизрения попадания наблюдений в реальный интервал).
Т.е. для построенияинтервала нужно определить выборочную дисперсию:1 ∑︁¯ 2 =( − ) − 1 =12(4.2.23)¯ - выборочное среднее. Тогда интервал для левой границы интервалагде ¯ − 3, а правой ¯ + 3.можно принять значение К недостатку вышеизложенного метода можно отнести неопределенностьс параметром , т.е.шириной области определения дельта функции.В [5] проведено статистическое исследования с целью определенияоптимального значения параметра, но только для некоторых известныхтипов распределений(нормального, экспоненциального).
Если не вводитьтип распределения, то можно наложить на параметр ряд ограничений.Понятно, что параметр зависит от области определения функции,поэтому можно переписать его в виде = ( − ) . Тогда:∙ ≤ |1 − |∙ lim →∞ = 0В примере 2 использовалась функция = 1/( + 2).