1626435387-5d0ec7dd22f55dfcc65f3209f497fb0b (844202), страница 10
Текст из файла (страница 10)
также соотношение (3.16)).Найдем такую плотность fξ (x), для которой дисперсия (4.2) минимальна.УТВЕРЖДЕНИЕ 4.1 (см., например, [9, 13]). Минимальная дисперсия (Dζ)(min) получается в случае, когда плотность fξ (x) пропорциональна модулю подынтегральной функции:1,|g(y)|dyX(min)fξ (x) = fξ(x) = H|g(x)|, где H = R(4.3)и она равна(min)(Dζ)2|g(x)| dx − I 2 .Z=(4.4)XДОКАЗАТЕЛЬСТВО. Соотношение (4.4) получается при прямойподстановке выражения (4.3) в соотношение (4.2) с учетом того, чтоg 2 (x)/|g(x)| = |g(x)|.Далее, используя формулы (4.2) и (4.4), получаем, что величина(Dζ)(min) действительно минимальна, так как для любой плотности57fξ (x) разностьDζ − (Dζ)(min) =−!2Z|g(x)| dxX−I2Xg 2 (x)dx − I 2fξ (x)Xg 2 (x)dx −fξ (x)ZZ=!−2Z|g(x)| dxXнеотрицательна, так как равна дисперсии случайной величины|g(ξ)|/fξ (ξ); здесь, как и ранее, случайный вектор ξ распределен согласно плотности fξ (x).
Утверждение 4.1 доказано.Сформулируем также важное следствие утверждения 4.1 для случаязнакопостоянной подынтегральной функции g(x).УТВЕРЖДЕНИЕ 4.2 (см., например, [9, 13]). Предположим, чтоg(x) ≥ 0 для x ∈ X ⊆ Rd .Еслиfξ (x) = f(min)ξ(x) = Hg(x), где H =1и x ∈ Rd ,I(4.5)(4.6)то (Dζ)(min) = 0.«Оптимальные» плотности (4.3) и (4.6) практически никогда не используются в реальных вычислениях R по той причине, что задача вычисления нормирующей H = 1 X |g(y)| dy из соотношений (4.3) и(4.6) с вычислительной точки зрения эквивалентна (для знакопостоянной функции – полностью совпадает) исходной проблеме вычислениявеличины I из соотношения (4.1).Более того, в случае (4.5)Pn алгоритм (4.1) попросту «вырождается»до тождества I = (1/n) × i=1 I.4.2. Выборка по важности.
Априорная оценка сверху длядисперсии. Несмотря на определенную «критику» плотностей (4.3) и(4.6), из утверждений 4.1 и 4.2 можно все-таки извлечь полезный выводо том, что во многих случаях можно достичь уменьшения трудоемкости S = t × Dζ алгоритма (4.1), выбирая плотность fξ (x) близкой (сточностью до нормирующего множителя H) к функции |g(x)|:fξ (x) ≈ H|g(x)|.(4.7)При таком выборе плотности алгоритм (4.1) называется методомвыборки по важности (см., например, [9, 13]), что соответствуетанглоязычному термину «importance sampling».58Такое название объясняется тем, что если плотность fξ (x) пропорциональна модулю подынтегральной функции g(x), то в тех частяхобласти интегрирования X, где |g(x)| велико, и вклад от которых винтеграл I более существенен, моделируется больше случайных точек{ξ i } (рис. 4.1).Рис.
4.1. К объяснению термина «выборка по важности»Итак, принцип выборки по важности (4.7) позволяет получить алгоритм приближения (4.1) с малой дисперсией весового оценивателяζ. Покажем это для случая (4.5).УТВЕРЖДЕНИЕ 4.3 (см., например, [9, 13]). Предположим, чтов области интегрирования X ⊆ Rd плотность fξ (x) такова, чтоfξ (x) > 0 при x ∈ X и fξ (x) = 0 при x ∈/ X, а также выполненынеравенства0 ≤ m1 ≤ q(x) =g(x)≤ m2 < +∞, x ∈ X; m1 , m2 = const.fξ (x)(4.8)Тогда можно построить следующую верхнюю границу для дисперсииDζ:(m2 − m1 )2.(4.9)Dζ = Dq(ξ) ≤4ДОКАЗАТЕЛЬСТВО. Используя свойства математического ожида-59ния (см., например, [14]), получаемm1 + m2E ζ−222m1 + m2= E (ζ − Eζ) + Eζ −=22m1 + m2+ 2E (ζ − Eζ) Eζ −=22m1 + m2= Dζ + Eζ −.2m1 + m2= Dζ + Eζ −2Тогдаm1 + m2Dζ ≤ E ζ −22≤(m2 − m1 )2.4Здесь мы использовали неравенство m1 ≤ ζ ≤ m2 (ведь ζ = q(ξ) иξ ∈ X) и то обстоятельство, что линейная функцияϕ(t) = t − (m1 + m2 )/2,m1 ≤ t ≤ m2принимает минимальное и максимальное значение в точках t1 = m1 иt2 = m2 (т.
е. в концах отрезка [m1 , m2 ]). Утверждение 4.3 доказано.Отметим, что из условия (4.8) следует соотношение (4.5).Принципу выборки по важности (т. е. соотношению (4.7) дляg(x) ≥ 0) соответствует случай m2 − m1 ≈ 0; при этом m1 ≈ m2 ≈1/H ≈ I.Соотношения (4.8), (4.9) дают возможность строить априорные оценки сверху для дисперсии Dζ при применении принципа выборки по важности (4.1), (4.7) в случае (4.5).Приведем пример применения соображений метода выборки по важности (здесь и далее такие примеры индексируются буквой «Д»).ПРИМЕР 4.1 (Д; 1,5 балла; [13]). Пусть требуется приближенно вычислить четырехкратный интеграл (1) Z 1 Z +∞ Z 1 Z 1 "3(2)πxI=cose−2xx(3) ×20000×arctghx(1) 2 (2)x+ x(3) 3x(4) 460i#dx(1) dx(2) dx(3) dx(4) .(4.10)В качестве плотности fξ (x) рассмотримfξ (x) = fξ x(1) , x(2) , x(3) , x(4) =π=cos2π x(1)2hi h3 i(2)× 2e−2x× 4 x(3)× 1,(4.11)0 < x(1) < 1; x(2) > 0; 0 < x(3) < 1; 0 < x(4) < 1.Тогда функция q(x) = g(x)/fξ (x) имеет видh34 i21.q(x) = q x(1) , x(2) , x(3) , x(4) =× arctg x(1) x(2) + x(3) x(4)4πТак как 0 < arctg u < π/2 для u > 0, то выполнены неравенстваm1 ≤ q(x) ≤ m2 , где m1 = 0 и m2 = 1/8.Имеем I = Eζ = Eq(ξ), где ξ = ξ (1) , ξ (2) , ξ (3) , ξ (4) , причем компоненты ξ (j) , j = 1, 2, 3, 4 являются независимыми случайными величинами.(1)Для моделирования выборочных значений ξi компоненты ξ (1) вектора ξ, несложно получить формулу метода обратной функции распределения:Z0(1)ξi(1) πu πu ξiπcosdu = α1,i , sin2220(1)(1)= α1,i и ξi=2 arcsin α1,i.πПроверка 2.1 для α1,i = 0 дает ξi = (2/π) arcsin 0 = 0, а при α1,i = 1(1)имеем ξi = (2/π) arcsin 1 = 1.Компонента ξ (2) имеет табличное (экспоненциальное) распределение(2.18) с параметром λ = 2 (см.
замечание 2.8), и для моделирования(2)соответствующих выборочных значений ξi следует использовать формулу (2.20).Компонента ξ (3) также имеет табличное (степенное) распределение(2.21) с параметром λ = 3, и для моделирования соответствующих вы(3)борочных значений ξi следует использовать формулу (2.22).Наконец, компонента ξ (4) является стандартной (равномерно распределенной в интервале (0, 1)) случайной величиной.Отсюда получаем следующий алгоритм метода Монте-Карло дляприближенного вычисления интеграла (4.10).61АЛГОРИТМ 4.1. Численно моделируем выборочные значения компонент четырехмерного случайного вектора ξ = ξ (1) , ξ (2) , ξ (3) , ξ (4) поформулам:(1)ξi=2 arcsin α1,i,π(2)ξi=−ln α2,i,2(3)ξi=√4α3,i ,(4)ξi= α4,i ,где i = 1, .
. . , n, и αj,i ∈ U (0, 1); j = 1, 2, 3, 4 – стандартные случайныечисла. Вычисляем приближение интеграла:I≈nih1 X(1) 2 (2)(3) 3 (4) 4arctg ξiξi + ξiξi.4πn i=1Справедливо неравенство:Dζ ≤ (m2 − m1 )2 /4 ≈ 3, 91 · 10−3 .Число в правой части этого неравенства является достаточно малым. Поэтому построенный алгоритм 4.1 является эффективным (экономичным), а выбор плотности (4.11) соответствует принципу выборкипо важности (4.7). Описание примера 4.1 закончено.Из соотношения (4.7) следует, что в качестве плотности fξ (x) целесообразно выбирать классические (чаще всего – кусочно-полиномиальные)приближения модуля подынтегральной функции g(x) видаfξ (x) = HL(M ) |g(x)| = HMXw(m) (g)χ(m) (x).(4.12)m=1Здесь χ(m) (x) – заданные «базисные» функции, согласованные сзаданными узловыми точками {x1 , . .
. , xM }, коэффициенты w(m) (g)зависят от значений g = (|g(x1 )|, . . . , |g(xM )|), а H – нормирующая константа. В этом случае соответствующий алгоритм выборки по важностиможно причислить к дискретно-стохастическим алгоритмам численного интегрирования – см. [9, 17].Здесь возникают требования «моделируемости» приближенияL(M ) |g(x)|, связанные с необходимостью существования эффективногоалгоритма реализации выборочных значений вектора ξ согласно плотности fξ (x).Из соотношения (4.12) следует, что для моделирования вектора ξможно использовать алгоритм метода дискретной суперпозиции (см.62подраздел 11.1 данного пособия). При этом требуется неотрицательность коэффициентов w(m) (g) .
Кроме того, «базисные» функции (m) χ (x) должны быть пропорциональными плотностям распределения случайных векторов, для которых имеются эффективные алгоритмы реализации выборочных значений (подробности см. в подразделе 11.4 данного пособия).Проведенные исследования известных приближений вида (4.12) показали, что требованиям «моделируемости» наилучшим образом удовлетворяет конечно-элементная аппроксимация Стренга – Фикса [18].4.3. Включение особенности в плотность. Возможность выбораплотности вида (4.7) позволяет также обеспечить конечность дисперсии(4.2) при наличии особенностей у подынтегральной функции g(x).ПРИМЕР 4.2. Рассмотрим интегралZ 1Z 1a(x)√ dx,I=g(x) dx =x00где a(x) – непрерывная на [0, 1] функция такая, что a(0) 6= 0.
Подынтегральная функция g(x) имеет особенность (разрыв второго рода внуле).Если в качестве fξ (x) выбрать плотность распределения стандартного случайного числа√ ξ = α (то есть fξ (x) ≡ 1, 0 < x < 1), то оценкаζ (1) = q (1) (ξ) = a(α)/ α имеет бесконечную дисперсию:Z 1 2a (x)Dζ (1) =dx − I 2 = +∞,x0и алгоритм 1.2 неприменим.Однако можно выбрать плотность fξ (x) таким образом, чтобы отношение |g(x)|/fξ (x) (а с ним и дисперсия Dq(ξ)) были ограничены.
Такойприем называют включением особенностив плотность.√Конкретнее, можно взять fξ (x) = 1/(2 x) (соответствующая моделирующая формула метода обратной функции распределения ξ0 = α02 ),и тогда оценка ζ (2) = q (2) (ξ) = 2a(ξ) имеет уже конечную дисперсиюZ 1 2a (x)√ dx − I 2 < +∞.Dζ (2) = 2x0Описание примера 4.2 закончено.Пример 4.2 очередной раз подтверждает тезис, сформулированныйв подразделе 2.8: «удобство» моделирования случайного вектора ξ не63всегда означает эффективность (экономичность) соответствующегоалгоритма 1.2) с оценивателем (монте-карловской оценкой) ζ = q(ξ).Эффективное включение особенностей в плотность возможно также в случае, когда подынтегральная функция включает обобщенныефункции:ZAXI=G(x) gj (x)δ (Yj (x)) dx, A = M ∨ ∞.(4.13)Xj=1Здесь функции gj (x) принимают положительные значения на гиперповерхностях Sj в Rd , определяемых уравнениями Yj (x) = 0.Обозначение δ(u) определяет дельта-функцию Дирака, такую, чтодля любой непрерывной функции y(u) выполнено соотношениеZy(u)δ(u − u0 ) du = y(u0 ).RТаким образом, соотношение (4.13) представляет собой интеграл пообъединению гиперповерхностей Sj .
Как правило, теория «классических» (сеточных) кубатурных формул не дает удовлетворительныхалгоритмов вычисления таких интегралов.Для понимания дальнейших рассуждений целесообразно рассмотреть обобщение теории непрерывных случайных величин, для которогопринципиально понятие случайной величины ξ, распределенной согласно дельта-плотности fξ (x) = δ(x − a) (здесь a = const).Это понятие означает, что с вероятностью единица ξ ≡ a, инымисловами, «обычное» число a трактуется как случайная величина.Такой подход позволяет рассматривать распределения дискретныхслучайных величин как смеси дельта-плотностей (см., например, [9, 13],а также подраздел 10.1 данного пособия).По аналогии с этим подходом и следуя принципу выборки по важности (или методу включения особенности в плотность) для интеграла(4.13) можно рассмотреть допустимую плотность видаfξ (x) =AXpj fj (x) δ (Yj (x))j=1(см., например, [9, 13]).