Ю.В. Прохоров, Л.С. Пономаренко - Лекции по теории вероятностей и математической статистике (1115359), страница 17
Текст из файла (страница 17)
Пусть H(x) ∈ H , {Yn } — последовательность случайных величин, для которой характеристические функции сходятся кхарактеристической функции случайной величины Yf (t; Yn ) → f (t; Y )равномерно в каждом конечном интервале. ТогдаEH(Yn ) → EH(Y ) .Замечание 2. На самом деле утверждение теоремы выполняетсядля более широкого класса функций H(x) – непрерывных и ограниченных. Нам же эта теорема понадобится только для случайной величиныZ ∼ N (0, 1) , поэтому доказательство проведем только для H(x) ∈ H.Доказательство.Z∞EH(Yn ) − EH(Z) =2h(t) f (t; Yn ) − e−t /2 dt = I1 + I2 + I3 ,−∞111где интегралы I1 , I2 , I3 берутся соответственно по промежуткам[−T, T ], (−∞, −T ], [T, ∞) . Оценим каждый из них по отдельности. Выбор константы T произведем позднее.2|I1 | ≤ 2T Ah sup f (t; Yn ) − e−t /2 ,|t|≤Tгде Ah = supt h(t) ,Z−T|I2 | ≤Z∞|I2 | ≤h(t)dt ,−∞h(t)dt .TТаким образом получаем|EH(Yn ) − EH(Z)| ≤ |I1 | + |I2 | + |I3 | .Поскольку h(t) — абсолютно интегрируемая на всей прямой функция, тодля ∀ε > 0 существует T = T (ε, h) такое, что|I2 | + |I3 | < 2ε/3 .Оставшееся слагаемое2|I1 | ≤ 2T (ε, h)Ah sup f (t, Yn ) − e−t /2 |t|≤Tи его можно сделать меньше, чем ε/3, выбрав n достаточно большим,так как существует n0 такое, что для всех n ≥ n0ε2.sup f (t, Yn ) − e−t /2 <6T Ah|t|≤TСледовательно, EH(Yn ) → EH(Z) для всех функций H(x) ∈ H.Покажем теперь, что аналогичное утверждение верно не только дляфункций из H.
Рассмотрим функцию I[c,d] (x) — индикатор произвольного отрезка [−1, 1] . Такие функции можно приближать функциями изкласса H.А именно для малых δ > 0 (см. рис.11.1) существует Hδ+ (x) ∈ Hтакая, чтоHδ+ (x) ≥ I[c,d] ,Hδ+ (x) = 0для всех x ∈/ [c − δ, d + δ] .ТогдаP{c ≤ Yn ≤ d} = EI[c,d] (Yn ) ≤ EHδ+ (Yn ) .112Рис. 11.1:Переходя к пределу при n → ∞, получимlim sup P{c ≤ Yn ≤ d} ≤ lim sup EHδ+ (Yn ) = lim EHδ+ (Yn ) =n→∞n→∞n→∞= EHδ+ (Z) ≤ EI[c−δ,d+δ] (Z) .Следовательно,Zd+δZdZcZd+δlim sup P{c ≤ Yn ≤ d} ≤ϕ(x)dx ≤ ϕ(x)dx+ ϕ(x)dx+ ϕ(x)dx ≤n→∞cc−δZd≤c−δd1ϕ(x)dx + √ 2δ .2πcУстремив теперь δ → 0+, получимZdlim sup P{c ≤ Yn ≤ d} ≤ϕ(x)dx = P{c ≤ Z ≤ d} .n→∞cАналогичным образом, выбирая Hδ− (x) ∈ HРис. 11.2:(см.
рис.11.2) такую, чтоHδ− (x) = 0для всех x ∈/ [c, d] ,113Hδ− (x) ≤ I[c,d] ,получим, чтоlim sup P{c ≤ Yn ≤ d} ≥ P{c ≤ Z ≤ d} .n→∞Итак, доказана следующая2 /2Теорема 11.6. Если f (t, Yn ) ⇒ e−t, то для любого отрезка [c, d]lim P{c ≤ Yn ≤ d} = P{c ≤ Z ≤ d} .n→∞11.5Примеры слабой сходимости последовательностей характеристических функцийРассмотрим сначала на примерах, как можно установить сходимость характеристических функций.Пример 11.11. Пусть X1 , X2 , . .
. — независимые случайные величины,принимающие значения 1 и (-1) с вероятностями 21 c характеристическойфункцией f (t, Xk ) = cos t, EXk = 0 . DXk = 1. Тогда для нормированSnимеемной суммы Sn∗ = √nttf (t, Sn∗ ) = f ( √ , Sn ) = cosn ( √ ) .nnПри оценке близости характеристических функций воспользуемся простой, но полезной леммой.Лемма 11.3. Если |α| ≤ 1,|β| ≤ 1, то|αn − β n | ≤ |α − β|nдля любого натурального n.Воспользовавшись неравенством леммы 3, получим t2t2 ttn∗−t2 /2 − 2nn− 2nf (t; Sn ) − e = cos ( √ ) − (e ) ≤ n cos( √ ) − e .nnПоскольку |t| ≤ T, n → ∞, то необходимо уметь оценивать эту разностьлишь в малой окрестности 0. Воспользуемся конкретными свойствамифункций:cos u = 1 −u2 u4u2n+− · · · + (−1)n+ Rn (u),24!(2n)!114причем остаток Rn (u) не превосходит по модулю первого отброшенногочлена в разложении Тейлора и имеет знак первого отброшенного члена;e−u = 1 + u +unu2 u 3−+ · · · + (−1)n + Qn (u) ,2!3!n!где остаток Qn (u) обладает аналогичным свойством для всех u > 0.
Такое свойство рядов Тейлора называют свойством "обертывания". Следовательно,u4u2,0 ≤ cos u − (1 − ) ≤24!−u0≤eu2− (1 − u) ≤,2и, значит, 2 2tt2t10 ≤ cos( √ ) − (1 − ) ≤,2nn24n 2 2t2t2t1− 2n− (1 − ) ≤0≤e.2n2n 2Таким образом для всех t имеем44t2 tcos( √ ) − e− 2n ≤ t ( 1 + 1 ) = t . n2 24 86n2nСледовательно, для всех |t| ≤ T|f (t; Sn∗ )−t2 /2−et2 tT4− 2n| ≤ n cos( √ ) − e ≤→06nnравномерно в каждом конечном интервале.Пример 11.12. Пусть A1 , A2 , . . .
— последовательность независимых событий, каждое из которых имеет вероятность p. Будем говорить, что виспытании с номером k произошел успех, если произошло событие Ak .nPТогда Sn =IAk (ω) – это число успехов в n испытаниях. Нетрудноk=1убедиться в том, чтоnitq√− √itpf (t; Sn∗ ) = qe npq + pe npq .Эта функция является комплекснозначной. Но и в этом случае, проводя непосредственые вычисления, можно убедиться в том. что f (t; Sn∗ ) ⇒2e−t /2 .11511.6Доказательство центральной предельнойтеоремыМетод характеристических функций — основной при доказательстве центральной предельной теоремы.
Ранее была сформулирована теорема Ляпунова. Приведем более простой вариант центральной предельнойтеоремы для одинаково распределенных случайных величин. Сформулируем центральную предельную теорему в форме Линдеберга – Леви.Теорема 11.7. Пусть X1 , X2 , .
. . — независимые одинаково распределенные случайные величины, имеющие конечные моменты первого и второго порядков: a = EXk , b2 = DXk , k = 1, 2, . . . . ТогдаZd1−x2 /2∗→0√edx(11.7)supP{c≤S≤d}−n2π−∞≤c<d≤∞ cпри n → ∞.Примеры предыдущей главы показывали, каким образом можно установить, что2f (t; Sn∗ ) ⇒ e−t /2 .РассмотримnSn∗ =n1 X ∗Sn − an X Xk − a√√==√Xk ,b nbnnk=1k=1где Xk∗ = Xkb−a , EXk∗ = 0, DXk∗ = 1.Пользуясь свойствами характеристических функций, получаемtX1 − a∗nn∗√ ; Xk .=ff (t; Sn ) = f t; √nb nПодобно тому, как мы поступали в примере 1 предыдущего раздела, запишем tt2 /2n n 2 /2n ∗−t2 /2 n∗−t∗−t=) ≤ n f ( √ ; X1 ) − ef (t; Sn ) − e = f ( √ ; X1 ) − (ennt2tt2 2= n f ( √ ; X1∗ ) − (1 − ) − (e−t /2n − (1 − )) ≤2n2nn24tt t≤ n f ( √ ; X1∗ ) − (1 − ) + n 2 .2n8nnЕсли |t| ≤ T , а n → ∞, то √tn → 0, и значит, необходимо изучитьповедение характеристических функций в окрестности 0.116Пример 11.13.
Пусть случайная величина Y принимает конечное числоразличных значений y1 , y2 , . . . , ys с вероятностями q1 , q2 , . . . , qs . В этомслучаеsXf (t; Y ) =eityl ql .l=1У этой функции существуют производные всех порядков иsdk f (t; Y ) X=(iyl )k eityl ql ,dtkl=1и если теперь возьмем эти производные в точке t = 0, то получимsXdk f (t; Y ) kyls ql = ik EY k .t=0 = idtkl=1Таким образом, производные характеристической функции в t = 0 связаны с моментами случайной величины.Применим к характеристической функции разложение в ряд Тейлорав окрестности 0:1f (t; Y ) = 1 + itEY + t2 i2 EY 2 + o(t2 ).2Если EY = 0,DY = 1, тоf (t; Y ) = 1 −Если вместо t подставить√t ,nt2+ o(t2 ).2то получимtt2t2f(√ ; Y ) = 1 −+ o( ).2n2nnДоказательство этого факта в общем случае требует применения теорем о предельном переходе под знаком интеграла. Поэтому мы толькосформулируем общее утверждение.Лемма 11.4.
Если существуют EY, DY , тоf (t) = 1 + itEY −t2EY 2 + o(t2 ).2Для доказательства следующего утверждения потребуется лемма изанализа.117Лемма 11.5. При любом действительном z и любом натуральном nn 2n+1 ize − 1 + iz + (iz) + · · · + (iz) ≤ |z|.2!n! (n + 1)!Доказательство этой леммы можно прочитать в учебниках А. Н. Ширяева, Б. А. Севастьянова.Лемма 11.6. Пусть в дополнение к условиям леммы 1 случайная величина Y имеет третий конечный момент. Тогда122f (t; Y ) − 1 + itEY − t EY ≤ 1 |t|3 E|Y |3 .
62Доказательство следует из леммы 2 при n = 2, если от обеих частейнеравенства взять математические ожидания.Возвращаясь к доказательству центральной предельной теоремы, получаем2 t4tn|t|3 E|X1∗ |3t4t∗∗−t2 /2 √ 3 + .≤f (t; Sn ) − e ≤ n f ( √ ; X1 ) − (1 − ) +2n8n8nn6( n)Поскольку |t| ≤ T , то последнее выражение не превосходитT 3 E|X1 − a|3 T 4√→ 0.+8n6 nb3Следовательно, f (t; Sn∗ ) ⇒ f (t; Z), причем скорость сходимости имеетпорядок O( √1n ).Итак, доказана центральная предельная теорема в предположениисуществования конечного третьего момента.
На самом деле для ее выполнения достаточно наличие первых двух моментов.Замечание. Центральной предельной теоремой называют все теоремы, в которых устанавливается сходимость к нормальному распределению.11.7Теорема ПуассонаВ теореме Пуассона устанавливается сходимость к другому распределению — распределению Пуассона. С.Пуассон — известный французскийматематик первой половины ХIХ века, доказавший, что в схеме испытаний Бернулли, когда n → ∞, распределение числа успехов при определенных условиях сходится не к нормальному распределению, а к распределению Пуассона.118Рассмотрим схему серий испытаний Бернулли: в серии с номером nпроводится n независимых испытаний, каждое из которых имеет вероятность pn , зависящую от номера серии.Теорема 11.8.
Пусть n → ∞,λ > 0. Тогдаpn → 0 таким образом, что npn →e−λ · λm.m!Доказательство теоремы в этой форме чрезвычайно просто. Легкопоказать,mPn (m) = Cnm pmn (1 − pn ) →Pn (0) = (1 − pn )n = en ln(1−pn ) = e−npn ·ln(1−pn )−pn→ e−λ ,Pn (k)n!pkn (1 − pn )n−k (k − 1)!(n − k + 1)!pnn−k+1=··==k−1n−k+1Pn (k − 1)k!(n − k)!n!pn (1 − pn )k1 − pn=)npn (1 − k−1λn→k(1 − pn )kдля всех k ≥ 1.ТогдаPn (m) =Pn (m) Pn (m − 1)Pn (1)λλλλm e−λ·····Pn (0) → ·· · · ·e−λ =.Pn (m − 1) Pn (m − 2)Pn (0)m m−11m!Мы доказали очень простым способом теорему Пуассона для схемыиспытаний Бернулли.
Эта теорема имеет обобщения, в том числе позволяющие получить оценку скорости сходимости к распределению Пуассона.Рассмотрим следующую схему, которая называется схемой Пуассона.Пусть A1 , A2 , A3 , . . . — независимые случайные события, для которыхP(Ak ) = pk , k = 1, 2, . . .. Обозначимµn (ω) =nXIAk (ω)k=1— число наступивших событий Ak среди первых n событий нашей последовательности.Замечание. Если P(Ak ) = p для всех k, то получим как частныйслучай схему Бернулли, в которой случайную величину µn (ω) называличислом успехов в n испытаниях.Случайная величина µn (ω) принимает целые значения от 0 до n, новыписать распределение в явном виде для различных между собой pk итем более работать с ним — задача достаточно сложная. Проиллюстрируем это на примере.119Пример 11.14.
Рассмотрим схему Пуассона при n = 5, m = 2. ТогдавероятностьP{µn = 2} = p1 p2 q3 q4 q5 + p1 q2 p3 q4 q5 + · · · + q1 q2 q3 p4 p5выражается через сумму C52 = 10 различных слагаемых.Как видим, даже при малых n формулы получаются громоздкими ивряд ли их можно использовать для доказательства предельных теорем.Поэтому воспользуемся методом характеристических функций.Приведем несколько утверждений для характеристических функцийцелочисленных случайных величин.Пусть случайная величина X принимаетцелые значения m (m =P0, ±1, ±2, . .
.) с вероятностями pm ,pm = 1. Тогда характеристичеmская функция имеет вид∞Xf (t; X) =eitm pm ,(11.8)m=−∞причем ряд сходится абсолютно и равномерно на всей прямой.Замечание. Ряд вида (11.8) называется тригонометрическим. Мыбудем рассматривать тригонометрические ряды и более общего вида:∞Xck eitk ,k=−∞где ck (−∞ < k < ∞) — комплексные числа, такие, что∞P|ck | < ∞.k=−∞Функции eitk ,k = 0, ±1, ±2, . . .