Ю.В. Прохоров, Л.С. Пономаренко - Лекции по теории вероятностей и математической статистике (1115359), страница 15
Текст из файла (страница 15)
+ (X2m + . . . + Xn ) =m2i+1nXX−1X=Xk +Xk .i=0k=2mk=2iТогда|Sn | 6mXi=0 j jX XmaxX+maxXkk .m 2 6j6n m 2i 6j<2i+1 ik=297k=2Введем обозначения для случайных величин1ηi = i2! jX Xk ,maxi+1 i i 2 6j<2(10.8)k=2тогда|Sn | 6 η0 + 2η1 + 22 η2 + . . . + 2m ηm ,и значит,|Sn |η0 + 2η1 + . . . + 2m ηm6.n2m(10.9)∞Лемма 10.2. Пусть {an }∞0 , {bn }0 – две последовательности чисел, связанных соотношениемbn =a0 + 2a1 + . . . + 2n an2n .Тогдаan → 0 ⇔ bn → 0,т. е. последовательности чисел an и bn стремятся ( или не стремятся ) к0 одновременно.Доказательство леммы.1). Пусть bn → 0.
Тогда 2n bn = 2n−1 bn−1 + 2n an . Откуда следует1an = bn − bn−1 → 0.22). Пусть теперь an → 0. Тогда для ∀ε > 0 ∃n1 такое, что при всехn > n1 |an | < 4ε , а также существует константа c > 0 такая, что |an | < cдля всех n. Проведя несложные выкладки, получим|bn | 6|a0 | + 2|a1 | + . . . + 2n1 −1 |an1 −1 | 2n1 |an1 | + . . . + 2n |an |+62n2nc · 2n1 ε(2n1 + 2n1 +1 + . . . + 2n )c · 2n1 ε · 2n1 · (2n−n1 +1 − 1)+=+.2n4 · 2n2n4 · 2nПоследнее выражение можно сделать меньше произвольного ε, если выбрать n достаточно большим.
Следовательно, bn → 0. Лемма доказана.Возвращаясь к (10.9), видим, что для доказательства теоремы остап.н.лось показать, что ηn (ω) −→ 0.698Действительно, применяя неравенство Колмогорова для максимумасумм независимых случайных величин, и проводя несложные выкладки,получим для ∀ε > 0n+1jX2X−11nσk2 6Xk | > ε · 2 } 6 2n 2P{|ηn | > ε} = P{ n maxn+1 |2 6j<22εk=2nk=2nn+1n+12−12−122(n+1) X σk24 X σk26 2 2n= 2→ 0,ε2k2ε k=2n k 2k=2nчто следует из сходимости соответствующего ряда по условию теоремы.Но это лишь доказывает сходимость ηn → 0 по вероятности.2 Для докап.н.зательства ηn (ω) −→ 0 применим лемму Бореля – Кантелли.
Посколькуиз условия теоремы и выше доказанного неравенства следует, чтоn+1∞ 2−1∞4 X σk24 X X σk2=< ∞,{|η(ω)|>ε}6P n2222εkεknn=0 k=2n=0k=1∞X— ряд из вероятностей сходится, то с вероятностью 1 осуществится лишьконечное число событий |ηn (ω)| > ε, и значит, начиная с некоторого номера N (ω) |ηn (ω)| < ε. Тем самымP{ω : ηn (ω) → 0} = 1.2См. раздел "Сходимость по вероятности"главы 12.99Глава 11Предельные теоремы и методхарактеристических функций11.1Обозначения и формулировки предельных теоремОпределение 11.1. Случайная величина Z имеет стандартное нормальное распределение, если ее плотность распределения ϕ(x) имеетвид12ϕ(x) = √ e−x /22πпри всех значениях x.Если плотность распределения случайной величины Y равна(x−a)21p(x) = √ e− 2σ2 ,σ 2πто распределение с такой плотностью называется нормальным с параметрами a и σ 2 .
В дальнейшем будем в этом случае писать Y ∼N (a, σ 2 ). Заметим, что EY = a, DY = σ 2 . Для стандартного нормального распределения a = 0, σ = 1.Пусть X1 , X2 , . . . — независимые случайные величины, для которыхсуществуют EXk = ak , DXk = b2k , ck = E | Xk − ak |3 .ОбозначимSn = X1 + X2 + · · · + Xn ,An = ESn = a1 + a2 + · · · + an ,Bn2 = DSn = b21 + b22 + · · · + b2n ,100Cn = c1 + c2 + · · · + cn .Замечание 1.
Если существует такая константа L, что | Xk −ak |≤ Lпри любом k ≥ 1, то | Xk − ak |3 ≤ L(Xk − ak )2 , а значит, ck ≤ Lb2k и,следовательно, Cn ≤ LBn2 .Замечание 2. Если случайные величины Xk равномерно ограничены, т.е. существует константа L0 такая, что для всех k |Xk | 6 L0 , то|Xk − ak | ≤ 2L0 , и тогда Cn ≤ 2L0 Bn2 .n- нормированную сумму.
После такой нормиОбозначим Sn∗ = SnB−An∗∗ровки ESn = 0, DSn = 1.Теорема 11.1. (А.М. Ляпунов).1∆n =|P {a ≤sup−∞<a<b<+∞Sn∗1≤ b} − √2πZbe−xa2 /2dx| ≤ 2Cn.Bn3Несколько комментариев к этой теореме.Если величина, стоящая в правой части неравенства мала, то этоозначает, что распределение Sn∗ близко к стандартному нормальному распределению и теорема позволяет оценить точность данного приближения.Приведем несколько примеров.Пример 11.1. Пусть для всех k выполнено неравенство |Xk − ak | ≤ L,то, воспользовавшись замечанием 1, получим ∆n ≤ B2Ln . Таким образом,если L мало по сравнению со стандартным отклонением всей суммы Sn ,то можно считать распределение Sn∗ "почти нормальным".Пример 11.2. Пусть A1 , A2 , . .
. – последовательность независимых событий, причем для любого kP(Ak ) = p, 0 < p < 1, q = 1 − p.PОбозначим µn (ω) = ni=1 IAi (ω) – число произошедших событий средипервых n. По теореме Бернулли µnn → p по вероятности. Так как случайная величина µn имеет биномиальное распределение с параметрами(n, p), то Eµn = np, Dµn = npq, и в этом случаеµn − npSn∗ = √.npq1Заметим, что правая часть неравенства в теореме 11.1 меньше, чем в оригинальном неравенстве Ляпунова.101Поскольку для индикатора любого случайного события A выполняетсянеравенство |IA (ω) − p| ≤ 1, то в нашем случае можно применить выводпредыдущего примера и получить оценку∆n ≤ √2.npqНормальной аппроксимацией для биномиального распределения можно2пользоваться, если значение величины √npqмало.Отсюда следуетТеорема 11.2.
( Интегральная теорема А.Муавра – П.Лапласа ). Еслиn → ∞, тоZ bϕ(x)dx,P {m1 ≤ µn (ω) ≤ m2 } →aгде a =m1 −np√,bnpq=m2 −np√.npqПрямой вывод интегральной теоремы Муавра - Лапласа состоит внепосредственном подсчете вероятностей биномиального распределенияm2XP{m1 ≤ µn ≤ m2 } =Cnm pm q n−mm=m1и применении формулы Стирлинга к отдельным слагаемым данной суммы.Теорема Муавра - Лапласа позволяет также вычислять вероятностиотклонений относительной частоты наступления события от его вероятности.
Действительно,√√pqpqµnµn − np≤ b} = P{a √ ≤− p ≤ b √ }.P{a ≤ √npqnnn√ √При этом видно, что эти отклонения имеют порядок pq/ n.Замечание 3. В практических задачах обычно заменяютP{a ≤Sn∗Z≤ b} =bϕ(x)dx,aне учитывая при этом, что в случаях, когда значения этого интеграламалы, применение теоремы неоправдано, так как погрешность аппроксимации может оказаться больше, чем значения этого интеграла.102Математики затратили немало усилий, чтобы справиться с этимитрудностями. Соответствующие теоремы носят название теорем о больших уклонениях. Более подробно об этом можно прочитать в учебникахВ.Феллера и А.А.Боровкова.Замечание 4. Попытки получить обобщение теоремы Муавра - Лапласа привели к созданию метода характеристических функций (1901 г.,Ляпунов).11.2Характеристические функции.
Определение и свойстваОпределение 11.2. Характеристической функцией случайной величины X называется функция f (t; X) действительной переменной t ∈(−∞; +∞), определяемая какf (t; X) = EeitX ,где i–чисто мнимая единица.Напомним, что по известной формуле Эйлера eitX = cos(tX)+i sin(tX).Математическое ожидание этой комплекснозначной величины определим какEeitX = E cos(tX) + iE sin(tX).Поскольку всякая ограниченная случайная величина имеет конечное математическое ожидание, то для всякой случайной величины существуетхарактеристическая функция.
Иногда для краткости, когда понятно, окакой случайной величине идет речь, будем обозначать характеристическую функцию f (t).Рассмотрим два частных случая.I. Распределение дискретной случайной величины X задано таблицейx1 , x 2 , . . . xn , . . .p1 , p 2 , . . . pn , . . .Тогда характеристическая функция этой случайной величины равнаf (t; X) =∞Xeitxk pk ,k=1причем если случайная величина X принимает конечное число значений,то и в сумме будет такое же число слагаемых.103II. Распределение абсолютно непрерывной случайной величины X задано плотностью распределения вероятностей p(x).
Тогда ее характеристическая функция равнаZ +∞f (t; X) =eitx p(x)dx.−∞Пример 11.3. Рассмотрим в качестве примера вычисление характеристической функции индикатора случайного события A(1, ω ∈ A, с вероятностью p = P (A)IA (ω) =−0, ω ∈/ A, с вероятностью q = P (A)Характеристическая функция равнаf (t; IA (ω)) = peit + q,itесли p = q = 21 , то f (t) = e 2 cos( 2t ).Пример 11.4.
Вычислим характеристическую функцию случайной величины X с симметричным распределением+1, 21X=−1, 21Нетрудно показать, что в этом случае характеристическая функция равна f (t) = cos t.Пример 11.5. Пусть X ∼ N (0, 1), тогда можно показать, что характеристическая функция равнаt2f (t) = e− 2 .Во многих учебниках по теории вероятностей имеются таблицы характеристических функций для наиболее часто встречающихся распределений, но существуют также более полные таблицы преобразованийФурье (а характеристическая функция есть не что иное как преобразование Фурье плотности или функции распределения).1.