Ю.В. Прохоров, Л.С. Пономаренко - Лекции по теории вероятностей и математической статистике (1115359), страница 8
Текст из файла (страница 8)
С другой стороны, многие предельныетеоремы позволяют глубже понять содержательную сторону теории вероятностей, объясняют смысл таких важных понятий как вероятностьслучайного события, математическое ожидание случайной величины.В дальнейшем мы будем рассматривать последовательности независимых случайных величин. Сразу же заметим, что такие объекты существуют.
Всегда можно указать вероятностное пространство, на которомопределены независимые случайные величины с заданными законамираспределения.17.1Закон больших чисел в форме ЧебышеваПусть X1 , X2 . . . — последовательность независимых случайных величин.1О последовательностях независимых случайных величин и событий см. такжеглаву 10.47ОбозначимSNX1 + . . . + XN=NN– арифметическое среднее случайных величин. ТогдаSN =E SN =E X1 + .
. . + E XN,ND SN =D X1 + . . . + D XN.N2Оказывается, что при достаточно общих предположениях о распределениях отдельных слагаемых Xi , их арифметическое среднее SN "почтипостоянно"в том смысле, что если N достаточно велико, то значения SNмало отличаются от константы E SN .Теорема 7.1. Пусть X1 , X2 . . . — последовательность независимых случайных величин, дисперсии которых равномерно ограничены некоторойконстантой c > 0 : D Xk ≤ c (k = 1, 2, . . .). Тогда для любого положительного ε > 0 при N → ∞(7.1)P |SN − E SN | ≥ ε −→ 0.Доказательство.
В силу неравенства ЧебышеваP{|SN − E SN | ≥ ε} ≤cND X1 + . . . + D XND SN=≤ 2 2 −→ 0222εεNεNУтверждение (7.1) теоремы можно переписать иначе:P{|SN − E SN | ≤ ε} −→ 1(7.2)при N → ∞.Если для последовательности случайных величин выполнены (7.1)или (7.2), то говорят, что для нее выполняется закон больших чисел.Следствие 7.1.1.
Пусть случайные величины X1 , X2 . . . независимы,имеют одинаковое распределение с математическим ожиданиемE Xk = α и D Xk = σ 2 . Тогда для всех ε > 0P{|SN − α | ≤ ε} −→ 1.Из последнего следствия вытекает, что усреднив значения случайной величины, наблюдаемые в независимых и проводимых в одинаковыхусловиях опытах, мы получим число, близкое к математическому ожиданию. Это является способом практического оценивания математическогоожидания случайной величины.48Замечание. Утверждение теоремы и способ доказательства остаются справедливыми и для произвольных случайных величин (необязательно с конечным числом значений), если потребовать от них наличие конечных моментов первого и второго порядков.
Из доказательства теоремы также видно, что условия на случайные величины можно несколькоослабить.Введем числовые характеристики, отражающие взаимное влияние случайных величин друг на друга. Это ковариация и коэффициент корреляции случайных величин. Их обозначают соответственно cov (X, Y ) иρ(X, Y ).Определение 7.1. Ковариацией двух случайных величин X, Y называется число cov (X, Y ) = E(X − E X)(Y − E Y ).Определение 7.2. Коэффициент корреляции ρ(X, Y ) =cov(X,Y ).σX σYДля независимых случайных величин ковариация и коэффициенткорреляции равны 0. Если же cov (X, Y ) = 0, то такие случайные величины называют некоррелированными.Задача 7.1.
Приведите пример некоррелированных случайных величин,не являющихся независимыми.Легко показать, что некоррелированность случайных величин означает, что E XY = E X · E Y.Задача 7.2. Докажите, что если случайные величины X1 , X2 . . . попарноне коррелированы, имеют равномерно ограниченные дисперсии, то дляних также справедливо предельное соотношение (7.1).Задача 7.3. Покажите, что утверждение теоремы 7.1 останется справедливым, если требование независимости заменить условиемcov (Xi , Xj ) −→ 0равномерно при |i − j| → ∞.7.2Теорема Бернулли.
Отклонение частотынаступления события от его вероятностиЧастным случаем закона больших чисел в форме Чебышева являетсязакон больших чисел Я. Бернулли, доказанный намного раньше теоремыЧебышева совершенно другим методом.49Теорема 7.2. Пусть A1 , A2 . . .— последовательность независимых событий с одинаковыми вероятностями P(Ak ) = p, k = 1, 2, . . . . Тогдапри любом ε > 0 и N → ∞P{ω : |µN (ω)− p| ≥ ε} −→ 0.NТаким образом, если число испытаний велико, то относительная частота наступления случайных событий становится близка к вероятностиэтих событий. Этот факт позволяет в практических задачах использовать в качестве оценки неизвестной вероятности ее приближенное значение: p ≈ µNN .Доказательство. Поскольку µN представляет собой сумму независимыхслучайных величин Xk , для которых E Xk = p, D Xk = pq, то примениматеорема 7.1 и утверждение теоремы Бернулли является следствием болееобщей теоремы Чебышева.Неравенство Чебышева позволяет также оценить отклонения относительной частоты от вероятности, а именноP{ω : |µNN pq1D(µN /N )− p| ≥ ε} ≤= 2 2 ≤.2NεN ε4N 2 ε2(7.3)При выводе неравенства мы воспользовались тем, что D µN = N pq, авеличина pq = p(1 − p) при 0 < p < 1 достигает максимального значения1в точке p = 12 .4Замечание.
В действительности правую часть неравенства (7.3) можно заметно усилить. Так в учебнике А.Н.Ширяева (второе издание, стр.81)приводится следующая оценка:µN2− p| ≥ ε} ≤ 2e−2N ε .P{ω : |NКак мы уже упоминали, Я. Бернулли доказал свою теорему2 многораньше теоремы Н.Чебышева. Выписывая точные значения вероятностейX{|µ−Np|<Nε}=CNk pk q N −k(7.4)P NN p−N ε<k<N p+N εпри различных значениях p, он обнаружил, что биномиальные вероятности быстро убывают при удалении от N p. Так при p = q = 1/2 величинабиномиальных вероятностей равна 21N CNk , поведение вероятностей определяется числами CNk . Приведем для иллюстрации таблицу биномиальных коэффициентов до N ≤ 10, известную как треугольник Паскаля:2Результат был опубликован в 1713г.50kN=1234567891001111111111l12345678910234567891013610152128364514102035568412015153570126210162156126252172884210183612019451101Мы видим, что поведение биномиальных коэффициентов всегда одинаково: сначала они возрастают, достигают максимального значения, а затемубывают, при этом средние коэффициенты значительно больше остальных.
Еще более это заметно при больших N. Так при N = 20k012345678910CNk12019011404845155043876077520125970167960184756средние 6 коэффициентов (мы учли их симметричность) гораздо большевсех остальных. Таким образом, возвращаясь к вероятностям в распределении частоты успехов, замечаем, что значительная часть всей вероятности сосредоточена вокруг значения k = 10. То же самое верно и в общемслучае. Заметив этот факт, Бернулли смог показать, что вероятность в(7.4) стремится к 1 при N → ∞.7.3Вероятностное доказательство теоремы ВейерштрассаПрименим закон больших чисел для доказательства теоремы Вейерштрасса о равномерном приближении полиномами функции, непрерывной на51отрезке.Пусть f (x) – непрерывная функция на [0, 1]. Составим многочленыБернштейнаnXkBn (x; f ) =Cnk xk (1 − x)n−k f ( ).nk=0Обозначим µn – число успехов в n испытаниях Бернулли с вероятностьюуспеха x, в отдельном испытании.
ТогдаBn (x; f ) = E f (µn).nЗадача 7.4. Покажите, что 1) если f (x) = x, то Bn (X; f ) = x; 2) если2f (x) = x2 , то Bn (x; f ) = n(n−1)x+ nx , 3) если f (x) = ex , то Bn (x; f ) =n21/nn(1 + x(e − 1)) .Докажем, что полиномы Бернштейна равномерно сходятся к f (x) приn → ∞. Из свойств непрерывной на отрезке функции следует, что1) f (x) ограничена и, значит, существует константа Mf = max |f (x)|,0≤x≤12) f (x) равномерно непрерывна на [0, 1].Рассмотрим величинуω(δ; f ) =|f (x0 ) − f (x00 )|,sup|x0 −x00 |<δназываемую модулем непрерывности функции f (x). Равномерная непрерывность функции на отрезке [0, 1] эквивалентна тому, что ω(δ; f ) монотонно стремится к 0 при δ → 0.nPПосколькуCnk xk (1 − x)n−k = 1 при всех x ∈ [0.1], тоk=0nXf (x) ≡Cnk xk (1 − x)n−k f (x).k=0Но тогдаf (x) − Bn (x; f ) =nXCnk xk (1 − x)n−k (f (x) − f (k/n)) .k=0Следовательно,|f (x) − Bn (x; f )| ≤ Σ1 + Σ2 ,гдеΣ1 =XCnk xk (1 − x)n−k |f (x) − f (k/n)|,k:|k−nx|<nδ52XΣ2 =Cnk xk (1 − x)n−k |f (x) − f (k/n)|.k:|k−nx|≥nδОценим каждую сумму по отдельности.Σ2 ≤ 2MfXCnk xk (1−x)n−k = 2Mf P{|k−x|≥δk:| nΣ1 ≤ µn2MfD µn−x| ≥ δ} ≤ 2Mf 2 2 ≤,nnδ4nδ 2XCnk xk (1 − x)n−k ω(δ; f ) ≤ ω(δ; f ).k−x|<δk:| nТаким образом,|f (x) − Bn (x; f )| ≤ ω(δ; f ) +Mf.2nδ 2Пусть ε > 0 – произвольное положительное число.
Из равномерной непрерывности функции f (x) следует, что существует δ0 такое, что ω(δ0 ; f ) <ε. Выберем теперь n0 так, чтобы при всех n ≥ n0 выполнялось нера2Mвенство 2nδf2 < 2ε . Но тогда, начиная с номера n0 одновременно для всех0x ∈ [0, 1]|f (x) − Bn (x; f )| < ε,т.е. многочлены Бернштейна равномерно сходятся к функции f (x).Замечание.
Из этой теоремы можно получить вторую теорему Вейерштрасса о равномерном приближении непрерывной периодической функции тригонометрическими полиномами.53Глава 8Неравенства для максимумасумм независимых случайныхвеличинДо сих пор мы рассматривали вероятности, связанные с отдельными суммами случайных величин. Но иногда приходится иметь дело с последовательностями частичных сумм.Пусть X1 , X2 . .