1625915153-62da7fb2e48a28563c377c8e71d63db2 (843881), страница 5
Текст из файла (страница 5)
Так что задача свелась к подсчету числа всевозможных размещенийn. Такимнеразличимых дробинок (нулей) на n+r−1 местах. Значит, их число равно Cn+r−1nобразом, вероятность каждого такого размещения вычисляется по формуле 1/Cn+r−1 .Упражнение. В обеих схемах размещения найти вероятность того, что в результате эксперимента останется l пустых ячеек.Асимптотический анализ биномиального распределения.При изучении схемы Бернулли мы получили формулу для биномиального распределения P(Sn = k) = Cnk pk (1 − p)n−k . Обозначим левую часть этой формулы через Bn,p (k),где k = 0, . . . , n.В реальных задачах обычно n велико, а p мало. Рассмотрим следующий двойной предельный переход по направлению:n → ∞, p → 0, np → λ > 0.(∗)Теорема (локальная предельная теорема Пуассона). Пусть выполнено условие (∗).Тогда при любом фиксированном kλk −λBn,p (k) → e =: πλ (k).k!Набор {πλ (k) : k = 0, .
. . , n} задаёт так называемоераспределение Пуассона сPпараметром λ (элементарно проверяется, что πλ (k) = 1).16Д ОКАЗАТЕЛЬСТВО . Достаточно выписать определение биномиального коэффициента и «вторым замечательным пределом»:kpn n−kn(n − 1) · . . . · (n − k + 1) k(pn)k n−k np (1 − p)1−Bn,p (k) =∼k!nkk!nnλk 1 − nλλk −λ∼e ,∼k! (1 − p)kk!что и завершает доказательство.Следствие 1. Если A ⊂ Z+ = N ∪ {0} и одно из множеств A или Ā конечно, топри выполнении условия (∗)P(S∈A)−Π(A) → 0,nλгде Πλ (A) =Pπλ (k).k∈AД ОКАЗАТЕЛЬСТВО. Поскольку P(Sn ∈ A) =PBn,p (k), то для конечного A мож-k∈Aно воспользоваться локальной предельной теоремой Пуассона. Если же Ā конечно, тоиспользуя свойство P(A) = 1 − P(Ā), сводим всё к предыдущему случаю. Следствие 2 (классическая интегральная теорема Пуассона).
При выполнении условия (∗)sup P(Sn ∈ A) − Πλ (A) → 0.A⊂Z+Д ОКАЗАТЕЛЬСТВО. Для любого натурального N справедливо неравенство X|Bn,p (k) − πλ (k)|P(Sn ∈ A) − Πλ (A) ≤k6N+P(Sn > N ) + Πλ (k : k > N ).Отметим, что правая часть в этой оценке не зависит от множества A. Далее, при фиксированном N первая сумма в правой части этого неравенства n → ∞ стремится к нулю всилу локальной предельной теоремы Пуассона.
Кроме того, следствие 1 утверждает, чтопри n → ∞P(Sn > N ) → Πλ (k : k > N ),причем вероятность Πλ (k : k > N ) может быть сделана сколь угодно малой выборомдостаточно большого N , что и требовалось доказать. Приведенные теоремы часто называют теоремами о редких событиях.Сформулируем без доказательства результат, позволяющий оценивать точность пуассоновской аппроксимации.Теорема. Для любых n и p имеет место оценкаsup P(Sn ∈ A) − Πnp (A) 6 min{p, np2 }.A⊂Z+17Пример. Пусть в игре «Спортлото» участвует n = 107 человек. Какова вероятность,что хотя бы один угадает все 6 номеров?Здесь p = 7, 2 · 10−8 .
Множество A = {k : k > 1}, min{p, np2 } = 0, 72 · 7, 2 · 10−8 .Очень малое значение последней величины позволяет нам утверждать, что в данномслучае значение биномиального распределение на любом подмножестве практическисовпадает с соответствующей пуассоновской вероятностью. В рассматриваемом случаеимеем: λ = np ≈ 0, 7 и Πλ (A) ≈ 0, 5. Если же n = 106 , то λ ≈ 0, 07 и Πλ (A) ≈ 0, 09.Пример. В аудитории 100 человек.
Какова вероятность, что хотя бы у одного из присутствующих день рождения 1 октября?В этом примере мы имеем дело со схемой Бернулли с вероятностью успеха p = 1/365и параметром пуассоновского распределения λ = np ≈ 0, 3. Снова рассматриваем множество A = {k : k > 1}. Искомая вероятность довольно точно определяется по теоремеПуассона: Πλ (A) ≈ 0, 26.Нормальное (гауссовское) приближение биномиального распределения.Теперь займемся изучением асимптотического поведения биномиального распределения при n → ∞, когда p фиксировано (например, мы изучаем распределения числа«орлов» при бросании симметричной монеты достаточно много раз). Всюду в дальнейшем символом log обозначается натуральный логарифм.Теоремa (обобщенная локальная предельная теорема (ЛПТ)).
Пусть k → ∞ иn − k → ∞. Тогда1Bn,p (k) ∼ p2πnp∗ (1−p∗ )exp{−nH(p∗ )},x1−x+ (1 − x) log, x ∈ (0, 1).p1−pД ОКАЗАТЕЛЬСТВО. Сначала мы представим факториалы в выражении для Bn,p (k)с помощью формулы Стирлингагде p∗ = k/n, H(x) = x logn! =√2πn nn e−n+θ(n) , где116 θ(n) 6.12n + 112nИмеем√2πn · nn · e−n+θ1 (n) · pk · (1 − p)n−kp∼ [т. к. все θi → 0] ∼2πn · k k · e−k+θ2 (k) · 2π(n − k) · (n − k)n−k · e−n+k+θ3 (n−k)√√( n · nn / n) · pk (1 − p)n−knn · pk (1 − p)n−kp∼√∼ √∼√√√( 2πk/ n) · k k n − k · (n − k)n−k2πp∗ · k k · ( (n − k)n/ n)(n − k)n−knn · pk (1 − p)n−kp∼√2πp∗ · k k · n(1 − p∗ )(n − k)n−kBn,p (k) ∼ √181]== [обозначим Cn (p∗ ) = p∗2πnp (1 − p∗ )kk∗∗∗= Cn (p ) exp −n − log n − log p − (1 − p ) log(1 − p) + log k + (1 − p ) log(n − k)=nnkk∗= Cn (p ) exp − n − (p∗ + 1 − p∗ ) log n − log p − (1 − p∗ ) log(1 − p) + log k+nnk/n(n − k)/n∗∗∗∗+ (1 − p ) log(n − k)= Cn (p ) exp −n p log+ (1 − p ) log=p1−pp∗1 − p∗∗∗∗= Cn (p ) exp −n p log + (1 − p ) log= Cn (p∗ ) exp{−nH(p∗ )}.
p1−pВ приведенном доказательстве можно было бы вместо знака «∼» подставить «=»,используя O-символику. В такой форме суммарная погрешность будет равнаO(1/k) + O(1/(n − k)),а так как eθ1 (n) = 1 + O(1/n) и O(1/n) + O(1/k) = O(1/k), то окончательное асимптотическое представление биномиальной точечной массы принимает вид 11∗∗Bn,p (k) = Cn (p ) exp{−nH(p )} 1 + O+O.kn−kПример. Бросаем симметричную монету 10000 раз. Какова вероятность, что гербови решек выпадет одинаковое количество?Итак, в нашем случае p = 1/2, n = 10000, k = 5000, p∗ = 1/2 и H(p∗ ) = 0. Тогда√√22√ ≈ 8 · 10−3 .=Bn,p (k) ∼ √πn100 πДля того чтобы сформулировать следствие из только что доказанной теоремы, введем важнейшие в теории вероятностей понятия.Определение.
Плотностью нормального распределения (распределения Гаусса) с параметрами α, σ называется функция122ϕ(α,σ) (x) = √ e−(x−α) /2σ .σ 2πСтандартной нормальной (гауссовской) плотностью называется функция12ϕ(0,1) (x) = √ e−x /2 .2π1x−αЗаметим, что ϕ(α,σ) (x) = ϕ(0,1).σσСледствие (классическая ЛПТ). Пусть n → ∞ и n|p∗ − p|3 → 0. Тогда1k − np√,Bn,p (k) ∼ √ ϕ(0,1)σ nσ n19или в терминах p∗ = k/n1Bn,p (k) ∼ √ ϕ(0,1)σ n√n(p∗ − p)σ,где σ 2 = p(1 − p).Д ОКАЗАТЕЛЬСТВО . Сначала отметим, что H(p) = 0.
Далее, вычислим первую производную функции H(x):H 0 (x) = logxp 11−x+ x · · + log· (−1) − 1px p1−p= logx1−x− log.p1−pЗначит, H 0 (p) = 0. Вторая производная имеет видH 00 (x) =111+=.x 1−xx(1 − x)1 ∗Тогда H 00 (p) = 1/σ 2 . Тогда по формуле Тейлора H(p∗ ) =(p − p)2 + O(|p∗ − p|3 ).2σ 2Поэтому в условиях теоремыnH(p∗ ) =n ∗n(p − p)2 + O(n|p∗ − p|3 ) = 2 (p∗ − p)2 + o(1)22σ2σ21 k − np√=+ o(1).2σ nТаким образом,(1exp {−nH(p∗ )} ∼ exp −2k − np√σ n2 ).Так как n|p∗ − p|3 → 0, то p∗ ∼ p, т. е.1p2πnp∗ (1−p∗ )1∼ √.σ 2πnИнтегральная предельная теорема Муавра– Лапласа.Перейдём теперь к вычислению интегральных вероятностей (т. е. сумм локальныхточечных вероятностей). Именно, нас интересует приближенное значение для вероятностиXP(Sn ∈ A) =Bn,p (k).k∈AСформулируем сначала20Определение.
Функцией Лапласа Φ(x), x ∈ R, называется функция распределения стандартного нормального законаZxΦ(x) =ϕ(0,1) (t) dt.−∞Теорема ( Муавр, Лаплас). Рассматривается схема Бернулли с вероятностьюуспеха p. Пусть Sn – число успехов в серии из n независимых испытаний. Тогдадля любых a < bSn − np√P a66 b −−−→ Φ(b) − Φ(a),n→∞σ nгде σ 2 = p(1 − p).Эта теоремаоценить вероятность попадания числа «успехов» Sn√ даёт возможность√в отрезок [aσ n + np, bσ n + np] при большом числе испытаний. Скажем, если величина Φ(b) − Φ(a) близка к единице, то при значительном числе испытаний мы вправерассчитывать на то, что число успехов Sn со значимой вероятностью будет находитьсяв окрестностичисла np, причем размер этой окрестности имеет существенно меньший√порядок n.Заметим, что график функции Лапласа обладает свойством центральной симметрииотносительно точки (0, 1/2), т.
е. Φ(x) = 1 − Φ(−x) (всё это легко следует из чётностифункции ϕ(0,1) (x)). Если интервал в теореме симметричный, т. е. −a = b > 0, тоSn − np√6 b → Φ(b) − Φ(−b) = 1 − 2Φ(−b) = 1 − ε.P −b 6σ nЗадав малое ε и решив уравнение Φ(−b) = ε/2, можно восстановить симметричный отрезок, в который попадет величина Sn с вероятностью, близкой к 1 − ε.Пример. Симметричная монета бросается 10000 раз. Требуется указать интервал, вкоторый число Sn «наверняка» попадает.Очевидно, из «соображений симметрии», за центр этого интервала нужно принять5000.
Под «наверняка» будем понимать ε = 0, 01 в вышеприведенной формуле. Из таб√1лиц найдем, что b = 2, 6. Отсюда получаем bσ n = 2, 6 · · 100 = 130, что дает на2удивление достаточно узкий «доверительный» интервал 4870 6 Sn 6 5130, в которомвеличина Sn окажется почти наверняка. Отметим, что для частоты появления «успеха»νn = Snn справедливо двойное включениеbσbσ− √ + p 6 νn 6 √ + p.nnВ рассматриваемом случае 0,√487 6 νn 6 0, 513 – подтверждение закона стабилизациичастот (порядок разброса 1/ n = 0, 01).Д ОКАЗАТЕЛЬСТВО ТЕОРЕМЫ .
Согласно модели дискретной вероятности (Sn =0, 1, 2, ...) имеемXSn − np√P a66b =Bn,p (k).σ nk−npk∈Z+ :a621σ√n6b√√Таккакnp+aσn6k6np+bσn, то число слагаемых сумме справа имеет порядок√n. Мы хотим воспользоваться локальнойпредельной теоремой, но так как число сла√гаемых в указанной сумме растет как n, то напрямую доказанные выше асимптотические формулы использовать нельзя, поскольку здесь уже нужно учитывать погрешностьприближения.Справедлива следующая цепочка импликаций: 3 3|b σ | |a3 σ 3 |aσkbσ|bσ| |aσ|∗3∗√ 6 −p 6 √ ⇒ |p −p| 6 max √ , √⇒ n|p −p| 6 max √ , √=nnnnnnnσ3= √ max |b|3 , |a|3 .nСтало быть, условие следствия выполнено, причем мы можем указать скорость1∗3n|p − p| = O √.nКроме того, из арифметики O-символов мы имеем√1−(...)+O(1/ n)−(...)e=e1+O √.nТаким образом, мы получили представление1−nH(p ) =2∗k − np√σ n22 ) 111+O+O √.1+Okn−kn.Тогда(1exp −Bn,p (k) = p∗∗22πnp (1 − p )1k − np√σ nКроме того, из ограничений на k следует, что и величины k и (n − k) имеют порядок n.Точнее, при фиксированном p ∈ (0, 1) мы имеем k ∼ np и n − k ∼ n(1 − p).
Тогда11.Bn,k (k) = √ exp {...} 1 + O √...nТакже мы отметим, чтоaσbσp + √ 6 p∗ 6 p + √ .nnСледовательно, еслиf (x) =1,x(1 − x)то∗∗f (p ) = f (p) + O(|p − p|) = f (p) + O221√n.Последнее равенство – это результат применения формулы конечных приращений Лагранжа. В итоге мы получим 1111k − npk − np√√1+O √= √ ϕ(0,1)+OBn,p (k) = √ ϕ(0,1)(1)nσ nσ nnσ nσ nЗаметим, что если p, а стало быть, и σ малы, то погрешность может оказаться значительной.