Закон больших чисел (Лекции)
Описание файла
PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "математическая статистика" из 5 семестр, которые можно найти в файловом архиве НГУ. Не смотря на прямую связь этого архива с НГУ, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
§1. Закон больших чисел (ЗБЧ).Определение. Последовательность случайных величин (c.в.) {Yn } сходится по вероятноpсти к с.в. Y (обозначение: Yn → Y ), если∀ε > 0 P(|Yn − Y | ≥ ε) → 0 при n → ∞.Свойства сходимости по вероятности:pp1. Если Xn → c и функция g(x) непрерывна в точке c, то g(Xn ) → g(c);pp2.
Если Xn → X и функция g(x) непрерывна, то g(Xn ) → g(X);ppp3. Если Xn → c1 , Yn → c2 и g(x, y) непрерывна в (c1 , c2 ), то g(Xn , Yn ) → g(c1 , c2 );ppp4. Если Xn → X, Yn → Y и функция g(x, y) непрерывна, то g(Xn , Yn ) → g(X, Y ).pНапример, g(x, y) = x + y, g(x, y) = xy непрерывны в R2 , т.е. Xn + Yn → X + Y ,pXn Yn → XY .Всюду далее используем обозначение Sn = X1 + .
. . + Xn .Теорема (ЗБЧ). Пусть случайные величины X1 , X2 , . . . независимы и одинаково распределены и DX1 < ∞. Тогда при n → ∞Sn p→ EX1 .nДоказательство. Нужно показать, что ∀ε > 0¯µ¯¶¯ Sn¯P ¯¯ − EX1 ¯¯ ≥ ε → 0 при n → ∞.nВоспользуемся неравенством Чебышева ∀ε > 0 P(|X −EX| ≥ ε) ≤ DX/ε2 при X = Sn /n:¡S ¢¯µ¯µ ¶¯¶¶µ¯n¯ Sn¯¯¯ SnDSD(X1 + . .
. + Xn )nDX1DX1nn¯≥ε ≤P ¯¯ − EX1 ¯¯ ≥ ε = P ¯¯ − E== 2 2 =→ 0.¯222nnnεnεnεnε2Здесь мы учли, что E(Sn /n) = E(X1 + . . . + Xn )/n = (EX1 + . . . EXn )/n = nEX1 /n = EX1 .¤Следствие. Пусть производится n независимых однотипных испытаний, в каждомиз которых с одной и той же вероятностью p = P(A) может реализоваться некотороесобытие A. Обозначим через nA число появлений события A в n испытаниях. ТогдаnA p→ p при n → ∞.nДоказательство. Справедливо представление nA = X1 +. . .+Xn , где с.в. {Xi } независимыи одинаково распределены, Xi ∼ Bp при всех i (т.е.
Xi = 1 c вероятностью p и Xi = 0 cвероятностью 1 − p). Следовательно, по ЗБЧ при n → ∞ выполненоX1 + . . . + Xn pnA≡→ EX1 = p.nnВывод: В построенной нами математической модели имеет место всемирный законстабилизации частот (см. Лекцию 1).Пример (см. Лекцию 1). Лотерея 5 из 36. Событие A = {угадать три номера из пяти}.Статистические данные и теоретическая вероятность:n = 241172,nA = 3026,nA= 0.0125;np = P(A) =2C53 · C31= 0.0123.5C36Т.е. nA ≈ np и nA можем вычислить еще до эксперимента! Но сколь большим должнобыть n?§2. Центральная предельная теорема (ЦПТ) и теорема Пуассона.Sn pSn − nEX1 p→ EX1 , т.е.→ 0.nnТеорема (ЦПТ). Пусть с.в. X1 , X2 , . .
. независимы и одинаково распределены, DX1 < ∞.Тогда для любого y ∈ Rµ¶Z ySn − nEX112n→∞√P< y −→ √e−t /2 dt ≡ Φ(y).nDX12π ∞ЗБЧ:(X√− EX)≡ Y . ТакDXпреобразованная с.в. имеет нулевое среднее и единичную дисперсию: EY = 0, DY = 1.В ЦПТ к с.в. Sn применяется операция стандартизации:Замечания. 1. Стандартизация с.в. X — это преобразование g(X) =Sn − nEX1Sn − ESn√≡ √.nDX1DSn2. Теорема Муавра–Лапласа — это частный случай ЦПТ для бернуллиевских случайных величин: если Xi ∼ Bp , то EX1 = p, DX1 = p(1 − p) иÃ!Z ySn − np12n→∞P pe−t /2 dt = Φ(y).< y −→ √2π −∞np(1 − p)3. Эквивалентная формулировка утверждения ЦПТ: для любого B ⊂ Rµ¶ZSn − nEX112n→∞√P∈ B −→ √e−t /2 dt.nDX12π BНапример, если B = (x, y), то в пределе получим Φ(y) − Φ(x).4. Как использовать ЦПТ? Например, нужно вычислить вероятность P(a < Sn < b):µ¶µ¶µ¶a − nEX1Sn − nEX1b − nEX1b − nEX1a − nEX1< √< √P(a < Sn < b) = P √≈Φ √−Φ √.nDX1nDX1nDX1nDX1nDX1Пример 1.
Театр на 1000 мест с двумя гардеробами. Каждый зритель с равнойвероятностью оставляет одежду в одном из гардеробов. Сколько должно быть вешалок вкаждом гардеробе, чтобы с вероятностью0.99 в гардеробе можно было оставить одежду?PРешение. Xi ∼ B1/2 , Sn = ni=1 Xi — число посетителей, направившихся в один из гард.Ã!√500 + x − npSn − np< pP(Sn < 500 + x) = P p≈ Φ(2x/ 1000) = 0.99.np(1 − p)np(1 − p)По таблицам√нормального распределения находим, что Φ(y) = 0.99 при y = 2.31. Такимобразом, 2x/ 1000 = 2.31, откуда x = 37.Пример 2. Монета подбрасывается 10000 раз. В каком интервале лежит число гербовс вероятностью 0, 95?PРешение.
Xi ∼ Bp при p = 12 , Sn = ni=1 Xi — число гербов. По т. М.–Л. P(a < Sn < b) =ÃÃÃ!!!a − npSn − npb − npb − npa − np=P p<p<p≈Φ p−Φ p= 0.95,np(1 − p)np(1 − p)np(1 − p)np(1 − p)np(1 − p)ppb − np/ np(1 − p) = y,a − np/ np(1 − p) = −y,y = 1.96(по таблице);ppa = np − y np(1 − p) = 5000 − 98, b = np + y np(1 − p) = 5000 + 98, P(4902 < Sn < 5098) ≈ 0.95.Пример 3. Для лица, дожившего до двадцатилетнего возраста, вероятность смертина 21-м году жизни равна 0.006. Застрахована группа 10000 лиц 20-летнего возраста, причем каждый застрахованный внес 120 рублей страховых взносов за год.
В случае смертизастрахованного родственникам выплачивается 10000 руб. Какова вероятность того, что:a) к концу года страховое учреждение окажется в убытке;б) его доход превысит 600000 рублей?в) Какой минимальный страховой взнос следует учредить, чтобы в тех же условиях свероятностью 0.95 доход был не менее 400000 рублей?PРешение. Xi ∼ Bp при p = 0, 006, n = 10000, Sn = ni=1 Xi — количество не доживших.µ10000 · 120P(убыток) = P Sn >10000ö=PS − np120 − npp n>pnp(1 − p)np(1 − p)µ10000 · 120 − 600000P(доход > 600000) = P Sn <10000ö=P!≈ 1 − Φ(7) ≈ 0;60 − npS − npp n<pnp(1 − p)np(1 − p)!1≈ Φ(0) = ;2µ¶10000 · x − 400000В п. в) нужно найти x такое, что P ≡ P Sn <= 0.95.10000Ã!Ã!Sn − npx − 40 − npx − 40 − npP=P p<p≈Φ p≡ Φ(y) = 0.95,np(1 − p)np(1 − p)np(1 − p)pΦ(y) = 0.95 при y = 1.64 (по таблицам), в итоге x = 40 + np + 1.64 np(1 − p) = 112.Пример 4.
Студент получает на экзамене 5 с вероятностью 0.5, 4 с вероятностью 0.3,3 с вероятностью 0.1 и 2 с вероятностью 0.1. За время обучения он сдает 100 экзаменов.Найти пределы, в которых Pс вероятностью 0.95 лежит средний балл.Решение. n = 100, Sn = ni=1 Xi , Xi принимает четыре значения с указанными вероятностями. C помощью ЦПТ найдем c такое, чтSnSnP −c <−E< c = 0.95nnТогда P (EX1 − c < Sn /n < EX1 + c) = 0.95. Итак,¶µ √µµ √ ¶µ √ ¶√ ¶Sn−c nSn − nEX1c nc n−c nSn−E<c =P √< √<√P −c <≈Φ √−Φ √= 0.95,nnDX1nDX1DX1DX1DX1Φ(y)√ Φ(−y) = 0.95 при y = 1.96 (по таблицам), EX1 = 4.2, DX1 = 0.96. Таким образом,√ −c n/ DX1 = 1.96 и c = 0.2. Ответ: (4.2 − 0.2, 4.2 + 0.2).Другой (эквивалентный) вариант решения: находим границы a и b из соотношенияµ¶µ√√ ¶Sn(a − EX1 ) nSn − nEX1(b − EX1 ) n√√0.95 = P a <<b =P< √<≈nDX1nDX1DX1µµ√ ¶√ ¶(b − EX1 ) n(a − EX1 ) n√√≈Φ−Φ= Φ(y) − Φ(−y) = 0.95.DX1DX1Здесь y = 1.96 и в итоге для Sn /n получим те же самые границы: a = EX1 −c и b = EX1 +c,где c введено выше.Погрешность в ЦПТ (неравенство Берри–Эссеена): при всех y и n¯ µ¯¶3¯¯1 − EX1 |¯P Sn√− nEX1 < y − Φ(y)¯ ≤ 1 E|X√√¯¯ 2 n( DX )3 .nDX11Как следствие, погрешность в теореме Муавра–Лапласа:¯¯ Ã!¯¯S−np1¯¯n< y − Φ(y)¯ ≤ p.¯P p¯¯ 2 np(1 − p)np(1 − p)Например, если n = 1000 и p = 1/2, то погрешность в т.
Муавра–Лапласа порядка 0.03,а если n = 1000 и p = 0, 001, то порядка 1/2. То есть в случае редких событий (когдазначение p мало) погрешность в теореме М.–Л. может быть не удовлетворительной. Втаких ситуациях можно использовать следующее утверждение.Теорема Пуассона. Пусть Sn = X1 +. . .+Xn , где {Xi } — независимые бернуллиевскиес.в. с вероятностью успеха p = pn .
И пусть n → ∞ и pn → 0 так, что λn := npn → λ. Тогда∀kP(Sn = k) →Доказательство. Поскольку pn = λn /n, тоn!λkn=k!(n − k)! nkµλn1−n¶n−kλk −λe .k!P(Sn = k) = Cnk pkn (1 − pn )n−k =n(n − 1) · . . . · (n − k + 1) λkn=nkk!µλn1−n¶n µ¶−kλnλk1−→ e−λ .nk!X λkЗамечания. 1. Как использовать? Ответ: P(Sn ∈ A) ≈e−λ , где A ⊂ Z+ , λ = np.k!k∈A¯¯¯¯kXλ¯¯2. Погрешность в теореме Пуассона: sup ¯P(Sn ∈ A) −e−λ ¯ ≤ min{p, np2 }.¯¯+k!A⊂Zk∈AНапример, при n = 1000 и p = 0, 001 погрешность в т. Пуассона не более 0, 001.3.
Для схемы Бернулли имеем два предельных утверждения: теорема Муавра–Лапласаи теорема Пуассона. Что использовать? Ответ: сравниваем погрешности.4. Теорема Муавра–Лапласа и при малых p может давать приемлемое приближение (вслучае очень больших значений n, компенсирующих малость p).Примеры использования теоремы Пуассона.1. В аудитории 100 человек. Найти приближенно вероятность того, что хотя бы уодного присутствующего сегодня день рождения.Решение. Используем теорему Пуассона. Здесь p = 1/365 ≈ 0, 003, λ = np = 0, 3,X λkmin{p, np2 } = 0.0009, P(Sn ≥ 1) ≈e−λ ≈ 0, 26 (по таблице распределения Пуассона).k!k≥12. Спортлото 6 из 49. Количество билетов n = 107 .
Найти приближенно вероятностьтого, что хотя бы 1 угадает все 6 номеров.C 6C 0Решение. Здесь p = 6 6 43 ≈ 7, 2 · 10−8 , λ = np ≈ 0, 7, min{p, np2 } = 0, 72 · 7, 2 · 10−8 ,C49X λke−λ ≈ 0, 5 (по таблице распределения Пуассона).P(Sn ≥ 1) ≈k!k≥1Реальные данные количества выигравших 6 номеров в нескольких розыгрышах: (0,0,1,2,0,1,0,0,...).Если n = 106 , то λ = 0, 07 и P(Sn ≥ 1) ≈ 0, 09.Примеры задач из второй самостоятельной работы.1. Игральная кость подбрасывается до тех пор, пока не выпадут шесть очков, приэтом более трёх раз подбрасывать не разрешается.
Найти таблицу распределения числаподбрасываний X и вероятность P(X ≥ 2).Решение. С.в. X принимает значения 1, 2 и 3 c вероятностями15 15 5 1 5 5 5P(X = 1) = , P(X = 2) = · , P(X = 3) = · · + · ·66 66 6 6 6 6 6(важно: сумма вероятностей по всем значениям с.в. должна равняться 1).P(X ≥ 2) = P(X = 2) + P(X = 3) = 1 − P(X = 1). (ae3t при t ≤ 0,2.
Найти значение a, при котором функция fX (t) =является плот0при t > 0ностью распределения. Найти функцию распр.-я с.в.RX и вероятность P(−1 < X < 0).∞Указание. Значение a находится из соотношения −∞ fx (t)dt = 1.3. Случайная величина X имеет показательное распределение с параметром α = 2,случайная величина Y имеет равномерное распределение на отрезке [0, 2], и эти величинынезависимы. Найти распределение случайной величины Z = max(X, Y ).Указание.