А.Н. Ширяев - Вероятность-1 (1115330), страница 15
Текст из файла (страница 15)
По поводу таблиц функций у(х) и Ф(х), а также других основных функций, используемых в теории вероятностей и математической статистике, см. [6]. Полезно отметить, что при расчетах, наряду с функцией Ф(х), часто используется родственная ей функция ошибок ег((к)= — ) е ' г(1, х>0. '7 0 Очевидно, что (х > О) Ф(х)=-[1+ег(( — )~, ег!(х)=2Ф(с/2х) — 1. 66. СХЕМА БЕРНУЛЛИ, И. ПРЕЛЕЛЬНЫЕ ТЕОРЕМЫ 9! гг/2 гге о ~ 026' ~~1 1! 0,62' ~ ~ 0,67' ~ 0,84 ' 1,28' Рис. !2. График функции нормального распределения Ф(х) ЕХ2~ р(Х>,)=р(Х >, )<Е' (33) Но можно пойти и дальше, а именно воспользоваться «экспоненцнальной» формой неравенства Чебышева: если Х > О н Л > О, то р(Х ) Е) р(ЕХХ > ЕЛг) < ЕЕХ(Х-г1 В силу произвольности Л > О ясно, что Р(Х)е)( )п( Ее"'» '1 л>о (35) Посмотрим, к чему приводит этот путь в случае Х = 5„/и, о„=С1+ +...
+ С„, РК; = 1) = р, Р(сг = О) = г), г > 1. У. В конце п.3 $5 было отмечено, что оценка сверху для вероятности события (ьг:~ — — р~ >е), даваемая неравенством Чебышева, является 5п достаточно грубой. Получение этой оценки основывалось на неравенстве ЕХ2 Чебышева Р(Х > е) < — для неотрицательных случайных величин Х > О.
аэ Можно попытаться, однако, воспользоваться неравенством Чебышева в форме ГЛ. ). ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Обозначим р(Л) = Еелб. Тогда р(Л) =! — р+ рел и в предположении независимости величин С(, ~э, ..., С„ Е ела" = [оо(Л) ]". Поэтому (0<а<1) РŠ—" >а) (!п! Ее"(л ) = )п! е "!й "п(й)! = гп з л>о л>о — и опд(ао-!и п(о)1 — гп! е и(ао !п у(оН вЂ” е >о (36) 5)0 Аналогично Поэтому ацр Г(з)= И(а), 5)0 где а 1 — а И(а) =а!п — +(1 — а)!ив Р 1 — р — функция, уже рассмотренная выше при доказательстве локальной теоремы (п.
1). Итак, при р < а < 1 Р! и > ~ (Е-иН(п) 1и и поскольку И( р + х) > 2хэ, 0 < р + х < 1, то при е > О, 0 < р <! Р[ — — р >ел <е ( 5и ! Эиоо (а Аналогичным образом устанавливается, что для а < р < 1 -пН(а) (л и, следовательно, для всякого е >О, 0< р < 1 Р [ —" — р ( -е~ < е эи' . (38) (39) (40) (41) -и мр(ао-)и а(о)1 ( и < () ) (37) Функция ((з) = аз — !п[1 — р+ ре'[ прн р < а < 1 достигает максимума в точке зо (('(зо) = 0), определяемой из равенства еоо— а(1 — р) р(1-а) ' $6.
СХЕМА БЕРНУЛЛИ. Н. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ 93 Тем самым Р Д вЂ”" — р ! > е~ < 2е з"' . (42) Отсюда вытекает, что число наблюдений лз(а), гарантирующее выполнение прн любых 0 < р < 1 неравенства Р(~ —" — р~ (е) ) 1 — а, (43) определяется формулой (44) где [х] — целая часть числа х. Пренебрегая «целымн частями» н сравнивая -1 '1 лз(а) с л~(а) = 1 — 1, находим, что ~4а«93' — — т, ~о. л~(а) 1 лз(а) 2 2 о — ) е "~злу — е ~, х-+со, л; ) д-..
можно показать, что й (а) 2 )п —, а10. Тем самым 2 2 а' — 1, аз О. лз(о) лз(о) Неравенства типа (38) — (42) носят название неравенств для вероятностей больших уклонений. Объяснение этому названию следующее. Интегральная теорема Муавра — 'Лапласа дает возможность просто оценивать вероятности событий (!5„— лр! < х~/л), характернзуюших «стандартное» уклонение (на величину порядка т/л) 5„от л р.
Неравенства же (39), (41) н (42) дают оценку для вероятностей событий (ш: !5„- п р! < <хл), описываюшнх уклонения порядка большего, нежели т/л, а именно порядка л. Мы продолжим рассмотрение вопроса о вероятностях больших уклонений в более общих случаях в $ б гл.('т'. Отсюда видно, что при а зО оценка минимального необходимого числа наблюдений, полученная с помошью экспоненциального неравенства Чебышева, является более точной, чем оценка, найденная из обычного неравенства Чебышева, особенно при малых а.
Воспользовавшись без труда устанавливаемым соотношением ГЛ.!. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ 8. Задачи. 1. Пусть л = 100, р = 1/10, 2/1О, 3/1О, 4/1О, 5/1О. Используя таблицы (например, из [6]) биномиального и пуассоновского распределений, сравните значения вероятностей Р(10 < 5~со < 12).
Р(20 < 5|оо < 22), Р(33 < 5~оо < 35), Р(40 < 5нп < 42), Р(50 <5ие < 52) с соответствующими значениями, даваемыми нормальной и пуассоновской аппроксимациями. 2. Пусть р = 1/2 н 2„=25„-л (число лревышений единиц над нулями в л испытаниях). Показать, что зцр]т/ялР(Хз„=/) — е '~~ ]-+О, л- оо. ! 3. Доказать, что в теореме Пуассона (с р = Л/л) имеет место следующая скорость сходимости: Лье л Лз зир[ Р„(й) —, ! < —. (Для доказательства полезно ознакомиться с $ !2 гл.!!1.) ф 7. Оценка вероятности «успеха» в схеме Бернулли 1. В рассмотренной выше схеме Бернулли (П, л~, Р) с й=(ил ш= =(хн ..., х), х; =О, Ц, Ы=(А: А Сй), Р®4)=р(ш), где р(ш) = рл. ад" 2.
", предполагалось, что число р (вероятность «успеха») известно. Представим теперь, что р заранее не известно и мы хотим его определить по наблюдениям за исходами эксперимента, или, что то же, по наблюдениям за случайными величинами 5н ..., 5„, где с;(ш) = х;. Эта задача, являющаяся типичной для математической статистики, допускает различные постановки. Ниже мы рассматриваем две такие постановки: задачу оценивания и задачу построения доверительных интервалов. Следуя обозначениям, принятым в математической статистике, неизвестный параметр р обозначим через й, считая а рлог1, что значения В принадлежат множеству 9= [О, !].
Часто говорят, что набор в = =(й, л~, Ре, йс9) с Ре((ш)) =ел л(1 — й)" л "' задает вероятностно- статистическую модель (отвечающую «л независимым испытаниям» с $7. ОПЕНКА ВЕРОЯТНОСТИ «УСПЕХА» В СХЕМЕ БЕРНУЛЛИ 95 вероятностью «успеха» В Е лэ), а всякую функцию Тл = Тл(ы), принимаюшую значения в 9, называют оценкой. Зл Если 5» = ~~ +... +с„н Т„*= —, то нз закона больших чисел следует, что оценка Т„' является сосгиояглельной в том смысле, что (е > 0) Рв(| Т„' — В| > е) - О, и - со.
Кроме того, эта оценка является несмещенной: для всякого Ве Ев ЕвТ,* =В (2) где Ев — математическое ожидание, отвечающее вероятности Рв. Свойство оценки быть несмещенной является вполне естественным: оно отражает тот факт, что всякая разумная оценка должна, по крайней мере «в среднем», приводить к желаемому результату. Однако легко заметить, что оценка Т„' не является единственной несмещенной оценкой. Например, такой же будет всякая оценка Т Ь!6+".+алел л где Ь! +... + Ьл = и. При этом для таких оценок также будет выполняться закон больших чисел (1) (по крайней мере, если |Ь| | < К < со), и тем самым эти оценки Тл так же «хороши», как и Т„*.
В этой связи возникают вопросы о том, как сравнивать различные несмешенные оценки, какую из них назвать наилучшей, оптимальной. По самому смыслу оценок естественно было бы считать, что оценка тем лучше, чем меньше ее отклонение от оцениваемого параметра. Основываясь на этом, назовем оценку Т„э44ективной (в классе несмешенных оценок Тл), если ОвТ«=1п1 ОвТл, ВЕО, г„ где ОвТ» — дисперсия оценки Тл, т.
е. величина Ев(Т« — В)э. Покажем, что рассмотренная выше оценка Т„' является эффективной. Имеем О Т„О /5» ~ Ов5» лВ(1 В) В(1 В) вТ,= в( /— ~л/ л лэ л (4) Поэтому, для того чтобы установить, что оценка Т„' эффективна, достаточно показать, что 1п! ОвТ„> В(! -В) При В = О или 1 это неравенство очевидно. Пусть теперь В е (О, 1) и рв(к;) =В"'(1 — В)' ". ГЛ. !. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Ясно, что Рв((ы)) = рв(ю), где и Рв(ш) = П Рв(хг).
Обозначим (-в(ы) = !и Рв(гв). Тогда 3-в(ы)=)п В ~ х;+1п(1 — В).~ (1 — х;) дЕв(м) ~(хг — В) дВ В(1 — В) Поскольку 1 = Ев) = ~ ~, Рв(ш) н а силу несмешенностн оценки Т„ В вл Ев Т„= ~~г Т„(ш) рв(ш), то после дифференцирования по В получим, что дРв(М М и дрв(м) Значит, [ ) ~ ~~1 и, согласно неравенству Коши †Буняковско, 1 ( Ев(҄— В! ° Ев [ дВ ] откуда Ев'!Т вЂ” В]т >— — '- /.(в) ° (6) где величина Г„(В)=Ее[ — ~ носит название информации Фишера.
г дбв(ш) 1 з дВ $7. ОПЕНКА ВЕРОЯТНОСТИ «УСПЕХА» В СХЕМЕ БЕРНУЛЛИ 97 Из (6) получаем частный случай так называемою неравенства Рвов Крамера для несмещенных оценок Т, ш! ОвТ„> 7 1 (т) В рассматриваемом случае у (В) Е ~д~в(ы)1 Е ~ (0 — В) пВ(1 В) и ' ~ В(! - ) ~ (В(1 - В)) В(1 - В) ' что и доказывает неравенство (5), из которого, как уже отмечалось, следует эффективность несмещенной оценки Т„* = 5„/и для неизвестного параметра В. 2. Очевидно, что, рассматривая в качестве «точечной» оценки лля В величину Т„', мы совершаем некоторую ошибку. Может даже случиться, что численное значение Т„*, подсчитанное по наблюденным значениям хн ..., х„, будет довольно сильно отличаться от истинного значения В. Поэтому целесообразно было бы указывать еще и величину погрешности.
Довольно бессмысленно надеяться, что для всех элементарных событий ь7 величины Т„=т„'(«7) мало отличаются от истинного значения неизвестного параметра В. Однако из закона больших чисел мы знаем, что для всякого б>0 при достаточно больших и вероятность события (1 — Т„' '! > б) будет достаточно мала. Согласно неравенству Чебышева, Рв(~В-ТД>б)< —," = О т„' в(1-в) пбз и, значит, для всякою Л > 0 Рв ! — Т„*! < Л >! — — 2. ~В(1- В) ) 1 Если взять, к примеру, Л = 3, то найдем, что с Рв-вероятностью, большей, 1 8 чем 0,8888 (1 — — = — =0,8888), осуществится событие 32 9 ! — Т„'~<З и тем более — событие ~в — т (<— поскольку В(1 — В) < —.
! 4 — 9727 ГЛ. 1, ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ Таким образом, Рв 2(! — Т; ( < — ~ = Рв (Тп — — < <В < <Тп + — ~ )~ 0,8888. Иначе говоря, можно утверждать, что истинное значение параметра В при- 3 . 31 надлежит интервалу <Т„* — —, Т„*+ — 1 с вероятностью, большей, чем 2~/й' " 2~/й1 0,8888. Иногда это утверждение символически записывают в такой форме: В Тп ~ — (~ )88%), где «) 88%» означает «более чем в 88% случаев». 3 3 Интервал Т„*— —, Т„*+ — является примером так называемых 2Дп 2,2, доверительных интервалов для неизвестного параметра. Определение. Множество вида (2Р~( ), Ф2( )), где п)ч(ы) и Впз(ы) — две функции элементарных событий, назовем доверительным интервалом надежности 1 — в (или с уровнем значимости б), если для всех В е 9 Р в(«Р! (ы) ( В ( 4~(ы) ) ) ! — В.