А.Н. Колмогоров, Г.И. Журбенко, А.В. Прохоров - Введение в теорию вероятностей (1115326), страница 22
Текст из файла (страница 22)
Мы ограничимся для иллюстрации построением «грубого» доверительного интервала для р на основе нераетютва Чебьппева. По неравенству "1ебьппева Р(~ р~ч,с~~1 )1 так как р (1 — р) < 1~'4. Зададимся числом а, О < а < 1, и найдем е ) 0 иа уравнения 1 — — „= 1 — а. 4леь Заменял е на 1/2ф па, получаем Итак, с вероятностьго, превосходна;ой 1 — и. выполняет- ся неравенство или ему равносильное Ю вЂ” 'л 1 == л Интервал с границами Р =- —" —, Р= — + л 2ул —,„' .
л 1 + .— называется доверительным интервалом для р 2рза с рроеьек значимости а. Смысл его применения заключается в том, что, доверяясь проведенному расчету, мы 12Л утверждаем, что неизвестная вероятность р ггрипадлвн(ф~ю:;- интервалу (р, р[, а вероятность возмо кпой опшбки, и[г(й."'.: кацей место, если этот интервал пе пакрывает ггстин(~~',",,г значение р, непревосходпт гх. Другтгзггг словами, нри й~),':; пользовании доверительного интервала уровня зггаггимойтн,'.; ' а длн оценки р мы будем ошибаться в среднем в доле сйу.'.;...',, чаев, не превосходящей сг (гх задается заранее).
Приведен(;,';," для примера доверительные интервалы для сг= 0г05::и'::,.-'=„: значения частоты 0,6 прк разных значениях и: ! 100 1000 10000 1', З2 О, 071 0,022 0,38 . гг,б20 0,022 (гг.'й( Мы видим, что с ростом гг довергпельпый интервал су'.,':>ф( жается. Кслп уменьшить и, например, гзять гг - О,ОХ;",=:" то для тех нв данных прк п .=- (000 полу пгм довг ритнйгь('",;:~," ный интервал [0,442, О, г бган г. Этот доверительный иггтерйгвф'--,"гй пгире того, который соотеп ствует уровпкг гг 0,05, 'хт(~:;; является логичвьнг следсгвпем гарантированного умейй.
-";",, шепия доли ошибочпых решеппй. Часто в атой же ситуации возкпкает проблема п(и[2г-;.-'с верки гипотезы о том, гто неизвестная веронгггость,'й(:;.,'.,"" равна заданному числу р„. Эту гипотезу, анализируя резулв,;:,-(т таты зкспериюента, можно принять, т. е.
пос штать не пуЮ:;;-'," тиворечащей статистическим даггггыы, или отклопитф,", „:; Можно указать такуго процедуру проверки гягготнвц~':;;. Р = Ро- 'если Рю Е=[Р, Р[, где [,о, (г[ — довеРнтсльпый инзй"2ьгг(! рвал с уровнем значимости и, то гипотеза р = ро ггриЖЬ":;;:;;„' мается, если же рз ~Е [р, р[, то зта гипотеза отклоггяетЩ(',.„.г„'; Пря этом можно отклонить вернуго гипотезу, слгппноггггггг,, полагаясь на «неудачныег в некотором смысле ревуну()к'::.,".,=.
таг ы эксперимента. Вероятность такой онгпбкн нем,'1 г известна, вернее, намп задана заранее прп построеНЩ$,";" доверительного интервала, и она не превосходит сг. Есни';"";::-":... например, и $000, р„= 0,5, а =- 0,05, то, отвергдйт11'" гипотезу о том, что р = 0,5, ка основании того, чьей.,;,„ 0,5 ф [0,529, 0,67([ (см. табличку), мы ошибаемся в сред''-:; нем меяее, чем в 5 случаях из 100. Гще одна интересная задача возникает при необходи" '!.';. мосте разлп геппя двух гипотез о неизвестной вевоятип;;,,': 130 сти р.
Пусть заранее известно, что или р = — рм или р р, где р, и р, — заданные числа, 0 с-р, '(р, -4. П р и м е р. Рассмотрим урновую схему и предположим, что доля белых шаров в урне неизвестна. Пусть р, = 0,2 и рз = 0,8. Необходимо аксперименталькым путем определить, какое иэ двух значений р, и ра больше соответствует р.
Для наглядности наговоримся называть урну с р = рз урной 1, а урну с р = рз — уркой 11. Вытаскиваем из урны олин шар и, если этот шар белый, то считаем, что он вынут иа урны П, если же черный, то из урны 1. При этом можно огзнбиться в указании номера урны. Вероятность одной иа ошибок равна верояткости вынуть белый шар из урны 1, т. е, равна 0,2. Вероятность нругой ошибки (вероятность извлечь черный шар иэ урны П) также равна 0,2. Вероятности ошибок можно уменьшить. Для этого извлечем из урны три шара с воавращением так, чтобы результаты испытаний были независимы. Гслн среди трех вынутых шаров белые тиары составляют больпшнство, т.
е. 2 или 3 белых шара, то будем считать, что ато урна И, в противоположном случае — урна 1. Очевидно, что вероятность ошибки прп этом равна вероятногтп вытащить 3 илн 2 белых шара пз урны 1, т. е. равна Сзр', (1 — р,)' + С',р,' (1 — р,)' = 0,104. По сравненгпо с первоначальной процедурой проверки вероятность ошибки уменьшилась почти в дза раза. При. увелнченпи объема выбории вероятности ошибок в разлг; чении двух гипотез продолгкают уменыпаться.
1".слп сре-' ди пяти выбранных шаров болыпинство белые, то мы принимаем гипотезу р = 0,8 (урна 11) и убеждаемся в том, что вероятность ошибки равна Сэр~ + С~зр,' (1 — р„)' + С~зр~ г(1 — р,)' = 0,058. При объеме выборки 7 вероятность ошибки равна 0,038„ и мы различаем две гипотезы (две урны) с вероятностями ошибок, которые во всяком случае иепыпе 0,05. Таким образом, придерживаясь принятого правила плп,'как говорят статистики, критерии проверки, мы будем огпнбаться в среднем меньше, йем в пяти случаях иэ ста. Поясним мотивы наших действий следующим рассужЛеннем.
Рассмотрим случайное блуящзнке, соответствующее схеме случайного выбора; частица выходит из начала координат и перемещается па единицу вверх при нэвлече- $37 нпи белого п<ара и остается на том же уровне прн павле' пенни черного. Траектория движения частицы описыва.' . ется в< личиной Я, — числом белых шаров в выборка объема п. Так как р = р, или р =- рм то в соответствии о' законом болыппх чисел траектория случайного блун<да' пня должна пролегать нли г направлении примой у = прх-, нлн в направлении прямой у = кр„так что при большйд' и отклонения Я, от пр, =- МЬ„при р == р, илп от пра =- ' в.- ЛЫ„прн р = р, в среднем малы. При фиксяроваш<ОМ< и моя<но задать некоторое (крит«ческое) значи<ив у„, пр, =у„(ир„такое, чтоб<а прв о„( у„принимать, гипотезу р =-- р„а при Б„> у„принимать гг<потаэу р = р,.
Значение у„должно быть назначено нз соображн. ний миннмальяости ошибочных решений. Можно посту-' '', пить иначе< аадать два числа у„и у„<<гр< <у„(у„( ( ир„) и последовательно для каждого и проверять, каКОВ из трех неравенств Я„( у„, Бч ) у„у„<о„< у„иыв', .", ет место. В первом случае принимается гипотеза р = рт, во втором — гипотеза р .=- р„п на атом эксперимент пп определению р прекращается.
В третьем же случае КМ „ блюдевня продолжаются. Прп таком подходе число шаров:.' в выборке не фиксируется заранее, а является случайным,:;.::, зависящим от значений Я„. Границы у„, у, также одре деляются ограничениями па воаможные ошибки. В этой случае задача проверки гипотез имеет непосредственной::".„: отно<пение к аадаче о рааорении, но в более сложной пе становке, чем мы рассматривали в т 3.
На практике задачу различения двух гипотез о веро< '- ятпости успеха в схеме Бернулли решают, например,: следующим образом. Пусть а и р — два малых числа -,, О (а (<, О <)3 (1. Для проверки гипотез р ='р< и р =- р<о р< (р„производится п неаависимых испыта- " ний и подсчитывается число успехов т.
Тогда если т ) тйп, то принимается гипотеаа р = рз, если т ~,,' ш„, то принимается гипотеза р =- р,. Здесь т„— критичсское значение т, подлея<ащее опреде-,:- лению. Вероятность ошибочного отклонения верной типо" тези р .= р< равна а вероятность овгнбочного принятия неверной гипотезы р = рг равна яз ~)„(жг„, рт) = ~«С ре (1 — ре)" ю.
Спрашивается, каково няименыпее чпсло испытаний, при котором возможно различение двух гипотез с вероятностями опщбок, не превосходящими заданных чисел сг и (), Наименьшее значение и и соответствующее ему аначение ти„удовлетворяют неравенствам )о„(«гг„, рг) < сг, г.)„(ж, рг) < р. (5) При решении практических задач испольэовать неравенства (5) для нахождения п и «я„не представляется воамо«кным, но можно воспользоваться специальными таблицами, в которых указываются пары («г, «я„) для употребительных вначекий р„рт, а, )). В следующей табличке указаны результаты решения задачи о рааличении гипотез для и =- )) = 0,05: 0,5 0,5 0,2 01 0,1 О,з 0,1 0,05 1З 67 1З5 245 з 26 19 21 Если число испытаний не фиксировать заранее, а определять в ходе эксперимента, действуя по указанной вылив схеме: на каждом шаге или принимать одну иэ гипотез, пли продолжать наблюдения, то число испытаний при тех «ке ограничениях на вероятности ошибок удается сократить в среднем почти вдвое.
Упрвжнення 1, Покажете, что случейнея велнчвнв Ух с распредеяснвем Р (Уе = 1) = р, Р (Уе =- — Ц = ч ямеет мвтеметвяесксе ожидание МУе = — р — ч н дисперсию ПУв = 4рч. Пользуясь свойствами матеметяческнх о«кядвнвй н двсперсвй, доке«ьвт, что М 0'г + ." + Уп) = и (р — ч), 2«(У, + -- + Уп) = 4прч. 2. Докажите, что в случайном бяуясгенвгг, соответстг«у«сжем схеме Бернулли с вороятностяян р в Ч, вероятность и« „того, что 159 в мовзскт я частица будет находиться в точке с ордвпатой р «"9-'' равна и„ „ = С",,'руз)т( +рузд~а-ау з (л и р имеют одинаковую четкость). 3.
Доканзите, что вероятность первого возвращения в изведай';;; коордипат в момент 2л, введенная в 4 2 (см.(3)), равна 2 «-г е Ь» — Сз~~гР и 4. Рассмотрим симметричное случайное блуркданве, начииаю' -;-", щееся в точке с ордкватой з ) О. Если частица исчеаает(поглощает", "-', ся) в точке О, то докажите, что вероятиость йа р (з) досюпкеиии чй',.~";", стицей точки с ордииатой р в лшмевт в раааа Ча, р (З) — иа, р-а иа, р+г где а„р овределепо в упражнении 2.
Если частица исчезает е двум.-";='й точках О в а ) О, то ()„р (з) =, р)(и„р и, — и„р - -ма) где гуммировавие происходит по всем отрицательным и положитвдьа вым й. (Используйте приицип отрав<ения, см. 4 2 главы 4,) 5. В задаче о разорении (4 3) предполон;им, что частица иерю,',;„а мещаетсн е полоязвтельном направлении, отрицательном папрайа - ",.' лепии или остается па мосте соответственно с вероятностями р,':;-'"::!а! е и г, р + д -(- г = 1 (зто обобщение иа игровом языке озиачввть что результатом отдельной партии с вероятностью г ) О может бьщ»..'-'., ничья).
Докажите, что вероятность разореиия да по-прежнему видается формулой (4), т. е. 3 а+а Да = ~а Ь где ь = д/р. б. Покажите, что матоматкческое ожидание и дисперсия ча" Г 8 стоты нуспохаз в схеме Бернулли раввы М вЂ” =. р и П вЂ” =" а и р (' — г) л 7. Докаязвте, что функция Ь (Г) =- рмда м достигает максиму" ма в точке р = гл/а. 8. Рассмотрим урповую схему, введеивую в примере 4 4. Пусть Й вЂ” общее число шаров, М вЂ” число белых шаров, так что р ~ = Мlй — доля белых шаров.