4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 34
Текст из файла (страница 34)
П Пример 4.! (нормальнал-1 модель, прогерка простых гипотез). усть о нормально распределенной случайной величине $ с известной дисперсией оа и неизвестным средним 6 имеются две гипотезы: На. 6=0о и Н,: 0=6, (для определенности будем считать„ что О, ) 6,). Если Х =, (Х), ..., Х„) — выборка из Х ф и х — наблю. давшаяся реализация Х, то » ')") ='*9 ~ — 9.-9 Д»'. Ц» — 9 à — 9» — 9,)*)~- 9' = 1 Гп и ехр [ з (6) Оа) л — — — (09 81)~ и неравенство Г(х)»с эквивалентно неравенству Х» о' 1п с/(п (8) — Оо)1+ (Оь+ Оа))2, которое можно переписать в виде — (2 — Ов)» а 1п с+ — (8« — Оо) = 1(с).
уп а Р' л (69 — ез) 2а Так как Х)ь(Х) =в»" (Ов, оеГР),-то отсюда имеем тр (С) = РЕ„(С (Х)» С) = РЕ»,~ (Х вЂ” Ое) ~1 (С)) = Ф ( — 1 (С)). ) Р«пш При с)0 функция 1(с) непрерывно зависит отс, поэтому )Р(с)— непрерывная функция и для любого иге(0, 1) однозначно определена величина г, где 1(с„) =1„, а Ф( — 1„) =се. Т аким образом, все условия теоремы 4.1 выполнены и, следовательно, наиболее мощный критерий для проверки гипотезы Н, против альтернативы Нз задается в данном случае критической областью Я7,=(х ) 1' и (х — Оо)Го-»! ), Ф( — 1„)=и.
(4.12) В данном случае статистикой критерия является выборочное сред. нее Х, а критическая область не зависит от конкретного значения альтернативы 6))ба. 145 (4.13) )»нс. 4.1 Здесь для любой точки х=-(х„ ((х; 6/)=6',(1 — О/).-, /=О, 1, Вычислим мощность критерия (4.12). Так кан лэ, (Х) = /" (О„п'/а), то рев ~~ » Оо+ — 'йо) = У-. р„(1 " (Я 6;),-= — "(Ох-Оо) +(а) = !о о Ф~ "(6,— О.) — (.) /!/ л В частности, отсюда видно, что (Р ('2»во' ~!)» ( смещенность). Аналогично, при Оэ(Оо наиболее мощный критерий имеет внд .2"во — — )вх: 3Г а (х — Оо)/о — — ( 1, Ф( — !„) =а, (4 14) испытаний, не меньшем 39, можно быть уверенным в том, что, поступая согласно критерию (4.12), будет принято ошибочное решение свероятностью, не большей 0,00!.
Пример 4.2 (берн уллиевсрлл модель, проверка лрсслвых п«лспез). Пусть о неизвестной вероятности «успеха» 0 в бернуллиевской модели Вг(1, О) имеются дае гипотезы: Н«.6=6, н Н»;9=0!«й, хл), к! ш (0„1), !'=1, ..., л, а его мощность ЯУ(Хво, 0 ) =Ф()гга (Оо — 0„)/и — !„). (4.15) Из (4.13) следует, что вероятность ошибки второго рода критерия (4.12) равна р= р(а, а)=Ф((„— 'рга (О! — Оо)/и). Наглядной иллюстрацией приведенных рассуждений служит рис.
4.!. Рассмотрим следующую задачу. Пусть заранее заданы вероятности ошибок первого и второго рода а и р, Определим, каким должно быть минимальное число а*=а«(а, р) испытаниЙ, необ. ходимых для того, чтобы ошибочные заключения могли быть сделаны с вероятностями, не превосходящими а и )). Из (4.16) следует, что р (а, а) с ростом а убывает к нулю, поэтому искомое число а* есть наименьшее из тех а, для которых р (а, а) «1). Для определения а имеем два уравнения: Ф ( — 1„) = а н Ф ((„— У а (О! — Оо)/о) = )).
Обозначим р-квантнль РаСПРЕДЕ!(ЕНИЯ е /" (О, 1) ЧЕРЕЗ (р т. Е. 5р — РЕШЕНИЕ УРаВНЕШ)Я Ф($)=р. Отсюда имеем — !о=гЬо, („— )/а (6! — 6,)/о=Ьр, т. е. а =о'(~. + ~р)'/(О, — 6,)з. Но число а" должно быть целым, поэтому надо положить а* =(пх (Ь + Ьр)з/(6! — Оо)'1+ 1 (4.17) где !а] — целая часть числа а.
Отсюда следует, что при фиксированных ошибках число наблюдений пропорционально дисперсии и обратно пропорционально квадрату разности между средними значениями. Если, например, а=)) =0,001, то ьо=ьр=-3,09 н 'из формулы (4.17) имеем а*=!38,2пз/(Ох — Оо)х)+1. При а= 1, Вх — Ое=! значение а'=39. Таким образом, если требуется различить гипотезы с указанными параметрами, то только при чнспе 140 где г=г(х)= ~ х! — наблюдавшееся число «успехов», а г=! ~9,(1 — О,) ~ (~ — 9,). Фнк я ункция !0(0)=9/(1-6) возрастает иа интервале (О, 1), поэтому прн 0»«9» 4! (6!)/4>(9») «1 и неравенство ! (х) «с эквивалентно неравенству г (х) « «(1п с — лр )/р, где р=!и ((6,(1 — 0 )К0« (1 — 0«)!), р,=1п ((! — О!)/(1 — 9»)). Следовательно, критическая область задается в данном случае условием .йе«=(п: г(х) «г„).
(4.18) Для определения критической границы г=г„заметим, что ж е (г(Х)) = = В! (л, 6о), поэтому условно (4.10) принимает вид л л Х Слбо (' — !о)" "~ "~ Х Слов ('-эо)л ". (4.19) л»=г+ ! т=г Бели в этом соотношении ямеет место зизк равенства, то тем самым построен критерий Неймана — Пирсона 2 л»л с уровнем значимости а длн гипотезы Н» против альтернативы Н,. Зйесь также критическая область ие зависит от альтернативы. Поскольку Х (г (Х)) =В!' (л, 0,), мощность этого критерия л ОГ (Я лвл 00 ~'! Совем (1 — 0„)л и, гл =г Чаще всего при заранее заданном а в (4 19) имеет место случай сгр ого „.
равенства; следовательно, критерий, определяемый критической областью (4.18), будет иметь уровень значниостн не точно равный о„а больший, именно л а'= Х «~о(~ — зо)' л! = г а Если бы в данной ситуации требовалось построить критерий с уровнем виновности, точно равным и, то следовало бы прибегнуть к рандомизации н иоступип следующим образом, Положив ро=Сл"Оо (' — эо) "=ро,('(Х)='о) 147 задать критическую фуннцню 1 при» (х) >»вв ер» (х)= (рв+а а )/рв при» (") = »и.
0 прн»(х) (»„, т. е. услонигься отвергать гипотезу Н,, если»(х)- »и, и пряннмать ее, если »!х) (»ой если»(х)=;„, то отвергать Н, с всроятнгктью (ре+а — а/)/ре и принимать с дополнительной вероятностью (а' — а)/ре. Тогда вероят1ьссть ошибки первого рода такого рандомиэированнсго критерия раина Рв+ гв Р (//г ' Не) = Ее»~а» (Х) =Ров (» (Х) >»а)+ Рое (» (Х) рв+ а — а' =а'-р + ре — — а. — е В)оп!ность этого критерия вычисляется по формуле П» (Ф»' 6ь)=ЕВр (Х)= и /Вг ь»и»! 6 !» — »и »ЕтВт(1 0)в-ев„[ (о +а гь)1 г ! ! ь = Х " — - ''~'-",=') тье / а+! Елучай Вг С в расс В, В - матривается аналогично, при этом критическая область имеет Вид [» (х) с»а) ° $4.3.
Выбор из двух простых гипотез. Полотне о последонзтельном анализе В п нмере 4.1 при рассмотрении задачи выбора одной пр нз двух гипотез о нормальном распределении была установл и [ шение (4.17)) связь межи числом необходимых наблюдеонй н значенннми ве- оятн осте тей ошибок а н р. Это число можно рассчитать заранее (до проведе"), н авнсит аг исходов самик испытаний.
Кроме правил ннк испытаний), и оно ие з нс об, известны проверки гнп еэ, отеэ, основанных на выборках фиксированного обьема, нз иост»доаалмльньм правила (критерии). В случае использования этн р .В х повил вопрос о числе необходимых наблюдении решают в процессе наблюдений; следовательно, это число нсло (обьем выборин) является случайной величиной. . Валь 1947 г.), П до ательные правила впервые были предложены А. алькам ( осле в ой стати- н ох изучение н составляет предмет важного раздела математическ — аогяедова яьнаго анализа.
В этом параграфе кратко на простейшем и нмере различения двух простых гипотез о распределении наблюд у асмой сл, чайной величины $ будут рассмотрены некоторые особенности последователь- . С об т =гней последовательного анализа можно ознакохз ч. мнться в [,' н ), [3) [24), где дана современная трактовка соответствующи зада . 1. О деление крвтернв Вваьда. Пусть, как обычно, л; — яаблюд — аблю авшаясн н , в 1, 2, ..., в в Е .в = ре алиэация случайной величины 0 в /-м испытан н, = 1. (хт, ..., ягй 6»)=Ц //(яг) — функция правдоподобия для первых а испы- :В В, '=О, 1 (квн тани пр й ри головин, что истинной является гипотеза Н»: », /'=, ( н в В 4.2, / (х) — плотность оаспределення 0 (илн вероятность в д р о в нск етним ог е И ).
Согласно теории Неймана — Пирсона, наилучшая случае) прн гнпоизе ). т патины Н состоят в принятии процедура проверки гипотезы Нв против альтернативы, с т р нлн отклонении гипотезы Н, в зависимости от того, мен ьше нлв больше отко-, шение правдоподобия /чв/(чв некоторой выбранной константы с, при этом" объем выборки и фяксируется заранее н не зависит от наблюдений. Однако обь бо н сделать случайным и зависящим от исходов наблюдений, ений о и ннятня окон- то.можно добиться выигрыша в среднем числе н чюден д р чательного решения, 14!) Ног.ведивитеяьиый критерий отношения ввроятногтей (критерий Вальда) состоит в Е г следующем.
Задаются две положительные константы Ав( ! < Ат н наблюдении проводятся до тех пор, пока не будет впервые нарушено кахое-нибудь из неравенств 4» < /ш//-ев( Ам (4.20) й е Если н момент прекращения испытаний (лиивят огаьттмки) /вв//.е с Ав, то принимается гипотеза НМ если /тв//е»~А,, то Лриииыить Нв принимается гипотеза Нд. Эта процедура характеризуется обычно вероятностями ошибок первого и нторого рода а=р(Н» ! Нв) н Р=Р(Н»(НД н средним числом Е (ч)= = Е (ч [ Н») наблюдений ч до момента остановки (/=О, !). Если вероятности ошибок а н Р заданы, то любой критерик с такими ошибками называют критериви сиды (а, [)). В классе критериев данной силы (а, р) предпочтительным язлнется тот, который требует меньшего числа наблюдений. Критерий, минимизирующий одновременно как Ев(в), так и Е,(ч), называют оятимияьлыл.
Оптимальным свойством и обладает критерий Вальда. В частности, этот критерий требует в среднем меньше наблюдений, чем критерий Неймана — Пирсона с твкимй же вероятностями ошибок. Этн и другие свойства критерия 35альда рассмотрены ниже. 2. О числе испытаний:до момента остановки в критерии Вальда. Пусть функции /»(к) > О, / =О, 1, при всех возможных звачеонях случайной величины $ и не тождественны (иначе гипотезы Нв и Н, неразличимы).
Это означает, что определена н не вырождеив случайная величина Е=!п(/г(ь)//е(б))' будем предполагать, что существуют ЕВЕ~О и 0оЕ=ав(0) >0 (9=0», Вв). Обозначим также Е;=!и (/,(Хг)//е(Х;)), /=1, 2, ..., где Хг, Хв, ...— последовательиые независимые наблюдения над Ц. Тогда Е„Ем ...— независимые наблюдения над Е, и если г,, гв, ...