4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 33
Текст из файла (страница 33)
Ясно, что ни с одним из этих решений согласиться нельзя. Рациональный принцип выбора критической области можно сформулировать следуюгцим образом: прн заданном числе испытаний и устанавливается граница для веролгпности сгиибки первого рода и при этом выбираетсл та критическая сб,гасть Хг, для которой вероятность осиибки второго рода минимальна.,Иными словами, выбирается число а между 0 и 1 и налагается условие йо (9):.=-сс для всех 8 ен Оо, (4.1) при этом условии желательно сделать минимальной (за счет выбора критической области Х,) величину 1 — !уг(9) для всех 0 енгдг, или, что то же самое, максимальной мощность )!7 (6) для всех 6 с= Вг.
(4.2) Величину с» в соотношении (4.1) называют уровнелг значиликти„ а тот факт, что критерий Х, имеет уровень значимости с», часто подчеркивают обозначением Х„. В конкретных задачах выбор уровня значимости до некоторой степени пйоизволен и связан с практической стороной вопроса. Так, часто ошибочное принятие или отбрасывание гипотезы Н, связано с материальными затратами. Если прннятие гипотезы Н, в то время, когда они не верна (ошнбьа второго рода), приводит к большим затратам, тогда как отклонение истинной гипотезы Н, (ошибка первого рода) приводит к небольшим потерям, то ясно, что желательно сделать как можно меньшей вероятность ошибки второго рода, допуская сравнительно большие значения сс.
Обычно для а выбирают одно из следующих стандартных значений: 0,005; 0,01; 0,05; для этих значений рассчитывают соответствующиетабпица, используемые при проведении различных испытаний. 4. Равномерно наиболее мощные критерии. Пусть'Х,„и Хчг„— два критерия одного и того же уровня значимости с» для гипотезы Но Если йг(Х;„; 8)~Ю'(Хго; 8), 8енйо, и ОГ(Х'с,; 9) (Р(Хго; 8), 6~Ем (4.4) прггчелг строгое неравенство в (4 4) имеет место хотя бы при одном значении 6, то говорят, что критерии Х,* равномерно мощнее критерия Я'г .
В этом случае, очевидно, следует отдать пре поч ение критерию Х,„„как приводящему к меньшим ошибкам. т д Если соотношения (4.3) и (4.4) выполняются для любого критерия Я г„, то Хг„называют равномерно наиболее лющным (р. н. м.) критериелг для проверки гипотезы Н.
В случае когда множегд о. ство, состоит из одной точки (гипотеза Н, простая), вместо термина р. н. и. критерий используют термин наиболее мощный критерий. Равкомерно наиболее мощный критерий не всегда существует, так как, как правило, критерий, максимизирующий мощность при определенной альтернативе 9 ен В„зависит от этой альтернативы и экстремальная задача (4.2) при ограничении (4Л) имеет решение только в некоторых специальных случаях. Примеры таких ситуаций встретятся в дальнейшем.
Часто ограничиваются рассмотрением подкласса несмещенных критериев, для которых одновременно с (4.1) выполняется условие !Р (6)-:сс для всех 6 ен Вг. (4.5) В ряде задач, для которых р. н. м, критерии не существуют, могут иметь место р. н. м, несмещениые критерии.
В заключение отметим, что обычно критическая область задается с помощью некоторой статистики Т(Х) и имеет, как правило, следующий вид: Я,=«х: Т(х)~с), илн Хг=«х: Т(х)~е), или Хг=«х: ! Т(х) !==с). Функцию наблюдений Т(Х) называют в этом случае статистикой критерия. 5 4.2. Выбор из двух простых гипотез Критерий Неймана — Пирсона 1. Постановка задачи. В этом параграфе рассмотрен важный частный случай описанной в 9 4.1 общей ситуации, а именно й гю В этом случае параметрическое множество й состоит из двух точек: = «0„6г) — и проверяемая (основная) гипотеза означает утверждение Но.
8 = 8„а альтернатива — утверждение Н,: 9 = 6,. Другими словами, допустимыми распределениями наблю ае ч й людаемои случа ной величины ь являются только два распределения (две функции распределения): Го(х) =Г(х; 0,) и гг (х) =р(х; 6,); требуется по выборке Х=(Хы ..., Х„) из распределения Х(г) определить какое из этих двух распределений истинно Предположим, что практические соображения приняты в расчет и уровень значимости а выбран. Тогда, согласно изложенному в 9 4.1 общему принципу„задача построения наилучшего кр те- я Х и ри Хсо сводится к решению экстремальной задачи максимизации по Х,„мощности Я7(Хго! 6г) при ограничении Ф'(Ямб 6о) =а.
Решению этой задачи, впервые найденному Ю. Нейманом и Э. Пирсонам (!933 г,), и посвящен настоящий парагрйжйф)~' 14! Напомним, что в рассматриваемом случае наилучший критерий Х,* называется наиболее мощным критерием. 2. Критерий Неймана в Пирсона в случае абсолютноь непрерывных распределений. Предположим, что распределения го и рг абсолютно непрерывны и соответствующие плотности (о (к) и 1! (к) удовлетворяют условию 11 (к) ) О, 1 = О, 1. Рассмотрим статистики отношения правдоподобия э и 1(Х) =, ',„',',, = И(! (Х,) И (о (Х!) (4.6) о=! н определим функцию !р(с)=ро,(1(Х)'=--с).
С ростом с эта функция может только убывать; кроме того, тр(0)=1. Далее имеем Ро,(1(Х) с) = ~ 7. (х; 6!) дх з с ~ 7. (х; Оо) дх= х; 1(х\ > с х: ! (х) ~ о — сро, (1 (Х) ) с) = сзр (с), (4.7) поэтому чр(с) ~1/с, откуда следует, что чр(с)-ьО при с-ьсо. Будем далее предполагать, что существует такое значение с =с, для которого тр(с) =а (в частности, это всегда имеет место, если функция тр (с) непрерывна). Тогда имеет место следующее утверждение.
Теорема 4.1 (Неймана — Пирсона). При сделанныхпредположенияк существует наиболее мощный критерий проверки гипотезы Но. Этот критерий задается критической областью Х,"„= (х: 1 (х) ) с), (4 8) где криптическая граница с определяется из условия тр(с) =а. П Рассмотрим любой другой критерий Х,„уровня значимости а. Тогда (Р(Хий 9!) = ~ 7.(х; 9!) ах = Хта 7.(х; 9!)дх+ ~ 1.(к; О!)Йх. Х,„Х;„ Х1а Х!а Аналогично имеем йУ(Х;„; 9,)= $ 7.(х; 6,)дх+ $ 7.(х; 6,)б . ХтэХ!а Х Хь Отсюда йУ(Хий 6,) =(Р(Хю; 9,)+ .(- $1(х) 7.
(х; 6о) йх — $ 1(х) г (х1 Оо) йх ХтгХтм ХтэХьэ Но согласно определению множества Хт„, вне этого множества (первый интеграл) 1(х):.с, а в точках этого множества (второй интеграл) — 1(х) е= — с; следовательно, нз последнего соотношения получаем неравенство (Хга) Ог) ( йу (Хтой 9!) + г(*; Во!* — 1 г!ч юг*), ~гаЖа ХтоХаз По условию, ~ 7-(х; 9,)дх= 5 7.(х; 6,)дх=и, Хпа Х*,к (4 й) откуда имеем, что каждый из интегралов в правой частя (4.9) отличается от а на одну и ту же величину $ 7.(х; 9,)дх. ХтаХ! а Таким образом, оба этих интеграла равны н получено требуемое неравенство Ф' (Хто) 6!) «%' (Х7ой) О!). ° Построенный критерий проверки гипотезы Но называют критерием Неймана — Пирсона.
Покажем, что этот критерий является несмещенным 1см. условие (4.5)1. Если в (4.8) с ь1, то из (4.?) получаем (Р (Х!„1 О!) '= си ) а. Если с«=1, то йг(Х;~; 9!)=1 — ~ 7.(х; 9!)дх 1 — ~ 7.(х; Оо)дх= Хта Х~!э = ~ф 7.(х; 6,)дх=и, !а поскольку 1, (х; 6!) ( сЬ (х; 6,) и- -1. (х; Оо) при х вн Х," . Следовательно, в любом случае %'(Х,"е; 9,) ~а. 3. Крнтернй Неймана — Парсона в случае дискретных распределеннй. Соатветствующне рассуждения можно провести н для дискретных распределеннй, длв хоторых веронтностн 1 (гь) ~О (1=0, 1) длн всех гэ.возможнык эначеннй наблюдаемой случайной велнчнны 6 (д,'1у(гэ)=1, )=О, 1!).
В этом случае также чупарядочнваютэ выборочные точка х=(х„..., х„] соствет. отвеина велнчнне отношения э л е(л; од ' ° и' 1(к)= '. = й й 1г(х!) И)о(хд !=! 1 (=! н включают в крнткчеслое множества Х! максимальное число точек, согда. СУЮЩЕЕСЯ С тРЕбаааННЕМ ~ й(Х; Эо)-.-"и. ОДНаКО В ОтЛНЧНЕ От НЕПРЕРЫВ- кю С! ного случая здесь в склУ днскретностн распределеннэ выборка, вообще говорк, уже нельзя получить 'точное значение а за счет выбора границы с в неравенстве !(к)~с. определающем множество Хк может быть так, чта, внлючнв в Хз очередную точку, мы еще не достнтнем уровня оь а включив сведующую — цревэойдем его. Подробнее зта можно обънсннть слелующнм образом. Обозначим через (...< 1э с1а!т( ...) возможные значенна статнствкн 1(Х).
Тогда в общем случае можно определить такое й=й(п), что 1. (х; 6») ()х( ~к~~ ь(х) 69). х9!)х)»~ !«+ Х9()Х)»Ь !) Если в правой частя соотношения (4.10) имеет место равенство, то, полагая Х", =':1(х) ==.1 ) и повторяя рассуждения, провеаенны. в и. 2, мо999.о «)Ю показать, что зто критическое множество задает нанбалйе/мощна)й крн)сряй ур вня зяачимостя ц для проверки гипотезы Нр против адьтер))ап9вы П,.
'ро Рассмотрим теперь более подробно случай, когда в (4.10) нмс)от Мес О ст строгие неравенства (как это чаше всего и бывает). Пусть иу= ~ ь(х; 6) н мМ4Л)П !и» х !1«)»1«9 р«=ре (1 (Х)=1«) = ч)9 й (х; 6!), 1=0, 1. 1= е« х: «19) =!» тогда соотношение (4.10) запишется в данном слу 9ае в ваде 0 (ц — и»( р„ Чтобы построить критерий с уровнем значимости и, паза использовать прием рзндомязацни, т. е.
поступить следующим образам. Когда выполняется Равен- ство 1(х) =1«,.„„— произвести дополнительный случайный эксперимент с исходам н и,, т д мн ]с и )1, вероятности которых равны соответственно (а — а»)1р» и 1 — (а — п»))р», и атнергпуть гипотезу Нв если наблюдается 9«, н принять «» в противном случае. Если 1(х)»1«,„„то гипотезу Н, слелует отвергнуть.
а при 1(х)(1„,„,— привять. тругими словами, строят рандомизированный критерий, основанный на критической функции 1 при 1 (х)»1«,„„ ф* (х) = (и — а )!Р«гри !(х) =1«9„„ при 1(х)(1„ю. Вероятность ошибки первого рода такого критерия равна [ . ( . )] [см. (4.П)] Р (Н,,' Н») =ЕЕ 96* (Х) =РЕ (1(Х)» 1„и))+ — РЕ,(! (Х) =1) (о)) = П вЂ” Сс» а — 9х» и»+ Р»=п Р» что н требовалось показать. Мощность вычисляют по аналогичной формуле )Р(Р') 6,)~Е,,ф*(Х)=,+( —,) Р,ГР,, Покажем, что это наиболее мощный критерий.
Рассмотрим произвольный крктери с урони й «р вием значимости а, задаваемый некоторой критической фуик- Цией )Р(х): Еоф(Х) (Щ н обозначим Я Ш=(х: 9Р* (х) — ф (х) » О) [знак «+»' Н вЂ” ») соответствует неравенству (()]. Если х ш Х+, то )р* (х)»0 н' поэтому 1 (х; 6,)»!«Г. (к; 69),' ЕсЛи ХШ Я, то 96*(х)(1 и, следовательно, Ь(х) 6))(1«Г(х) 6»). Таким образом, ~ )(ф" (х) — )Р(х)) (1.(х; 69) — 1«1. (х; 6»))= ~'.,' + ~»»0, лхХ+ «шов Отсюда для разности мощностей А =Ее ф» (Х) — Ее,ф (Х) получаем Ь= (96* (х) — )Р (х)) ь (х; 6 )»1«~ ()Р» (х) — )Р (х)) ь (х; 6«)= х х 1« (Ее,)Р' (Х) — Ее )Р(Х))» 1« (а — %) =О. что и требовалось доказать, ггтлх, В ДИСКРЕТНОМ СЛУЧаЕ ВСЕГДа МОЖНО ПОСтрОИтЬ Нанбад, ц 'р * 'р" щ говоря, явля и ранломнзированиым, О„,етим что то рандомизация н,бхгднма лишь па гограннчн,„множес «н то лько в том сл)чае, когда желательно иметь вероятность ошибки первого рода равной точно )х.
На арахтнке предпочитают в таких слнзменить а и УР вс ь значимости так, чтобы о~пала необходимость в рандомнза- Х» =1 х»1с, к цин, т. е. запевать 9х на и» и использовать неракцомизнрша =( (х)» «;6!9 ), который. ца предьыущему, нвлнется наиболее мшцным критерием уров)цг значимости а»((м). Можно также использовать нерандомнзираванный кРнт)ь)ий Я», =(! (х)» 1« и Д с ббльшим УРавнем значймости а =не+ Р» Зги общие положения проиллюстрированы ниже в приме 4,2, и имере 4. Примеры применения критерия Неймана — Пирсона.