М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 37
Текст из файла (страница 37)
Чаще, однако, используют набор стандартных значений а: 0,1; 0,05; 0,01 и др., и степень согласия наблюдения х с гипотезой Но-характеризуют наименьшим а из этого набора, для которого хенФ,. Для одного и того же наблюдения х прн одних уровнях значимости критерий отвергает гипотезу Но, а при других — принимает. Поэтому следует подчеркнуть, что теория проверки гипотез не рассчитана на такое ее применение, когда по результатам наблюде. ний гипотеза Н» будет на самом деле принята илп отвергнута.
Применение статистического критерия к результатам наблюдений есть форма извлечения пз выборки полезной информации, дальнейшее использование которой зависит от наблюдателя. Если сравниваются два критерия ((Р,) и ((Р„'), то естественно сопоставить критические области одного и того же размера.
При. менение любой из критических областей Ф', и Ф' ' в предположении, что для каждой пз ннх имеет место (2), приводит к одной и той же вероятности так называеь ей сниибкн первого рода— отвергнуть гипотезу Н», если на самом деле она верна. Говорят, что совершена ошибка второго радо, если гипотеза Н» принята, когда она неверна. Чтобы уточнить математическую постановку вопроса, введем непересекающееся с (Р)» семейство распределений (Р),~(Р) и назовем гипотезу Н,: Ры(Р), альтернативной к гипоте.
эе Н» иэ (1) (гипотезу Н» назовем нулевой). Будем оценивать качество критерия (Ф' ) по проверке гипотезы Н» против альтернатн. вы Н, набором вероятностей б = Р ( Ф' ), Рсй(Р)ь (3) При фиксированном а вероятность () рассматривают как функцию от Р и называют функцией мощности критерия. Значение ! — () прн любом фиксированном Р, равно вероятности ошибки следущего вида: гипотеза Н» принята, хотя она неверна, а выборка на самом деле извлечена из распределения Рь Если Р(Ф"„)(Р(Ф',), Реп(Р)~ (4) и хотя бы при одном Р неравенство (4) является строгим, то критическую область Ф', размера а следует предпочесть области того же размера В", поскольку критическая область В'„обеспечивает меньшую вероятность ошибки второго рода.
Неравенство (4) задает отношение (частичного) порядка в множестве критериев, и тем самым можно поставить вопрос о существовании оптимального критерия, мощность которого превосходит мощности всех других критериев. Поскольку функция мощности (3) зависит еще от параметра а, то сравнение критериев (4) было бы целесообразно проводить прн всех а. В теории это, однако, привело бы к излишним усложнениям, п потому принято изучать и сравнивать критические области, а не критерии, тем более что в приложениях критерии задаются обычно статистиками и наличие неравенства (4) при каком- либо одном а влечет, как правило, такое же неравенство и при других уровнях значимости.
В связи со сказанным в теории принято критическую область размера а называть также критерием размера а нли даже просто критерием. Индикаторную функцию области Ф': ц(х) =1, если хепФ', н а(х) =О, если хя йу„(5) называют критической функциеи критерия Цу . Из контекста всег- 213 да будет ясно, идет лн речь о критерии как системе вложенных критических областей либо как об одной такой области. Параметрические модели, как и в задаче оценнвания, играют первостепенную роль в теории проверки статистических гипотез. Пусть (Рв) =-(Ро:ОеО) (Рв) =(Рв:О~Ч, В ПВ =8, тогда гипотезы о распределениях становятся гипотезами о параметрах Но . 'Оесоо, Н1 .
'Ое9ц а функция мощности р(9)=-Рв(В') рассматривается как функция переменного 9. Рассмотрим примеры. (1) Для повторной выборки из экспоненциального распределения с плотностью !(х) =ехр( — (х — О)), х>6, а-доверительный интервал для параметра 0 нз п. 4 $3 имеет вид х<ц+ л ' 1п (1 — а) (8(х< ц. Критерий Ф', размера а для проверки гипотезы Но ..0=6» против альтернативы Н1 .. 6~0» выбираем в виде *йг,=(х»: Оо>хгц, либо Оо<хп1+и-'!и (1 — а)).
Отметим, что включение в 07, точек х„для которых х~ц<9», не влияет на размер критерия, так как подмножество (х„: хгц(О») имеет Ро,-меру нуль. Функция мощности критерия В': !)(О) =Ро(х„:хгц(8„, либо хп1>0,— и-' 1п(1 — а))= = о е (Хгцп < Оо) +»Ув (Х<ц > О, — и-' 1п (1 — а)) принимает значения 1 — ае"ю — он при 0 — 0 С О, $$(0) = (1 — а) о'чо-~ю прн 0( Π— 0,( — л-' 1п(1 — а), (6) 1 при Π— О, > — п-'!п (1 — а). Функция мощности О(0) принимает минимальное значение в точке Оо: р(8») =1 — а и монотонно стремится к 1, если 6-»-.+.оо.
Если л-» оо, то при любом ОФО» (!(О) ==О''ц(0)-».1. Рассмотрим другую альтернативу Н+~. 0>0». В этом случае представляется естественным взять критерий исходя из нижней доверительной границы для О: !Р+,=(х„: О»<хан-Ьн-'!п(1 — а)). Легко видеть, что функцпя мощности этого критерия дается последними двумя строками в (6), и, следовательно, мощность одностороннего критерия В" в области 0>О» такая же, как и двустороннего 87„.
214 (П) Для повторной выборки из нормального распределения Н(р, 1) при проверке гипотезы На ' р=рв против альтернативы Н+~: 1ь>ра будем исходить из нижней доверительной границы для р (см. п. 1 $8): у+,=(х»: ра<х — хг в/)гй), где х„— а-квантиль распределения Н(0, 1). Мощность критерия (р'", равна В+(р) =-~+(р' а).= » = й'„~ — '~~)',Х, >рв+ — "'-"~ = 1 » Е(х р) > рй(р — р)+хг,) == » = сг в 1 .„-Х Х' > $г а (ра — р) г г 1 Рпс.
13. Функннн могнностн однпсто. роннсго и двустороннего критериев отнпменпя правдоподобий выборки нз нормального распределення йг(н, 11 , „) =1 — Ф(Уп(р — р)+ + х1 ~) =Ф (Ул (р — р,— х1~/р и)) и представляет собой по и ф. р. закона Ж(ра+х,-»/ул, и-') (рис. 13). Отметим, что ф+(р)<а при р<ра и стремится к 0 при р-ь — пп, так что критерий В'+, не годится против альтернативы Н-~. р<ра. Критическая область для проверки гипотезы На против альтернативы Н-~ строится по верхней а-доверительной грани.
це для р: Ф'-,=(х»: рв>х — х /уй). Функция мощности критерия йр-, получается из ()+(р) симметричным отражением относительно точки ра (см. рнс. 13): (1 (р)=(1 (р; а)=Ф()а( — р+1гв-х~ /уп)). Против двусторонней альтернативы Н,: рура критерий и функция мощности, основанные на симметричном а-доверительном интервале, имеют внд йу,„=йуна+ йу..га.
р(р) =р(р; а) =р'н(йу ) = .дв (1Р )+Р„(Ф'„а) =(1 (Р; а/2)+Р+(Р; а/2). 215 Нетрудно проверить, что р(р; а)<р+(р; а) прн р>ро, р(р; а) <р (м; а) прн р<ум, так что двусторонний крнтерпй Иу, менее мощен, чем Ж', нлн (Р-„если его прпмснять протнв соответствующих односторонних альтернатнв (см. рнс. 13).
Зато критерии (Р+„, М7-„нмея большую мощность прп односторонних альтернатнвах„дают неудовлетворнтельное решение против альтернативы Н,: рчьрз. ° Отметим, что в обоих примерах критические функции рассматриваемых критериев являются функциями мнннмальпой достаточной статнстнкн Т(х). В результате задача фактнческн сводятся к проверке гипотезы о параметре распределения статнстпкн Т(х) по результату еднннчного нспытання.
Например, крптернй (Р, нз (П) можно преобразовать в критерий (Р~=(1:(( ра — 'х„l~п, либО 1 )ра+х1 и/~а) для проверки гнпотезы Но. р=ро по результатам наблюдений т в моделн (Й', Я, М(р, и-')) прогна альтернативы Н1 . РФр~. 2. Лемма Неймана — Пирсона. Рассмотрим статнстнческую модель вида (х, Я, (Р,, Р )), где семейство вероятностных мер состоит всего нз двух элементов. Допустнм, что Но ' Р = Ро, Н| . 'Р = Р и (8) т. е. прн каждой нз гппотез На н Н~ распределение выборки полностью определено. Такие гипотезы называются простыми (в разобранных выше примерах (1), (П) нулевая гипотеза была простой, а альтерпатпвпая — не простой).
Оказывается, что крптернй максимальной мощностн в счучае (8) всегда существует. Поскольку функция мощностн лобого критерия 1Г, в постановке ~8) сводятся к двум вероятностям: Рь( йт,), Р,( В',), то задача поиска оптпмальной критической области ставптсг. следующнм образом: среди всех подмножеств йт.ыЯ, для которых выполнено равенство а=ро((Р ), 0<а<1, 19) найтн подмножество (Р"'„такое, что прн всех В'„енЯ Р, (27*.) ) Р, (27„). (10) Поясним, как строится это множество, а затем проведем формальное доказательство. Рассмотрим вначале следующую простую снтуацню: Ф (х„хв "., хх), Ра(х;) =М-', 1=1, ..., М.
Заметим 216 прежде всего, что условие (9) выполнимо лишь прн п=а»=й/й1; й 1, 2, ..., Ф вЂ” 1. Равенство а» = Р„()ра») выполняется для любого подмножества (Рч», состоящего ровно из й точек. Так как »( а) ~ ( ) л~ав'д» то ясно, что, упорядочив вероятности н положив мы придем к свойству (10).