С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 19
Текст из файла (страница 19)
И, наконец, последнее.Если не стремиться к оптимальности, часто без рандомизированныхкритериев удается обойтись.Проверка статистических гипотез4.4113Пример наиболее мощного критерияПроиллюстрируем теорему Неймана-Пирсона построением наиболеемощного критерия в случае выбора из двух нормальных распределений.Еще раз стоит подчеркнуть, что саму теорему (как и описанный нижепример) следует рассматривать лишь как начальный этап в решенииболее сложных задач.Пусть основная гипотеза H0 утверждает, что неизвестноетеоретическое распределение есть N(a0 , σ 2 ) (оба параметра — известныечисла), альтернативная гипотеза H1 — что теоретическое распределениеесть N(a1 , σ 2 ) (дисперсия — та же, что и в H0 , среднее значение a1 —известное число).Для определенности будем считать, что a0 < a1 .
Как скоро выяснится,это предположение приведет к правосторонней критической области.Случай a0 > a1 , приводящий к левосторонней критической области,рассматривается аналогично.Запишем отношение правдоподобия и его логарифм, обозначаяположительные постоянные множители, может быть, разные, но неимеющие существенной роли, единым символом const, а постоянноеслагаемое – символом constant.
Итак,QN £ 1 ¡ xi −a1 ¢¤σϕσZ(~x) = Qi=1£¡ xi −a¢¤ ,N10ϕi=1 σσln Z(~x) = constNX£(xi − a0 )2 − (xi − a1 )2¤i=1NNXX= const(a1 − a0 )xi + constant = constxi + constant.i=1i=1Последний переход использовал предположение a0 < a1 .По теореме Неймана-Пирсона заключаем, что критическая областьнаиболее мощного критерия имеет видK = K(c) = {~x ∈ RN : x̄ > c}.Другими словами, основную гипотезу следует отвергнуть, если X̄ > c.Как мы сейчас увидим, такое c определяется по уровню значимости εоднозначно, а рандомизации не требуется.114Глава 4Для нахождения c заметим, что, в предположении справедливостиосновной гипотезы,X̄ ∈ N(a0 , σ 2 /N ),так что√ X̄ − a0N∈ N(0, 1).σВыбирая z = zε = Φ−1 (1 − ε), мы получаем√ c − a0N= z,σт.е.σc = a0 + z √ .NРазумеется, осмысленный уровень значимости ε должен предполагатьсяменьшим, чем 1/2, а тогдаz > Φ−1 (1/2) = 0,c > a0 .В зависимости от соотношения между a0 , a1 , z, σ и N возможны дваварианта:основной: a0 < a0 + z √σN < a1 ;дополнительный: a0 + z √σN ≥ a1 .При фиксированных a0 , a1 , z, σ и достаточно больших N выполняетсяосновной вариант, не вызывающий каких-либо недоумений.
В частности,если Xэмп. = a1 , основная гипотеза отвергается. При малых N , большихσ или малой разности a1 − a0 может реализоваться дополнительныйвариант, который, в частности, приводит к тому, что "рецепт"наиболеемощного критерия выглядит противоречащим здравому смыслу: еслиXэмп. = a1 , этот рецепт призывает отвергнуть альтернативу в пользуосновной гипотезы!Объяснение этого эффекта весьма прозаично: число наблюдений Nслишком мало, чтобы отличить одну гипотезу от другой — за счетблизости a0 и a1 , или за счет большого разброса σ сделать это разумнымобразом невозможно: даже оптимальный (т.е.
наиболее мощный) тестне позволяет эти гипотезы различить. Совет может быть один —увеличивать число наблюдений и получать из них дополнительнуюинформацию.Заключительный комментарий. Напомним, что сама постановказадачи о различении двух простых гипотез малореалистична, такПроверка статистических гипотез115что буквального применения только что высказанные толкованияи рекомендации не имеют. Однако они очень хорошо передаютдух проблемы и описывают возможный (надо полагать, единственновозможный) путь разрешения трудностей.4.5ИспользованиеправдоподобиямонотонностиотношенияВ этом параграфе обсуждаются идеи, позволяющие иногда находитьравномерно наиболее мощные критерии при сложных альтернативах.Основой для надежд на получение подобных результатов может служитьпростое замечание, относящееся к примеру из предыдущего параграфа.Именно, критическая область оказалась одной и той же для всех a1 > a0 .Рассмотрим для начала параметрическую гипотезу H0 вида θ ≤ θ0при альтернативе H1 вида θ > θ0 .
Такую альтернативу естественноназвать односторонней. Мы сможем обсудить подобную задачу проверкипри специальном предположении о параметрическом семействе априоридопустимых распределений.Для определенности будем считать, что совместное распределениевыборки задается плотностью pθ (~x) (дискретный случай можнорассматривать аналогично).
Будем, далее, предполагать, что существует~ так что (вспомнимодномерная достаточная статистика T = T (X),теорему факторизации из параграфа 2.6)pθ (~x) = ψ(T (~x), θ)h(~x).Отношение правдоподобия в этом случае представляется в видеZ(~x; θ1 , θ2 ) =pθ2 (~x) ψ(T (~x), θ2 )=,pθ1 (~x) ψ(T (~x), θ1 )т.е. как функция от достаточной статистики.Будем говорить, что семейство мер Pθ имеет монотонное отношениеправдоподобия, если при фиксированных θ1 < θ2 функция Z(~x; θ1 , θ2 )является монотонно возрастающей функцией от достаточной статистики:если T (~x) ≤ T (~x0 ),то Z(~x; θ1 , θ2 ) ≤ Z(~x0 ; θ1 , θ2 ).Ограничениевозрастающимифункцияминесущественно:убывающую функцию аргумента T можно истолковать и как116Глава 4возрастающую функцию аргумента −T , а выбор варианта достаточнойстатистики (T или −T ) зависит от нас.Очевидно, что в примере из предыдущего параграфа отношениеправдоподобия было монотонным.Если условие монотонности выполнено, то неравенство видаZ(~x; θ1 , θ2 ) > cможно равносильным образом переписать в видеT (~x) > c0 или T (~x) ≥ c0 ,где c0 однозначно определяется по c,θ1 , θ2 и N .
Вторая возможностьможет реализоваться в точках разрыва отношения правдоподобия какфункции достаточной статистики T .Сформулируем теперь результат, относящийся к случаюодносторонней альтернативы.Теорема 1. Если семейство априори допустимых распределений Pθимеет монотонное отношение правдоподобия, то существует равномернонаиболее мощный рандомизированный критерий проверки гипотезыH0 = {θ ≤ θ0 } при односторонней альтернативе H1 = {θ > θ0 }. Этоткритерий имеет вид:~ > c, то H0 отвергается;если T (X)~ = c, то H0 отвергаетсяесли T (X)с некоторой вероятностью p;~ < c, то H0 не отвергаетсяесли T (X)(т.е. принимается).Числа c и p определяются по уровню значимости ε и распределению Pθ0так же, как в теореме Неймана-Пирсона:~ > c) ≤ ε ≤ Pθ (T (X)~ ≥ c),Pθ0 (T (X)0~ > c) + (1 − p)Pθ (T (X)~ ≥ c) = ε.pPθ0 (T (X)0При этом мощность критерия m(θ) строго возрастает по θ.
Кроме того,при каждом θ < θ0 , указанный критерий минимизирует ошибку первогорода α(θ).~ можно записать вид нашегоВ терминах критической функции π(X)критерия более коротким образом:~ > c, 1, если T (X)~ =~ = c,π(X)p, если T (X) 0, если T (X)~ < c;Проверка статистических гипотез117~ = ε.Eθ0 π(X)Эта теорема (кроме последнего утверждения) почти автоматическиследует из теоремы Неймана-Пирсона. Для получения последнегоутверждения нужно поменять местами гипотезы H0 и H1 иснова воспользоваться теоремой Неймана-Пирсона.
Мы опускаем всеформальные детали соответствующих рассуждений.Частный случай сформулированной выше теоремы относится кэкспоненциальным семействамpθ (~x) = h(~x) exp{θ̂(~x)A(θ) + B(θ)}(4.6)(см. параграф 2.4). Монотонность отношения правдоподобия при этомпревращается в монотонность функции A(θ):Z(~x; θ1 , θ2 ) = exp{θ̂(~x)[A(θ2 ) − A(θ1 )] + [B(θ2 ) − B(θ1 )]}и знак разности A(θ2 ) − A(θ1 ) должен быть постоянным при θ1 < θ2 .Пример экспоненциальных семейств (или даже пример нормальныхраспределений из предыдущего параграфа) почти очевидным образомпоказывает, что при двусторонней альтернативе (например, H0 = {θ =θ0 }, H1 = {θ 6= θ0 }) равномерно наиболее мощного критерия несуществует (критическая область не может одновременно оказатьсялево- и правосторонней).Тем не менее, и в двустороннем случае удается при некоторыхпредположениях получить равномерно наиболее мощный критерий,поменяв ролями основную и альтернативную гипотезы.
Сформулируембез доказательства соответствующий результат (см. [1])Теорема 2. Предположим, что для однопараметрическогоэкспоненциального семейства (4.6) функция A(θ) монотонна, а θ1 < θ2— два значения параметра. Тогда для задачи проверки гипотезыH0 = {θ 6∈]θ1 , θ2 [} при альтернативе H1 = {θ ∈]θ1 , θ2 [} равномернонаиболее мощный критерий существует и имеет вид:~ < c2 , то H0 отвергается;если c1 < T (X)~ = c1 , то H0 отвергается с некоторойесли T (X)вероятностью p1 ;~ = c2 , то H0 отвергается с некоторойесли T (X)вероятностью p2 ;~ < c1 или T (X)~ > c2 , тоесли T (X)118Глава 4H0 не отвергается.Числа c1 , c2 , p1 , p2 определяются по уровню значимости ε ираспределениям Pθ1 и Pθ2 так же, как в теореме Неймана-Пирсона:~ ≤ c2 ),~ < c2 ) ≤ ε ≤ Pθ (c1 ≤ T (X)Pθ1 (c1 < T (X)1~ ≤ c2 ),~ < c2 ) ≤ ε ≤ Pθ (c1 ≤ T (X)Pθ (c1 < T (X)22~ < c2 ) + (1 − p1 )Pθ (c1 ≤ T (X)~ ≤ c2 ),p1 Pθ1 (c1 < T (X)1~ < c2 ) + (1 − p2 )Pθ (c1 ≤ T (X)~ ≤ c2 ).p2 Pθ (c1 < T (X)22Наиболее трудным техническим местом здесь является нахождение c1и c2 .И эту формулировку можно сжато записать в терминах критическойфункции:~ < c2 ,1, если c1 < T (X)~ = c1 ,p1 , если T (X)~π(X) =~ = c2 ,p2 , если T (X)~ < c1 или T (X)~ > c2 ,0, если T (X)~ = Eθ π(X)~ = ε.Eθ1 π(X)2Аналогичный результат имеет место и для основной гипотезы видаH0 = {θ 6∈ [θ1 , θ2 ]} и соответствующей альтернативы.4.6Несмещенные и инвариантные критерииМы продолжаем обсуждение таких постановок задач, когда существуютравномерно наиболее мощные тесты.