Н.И. Чернова - Математическая статистика (1119916), страница 16
Текст из файла (страница 16)
Построение оптимальных критериевО п р е д е л е н и е 29. Критерий δn = δn (X1 , . . . , Xn ) называется критерием асимптотического размера ε, если α1 (δn ) → ε при n → ∞.Критерий δn = δn (X1 , . . . , Xn ) называется состоятельным, еслиα2 (δn ) → 0 при n → ∞.З а м е ч а н и е 17. Отметим снова, что для сложной гипотезы Hi вероятность ошибки i -го рода αi (δn ) = αi (δn , F) зависит от конкретногораспределения F, удовлетворяющего этой гипотезе, по которому и вычисляется вероятность ошибки. Тогда сходимость в определении 29 должнаиметь место для каждого такого распределения F.П р и м е р 40.
Является ли состоятельными НМК, построенные намив двух предыдущих примерах? Проверим состоятельность критерия изпримера 38:1−ε~ = H2 при X > a1 + τ√.δn (X)nВероятность ошибки второго рода этого критерия равнаτ1−ε τ1−εα2 (δn ) = PH2 X < a1 + √= PH2 X − √< a1 .nnПри верной гипотезе H2 по ЗБЧτp1−ε−→ a2 > a1 .ξn = X − √nИз сходимости по вероятности следует слабая сходимость, т.
е. сходимостьфункций распределения Fξn (x) во всех точках непрерывности предельнойфункции распределения Fa2 (x). Функция Fa2 (x) = P(a2 < x) непрерывнав точке a1 (а где разрывна?) и равна в этой точке нулю. Поэтомуτ1−ε< a1 = Fξn (a1 ) → Fa2 (a1 ) = 0.α2 (δn ) = PH2 X − √nПроверим состоятельность критерия из примера 39:~ = H2δn (X)приX2 >h1−ε σ21.nВероятность ошибки второго рода этого критерия равнаh1−ε σ21 α2 (δn ) = PH2 X 2 <.nВ замечании 14 (с. 78) мы выяснили, что квантили распределения χ2 c nстепенями свободы с ростом n ведут себя следующим образом:√√h1−ε = n + τ1−ε 2n + o( n).90ГЛАВА VII.
ПРОВЕРКА ГИПОТЕЗТогдаα2 (δn ) = PH2√X2<σ212+ σ21 τ1−ε √n1+o √.nОсталось перенести в левую часть неравенства всё, что зависит от n,и применить ЗБЧ вместе с определением слабой сходимости: при вернойгипотезе H2√ p2122X − σ1 τ1−ε √ + o √−→ σ22 > σ21 .nnВ силу непрерывности предельной функции распределения Fσ2 (x) в точкеσ212имеемα2 (δn ) = PH2√X22− σ21 τ1−ε √n12< σ1 → Fσ2 (σ21 ) = 0.+o √n2§ 4.
Вопросы и упражнения1. Есть две гипотезы: основная состоит в том, что элементы выборкиимеют нормальное распределение, а альтернатива — в том, что элементывыборки имеют распределение Пуассона. Построить критерий, обладающий нулевыми вероятностями ошибок первого и второго рода.2. Говорят, что распределения F и G взаимно сингулярны, если существует борелевское множество B такое, что F(B) = 0, G(B) = 1. Естьдве гипотезы: основная состоит в том, что элементы выборки имеют распределение F, а альтернатива — в том, что элементы выборки имеют распределение G, причём эти распределения взаимно сингулярны. Построитькритерий, обладающий нулевыми вероятностями ошибок и первого, и второго рода.3.
Пусть X1 , . . . , Xn — выборка из биномиального распределения с параметрами m и p, где p может принимать лишь значения 1/3 и 2/3с априорными вероятностями 1/5 и 4/5 соответственно, а параметр m известен и фиксирован. Построить байесовский критерий.4. По выборке из показательного распределения с параметром α построить наиболее мощный критерий асимптотического размера ε, различающий гипотезу α = α1 и альтернативу α = α2 , если α1 < α2 . Вычислить предел мощности построенного критерия при n → ∞.Г Л А В А VIIIКРИТЕРИИ СОГЛАСИЯКритериями согласия обычно называют критерии, предназначенные дляпроверки простой гипотезы H1 = {F = F1 } при сложной альтернативе H2 = {H1 неверна}. Мы рассмотрим более широкий класс основныхгипотез, включающий в том числе и сложные гипотезы, а критериямисогласия будем называть любые критерии, устроенные по одному и тому же принципу.
А именно, пусть задана некоторая случайная величина,измеряющая отклонение эмпирического распределения от теоретического,распределение которой существенно разнится в зависимости от того, вернаили нет основная гипотеза. Критерии согласия принимают или отвергаютосновную гипотезу исходя из величины этой функции отклонения.§ 1. Общий вид критериев согласияМы опишем конструкцию критерия для случая простой основной гипотезы, а в дальнейшем будем её корректировать по мере изменения задачи.~ = (X1 , . . .
, Xn ) — выборка из распределения F. ПроверяетсяПусть Xосновная гипотеза H1 = {F = F1 } при альтернативе H2 = {F 6= F1 }.~О п р е д е л е н и е 30. Пусть существует борелевская функция ρ(X),обладающая следующими свойствами:~ ⇒ G,= F1 , то ρ(X)(K1) если гипотеза H1 верна, т. е. если Xi ⊂где G — полностью известное непрерывное распределение;(K2) если гипотеза H1 неверна, т. е. если Xi имеют какое-то распредеp~ −→ление F2 6= F1 , то |ρ(X)|∞ при n → ∞ для любого такого F2 .= G определим постоянную C из равенДля случайной величины η ⊂ства ε = P(|η | > C). Построим критерий(~~ = H1 , если |ρ(X)| < C,δ(X)(23)~ > C.H2 , если |ρ(X)|Этот критерий называется критерием согласия.92ГЛАВА VIII.
КРИТЕРИИ СОГЛАСИЯКритерий согласия «работает» по принципу: если для данной выборкифункция отклонения велика по абсолютному значению, то это свидетельствует в пользу альтернативы, и наоборот. При этом степень «великости»определяется исходя из того, как функция отклонения должна себя вести,если бы основная гипотеза была верна. Действительно, если H1 верна, ста~ имеет почти распределение G. Следовательно, она должнатистика ρ(X)себя вести подобно типичной случайной величине η из этого распределения. Но для той попадание в область {|η | > C} маловероятно: вероятность этого события равна малому числу ε. Поэтому попадание величины~ в эту область заставляет подозревать, что гипотеза H1 неверна.
Темρ(X)~ следует ожидать именноболее, что больших значений величины |ρ(X)|при альтернативе H2 .Убедимся в том, что этот критерий имеет (асимптотический) размер εи является состоятельным. Повторим определение состоятельности критерия. Поскольку альтернатива H2 всегда является сложной, то, как мыуже отмечали, вероятность ошибки второго рода любого критерия δ будетзависеть от конкретного распределения F2 из числа альтернатив.О п р е д е л е н и е 31. Критерий δ для проверки гипотезы H1 противсложной альтернативы H2 называется состоятельным, если для любогораспределения F2 , отвечающего альтернативе H2 , вероятность ошибкивторого рода стремится к нулю с ростом объёма выборки:~ = H1 → 0 при n → ∞.α2 (δ, F2 ) = PF δ(X)2Т е о р е м а 22.
Критерия согласия δ, заданный в определении 30,имеет асимптотический размер ε и является состоятельным.Д о к а з а т е л ь с т в о. Условие (K1) отвечает за размер критерия:~ > C → P ( |η | > C ) = ε.α1 (δ) = PH1 |ρ(X)|Расшифруем условие (K2), отвечающее за состоятельность критерия.pПо определению, запись ξn −→ ∞ означает, что для любого C > 0P(ξn < C) → 0 при n → ∞.Согласно этому определению, для любого распределения F2 из числа альтернатив вероятность ошибки второго рода стремится к нулю:~ < C → 0.α2 (δ, F2 ) = PF |ρ(X)|2З а м е ч а н и е 18. Если вместо слабой сходимости в (K1) выполняется~ ⊂= G, то критерий (23) будет иметь точный размер ε.ρ(X)§ 1.
Общий вид критериев согласия93Проверяя гипотезу, мы задали ε, затем по точному или предельному~ ⇒η⊂= G вычислили «барьер» C, с которым сравраспределению ρ(X)~нили значение |ρ(X)|.На практике поступают иначе.Пусть по данной∗~реализации выборки получено число ρ = ρ X(ω0 ) .
Числоε∗ = P(|η | > |ρ∗ |)называют реально достигнутым уровнем значимости критерия. По величине ε∗ можно судить о том, следует принять или отвергнуть основнуюгипотезу. Именно это число является результатом проверки гипотезы в любом статистическом пакете программ.
Каков же смысл величины ε∗ ?Легко проверить, что критерий (23) можно записать так:(H1 , если ε∗ > ε,~δ(X) =H2 , если ε∗ 6 ε.При больших n вероятность~ > |ρ∗ |)PH1 (|ρ(X)|(24)стремится к ε∗ или равна ей — в зависимости от того, является G точ~ Поэтому ε∗ есть почтиным или предельным распределением для ρ(X).то же самое, что (24).
Вероятность (24) имеет следующий смысл: это вероятность, взяв выборку из распределения F1 , получить по ней большее~ эмпирического от истинного распределения, чем полуотклонение |ρ(X)|чено по проверяемой выборке. Больши́е значения вероятности (24) или ε∗свидетельствуют в пользу основной гипотезы. Напротив, малые значениявероятности (24) или ε∗ свидетельствуют в пользу альтернативы.Если, например, вероятность (24) равна 0,2, следует ожидать, чтов среднем 20 % «контрольных» выборок, удовлетворяющих основной ги~ попотезе (каждая пятая), будут обладать бо́льшим отклонением |ρ(X)|сравнению с тестируемой выборкой, в принадлежности которой распределению F1 мы не уверены.
Можно отсюда сделать вывод, что тестируемаявыборка ведёт себя не хуже, чем 20 % «правильных» выборок.Но попадание в область вероятности 0,2 не является редким или «почти невозможным» событием. В статистике редкими обычно считают события с вероятностями ε = 0,01 или ε = 0,05 (это зависит от последствийошибочного решения).