Н.И. Чернова - Математическая статистика (1119916), страница 14
Текст из файла (страница 14)
Найти k, при котором величины ξ1 − 3ξ2и k ξ1 + ξ2 независимы. Можно использовать теорему 18 (с. 73).2. Как, пользуясь таблицей стандартного нормального распределения,найти квантиль заданного уровня для χ2-распределения с одной степеньюсвободы?3. Изобразить квантили уровней ε/2 и 1− ε/2 на графиках плотностейраспределений Hn и Tn−1 .4. Вычислить, зная распределение (n − 1)S02 /σ2 и пользуясь известным математическим ожиданием и дисперсией распределения χ2 , математическое ожидание и дисперсию длины доверительного интервала длядисперсии нормального распределения при неизвестном среднем.5.
Вычислить математическое ожидание и дисперсию длины доверительного интервала для среднего нормального распределения при неизвестной дисперсии.Г Л А В А VIIПРОВЕРКА ГИПОТЕЗИмея выборку, мы можем выдвинуть несколько взаимоисключающих гипотез о теоретическом распределении, одну из которых следует предпочестьостальным. Задача выбора одной из нескольких гипотез решается построением статистического критерия. Как правило, по выборке конечного объёмабезошибочных выводов о распределении сделано быть не может, поэтому всегда есть опасность выбрать неверную гипотезу. Так, бросая монету, можновыдвигать предположения об истинной вероятности выпадения герба. Допустим, есть две гипотезы: вероятность либо находится в пределах 0,45—0,55,либо нет. Получив после ста бросков ровно 51 герб, мы наверняка выберемпервую гипотезу.
Однако есть ненулевые шансы на то, что и при p = 0,3выпадет 51 герб: выбирая первую гипотезу, мы можем ошибиться. Напротив, получив 33 герба, мы скорее всего предпочтём вторую гипотезу. И опятьне исключена возможность, что столь далёкое от половины число гербов естьпросто результат случайности, а монета на самом деле симметрична.§ 1. Гипотезы и критерииПусть дана выборка X1 , . . . , Xn из распределения F. Мы будем считать выборку набором независимых случайных величин с одним и тем жераспределением, хотя в ряде задач и эти предположения нуждаются в проверке. Тогда одинаковая распределённость или независимость наблюденийне предполагается.О п р е д е л е н и е 21.
Гипотезой ( H ) называется любое предположение о распределении наблюдений:H = {F = F1 }илиH = { F ∈ F },где F — некоторое подмножество в множестве всех распределений. Гипотеза H называется простой, если она указывает на единственное распределение: F = F1 . Иначе H называется сложной: F ∈ F.Если гипотез всего две, то одну из них принято называть основной,а другую — альтернативой, или отклонением от основной гипотезы.80ГЛАВА VII.
ПРОВЕРКА ГИПОТЕЗП р и м е р 34. Перечислим типичные задачи проверки гипотез.1. Выбор из нескольких простых гипотез: есть H1 = {F = F1 }, . . . ,Hk = {F = Fk }, и другие предположения невозможны.2. Простая основная гипотеза и сложная альтернатива:H1 = {F = F1 },H2 = {F 6= F1 }.Например, дана выборка из семейства распределений Bp , где p 6 1/2.Есть простая гипотеза H1 = {p = 1/2} и сложная односторонняя альтернатива H2 = {p < 1/2}.
Случай p > 1/2 исключен априори.3. Сложная основная гипотеза и сложная альтернатива:H1 = {F ∈ F},H2 = {F 6∈ F}.Например, гипотеза о нормальности: H1 = {распределение F являетсянормальным} при альтернативе H2 = {H1 неверна}.4. Гипотеза однородности: есть несколько выборок; основная гипотезасостоит в том, что эти выборки извлечены из одного распределения.5.
Гипотеза независимости: по выборке (X1 , Y1 ), . . . , (Xn , Yn ) из nнезависимых наблюдений пары случайных величин проверяется гипотеза H1 = {Xi и Yi независимы} при альтернативе H2 = {H1 неверна}.Обе гипотезы являются сложными.6. Гипотеза случайности. В эксперименте наблюдаются n случайныхвеличин X1 , . . . , Xn и проверяется сложная гипотеза H1 = {X1 , .
. . , Xnнезависимы и одинаково распределены }.Эту задачу ставят, например, при проверке качества генератора случайных чисел.Пусть дана выборка X1 , . . . , Xn , относительно распределения которойвыдвинуты гипотезы H1 , . . . , Hk .О п р е д е л е н и е 22. Критерием δ = δ(X1 , . . . , Xn ) называется измеримое отображениеδ : Rn → {H1 , . . . , Hk }из множества всех возможных значений выборки в множество гипотез.Измеримость понимается в обычном смысле: {ω | δ(X1 , .
. . , Xn ) = Hi }есть событие при любом i = 1, . . . , k.О п р е д е л е н и е 23. Говорят, что произошла ошибка i -го рода критерия δ, если критерий отверг верную гипотезу Hi . Вероятностью ошибкиi -го рода критерия δ называется число~ 6= Hi ).αi (δ) = PH (δ(X)i§ 1. Гипотезы и критерии81З а м е ч а н и е 15. Говоря «Hi верна» и вычисляя PHi (··), мы имеемв виду, что распределение выборки именно такое, как предполагает гипотеза Hi , и вычисляем вероятность в соответствии с этим распределением.Если гипотеза Hi простая, т. е. указывает ровно на одно возможное распределение выборки, то αi (δ) — число.
Если же Hi — сложная гипотеза,то αi (δ) будет зависеть от того, при каком именно из распределений F,отвечающих Hi , вычисляется вероятность:~ 6= Hi = P δ(X)~ 6= Hi | Xi ⊂= F .αi (δ) = αi (δ, F) = PF δ(X)П р и м е р 35. Пусть любое изделие некоторого производства оказывается браком с вероятностью p. Контроль продукции допускает ошибки:годное изделие бракует с вероятностью γ , а бракованное пропускает (признаёт годным) с вероятностью ε.Если ввести для проверяемого изделия гипотезы H1 = {изделиегодное} и H2 = {изделие бракованное}, а критерием выбора одной изних считать контроль продукции, то γ — вероятность ошибки первого рода этого критерия, а ε — второго рода:γ = P H1 (δ = H2 ) = P(контроль забраковал годное изделие);ε = P H2 (δ = H1 ) = P(контроль пропустил бракованное изделие);У п р а ж н е н и е .
Вычислить вероятности ошибок первого и второгорода того же критерия, если гипотезы занумеровать иначе:H1 = изделие бракованное , H2 = изделие годное .Надеемся, что читатель на основании своего опыта и воображения сделал для себя следующие выводы.1. Статистический критерий не отвечает на вопрос, верна или нет проверяемая гипотеза. Он лишь решает, противоречат или не противоречатвыдвинутой гипотезе выборочные данные, можно ли принять или следуетотвергнуть данную гипотезу.2. Вывод «данные противоречат гипотезе» всегда весомее и категоричнее, нежели вывод «данные не противоречат гипотезе».3.
Нам неизвестно, какая из гипотез верна в действительности, поэтому следует считаться с гипотетическими вероятностями ошибок критерия.Смысл этих ошибок в следующем: если много раз применять критерийк выборкам из распределения, для которого гипотеза Hi верна, то в среднем доля αi таких выборок будет признана противоречащей гипотезе Hi .82ГЛАВА VII. ПРОВЕРКА ГИПОТЕЗ§ 2.
Подходы к сравнению критериевРассмотрим подробно случай, когда имеются две простые гипотезыо распределении наблюденийH1 = {F = F1 } и H2 = {F = F2 }.~ принимает не более двух значений. Это ознаТогда любой критерий δ(X)чает, что область Rn делится на две части Rn = S ∪ (Rn \S) так, что(~ ∈ Rn \S,H1 , если X~δ(X) =~ ∈ S.H2 , если XОбласть S, в которой принимается вторая (альтернативная) гипотеза, называется критической областью.О п р е д е л е н и е 24. Вероятность ошибки первого рода α1 = α1 (δ)иначе называют размером или критическим уровнем критерия δ :~ 6= H1 ) = PH (δ(X)~ = H2 ) = PH (X~ ∈ S).α1 = α1 (δ) = PH (δ(X)111Мощностью критерия δ называют величину 1 − α2 , где α2 = α2 (δ) —вероятность ошибки второго рода критерия δ. Мощность критерия равна~ 6= H2 ) = PH (δ(X)~ = H2 ) = PH (X~ ∈ S).1 − α2 (δ) = 1 − PH (δ(X)222Заметим, что вероятности ошибок первого и второго рода вычисляютсяпри разных предположениях о распределении (верна H1 либо верна H2 ),поэтому никакими фиксированными соотношениями вида α1 ≡ 1 − α2 этиошибки не связаны.Как сравнивать критерии? Разумеется, критерий тем лучше, чем меньше вероятности его ошибок.
Но если сравнивать критерии по двум вероятностям ошибок одновременно, чтобыαi (δ1 ) 6 αi (δ2 )приi = 1, 2,то слишком многие критерии окажутся несравнимыми. Например, рассмотрим два крайних случая, когда критерий, независимо от выборки,всегда принимает одну и ту же гипотезу.~ ≡ H1 всегда выбирает первуюП р и м е р 36. Пусть критерий δ(X)гипотезу. Тогда α1 = PH1 (δ = H2 ) = 0, α2 = PH2 (δ = H1 ) = 1.~ ≡ H2 всегда выбирает вторую гипотеНаоборот: пусть критерий δ(X)зу. Тогда α1 = PH1 (δ = H2 ) = 1, α2 = PH2 (δ = H1 ) = 0.§ 2. Подходы к сравнению критериев83П р и м е р 37.
Имеется выборка объёма n = 1 из нормального распределения Na, 1 и две простые гипотезы H1 = {a = 0} и H2 = {a = 1}.Рассмотрим при некотором b ∈ R следующий критерий:(H1 , если X1 6 b,δ(X1 ) =H2 , если X1 > b.Изобразим на графике (рис. 10) соответствующие гипотезам плотностираспределений и вероятности ошибок первого и второго рода критерия δα1 = PH1 (X1 > b),α2 = PH2 (X1 6 b).N0,1N1,1α20α1b1Рис. 10. Две простые гипотезыВидим, что с ростом числа b вероятность ошибки первого рода α1уменьшается, но вероятность ошибки второго рода α2 растёт.Итак, примеры 36 и 37 показывают общую тенденцию: при попыткеуменьшить одну из вероятностей ошибок другая, как правило, увеличива~ ∈ S) за счёт сужения критическойется. Так, если уменьшать α1 = PH1 (Xобласти S, то одновременно будет расти вероятность ошибки второго рода~ ∈ S).и уменьшаться мощность критерия 1 − α2 = PH2 (XПеречислим общепринятые подходы к сравнению критериев.