1612725170-d2dcc605205feb3d5b9a0101f2221951 (828894), страница 13
Текст из файла (страница 13)
58):τστσ= 1 − ε, где Φ0,1 (τ) = 1 − ε/2.P X− √ <a<X+ √nnП р и м е р 31 (Д И д л я σ2 п р и и з в е с т н о м a ). По теореме 20nnS121 X2= Hn , где S1 =⊂(Xi − a)2 .2σni=1Пусть g1 и g2 — квантили распределения Hn уровней ε/2 и 1 − ε/2соответственно. Тогда2nS12nS12nS1 − ε = P g1 < 2 < g2 = P< σ2 < 1 .σg2g1П р и м е р 32 (Д И д л я σ2 п р и н е и з в е с т н о м a ). По теореме 20n(n − 1)S021 X2= Hn−1 , где S0 =⊂(Xi − X)2 .2σn−1i=1Пусть g1 и g2 — квантили распределения Hn−1 уровней ε/2 и 1 − ε/2соответственно.
Тогда2(n − 1)S02(n−1)S(n − 1)S020< g2 = P< σ2 <.1 − ε = P g1 <2σg2g1У п р а ж н е н и е . Найти 17 отличий примера 31 от примера 32.П р и м е р 33 (Д И д л я a п р и н е и з в е с т н о м σ ). По теореме 20√ X −a= Tn−1 .⊂nS0Пусть c — квантиль распределения Tn−1 уровня 1 − ε/2. Распределение Стьюдента симметрично. Поэтому√ X −acScS1 − ε = P −c < n< c = P X − √0 < a < X + √0 .S0nn78ГЛАВА VI. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМУ п р а ж н е н и е . Сравнить примеры 30 и 33.З а м е ч а н и е 14.
Доверительные интервалы, полученные в примерах31 и 32, выглядят странно по сравнению с доверительными интервалами из примеров 30 и 33: они содержат n в числителе, а не в знаменателе. Но если квантили нормального распределения от n не зависят вовсе,квантили распределения Стьюдента асимптотически не зависят от n посвойству Tn ⇒ N0,1 , то квантили распределения Hn зависят от n существенно.Действительно, пусть gn таковы, что P(χ2n < gn ) = δ при всех n,и пусть τδ — квантиль уровня δ стандартного нормального распределения.
Тогда по свойству 3 (с. 67)2 −nχg−nnn√→ Φ0, 1 (τδ ) = δ.P(χ2n < gn ) = P< √2nПоэтому2ngn − n√→ τδ при n → ∞ и, следовательно,2n√√gn = n + τδ 2n + o( n).У п р а ж н е н и е . Подставить в границы доверительных интервалов изп. 2—3 асимптотические выражения для квантилей и выяснить, как ведётсебя длина этих интервалов с ростом n.§ 4. Вопросы и упражнения1. Величины ξ1 и ξ2 независимы и имеют нормальное распределениес параметрами a = 0, σ2 = 16. Найти k, при котором величины ξ1 − 3ξ2и k ξ1 + ξ2 независимы. Можно использовать теорему 18 (с.
73).2. Как, пользуясь таблицей стандартного нормального распределения,найти квантиль заданного уровня для χ2-распределения с одной степеньюсвободы?3. Изобразить квантили уровней ε/2 и 1− ε/2 на графиках плотностейраспределений Hn и Tn−1 .4. Вычислить, зная распределение (n − 1)S02 /σ2 и пользуясь известным математическим ожиданием и дисперсией распределения χ2 , математическое ожидание и дисперсию длины доверительного интервала длядисперсии нормального распределения при неизвестном среднем.5. Вычислить математическое ожидание и дисперсию длины доверительного интервала для среднего нормального распределения при неизвестной дисперсии.Г Л А В А VIIПРОВЕРКА ГИПОТЕЗИмея выборку, мы можем выдвинуть несколько взаимоисключающих гипотез о теоретическом распределении, одну из которых следует предпочестьостальным.
Задача выбора одной из нескольких гипотез решается построением статистического критерия. Как правило, по выборке конечного объёмабезошибочных выводов о распределении сделано быть не может, поэтому всегда есть опасность выбрать неверную гипотезу. Так, бросая монету, можновыдвигать предположения об истинной вероятности выпадения герба. Допустим, есть две гипотезы: вероятность либо находится в пределах 0,45—0,55,либо нет. Получив после ста бросков ровно 51 герб, мы наверняка выберемпервую гипотезу.
Однако есть ненулевые шансы на то, что и при p = 0,3выпадет 51 герб: выбирая первую гипотезу, мы можем ошибиться. Напротив, получив 33 герба, мы скорее всего предпочтём вторую гипотезу. И опятьне исключена возможность, что столь далёкое от половины число гербов естьпросто результат случайности, а монета на самом деле симметрична.§ 1. Гипотезы и критерииПусть дана выборка X1 , .
. . , Xn из распределения F. Мы будем считать выборку набором независимых случайных величин с одним и тем жераспределением, хотя в ряде задач и эти предположения нуждаются в проверке. Тогда одинаковая распределённость или независимость наблюденийне предполагается.О п р е д е л е н и е 21. Гипотезой ( H ) называется любое предположение о распределении наблюдений:H = {F = F1 }илиH = { F ∈ F },где F — некоторое подмножество в множестве всех распределений.
Гипотеза H называется простой, если она указывает на единственное распределение: F = F1 . Иначе H называется сложной: F ∈ F.Если гипотез всего две, то одну из них принято называть основной,а другую — альтернативой, или отклонением от основной гипотезы.80ГЛАВА VII. ПРОВЕРКА ГИПОТЕЗП р и м е р 34. Перечислим типичные задачи проверки гипотез.1.
Выбор из нескольких простых гипотез: есть H1 = {F = F1 }, . . . ,Hk = {F = Fk }, и другие предположения невозможны.2. Простая основная гипотеза и сложная альтернатива:H1 = {F = F1 },H2 = {F 6= F1 }.Например, дана выборка из семейства распределений Bp , где p 6 1/2.Есть простая гипотеза H1 = {p = 1/2} и сложная односторонняя альтернатива H2 = {p < 1/2}.
Случай p > 1/2 исключен априори.3. Сложная основная гипотеза и сложная альтернатива:H1 = {F ∈ F},H2 = {F 6∈ F}.Например, гипотеза о нормальности: H1 = {распределение F являетсянормальным} при альтернативе H2 = {H1 неверна}.4. Гипотеза однородности: есть несколько выборок; основная гипотезасостоит в том, что эти выборки извлечены из одного распределения.5. Гипотеза независимости: по выборке (X1 , Y1 ), . . . , (Xn , Yn ) из nнезависимых наблюдений пары случайных величин проверяется гипотеза H1 = {Xi и Yi независимы} при альтернативе H2 = {H1 неверна}.Обе гипотезы являются сложными.6.
Гипотеза случайности. В эксперименте наблюдаются n случайныхвеличин X1 , . . . , Xn и проверяется сложная гипотеза H1 = {X1 , . . . , Xnнезависимы и одинаково распределены }.Эту задачу ставят, например, при проверке качества генератора случайных чисел.Пусть дана выборка X1 , . . . , Xn , относительно распределения которойвыдвинуты гипотезы H1 , .
. . , Hk .О п р е д е л е н и е 22. Критерием δ = δ(X1 , . . . , Xn ) называется измеримое отображениеδ : Rn → {H1 , . . . , Hk }из множества всех возможных значений выборки в множество гипотез.Измеримость понимается в обычном смысле: {ω | δ(X1 , . . . , Xn ) = Hi }есть событие при любом i = 1, . .
. , k.О п р е д е л е н и е 23. Говорят, что произошла ошибка i -го рода критерия δ, если критерий отверг верную гипотезу Hi . Вероятностью ошибкиi -го рода критерия δ называется число~ 6= Hi ).αi (δ) = PH (δ(X)i§ 1. Гипотезы и критерии81З а м е ч а н и е 15. Говоря «Hi верна» и вычисляя PHi (··), мы имеемв виду, что распределение выборки именно такое, как предполагает гипотеза Hi , и вычисляем вероятность в соответствии с этим распределением.Если гипотеза Hi простая, т. е. указывает ровно на одно возможное распределение выборки, то αi (δ) — число. Если же Hi — сложная гипотеза,то αi (δ) будет зависеть от того, при каком именно из распределений F,отвечающих Hi , вычисляется вероятность:~ 6= Hi = P δ(X)~ 6= Hi | Xi ⊂= F .αi (δ) = αi (δ, F) = PF δ(X)П р и м е р 35. Пусть любое изделие некоторого производства оказывается браком с вероятностью p.
Контроль продукции допускает ошибки:годное изделие бракует с вероятностью γ , а бракованное пропускает (признаёт годным) с вероятностью ε.Если ввести для проверяемого изделия гипотезы H1 = {изделиегодное} и H2 = {изделие бракованное}, а критерием выбора одной изних считать контроль продукции, то γ — вероятность ошибки первого рода этого критерия, а ε — второго рода:γ = P H1 (δ = H2 ) = P(контроль забраковал годное изделие);ε = P H2 (δ = H1 ) = P(контроль пропустил бракованное изделие);У п р а ж н е н и е . Вычислить вероятности ошибок первого и второгорода того же критерия, если гипотезы занумеровать иначе:H1 = изделие бракованное , H2 = изделие годное .Надеемся, что читатель на основании своего опыта и воображения сделал для себя следующие выводы.1.
Статистический критерий не отвечает на вопрос, верна или нет проверяемая гипотеза. Он лишь решает, противоречат или не противоречатвыдвинутой гипотезе выборочные данные, можно ли принять или следуетотвергнуть данную гипотезу.2. Вывод «данные противоречат гипотезе» всегда весомее и категоричнее, нежели вывод «данные не противоречат гипотезе».3. Нам неизвестно, какая из гипотез верна в действительности, поэтому следует считаться с гипотетическими вероятностями ошибок критерия.Смысл этих ошибок в следующем: если много раз применять критерийк выборкам из распределения, для которого гипотеза Hi верна, то в среднем доля αi таких выборок будет признана противоречащей гипотезе Hi .82ГЛАВА VII.
ПРОВЕРКА ГИПОТЕЗ§ 2. Подходы к сравнению критериевРассмотрим подробно случай, когда имеются две простые гипотезыо распределении наблюденийH1 = {F = F1 } и H2 = {F = F2 }.~ принимает не более двух значений. Это ознаТогда любой критерий δ(X)чает, что область Rn делится на две части Rn = S ∪ (Rn \S) так, что(~ ∈ Rn \S,H1 , если X~δ(X) =~ ∈ S.H2 , если XОбласть S, в которой принимается вторая (альтернативная) гипотеза, называется критической областью.О п р е д е л е н и е 24.
Вероятность ошибки первого рода α1 = α1 (δ)иначе называют размером или критическим уровнем критерия δ :~ 6= H1 ) = PH (δ(X)~ = H2 ) = PH (X~ ∈ S).α1 = α1 (δ) = PH (δ(X)111Мощностью критерия δ называют величину 1 − α2 , где α2 = α2 (δ) —вероятность ошибки второго рода критерия δ. Мощность критерия равна~ 6= H2 ) = PH (δ(X)~ = H2 ) = PH (X~ ∈ S).1 − α2 (δ) = 1 − PH (δ(X)222Заметим, что вероятности ошибок первого и второго рода вычисляютсяпри разных предположениях о распределении (верна H1 либо верна H2 ),поэтому никакими фиксированными соотношениями вида α1 ≡ 1 − α2 этиошибки не связаны.Как сравнивать критерии? Разумеется, критерий тем лучше, чем меньше вероятности его ошибок.