1625915145-5b3debabab98d9e994cc3a1bc8da0f5b (843876), страница 14
Текст из файла (страница 14)
Тогда√ X −a= N0, 1 (для a при σ известном),⊂1) nσ)n (∑Xi − a 2= Hn (для σ2 при a известном),⊂2)σi=13)(n − 1) S024)√ X −a= Tn−1 (для a при σ неизвестном).⊂nσ2= Hn−1 (для σ2 при a неизвестном),⊂S0Д о к а з а т е л ь с т в о. Утверждения (1) и (3) следуют из леммы Фишера, (2) — из теоремы 5. Осталось воспользоваться леммой Фишера и определением распределения Стьюдента, чтобы доказать (4). Запишем√ X −a√ X −a1ξ(20)n= n· √= √ 0 ,σS0(n − 1)S02σ2·1n−1χ2n−1n−1где величины√ X −a= N0, 1 и χ2n−1 = (n − 1)S02 /σ2 ⊂= Hn−1⊂ξ0 = nσнезависимы по теореме 5. По определению 19, величина (20) имеет распределение Стьюдента Tn−1 .77§ 3.
Доверительные интервалы для нормального распределения§ 3. Точные доверительные интервалы для параметровнормального распределенияПусть X1 , . . . , Xn — выборка объёма n из распределения Na, σ2 . Построим точные доверительные интервалы (ДИ) с уровнем доверия 1 − εдля параметров нормального распределения, используя соответствующиеутверждения теоремы 20.П р и м е р 30 (Д И д л я a п р и и з в е с т н о м σ2 ). Этот интервал мыпостроили в примере 26 (с. 58):()τστσP X− √ <a<X+ √= 1 − ε, где Φ0,1 (τ) = 1 − ε/2.nnП р и м е р 31 (Д И д л я σ2 п р и и з в е с т н о м a ). По теореме 20nnS121 ∑2= Hn , где S1 =⊂(Xi − a)2 .2σni=1Пусть g1 и g2 — квантили распределения Hn уровней ε/2 и 1 − ε/2соответственно.
Тогда)()(2nS12nSnS12< σ2 < 1 .1 − ε = P g1 < 2 < g2 = Pσg2g1П р и м е р 32 (Д И д л я σ2 п р и н е и з в е с т н о м a ). По теореме 20n(n − 1)S021 ∑2= Hn−1 , где S0 =⊂(Xi − X)2 .2σn−1i=1Пусть g1 и g2 — квантили распределения Hn−1 уровней ε/2 и 1 − ε/2соответственно.
Тогда)(()(n − 1)S02(n − 1)S02(n − 1)S022< g2 = P1 − ε = P g1 <<σ <.2σg2g1У п р а ж н е н и е . Найти 17 отличий примера 31 от примера 32.П р и м е р 33 (Д И д л я a п р и н е и з в е с т н о м σ ). По теореме 20√ X −a= Tn−1 .⊂nS0Пусть c — квантиль распределения Tn−1 уровня 1 − ε/2. Распределение Стьюдента симметрично. Поэтому()()√ X −ac S0c S01 − ε = P −c < n<c =P X− √ <a<X+ √.S0nn78ГЛАВА VI. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМУ п р а ж н е н и е . Сравнить примеры 30 и 33.З а м е ч а н и е 14. Доверительные интервалы, полученные в примерах31 и 32, выглядят странно по сравнению с доверительными интерваламииз примеров 30 и 33: они содержат n в числителе, а не в знаменателе.Но если квантили нормального распределения от n не зависят вовсе,квантили распределения Стьюдента асимптотически не зависят от n посвойству Tn ⇒ N0,1 , то квантили распределения Hn зависят от n существенно.Действительно, пусть gn таковы, что P(χ2n < gn ) = δ при всех n,и пусть τδ — квантиль уровня δ стандартного нормального распределения.
Тогда по свойству 3 (с. 67))(2 −ng−nχnn√< √→ Φ0, 1 (τδ ) = δ.P(χ2n < gn ) = P2nПоэтому2ngn − n√→ τδ при n → ∞ и, следовательно,2n√√gn = n + τδ 2n + o( n).У п р а ж н е н и е . Подставить в границы доверительных интерваловиз п. 2—3 асимптотические выражения для квантилей и выяснить, какведёт себя длина этих интервалов с ростом n.§ 4. Вопросы и упражнения1. Величины ξ1 и ξ2 независимы и имеют нормальное распределениес параметрами a = 0, σ2 = 16. Найти k, при котором величины ξ1 − 3ξ2и k ξ1 + ξ2 независимы. Можно использовать теорему 18 (с. 73).2. Как, пользуясь таблицей стандартного нормального распределения, найти квантиль заданного уровня для χ2-распределения с одной степенью свободы?3. Изобразить квантили уровней ε/2 и 1− ε/2 на графиках плотностейраспределений Hn и Tn−1 .4.
Вычислить, зная распределение (n − 1)S02 /σ2 и пользуясь известным математическим ожиданием и дисперсией распределения χ2 , математическое ожидание и дисперсию длины доверительного интервала длядисперсии нормального распределения при неизвестном среднем.5. Вычислить математическое ожидание и дисперсию длины доверительного интервала для среднего нормального распределения при неизвестной дисперсии.Г Л А В А VIIПРОВЕРКА ГИПОТЕЗИмея выборку, мы можем выдвинуть несколько взаимоисключающих гипотез о теоретическом распределении, одну из которых следует предпочестьостальным. Задача выбора одной из нескольких гипотез решается построением статистического критерия. Как правило, по выборке конечного объёмабезошибочных выводов о распределении сделано быть не может, поэтому всегда есть опасность выбрать неверную гипотезу.
Так, бросая монету, можновыдвигать предположения об истинной вероятности выпадения герба. Допустим, есть две гипотезы: вероятность либо находится в пределах 0,45—0,55,либо нет. Получив после ста бросков ровно 51 герб, мы наверняка выберемпервую гипотезу. Однако есть ненулевые шансы на то, что и при p = 0,3 выпадет 51 герб: выбирая первую гипотезу, мы можем ошибиться. Напротив,получив 33 герба, мы скорее всего предпочтём вторую гипотезу. И опятьне исключена возможность, что столь далёкое от половины число гербовесть просто результат случайности, а монета на самом деле симметрична.§ 1. Гипотезы и критерииПусть дана выборка X1 , .
. . , Xn из распределения F. Мы будем считать выборку набором независимых случайных величин с одним и темже распределением, хотя в ряде задач и эти предположения нуждаютсяв проверке. Тогда одинаковая распределённость или независимость наблюдений не предполагается.О п р е д е л е н и е 21. Гипотезой ( H ) называется любое предположение о распределении наблюдений:H = {F = F1 }илиH = { F ∈ F },где F — некоторое подмножество в множестве всех распределений. Гипотеза H называется простой, если она указывает на единственное распределение: F = F1 . Иначе H называется сложной: F ∈ F.Если гипотез всего две, то одну из них принято называть основной,а другую — альтернативой, или отклонением от основной гипотезы.80ГЛАВА VII.
ПРОВЕРКА ГИПОТЕЗП р и м е р 34. Перечислим типичные задачи проверки гипотез.1. Выбор из нескольких простых гипотез: есть H1 = {F = F1 }, . . . ,Hk = {F = Fk }, и другие предположения невозможны.2. Простая основная гипотеза и сложная альтернатива:H1 = {F = F1 },H2 = {F ̸= F1 }.Например, дана выборка из семейства распределений Bp , где p ⩽ 1/2.Есть простая гипотеза H1 = {p = 1/2} и сложная односторонняя альтернатива H2 = {p < 1/2}. Случай p > 1/2 исключен априори.3. Сложная основная гипотеза и сложная альтернатива:H1 = {F ∈ F},H2 = {F ̸∈ F}.Например, гипотеза о нормальности: H1 = {распределение F являетсянормальным} при альтернативе H2 = {H1 неверна}.4.
Гипотеза однородности: есть несколько выборок; основная гипотезасостоит в том, что эти выборки извлечены из одного распределения.5. Гипотеза независимости: по выборке (X1 , Y1 ), . . . , (Xn , Yn ) из nнезависимых наблюдений пары случайных величин проверяется гипотеза H1 = {Xi и Yi независимы} при альтернативе H2 = {H1 неверна}.Обе гипотезы являются сложными.6. Гипотеза случайности.
В эксперименте наблюдаются n случайныхвеличин X1 , . . . , Xn и проверяется сложная гипотеза H1 = {X1 , . . . , Xnнезависимы и одинаково распределены }.Эту задачу ставят, например, при проверке качества генератора случайных чисел.Пусть дана выборка X1 , .
. . , Xn , относительно распределения которойвыдвинуты гипотезы H1 , . . . , Hk .О п р е д е л е н и е 22. Критерием δ = δ(X1 , . . . , Xn ) называется измеримое отображениеδ : Rn → {H1 , . . . , Hk }из множества всех возможных значений выборки в множество гипотез.Измеримость понимается в обычном смысле: {ω | δ(X1 , . . . , Xn ) = Hi }есть событие при любом i = 1, . . . , k.О п р е д е л е н и е 23. Говорят, что произошла ошибка i -го рода критерия δ, если критерий отверг верную гипотезу Hi . Вероятностью ошибкиi -го рода критерия δ называется число⃗ ̸= Hi ).αi (δ) = PH (δ(X)i§ 1. Гипотезы и критерии81З а м е ч а н и е 15.
Говоря «Hi верна» и вычисляя PHi (··), мы имеемв виду, что распределение выборки именно такое, как предполагает гипотеза Hi , и вычисляем вероятность в соответствии с этим распределением.Если гипотеза Hi простая, т. е. указывает ровно на одно возможное распределение выборки, то αi (δ) — число.
Если же Hi — сложная гипотеза,то αi (δ) будет зависеть от того, при каком именно из распределений F,отвечающих Hi , вычисляется вероятность:()()⃗ =⃗ ̸= Hi | Xi ⊂= F .αi (δ) = αi (δ, F) = PF δ(X)̸ Hi = P δ(X)П р и м е р 35. Пусть любое изделие некоторого производства оказывается браком с вероятностью p. Контроль продукции допускает ошибки:годное изделие бракует с вероятностью γ , а бракованное пропускает (признаёт годным) с вероятностью ε.Если ввести для проверяемого изделия гипотезы H1 = {изделиегодное} и H2 = {изделие бракованное}, а критерием выбора одной изних считать контроль продукции, то γ — вероятность ошибки первого рода этого критерия, а ε — второго рода:γ = P H1 (δ = H2 ) = P(контроль забраковал годное изделие);ε = P H2 (δ = H1 ) = P(контроль пропустил бракованное изделие);У п р а ж н е н и е .