Н.И. Чернова - Математическая статистика (1115306), страница 11
Текст из файла (страница 11)
е. можно с самого начала считать, что Xi имеют стандартное нормальное распределение, и доказывать пункт 2 следствия при a = 0, σ2 = 1.где zi =Применим лемму Фишера.T (X) = (n − 1)S20 =n Xi=12Xi − X=nXi=153X2i − n(X)2 =nXi=1X2i − Y12 .Мы обозначили через Y1 величинуY1 =√XnX1n X = √ + ... + √ .nnЧтобы применить лемму Фишера, нужно найти ортогональную матрицу C такую,что Y1 — перваякоордината вектора Y = C·X. Возьмем матрицу C с первой строкой11√ , . . .
, √ . Так как длина (норма) этого вектора — единица, его можноnnдополнить до ортонормального базиса в IRn (иначе — этот столбец можно дополнить√до ортогональной матрицы). Тогда Y1 = n X и будет первой координатой вектораY = C · X.Осталось применить лемму Фишера. непременно сделайте это!3. Из леммы Фишера сразу следует, что T (X) = (n−1)S20 =√от Y1 = n X, то есть X и S20 независимы.Pn22i=1 Xi −Y1не зависитОчередное следствие из леммы Фишера наконец позволит нам строить доверительные интервалы для параметров нормального распределения — то, ради чего мы идоказали уже так много утверждений. В каждом пункте указано, для какого параметрамы построим доверительный интервал с помощью данного утверждения.Следствие основного следствия леммы Фишера.√ X−aимеет стандартное нормальное распределение (для a при σ известном);1) nσ2)nPi=13)nPi=14)Xi − aσXi − Xσ2имеет распределение Hn (для σ2 при a известном);!2=(n − 1)S20имеет распределение Hn−1 (для σ2 при a неизвестном);σ2√ X−a √ X−aимеет распределение Tn−1 (для a при σ неизвестном).= nnqS0S20Доказательство следствия.1) и 3) — из леммы Фишера, 2) — из следствия 3.
Осталось воспользоваться леммойФишера и определением 17 распределения Стьюдента, чтобы доказать 4).√ X−a √ X−a= nnqS20| {zσ }N0,1×1vuu (n − 1)S20t|- независ. %2σ{z1}n−1=sξ0χ2n−1n−1Hn−1По определению 17, такое отношение имеет распределение Стьюдента Tn−1 .54.6.6. Точные ДИ для параметров нормального распределения1. Для a при известном σ2 . Этот интервал мы уже построили в примере 23:τ1−ε/2 στ1−ε/2 σPa,σ2 X − √<a<X+ √= 1 − ε, где Φ0,1 (τ1−ε/2 ) = 1 − ε/2.nn2.
Для σ2 при известном a. По п. 2 следствия,1XnS21(Xi − a)2 .имеет распределение Hn , где S21 =2σnni=1Пусть g1 = χ2n,ε/2 и g2 = χ2n,1−ε/2 — квантили распределения Hn уровня ε/2и 1 − ε/2. Тогда1 − ε = Pa,σ2nS2g1 < 21 < g2σ!= Pa,σ2nS21nS21< σ2 <g2g1!.3. Для σ2 при неизвестном a. По п. 3 следствия,1 X(n−1)S202(Xi − X)2 .имеетраспределениеH,гдеS=n−10σ2n−1ni=1Пусть g1 = χ2n−1,ε/2 и g2 = χ2n−1,1−ε/2 — квантили распределения Hn−1 уровня ε/2и 1 − ε/2. Тогда1 − ε = Pa,σ2(n−1)S20g1 << g2σ2!= Pa,σ2(n−1)S20(n − 1)S20< σ2 <g2g1!.Упражнение. Найти 17 отличий п.
3 от п. 2.4. Для a при неизвестном σ. По п. 4 следствия,n√ X−a1 X2n(Xi − X)2 .имеет распределение Tn−1 , где S0 =S0n−1i=1Пусть a1 = tn−1,ε/2 и a2 = tn−1,1−ε/2 — квантили распределения Tn−1 уровня ε/2и 1 − ε/2. Распределение Стьюдента симметрично, поэтому a1 = −a2 . Тогда!1 − ε = Pa,σ2√ X−a−tn−1,1−ε/2 < n< tn−1,1−ε/2 =S0tn−1,1−ε/2 S0tn−1,1−ε/2 S0√√.<a<X+= Pa,σ2 X −nnУпражнение. Сравнить п. 4 с п. 1.Замечание 15. ДИ, полученные в п.
2 и 3, выглядят странно по сравнению с ДИ изп. 1 и 4: они содержат n в числителе, а не в знаменателе. Но если квантили нормальногораспределения от n не зависят вовсе, квантили распределения Стьюдента асимптотически независят от n по свойству Tn ⇒ N0,1 , то квантили распределения Hn зависят от n существенно.Действительно, пусть g = g(n) таково, что P (χ2n < g) = δ при всех n, в том числе иg−nпри n → ∞. Тогда последовательность g(n) такова, что √→ τδ при n → ∞, где τδ2n— квантиль стандартного нормального распределения.
В самом деле: по ЦПТ с ростом n! 2nXg−nχn − n22√< √→ Φ0,1 (τδ ) = δ.ξi < g = PP (χn < g) = P2n2ni=1√√Поэтому квантиль уровня δ распределения Hn ведет себя как g = g(n) = n+τδ 2n+o( n).Упражнение. Подставить в границы ДИ из п. 2 и 3 асимптотические выражения дляквантилей и выяснить, как ведет себя длина этих ДИ с ростом n.556.7. Вопросы и упражнения1. Величины ξ1 и ξ2 независимы и имеют нормальное распределение N(0, 16). Найти k, прикотором величины ξ1 − 3ξ2 и kξ1 + ξ2 независимы.
Можно использовать свойство 9.2. Доказать, что для величины χ2n с распределением Hn справедлива аппроксимация Фишера:qq2χ2n − 2n ⇒ N0,1 ,и вывести отсюда, что при больших n для вычисления квантилей распределения Hn можнопользоваться аппроксимациейqq√√√√ 22Hn (x) = P χn < x = P2χn − 2n < 2x − 2n ≈ Φ0,12x − 2n .Указание. Домножить и поделить на сопряженное и воспользоваться ЦПТ и ЗБЧ вместесо свойствами произведения слабо сходящейся и сходящейся по вероятности к постояннойпоследовательностей.3.
Изобразить квантили уровня ε/2 и 1−ε/2 на графике плотности распределения Hn и Tn−1 .4. Вычислить, зная распределение (n−1)S20 /σ2 и пользуясь известным математическим ожиданием и дисперсией распределения χ2 , математическое ожидание и дисперсию длины ДИдля дисперсии нормального распределения при неизвестном среднем.7. Проверка гипотезЕсли возможно выдвинуть несколько взаимоисключающих «гипотез» о распределении элементов выборки, то возникает задача выбора одной из этих гипотез на основании выборочных данных. Как правило, по выборке конечного объема безошибочныхвыводов о распределении сделано быть не может, поэтому приходится считаться свозможностью выбрать неверную гипотезу.Пусть дана выборка X = (X1 , . . .
, Xn ) из распределения F. Если не оговоренопротивное, считается, что все наблюдения имеют одно и то же распределение. Вряде случаев это предположение также нуждается в проверке (см., например, ниже:гипотеза об однородности или гипотеза о случайности) — в таких случаях одинаковаяраспределенность наблюдений не предполагается. То же касается и независимостинаблюдений.Определение 19. Гипотезой ( H ) называется любое предположение о распределениинаблюдений:^} .H = F = F1илиH = F ∈ {FГипотеза Hпростой, если она однозначно определяет распределение, называетсят. е. H = F = F1 .
Иначе H называется сложной гипотезой. Сложная гипотеза^ }.предполагает, что распределение F — одно из некоторого множества распределений { FЕсли гипотез всего две, то одну из них принято называть основной, а другую— альтернативой или отклонением от основной гипотезы.56Пример 27 (типичные постановки задач).1. Выбор из нескольких простых гипотез: H1 = F = F1 , . . . , Hk = F = Fk (и другие предположения невозможны).2.
Простая основнаяальтернатива:H1 = F = F1 , H2 = F 6= F1 . гипотеза и сложнаяНапример, H1 = F = U0,1 , H2 = F 6= U0,1 .Еще вариант: дана выборка из семейства распределений Bp , где 0 < p 6 1/2. Простая гипотезаH1 = p = 1/2 .
Сложная односторонняя альтернатива H2 = p < 1/2 . Случай p > 1/2исключен априори.^ } , H2 = F 6∈ { F^3. Сложная основная гипотеза и сложная альтернатива: H1 = F ∈ {F } .Например, гипотеза о нормальности H1 = F ∈ { Na,σ2 , a ∈ IR, σ > 0 } , H2 = H1 неверна .4. Гипотеза однородности. Заданы несколько выборок:(X11 , . .
. , X1n1 ) из распределенияF1 ,(Xk1 , . . . , Xknk ) из распределения Fk .. . . ,Проверяется гипотезаH=F=···=F—сложнаягипотеза — против (сложной) аль11kтернативы H2 = H1 неверна .5. Гипотеза независимости. Наблюдается пара случайных величин (ξ, η).По выборке (X1 , Y1 ), . . . , (Xn , Yn ) из n независимых наблюдений над парой (ξ, η) проверяетсягипотезаH=ξ и η независимы — сложная гипотеза — против (сложной) альтернативы1H2 = H1 неверна .6. Гипотеза случайности.
В эксперименте наблюдаются n случайных величин (ξ1 , . . . , ξn ).По выборке X1 , . . . , Xn , в которойкаждая случайная величина представлена одним значением, проверяется гипотеза H1 = ξ1 , . . . , ξn независимыиодинаковораспределены— сложнаягипотеза — против (сложной) альтернативы H2 = H1 неверна .Эту задачу ставят, например, если требуется проверить качество датчика случайных чисел.Определение 20.
Если имеются гипотезы H1 , . . . , Hk , то критерием (нерандомизированным критерием) δ = δ(X1 , . . . , Xn ) называется отображениеδ : IRn → {H1 , . . . , Hk }.О рандомизированных критериях, которые предписывают принимать каждую гипотезу с некоторой (зависящей от выборки) вероятностью, мы поговорим позднее.Определение 21. Для заданного критерия δ : IRn → {H1 , . . . , Hk } будем говорить, чтопроизошла ошибка i-го рода, если гипотеза Hi отвергнута критерием, в то время какона верна. Вероятностью ошибки i-го рода критерия δ называетсяαi (δ) = PHi (δ(X) 6= Hi ).Замечание 16. Говоря «Hi верна» и вычисляя PHi (··), мы имеем в виду, что распределение выборки именно такое, как предполагает гипотеза Hi , и вычисляем вероятность в соответствии с этимраспределением. Если гипотеза Hi простая, т.
е. указывает ровно на одно возможное распределениевыборки, то αi (δ) — число. Если же Hi — сложная гипотеза, то αi (δ) будет зависеть от того, прикаком именно из распределений Fi , отвечающих Hi , вычисляется вероятность:αi (δ) = αi (δ, Fi ) = PFi (δ(X) 6= Hi )57Пример 28 (контроль качества и ошибки).Пусть любое изделие некоторого производства оказывается браком с вероятностью p.Контроль продукции допускает ошибки: годное изделие бракует с вероятностью γ, абракованное пропускает (признает годным) с вероятностью ε.Есливвестидлянаудачувзятогоизделиядвегипотезы:H=изделиегодноеи1H2 = изделие бракованное , и критерием выбора считать контроль продукции, то γесть вероятность ошибки первого рода, а ε — вероятность ошибки второго рода данногокритерия:γ = PH1 (δ = H2 ) = Pизделие годное (контроль забраковал изделие);ε = PH2 (δ = H1 ) = Pизделие бракованное (контроль пропустил изделие);Упражнение.
Вычислить вероятности ошибок первогои второго рода того жекритерия,еслигипотезызанумероватьиначе:H=изделиебракованноеи H2 =1изделие годное .Надеемся, что читатель сделал для себя следующие выводы:1. Статистический критерий не отвечает на вопрос, верна или нет проверяемая гипотеза. Онлишь решает, противоречат или не противоречат выдвинутой гипотезе выборочные данные,можно ли принять или следует отвергнуть данную гипотезу.2. Если есть одна основная гипотеза, а все остальное — нежелательные отклонения от нее, товывод «данные противоречат гипотезе» всегда весомее, нежели вывод «данные не противоречат гипотезе».3.