Н.И. Чернова - Лекции по матстату (1115348), страница 12
Текст из файла (страница 12)
α(δ) = PH1 (|ρ(X)|52~ < C) → 0 для любой альтернативы H2 (F2 ) : F = F2 6= F1 .2. βF2 (δ) = PF2 (|ρ(X)|pЗамечание 22. По определению, ξn −→ ∞ ⇐⇒ для любого C > 0P(ξn < C) → 0 при n → ∞.Упражнение. Доказать свойство 3.8.3Критерии согласия: критерий Колмогорова~ = (X1 , . . . , Xn ), Xi ⊂Имеется выборка X= F. Проверяется простая гипотеза H1 : F = F1 против сложной альтернативы H2 : F 6= F1 .
В том случае, когда распределение F1 имеет непрерывную функциюраспределения F1 ,√можно пользоваться критерием Колмогорова.~ = n sup |F ∗ (y) − F1 (y)|. Покажем, что ρ(X)~ удовлетворяет условиям K1(a,б):Пусть ρ(X)ny~а) если гипотеза H1 верна, т. е. Xi ⊂= F1 , то по теореме Колмогорова ρ(X)с ф.р. Колмогорова;⇒ ξ ⊂= K — распределениеpб) если гипотеза H1 неверна, т. е. Xi ⊂= F2 6= F1 , то по теореме Гливенко-Кантелли Fn∗ (y) −→ F2 (y) длялюбого y при n → ∞.
Поскольку F1 6= F2 , найдется y такое, что |F2 (y) − F1 (y)| > 0. Для таких yp|Fn∗ (y) − F1 (y)| −→ |F2 (y) − F1 (y)| > 0Поэтому при n → ∞~ =ρ(X)√pn sup |Fn∗ (y) − F1 (y)| −→ ∞.yP∞2 2Пусть случайная величина ξ имеет распределение с ф.р. K(y) = j=−∞ (−1)j e−2j y . Это распределение табулировано, так что по заданному ε легко найти C такое, что ε = P(ξ > C).Критерий Колмогорова выглядит так:~ <CH1 , если ρ(X)~δ(X) =~ >CH2 , если ρ(X)8.4Критерии согласия: критерий χ2 (Пирсона)Критерий χ2 основывается на группированных данных. Предполагаемую область значений элементоввыборки делят на некоторое число интервалов.
После чего строят функцию отклонения ρ по разностямтеоретических вероятностей попадания в интервалы группировки и эмпирических частот.~ = (X1 , . . . , Xn ), Xi ⊂Имеется выборка X= F. Проверяется простая гипотеза H1 : F = F1 противсложной альтернативы H2 : F 6= F1 .Пусть, в соответствии с обозначениями 1-й лекции, A1 , . . .
, Ak — интервалы группировки в областизначений с.в. с распределением F1 . Обозначим для j = 1, . . . , k через νj число элементов выборки,попавших в интервал AjnXνj = {число Xi ∈ Aj } =I(Xi ∈ Aj ),i=1и через pj теоретическую вероятность PH1 (X1 ∈ Aj ) попадания в интервал Aj случайной величины сраспределением F1 .ПустьkX(νj − npj )2~ = ρ(X,~ F1 ) =.(15)ρ(X)npjj=1Замечание 23.
Свойство K1(б) выполнено далеко не для всех альтернатив. Если распределениевыборки F2 6= F1 имеет те же вероятности pj попадания в интервалы Aj , 1 6 j 6 k, что и распределениеF1 , то по данной функции ρ эти распределения различить нельзя.53Поэтому, на самом деле, критерий χ2 , построенный по данной функции ρ (15), применим для проверкисложной гипотезыH̃1 : распределение X1 обладает свойством: ∀j = 1, . . . , kP(X1 ∈ Aj ) = pjпротив сложной альтернативы H̃2 : H̃1 не верна, т.е. хотя бы для одного из интервалов P(X1 ∈ Aj ) 6= pj .~ удовлетворяет условиямДля решения этой задачи мы и построим критерий χ2 .
Покажем, что ρ(X)K1(a,б).Теорема 12. (Пирсона). Если верна гипотеза H̃1 , то при фиксированном k и при n → ∞~ =ρ(X)kX(νj − npj )2npjj=1⇒ χ2 ⊂= χ2k−1 ,где χ2k−1 есть χ2 -распределение с k − 1 степенью свободы.Доказательство теоремы Пирсона в случае k = 2. При бо́льших k см.
упражнения ниже. Тогда ν2 = n − ν1 , p2 = 1 − p1 . Посмотрим на ρ и вспомним ЦПТ:(ν1 − np1 )2(ν2 − np2 )2(ν1 − np1 )2(n − ν1 − n(1 − p1 ))2+=+=np1np2np1n(1 − p1 )!2(ν1 − np1 )2(−ν1 + np1 )2(ν1 − np1 )2ν1 − np1=+== pnp1n(1 − p1 )np1 (1 − p1 )np1 (1 − p1 )~ =ρ(X)Но величина ν1 есть сумма n независимых с.в. с распределением Бернулли Bp1 , и по ЦПТν1 − np1pnp1 (1 − p1 )⇒ ξ ⊂= N0,1 .Поэтому~ =ρ(X)ν1 − np1pnp1 (1 − p1 )!2⇒ ξ 2 ⊂= χ21 .νj√ n − pjνj − npjУпражнение.
Доказать, что для любого j = 1, . . . , k √= n √⇒ N0,(1−pj ) .npjpjPkВспомнить, как (по лемме Фишера) распределена величина i=1 (Yi − Y )2 для выборки Yi ⊂= N0,1 ,i = 1, . . . , k.Доказать, что Yi − Y ⊂= N0,1−1/k . Провести аналогии (только!) между утверждениями теоремы Пирсона и леммы Фишера.Упражнение. Почему сумма квадратов k асимптотически нормальных случайных величин сходится краспределению χ2k−1 , а не χ2k ? Куда делась одна степень свободы? Наводящий вопрос: не связаны ли νjкаким-либо уравнением?Свойство K1(б):Упражнение. Вспомнить ЗБЧ и доказать, что если H̃1 не верна, то найдется j ∈ {1, . . .
, k} такое, что2νj− pj(νj − npj )2p=n n−→ ∞.npjpjПусть случайная величина χ2 имеет распределение χ2k−1 . Это распределение табулировано, так чтопо заданному ε можно найти C такое, что ε = P(χ2 > C).Осталось построить критерий согласия χ2 :~ <CH1 , если ρ(X)~δ(X) =~ > C.H2 , если ρ(X)54Замечание 24. На самом деле критерий χ2 применяют и для решения первоначальной задачи о проверке гипотезы H1 : F = F1 .
Необходимо только помнить, что этот критерий не состоятелен для альтернатив с теми же вероятностями попадания в интервалы разбиения, что и у F1 . Поэтому берут большоечисло интервалов разбиения — чем больше, тем лучше. Но:~Замечание 25. Сходимость по распределению ρ(X)допредельной и предельной вероятностей ведет себя как⇒ χ2 обеспечивается ЦПТ, поэтому разница~ > C) − P(χ > C)| ∼ max|P(ρ(X)2(bpnpj (1 − pj ))(см. точность в ЦПТ, 1-й семестр), где b – некоторая постоянная.
Поэтому для выборки объема n число~интервалов разбиения выбирают так, чтобы обеспечить нужную точность при замене распределения ρ(X)2на χk−1 . Обычно требуют, чтобы np1 = . . . = npk ≈ 6 ÷ 9.8.5 Критерий χ2 (Пирсона). Параметрическая гипотезаКритерий χ2 часто применяют для проверки гипотезы о виде распределения, или о принадлежности распределения выборки некоторому параметрическому семейству.~ = (X1 , .
. . , Xn ), Xi ⊂Имеется выборка X= F. Проверяется сложная гипотезаH1 : F ∈ {Fθ , θ ∈ Θ}, где θ — неизвестный параметр (скалярный или векторный), против сложной жеальтернативыH2 : F 6∈ {Fθ }.Пусть опять A1 , . . . , Ak — интервалы группировки, νj — число элементов выборки, попавших в Aj .Но теоретическая вероятность pj = PH1 (X1 ∈ Aj ) = pj (θ) зависит от неизвестного параметра θ.b получим функцию отклоПусть θb — ОМП для параметра θ. Взяв в (15) вместо pj оценки pbj = pj (θ),ненияkX(νj − nbpj )2~ =ρ(X).(16)nbpjj=1Замечание 26. Иначе говоря, в функции (16) вероятности pbj попадания в интервалы Aj вычисленыдля распределения Fb.θОтметим снова, что критерий χ2 , построенный по данной функции ρ (16), применим лишь для проверки гипотезыH̃1 : распределение X1 обладает свойством: ∀j = 1, .
. . , kP(X1 ∈ Aj ) = pbjпротив сложной альтернативы H̃2 : H̃1 не верна.Условие K1(a) (при выполнении некоторых условий относительно гладкости pj (θ)) обеспечиваетсятеоремой:Теорема 13. (Пирсона). Если верна гипотеза H̃1 , и dim(θ) = m — размерность параметра(вектора) θ, то при фиксированном k и при n → ∞~ =ρ(X)kX(νj − nbpj )2nbpjj=1⇒ χ2 ⊂= χ2k−m−1 ,где χ2k−m−1 есть χ2 -распределение с k − m − 1 степенью свободы.Выполнение условия K1(б) очевидно.Пусть теперь случайная величина χ2 имеет распределение χ2k−m−1 .
По заданному ε найдем C такое,что ε = P(χ2 > C).55Критерий согласия χ2 имеет вид:~ =δ(X)H1 ,H2 ,~ <Cесли ρ(X)~ > C.если ρ(X)Замечание 27. Замечания 24, 25 остаются в силе.8.6Проверка гипотезы однородности: критерий Колмогорова - Смирнова~ = (X1 , . . . , Xn ) и Y~ = (Y1 , .
. . , Ym ), причем Xi ⊂Есть две выборки X= Fx , Yi ⊂= Fy , и распределенияFx , Fy , вообще говоря, неизвестны. Проверяется сложная гипотеза H1 : Fx = Fy против (еще болеесложной) альтернативы H2 : H1 не верна.Если Fx , Fy имеют непрерывные функции распределения, применим критерий Колмогорова - Смирнова.∗∗~ иY~,Пусть Fn,xи Fm,y— эмпирические функции распределения, построенные по выборкам X~ Y~)=ρ(X,rmn∗∗sup |Fn,x(t) − Fm,y(t)|.m+n t~ Y~)Теорема 14. Если гипотеза H1 верна, то ρ(X,ва) при n, m → ∞.⇒ ξ ⊂= K (распределение с ф.р. Колмогоро-p~ Y~ ) −→Упражнение.
Доказать, что ρ(X,∞ при n, m → ∞, если гипотеза H2 верна.И снова: пусть случайная величина ξ имеет распределение с ф.р. K(y). По заданному ε найдем Cтакое, что ε = P(ξ > C), и построим критерий согласия Колмогорова - Смирнова:~ <CH1 , если ρ(X)~δ(X) =~ > C.H2 , если ρ(X)Замечание 28. Если есть более двух выборок, и требуется проверить гипотезу однородности, частопользуются одним из вариантов критерия χ2 Пирсона.
Этот критерий (и ряд других критериев) рекомендую посмотреть в §3.4.2, с. 124 книгиГ. И. Ивченко, Ю. И. Медведев, Математическая статистика. Москва, 1984, 248 с.8.7Проверка гипотезы независимости: критерий χ2 Пирсона~ Y~ ) = ((X1 , Y1 ), . . . , (Xn , Yn )) значений двух наблюдаемых совместно величин ξ и η в nЕсть выборка (X,экспериментах. Проверяется гипотеза H1 : ξ и η независимы.Введем k интервалов группировки для значений ξ: ∆x1 , . . .
, ∆xk и m интервалов группировки для значений η: ∆y1 , . . . , ∆ym .Посчитаем эмпирические частоты: для i = 1, . . . , k, j = 1, . . . , mνi,j = {число пар (Xl , Yl ) ∈ ∆xi × ∆yj },ν·,j = {число пар (Xl , Yl ) : Yl ∈ ∆yj } = {число Yl ∈ ∆yj },νi,· = {число пар (Xl , Yl ) : Xl ∈ ∆xi } = {число Xl ∈ ∆xi }.~Y∆y1∆y2 . .
. ∆ymΣ~X∆x1ν1,1 ν1,2 . . . ν1,m ν1,·∆x2ν2,1 ν2,2 . . . ν2,m ν2,·......∆xkΣνk,1ν·,1νk,2ν·,2......νk,mν·,mνk,·n56Если гипотеза H1 верна, то теоретические вероятности попадания пары (X1 , Y1 ) в любую из областей∆xi × ∆yj равны произведению вероятностей:pi,j = P((X1 , Y1 ) ∈ ∆xi × ∆yj ) = P(X1 ∈ ∆xi )P(Y1 ∈ ∆yj ) = pxi pyjПо ЗБЧ,ν·,jνi,jνi,·≈ pxi ,≈ pyi ,≈ pi,j .nnnνi,· ν·,jνi,j νi,· ν·,jи, или между νi,j иможет служить основаниемПоэтому значительная разница междуnn nnдля отклонения гипотезы независимости.Пустьk Xmk Xm22XXν(ν−(νν)/n)i,ji,· ·,ji,j~ Y~)=nρ(X,= n− 1 .ννννi,··,ji,··,ji=1 j=1i=1 j=1~ Y~)Теорема 15. Если гипотеза H1 верна, то ρ(X,⇒ χ2(k−1)(m−1) при n → ∞.Как обычно, строится критерий согласия асимптотического уровня ε.Упражнение. Для каких альтернатив построенный критерий является состоятельным?Замечание 29.
Замечания 24, 25 остаются в силе.8.8Гипотеза о совпадении средних двух нормальных совокупностей с равнымидисперсиями~ = (X1 , . . . , Xn ) и Y~ = (Y1 , . . . , Ym ), причем Xi ⊂Есть две независимые выборки X= Na1 ,σ2 , Yi ⊂= Na2 ,σ2 , идисперсия σ 2 одинакова для обоих распределений, но, вообще говоря, неизвестна. Проверяется сложнаягипотеза H1 : a1 = a2 против сложной альтернативы H2 : H1 не верна.Разумеется, эта задача есть частный случай задачи об однородности, и можно построить критерийКолмогорова - Смирнова асимптотического уровня ε.
Но мы построим другой критерий — критерийСтьюдента точного уровня ε.~ S 2 (Y~ ) несмещенные выборочные дисперсии:Обозначим через S02 (X),0n1 X(Xi − X)2 ,n−1 1~ =S02 (X)m~)=S02 (Y1 X(Yi − Y )2 .m−1 1Из леммы Фишера следуетТеорема 16. Случайная величина tn+m−2 имеет распределение Стьюдента:rnm(X − a1 ) − (Y − a2 )q⊂= Tn+m−2 .tn+m−2 =2 ~~n + m (n−1)S02 (X)+(m−1)S0 (Y )n+m−2Доказательство теоремы 16. Соглашение: N0,1 ≡ N(0, 1).1. Легко видеть (Упражнение: убедиться, что легко):X − a1 ⊂= N(0,|=⇒σ2σ2), Y − a2 ⊂= N(0, )nm|=⇒σ2σ2n+m(X − a1 ) − (Y − a2 ) ⊂= N(0,+) = N(0, σ 2)nmnmr|=⇒ ξ0 = σ1 nnm((X − a1 ) − (Y − a2 )) ⊂= N(0, 1).+m57|=⇒2. Из леммы Фишера следует, что|=⇒(n − 1) 2 ~(m − 1) 2 ~S0 (X) ⊂= χ2n−1 ,S0 (Y ) ⊂= χ2m−1σ2σ2def 1~ + (m − 1)S02 (Y~) ⊂S = 2 (n − 1)S02 (X)= χ2n+m−2 ,σи не зависит от X, Y .ξ03.