1625915145-5b3debabab98d9e994cc3a1bc8da0f5b (843876), страница 19
Текст из файла (страница 19)
При верной гипотезе H1 величина ρ(X,распределение Фишера Fn−1, m−1 с n − 1 и m − 1 степенями свободы.Д о к а з а т е л ь с т в о. По лемме Фишера, независимые случайные величиныχ2n−1=⃗(n−1) S02 (X)σ21и2ψm−1=(m−1) S02 (Y⃗ )σ22102ГЛАВА VIII. КРИТЕРИИ СОГЛАСИЯимеют распределения Hm−1 и Hn−1 соответственно. При σ1 = σ2 , поопределению распределения Фишера,2 ⃗⃗ Y⃗ ) = S0 (X) ·ρ(X,2σ1σ22S02 (Y⃗ )=χ2n−1 / (n − 1)2ψm−1/(m − 1)= Fn−1, m−1 .⊂Возьмём квантиль f1−ε распределения Фишера Fn−1, m−1 . КритериемФишера называют критерий{⃗ ⃗⃗ Y⃗ ) = H1 , если ρ(X, Y ) < f1−ε ,δ(X,⃗ Y⃗ ) ⩾ f1−ε .H2 если ρ(X,У п р а ж н е н и е . Доказать, что для любой альтернативы σ1 ̸= σ2pσ21⃗ Y⃗ ) −↛= 1 при n, m → ∞.ρ(X,2σ2(28)Докажем состоятельность критерия Фишера. Достаточно в качествеальтернативы рассмотреть σ1 > σ2 (иначе при больших объёмах выборок⃗ > S 2 (Y⃗ )).будет, согласно (28), нарушаться предположение S02 (X)0Убедимся, что последовательность квантилей fδ = fδ (n, m) распределения Fn, m любого уровня δ ∈ (0, 1) сходится к единице при n, m → ∞.= Fn, m .Пусть ξn,m ⊂По определению квантилей, вероятностиP(ξn,m < fδ ) и P(ξn,m > fδ ) не зависят от n, m и равны фиксированнымчислам δ и 1 − δ соответственно.pЗнаем, что ξn,m −→ 1.
Поэтому для любого фиксированного ε > 0 вероятности P(ξ < 1 − ε) и P(ξ > 1 + ε) стремятся к нулю при n, m → ∞,становясь рано или поздно меньше как δ, так и 1 − δ.Следовательно, 1 − ε < fδ < 1 + ε при достаточно больших n, m. Этоозначает, что fδ → 1 при n, m → ∞.Для доказательства состоятельности критерия Фишера осталось предположить, что гипотеза H1 неверна, т. е.
σ1 > σ2 , и использовать сходимости (28) и fδ → 1. Сходимость по вероятности влечёт слабую сходимость⃗ Y⃗ ) − f1−ε ⇒ρ(X,σ21σ22− 1 > 0.Предельная функция распределения P(σ21 / σ22 − 1 < x) непрерывна в точке x = 0 (почему?) и равна нулю в этой точке. Отсюда( 2)σ1α2 (δ) = PH2 (ρ < f1−ε ) = PH2 (ρ − f1−ε < 0) → P 2 − 1 < 0 = 0.σ2103§ 3.
Критерии для проверки однородностиКритерий Стьюдента. Пусть имеются две независимые выборки: вы⃗ = (X1 , . . . , Xn ) из N⃗борка Xa1 , σ2 и выборка Y = (Y1 , . . . , Ym ) из Na2 , σ2с неизвестными средними и одной и той же неизвестной дисперсией σ2 .Проверяется сложная гипотеза H1 = {a1 = a2 }.Построим критерий Стьюдента точного размера ε.Т е о р е м а 28.
Случайная величина tn+m−2 , равная√nm· √n+mtn+m−2 =(X − a1 ) − (Y − a2 )⃗ + (m − 1)S 2 (Y⃗ )(n − 1)S 2 (X)0n+m−20имеет распределение Стьюдента Tn+m−2 .Д о к а з а т е л ь с т в о. Легко видеть (убедитесь, что легко!), что случайная величина X − a1 имеет распределение N0, σ2/n , а случайная величина Y − a2 имеет распределение N0, σ2/m . Тогда их разность распределена тоже нормально с нулевым средним и дисперсией)(σ2σ2n+mD (X − a1 ) − (Y − a2 ) =+= σ2 ·.nmnmНормируем эту разность:√ξ0 =)nm (= N0, 1(X − a1 ) − (Y − a2 ) ⊂n+m1σИз леммы Фишера следует, что независимые случайные величины⃗ σ2 и (m−1) S 2 (Y⃗ )/σ2 имеют распределения Hn−1 и Hm−1(n − 1) S02 (X)/0соответственно, а их сумма)1 (⃗ + (m − 1)S 2 (Y⃗ )S 2 = 2 (n − 1)S02 (X)0σимеет χ2-распределение Hn+m−2 с n+m−2 степенями свободы (почему?)и не зависит от X и от Y (почему?).По определению 19 (с. 69), отношение √ξ0S 2 /(n + m − 2)имеет распре-деление Стьюдента Tn+m−2 .
Осталось подставить в эту дробь ξ0 и S 2и убедиться, что σ сократится и получится tn+m−2 из теоремы 28.Введём функцию√nmX −Y⃗ Y⃗ ) =ρ(X,· √.n+m⃗ + (m − 1)S 2 (Y⃗ )(n − 1)S02 (X)0n+m−2104ГЛАВА VIII. КРИТЕРИИ СОГЛАСИЯИз теоремы 28 следует свойство (K1): если H1 верна, т. е. если a1 = a2 ,то величина ρ = tn+m−2 имеет распределение Стьюдента Tn+m−2 .Поэтому остаётся по ε найти C = τ1−ε/2 — квантиль распределенияTn+m−2 . Критерий Стьюдента выглядит как все критерии согласия:{⃗ ⃗⃗ Y⃗ ) = H1 , если |ρ(X, Y )| < C,δ(X,⃗ Y⃗ )| ⩾ C.H2 , если |ρ(X,У п р а ж н е н и е . Доказать, что этот критерий имеет размер ε.У п р а ж н е н и е . Доказать свойство (K2): если a1 ̸= a2 , величина |ρ|неограниченно возрастает по вероятности с ростом n и m.У к а з а н и е. Воспользовавшись ЗБЧ для числителя и свойством 3(с.
67) распределения χ2 — для знаменателя, доказать, что числительи знаменатель сходятся к постоянным:pX − Y −→ const ̸= 0,⃗ + (m − 1)S 2 (Y⃗ ) p(n − 1)S02 (X)0−→ const ̸= 0,n+m−2тогда как корень перед дробью неограниченно возрастает.Однофакторный дисперсионный анализ. Предположим, что влияниенекоторого «фактора» на наблюдаемые нормально распределённые величины может сказываться только на значениях их математических ожиданий. Мы наблюдаем несколько выборок при различных «уровнях» фактора.
Требуется определить, влияет или нет изменение уровня факторана математическое ожидание.Говоря формальным языком, однофакторный дисперсионный анализрешает задачу проверки равенства средних нескольких независимых нормально распределённых выборок с одинаковыми дисперсиями. Для двухвыборок эту задачу мы решили с помощью критерия Стьюдента.Пусть даны k независимых выборок(1)(1)(k)(k)X (1) = (x1 , . . . , xn1 ), . .
. , X (k) = (x1 , . . . , xnk )(j)= Na , σ2 с одной и той же дисперсииз нормальных распределений xi ⊂jей. Верхний индекс у наблюдений отвечает номеру выборки. Проверяетсяосновная гипотеза H1 = {a1 = . . . = ak }.Для каждой выборки вычислим выборочные среднее и дисперсиюnX(j)j1 ∑ (j)=xi ,nji=1nj(j) )21 ∑( (j)(j)xi − X.S =nji=1105§ 3.
Критерии для проверки однородностиПоложим n = n1 + . . . + nk . Определим также общее выборочное среднееи общую выборочную дисперсиюk(j)1 ∑ (j)1 ∑X=xi =nj X ,nni, jj=1njk ∑∑)2( (j)1S2 =xi − X .nj=1 i=1Критерий для проверки гипотезы H1 основан на сравнении внутригрупповой и межгрупповой дисперсий. Определим эти характеристики.Вычислим так называемую межгрупповую дисперсию, или дисперсию выборочных среднихk)21 ∑ ( (j)2Sм =nj X − X .nj=1Она показывает, насколько отличны друг от друга выборочные средние при разных уровнях фактора.
Именно эта дисперсия отражает влияние фактора. При этом каждое выборочное среднее вносит в дисперсию вклад, пропорциональный объёму соответствующей выборки: выбросы средних могут быть вызваны малым числом наблюдений.Вычислим так называемую внутригрупповую дисперсиюnSв2jkk(j) )21 ∑ ∑( (j)1 ∑(j)nj S =xi − X.=nnj=1j=1 i=1Она показывает, насколько велики разбросы внутри выборок относительно выборочных средних.
Эти разбросы определяются случайностью внутри выборок. Вывод о том, что средние существенно различны, т. е. присутствует влияние фактора на среднее, может быть сделан, если межгрупповая дисперсия оказывается существенно больше внутригрупповой. Чтобыпонять, насколько больше, следует рассмотреть распределения этих случайных величин при верной основной гипотезе.По основному следствию из леммы Фишера при любом j = 1, . . . , k(j)величина nj S (j)/σ2 имеет распределение Hnj −1 и не зависит от X . Изнезависимости выборок и устойчивости χ2 -распределения относительносуммирования получаемnSв2σ2=k∑nj S (j)j=1σ2= Hn−k ,⊂где n − k = n1 − 1 + . . . + nk − 1.106ГЛАВА VIII.
КРИТЕРИИ СОГЛАСИЯ(1)(k)Кроме того, величина Sв2 не зависит от X , . . . , X . Поэтому онане зависит и от их взвешенного среднего X, а также (что уже совсемневероятно) от межгрупповой дисперсии Sм2 , поскольку последняя является функцией только от перечисленных средних. Эти свойства никак несвязаны с проверяемой гипотезой и верны независимо от равенства илинеравенства истинных средних.Пусть гипотеза H1 верна. Тогда выборки можно считать одной выбор= Hn−1 .кой объёма n. По основному следствию леммы Фишера nS 2 /σ2 ⊂222Величины S , Sм и Sв удовлетворяют легко проверяемому основномудисперсионному соотношениюnS 2σ2=nSм2σ2+nSв2σ2.Величина в левой части имеет распределение Hn−1 , справа — сумма двухнезависимых слагаемых, второе из которых имеет распределение Hn−k .Покажем, что тогда первое распределено по закону Hk−1 .Л е м м а 8.
Пусть случайные величины ξ и η независимы, причём= Hm и ξ + η ⊂= Hs . Тогда η ⊂= Hs−m .ξ⊂Д о к а з а т е л ь с т в о. Используем известную нам характеристическую функцию φ(t) = (1 − 2it)−k/2 гамма-распределения Hk = Γ1/2, k/2 :φξ (t) · φη (t) = (1 − 2it)−m/2 · φη (t) = φξ+η (t) = (1 − 2it)−s/2 .= Hs−m .Отсюда φη (t) = (1 − 2it)−(s−m)/2 и η ⊂Итак, при верной гипотезе H1 мы получили два χ2 -распределения независимых случайных величинχ2 =nSм2σ2= Hk−1⊂иψ2 =nSв2σ2= Hn−k .⊂Построим по ним статистику из распределения Фишера Fk−1, n−kρ=χ2k−1·n−kψ2=n − k Sм2= Fk−1, n−k .⊂·k − 1 Sв2По заданному ε найдём квантиль C уровня 1 − ε распределения ФишераFk−1, n−k и устроим следующий критерий точного размера ε :{H1 , если ρ < C,δ=H2 , если ρ ⩾ C.З а м е ч а н и е 24.
Предположение о равенстве дисперсий проверяют,например, с помощью критерия Бартлетта (см. [6]).§ 4. Критерий χ2 для проверки независимости107§ 4. Критерий χ2 для проверки независимостиЕсть выборка (X1 , Y1 ), . . . , (Xn , Yn ) значений двух наблюдаемых совместно случайных величин X и Y в n независимых экспериментах.