С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 20
Текст из файла (страница 20)
Еще один путь состоит всужении класса критериев, из которых разрешается выбирать. В теорииоценивания рассматривался аналогичный прием — выделение классанесмещенных оценок K0 , класса эквивариантных оценок Keq и т.п.Прежде чем вводить класс несмещенных критериев, играющий сходнуюроль, напомним, см.
параграф 3, что для рандомизированных критериевможно определить вероятности ошибок и мощность почти так же, как идля нерандомизированных:~ θ ∈ Θ0 ,α(θ) = Eθ π(X),~ θ ∈ Θ1 ,m(θ) = Eθ π(X),β(θ) = 1 − m(θ),Проверка статистических гипотез119~ — критическая функция рандомизированного критерия. Дадимгде π(X)теперь нужное определение.Критерий называется несмещенным, еслиinf m(θ) ≥ sup α(θ).θ∈Θ1θ∈Θ0Если ограничиваться критериями с заданным уровнем значимости ε, т.е.сsup α(θ) = ε,θ∈Θ0условие несмещенности превращается вm(θ) ≥ ε при всех θ ∈ Θ1 .Наглядный смысл условия несмещенности в том, что вероятностьm(θ) отвергнуть основную гипотезу H0 в том случае, когда онанесправедлива, никогда не оказывается меньше вероятности α(θ)отвергнуть основную гипотезу H0 в том случае, когда она справедлива.Следующие очень простые соображения отчасти мотивируютвведение несмещенных тестов.
Во-первых, легко видеть, что равномернонаиболее мощный тест, если он существует, обязан быть несмещенным.~ ≡Действительно, тривиальный критерий с критической функцией π(X)ε, вообще не использующий выборку, имеет мощность ε. Следовательно,мощность наиболее мощного критерия должна быть не меньше.Во-вторых, требование несмещенности исключает те односторонниекритерии, которые препятствовали существованию наиболее мощноготеста при двусторонней альтернативе.Приведем без доказательства (см.
[1]) результат, дополняющийтеорему 2 из параграфа 5.Теорема 1. Предположим, что для однопараметрическогоэкспоненциального семейства (4.6) функция A(θ) монотонна, а θ1 ≤ θ2— два значения параметра. Тогда для задачи проверки гипотезыH0 = {θ ∈ [θ1 , θ2 ]} при альтернативе H1 = {θ 6∈ [θ1 , θ2 ]} в классенесмещенных критериев существует равномерно наиболее мощный.
Егокритическая функция в случае строго неравенства θ1 < θ2 задаетсяформулой~ < c2 ,0, c1 < T (X)~ = c1 ,p1 , T (X)~π(X) =~ = c2 ,p2 , T (X)~ < c1 или T (X)~ > c2 .1, T (X)120Глава 4Описание критической функции в случае θ1 = θ2 мы не приводим (см.[1]).Еще одно возможное сужение класса рассматриваемых критериев— требование инвариантности. Рассмотрим соответствующие идеи напримере.Пусть X1 , . . .
, XN — повторная выборка, имеющая распределениеN(a, σ 2 ) (оба параметра неизвестны). Рассмотрим основную гипотезуH0 = {σ 2 ∈ [σ12 , σ22 ], a ∈ R} при альтернативе H1 = {σ 2 6∈[σ12 , σ22 ], a ∈ R}. Очевидно, H0 и H1 "инвариантны относительносдвига— о среднем значении ничего не предполагается. Достаточнаястатистика (X̄, S 2 ) имеет две компоненты с разным поведением присдвиге: X̄ эквивариантна, а S 2 — инвариантна (см. параграф 2.9).Естественно предположить, что проверка инвариантной гипотезы H0должна основываться на S 2 . Такие критерии также называютсяинвариантными. Можно доказать, что наиболее мощный инвариантныйкритерий (притом нерандомизированный) существует и его критическаяобласть имеет вид {S 2 6∈ [c1 , c2 ]}. Числа c1 и c2 выбираются так, чтобыпо каждому из распределений N(a, σ12 ) и N(a, σ22 ) вероятность ошибкипервого рода была равна ε.
Сделать такой выбор не слишком сложно,т.к. по лемме ФишераN S2∈ χ2N −1 .2σ4.7Критерий хи-квадратВ предыдущих параграфах мы видели, что общая теория проверкигипотез весьма сложна. Поэтому, изложив некоторые основные ееидеи, мы посвятим остаток главы обсуждениям ряда популярныхстатистических тестов, первым из которых является критерий хиквадрат.Первый вариант критерия хи-квадрат.Предположим, что случайные величины X1 , .
. . , XN , составляющиевыборку, принимают значения из конечного множества E = {e1 , . . . , er },а соответствующие вероятности pj = P(Xi = ej ), составляющие в суммеединицу, образуют вектор параметров:Trp~ = (p1 , . . . , pr ) ∈ R ,rXi=1pj = 1.Проверка статистических гипотез121Нам будет удобно предположить, что конечное множество E выбраноспециальным образом:E = {e1 = (1, 0, . . . , 0)T , e2 = (0, 1, 0, . . . , 0)T ,. . . , er = (0, 0, . .
. , 1)T },т.е. состоит из векторов r-мерного пространства Rr , одна из компоненткоторых равна единице, а остальные — нулю. При изучении испытанийБернулли мы поступали похожим образом — кодировали успех числом 1,а неудачу — числом 0. Сейчас испытания Бернулли (они соответствуютr = 2) закодированы чуть иначе: успех — вектором (1, 0)T , а неудача —вектором (0, 1)T . Наше теперешнее векторное представление испытанийс r исходами немного избыточно, зато все исходы равноправны.Итак, мы будем иметь дело с векторными наблюдениями X1 , .
. . , XNс очень простыми значениями из Rr . Как обычно, будем рассматриватьсуммуSN = X1 + · · · + XN .Компоненты этого случайного вектора SN имеют смысл кратностейпоявления отдельных исходов в нашей выборке. Они будут обозначатьсяn1 , . . . , nr :SN = (n1 , . . . , nr )0 .Очевидно,rXnj = N.j=1РаспределениеслучайноговектораSNчастоназываетсяполиномиальным. Оно задается обобщенной формулой Бернулли:P(n1 = k1 , .
. . , nr = kr ) =N!pk11 · · · pkr rk1 ! . . . k r !(k1 , . . . , kr ≥ 0, k1 + · · · + kr = N ).Впрочем, эта формула далее не потребуется, поскольку мыбудем действовать в рамках асимптотического подхода и заменимполиномиальное распределение аппроксимирующим его многомернымнормальным.Согласно многомерному варианту центральной предельной теоремыЛеви́ (см. одномерный ее вариант в параграфе 1.4) распределение122Глава 4случайного вектораSN − ESN√Nслабо сходится при N → ∞ к r-мерному нормальному распределению снулевым средним, матрица ковариаций которого совпадает с матрицейковариаций C отдельного наблюдения Xi .
Легко вычислить, чтоESN = N EX1 = NrXpj ej = N p~.j=1Аналогично вычисляется матрица ковариаций C, а через нее и матрицаковариаций SN . Для проведения этого вычисления обозначим через(X1 )j (j = 1, . . . , r) компоненты случайного вектора X1 . Каждая из нихпринимает два значения (1 и 0), причем P((X1 )j = 1) = pj . Поэтомуcjj = V[(X1 )j ] = pj (1 − pj ).Для вычисления внедиагональных элементов (ковариаций) cj1 ,j2 (j1 6= j2 )заметим, что (X1 )j1 · (X1 )j2 ≡ 0. Поэтомуcj1 ,j2 = cov[(X1 )j1 , (X1 )j2 ] = −E[(X1 )j1 ] · E[(X1 )j2 ] = −pj1 pj2 .Кроме того, очевидно, чтоcov(SN ) = N cov(X1 ) = N C(векторы X1 , . .
. , XN независимы, а при сложении независимых векторових ковариационные матрицы также складываются).Перейдем теперь к постановке задачи проверки гипотезы и кописанию критерия хи-квадрат, дающего асимптотическое решение этойзадачи.Простая гипотеза, которую мы будем проверять, имеет вид H0 ={~p = p~0 }, где p~0 — известный гипотетическийвектор параметров,Pr0удовлетворяющий естественному условиюj=1 pj = 1.
В качествеальтернативы берется отрицание основной гипотезы: H1 = {~p 6= p~0 }.Для построения статистического критерия Пирсон предложилстатистику2r0X nj − N pj Π= q .0N pjj=1Проверка статистических гипотез123Как мы видели чуть выше, случайные величиныnj − N pjpN pjасимптотически нормальны, хотя и зависимы при разных j.
Изпроделанных вычислений следует, чтоÃ!µ¶nj − N pjnj − N pjcjj1p√== 1 − pj .V= VpjpjN pjNТем не менее, замечательным образом оказывается, что сумма ихквадратов имеет асимптотически распределение хи-квадрат. Этотрезультат, собственно, и привел Пирсона к успеху.Теорема Пирсона. Предположим, что основная гипотеза H0 = {~p =0p~ } справедлива. Тогда при N → ∞ распределение случайной величиныΠ слабо сходится к распределению хи-квадрат с r −1 степенями свободы:P0 (Π < z) → P(χ2r−1 < z).Теорему Пирсона мы докажем в следующем параграфе, а сейчасперейдем к статистическим приложениям ее.Заметим сначала, что Π — взвешенная сумма квадратов отклонений.Точнее,rr´2XX11 ³ nj0=NΠ=N−p(p̂j − p0j )2 ,j00p Npj=1 jj=1 jnгде p̂j = Nj — известные нам из главы 2 эффективные несмещенныеоценки вероятностей pj .
В предположении справедливости гипотезы H0эти оценки сходятся именно к гипотетическим вероятностям p0j , а тогдаΠ, как сумма квадратов отклонений, с подавляющей вероятностью неслишком велика. Поэтому естественно рассмотреть критерий, имеющийкритическую область видаK = {Π > z}.Теорема Пирсона дает нам возможность найти такое z по уровнюзначимости ε, пользуясь (асимптотическим) шаблоном χ2r−1 .
Выбирая zεиз соотношенияP(χ2r−1 < zε ) = 1 − ε,мы получаем критическую областьKε = {Π > zε },124Глава 4имеющую асимптотически требуемый уровень значимости ε. Это и естькритерий хи-квадрат, предложенный Пирсоном. Можно доказать, что онасимптотически оптимален (см.
[1]).С практической точки зрения значительно бо́льшую ценность имеютдругие версии критерия хи-квадрат, основанные на рассмотренномпростейшем варианте.Второй вариант критерия хи-квадрат: простая гипотеза.Рассмотрим задачу проверки одномерной простой гипотезы H0 ={F = F 0 } при альтернативе H1 = {F 6= F 0 }. Здесь F 0— известная гипотетическая функция распределения на прямой R.Образуем вспомогательную гипотезу H0∗ , являющуюся следствием H0 ,следующим образом. Разобьем числовую ось R на r дизъюнктныхпромежутков ∆1 , . .