Н.И. Чернова - Математическая статистика (1115306), страница 14
Текст из файла (страница 14)
Тогда c1 = a1 + τ1−ε / n и НМКразмера ε имеет видτ1−εδ(X) = H2 при X > a1 + √ .nПри α1 (δ) = α2 (δ) получим минимаксный критерий. Пользуясь свойствами функции распределения стандартного нормального закона, запишем√√√1 − Φ0,1n (c1 − a1 ) = Φ0,1n (c1 − a2 ) = 1 − Φ0,1n (a2 − c1 ) ,откуда c1 − a1 = a2 − c1 и c1 = (a1 + a2 )/2. Минимаксный критерий имеет видδ(X) = H2приX>a1 + a2.2Пример 32. Имеется выборка X1 , .
. . , Xn из нормального распределения со средним 0 и дисперсией σ2 , σ > 0. Построим наиболее мощный критерий размера ε дляпроверки гипотезы H1 = {σ = σ1 } против альтернативы H2 = {σ = σ2 }, где σ1 < σ2 .Отношение правдоподобия снова имеет абсолютно непрерывное распределение при любойиз гипотез, поэтому критерий отношения правдоподобия 28 будет нерандомизированным.
Егокритическая область δ(X) = H2 определяется неравенством Xn11σn12T (X) = 1n exp−Xi > c,σ22 σ21 σ22i=1что эквивалентно неравенству X2 > c1 . Найдем c1 , при котором размер критерия равен ε:!2ncnc1nX1>=1−H= ε.α1 (δ) = PH1 X2 > c1 = PH1nσ21σ21σ21Отсюда nc1 /σ21 = h1−ε , где h1−ε — квантиль χ2 -распределения с n степенями свободыуровня 1 − ε. Тогда c1 = h1−ε σ21 /n и НМК размера ε имеет видδ(X) = H2приX2 >66h1−ε σ21.n8. Критерии согласияКритериями согласия называют критерии, предназначенные для проверки простойгипотезы H1 = {F = F1 } при сложной альтернативе H2 = {H1 неверна}.
Мы рассмотрим более широкий класс основных гипотез, включающий и сложные гипотезы, акритериями согласия будем называть любые критерии, устроенные по одному и томуже принципу. А именно, пусть задана некоторая функция отклонения эмпирическогораспределения от теоретического, распределение которой существенно разнится в зависимости от того, верна или нет основная гипотеза. Критерии согласия принимают илиотвергают основную гипотезу исходя из величины этой функции отклонения.Итак, имеется выборка X = (X1 , . . . , Xn ) из распределения F.
Мы сформулируем ряд понятий для случая простой основной гипотезы, а в дальнейшем будем ихкорректировать по мере изменения задачи. Проверяется простая основная гипотезаH1 = {F = F1 } при сложной альтернативе H2 = {F 6= F1 }.K1. Пусть возможно задать функцию ρ(X), обладающую свойствами:а) если гипотеза H1 верна, то ρ(X) ⇒ G, где G — непрерывное распределение;pб) если гипотеза H1 неверна, то |ρ(X)| −→ ∞ при n → ∞.K2.
Пусть функция ρ(X) задана. Для случайной величины η из распределения Gопределим постоянную C из равенства ε = P (|η| > C). Построим критерий:H1 , если |ρ(X)| < C,(22)δ(X) =H2 , если |ρ(X)| > C.Мы построили критерий согласия. Он «работает» по принципу: если для даннойвыборки функция отклонения велика (по абсолютному значению), то это свидетельствует в пользу альтернативы, и наоборот. Убедимся в том, что этот критерий имеет(асимптотический) размер ε и является состоятельным.Определение 29.
Говорят, что критерий δ для проверки простой гипотезы H1 являетсякритерием асимптотического размера ε, если его размер приближается к ε с ростом n:α1 (δ) = PH1 (δ(X) 6= H1 ) → ε приn → ∞.Поскольку альтернатива H2 всегда является сложной, то, как мы уже отмечали в замечании 16,вероятность ошибки второго рода любого критерия δ есть функция α2 (δ, F2 ) от конкретногораспределения F2 из списка возможных альтернатив {F2 : F2 6= F1 }.Определение 30.
Критерий δ для проверки гипотезы H1 против сложной альтернативы H2 называется состоятельным, если для любого распределения F2 , отвечающегоальтернативе H2 , вероятность ошибки второго рода стремится к нулю с ростом объемавыборки:α2 (δ, F2 ) = PF2 (δ(X) = H1 ) → 0 при n → ∞.67Свойство 10.
Для критерия δ, заданного в (22), при n → ∞:1. α1 (δ) = PH1 (|ρ(X)| > C) → P (|η| > C) = ε;2. α2 (δ, F2 ) = PF2 (|ρ(X)| < C) → 0 для любого распределения F2 , отвечающего H2 .Иначе говоря, построенный критерий имеет асимптотический размер ε и состоятелен.Упражнение. Доказать свойство 10.pУказание. По определению, запись ξn −→ ∞ означает, что для любого C > 0P (ξn < C) → 0 при n → ∞.Замечание. Если вместо «ρ(X) ⇒ G» в K1(а) выполняется «ρ(X) имеет распределение G», то критерий (22) будет иметь точный размер ε.8.1.
Критерии согласия: критерий КолмогороваИмеется выборка X = (X1 , . . . , Xn ) из распределения F. Проверяется простая гипотеза H1 = {F = F1 } против сложной альтернативы H2 = {F 6= F1 }. В том случае,когда распределение F1 имеет непрерывную функцию распределения F1 , можно пользоваться критерием Колмогорова.Пустьρ(X) =√n sup|F∗n (y) − F1 (y)|.yПокажем, что ρ(X) удовлетворяет условиям K1(a,б).а) Если H1 верна, то Xi имеют распределение F1 . По теореме Колмогорова ρ(X) ⇒ η,где η имеет распределение с функцией распределения Колмогорова.б) Если гипотеза H1 неверна, то Xi имеют какое-то распределение F2 , отличное от F1 .pПо теореме Гливенко — Кантелли F∗n (y) −→ F2 (y) для любого y при n → ∞.Поскольку F1 6= F2 , найдется y0 такое, что |F2 (y0 ) − F1 (y0 )| > 0.
Ноpsup|F∗n (y) − F1 (y)| > |F∗n (y0 ) − F1 (y0 )| −→ |F2 (y0 ) − F1 (y0 )| > 0.yУмножая на√√pn, получим при n → ∞, что ρ(X) = n supy |F∗n (y) − F1 (y)| −→ ∞.K(y)1Пусть случайная величина η имеет распределениес функцией распределения Колмогорова0.5K(y) =∞X2 y2(−1)j e−2j,y > 0.j=−∞0.51yРис. 9: График функции K(y)Это распределение табулировано, так что по заданному ε легко найти C такое, что ε = P (η > C).Критерий Колмогорова выглядит так:δ(X) =68H1 , если ρ(X) < C,H2 , если ρ(X) > C.8.2.
Критерии согласия: критерий χ2 ПирсонаКритерий χ2 (K.Pearson, 1903) основывается на группированных данных. Областьзначений предполагаемого распределения F1 делят на некоторое число интервалов. После чего строят функцию отклонения ρ по разностям теоретических вероятностей попадания в интервалы группировки и эмпирических частот.Имеется выборка X = (X1 , . .
. , Xn ) из распределения F. Проверяется простаягипотеза H1 = {F = F1 } против сложной альтернативы H2 = {F 6= F1 }.Пусть, как в параграфе 1.6, A1 , . . . , Ak — интервалы группировки в областизначений случайной величины с распределением F1 . Обозначим для j = 1, . . . , k черезνj число элементов выборки, попавших в интервал Ajνj = {число Xi ∈ Aj } =nXI(Xi ∈ Aj ),i=1и через pj > 0 — теоретическую вероятность PH1 (X1 ∈ Aj ) попадания в интервал Ajслучайной величины с распределением F1 . С необходимостью, p1 + .
. . + pk = 1. Какправило, длины интервалов выбирают так, чтобы p1 = . . . = pk = 1/k.Пустьρ(X) =kX(νj − npj )2npjj=1.(23)Замечание 18. Свойство K1(б) выполнено далеко не для всех альтернатив. Еслираспределение выборки F2 6= F1 имеет такие же, как у F1 , вероятности pj попаданияв каждый из интервалов Aj , то по данной функции ρ эти распределения различитьневозможно.Поэтому на самом деле критерий, который мы построим по функции ρ из (23),решает совсем иную задачу. А именно, пусть задан набор вероятностей p1 , .
. . , pkтакой, что p1 + . . . + pk = 1. Критерий χ2 предназначен для проверки сложнойгипотезыH10 = распределение X1 обладает свойством: P (X1 ∈ Aj ) = pj для всех j = 1, . . . , kпротив сложной альтернативы H20 = {H10 неверна}, т. е.H20 = хотя бы для одного из интервалов вероятность P (X1 ∈ Aj ) отличается от pj .Покажем, что ρ(X) удовлетворяет условию K1(a).Теорема Пирсона. Если верна гипотеза H10 , то при фиксированном k и при n → ∞ρ(X) =kX(νj − npj )2j=1npj⇒ Hk−1 ,где, напомним, Hk−1 есть χ2 -распределение с k−1o степенью свободы.oСтоит остановиться и задать себе вопрос.
Величина ρ есть сумма k слагаемых. Слагаемые, если выне забыли ЦПТ или теорему Муавра — Лапласа, имеют распределения, близкие к квадратам каких-тонормальных. Куда потерялась одна степень свободы? Причина кроется, конечно, в зависимости слагаемых:νk = n − ν1 − . . . − νk−1 .69Докажем теорему Пирсона при k = 2.В этом случае ν2 = n − ν1 , p2 = 1 − p1 .
Посмотрим на ρ и вспомним ЦПТ:ρ(X) =(ν1 − np1 )2 (ν2 − np2 )2(ν1 − np1 )2 (n − ν1 − n(1 − p1 ))2+=+=np1np2np1n(1 − p1 )(ν1 − np1 )2(ν1 − np1 )2 (−ν1 + np1 )2+===np1n(1 − p1 )np1 (1 − p1 )ν1 − np1pnp1 (1 − p1 )!2Но величина ν1 есть сумма n независимых случайных величин с распределением Бернулли Bp1 , и по ЦПТν1 − np1p⇒ ξ,np1 (1 − p1 )где ξ имеет стандартное нормальное распределение.
Поэтомуρ(X) =ν1 − np1pnp1 (1 − p1 )!2⇒ ξ2 .Величина ξ2 имеет χ2 -распределение H1 с одной степенью свободы.Для экономистов, только приступающих к знакомству с многомерным нормальным распределением, матрицами ковариаций и всевозможными квадратичными формами, составленнымииз (асимптотически) нормальных слагаемых, исключительно полезно познакомиться с доказательством теоремы Пирсона в общем случае. Параграф A приложения, который познакомитчитателя с многомерным нормальным распределением, стоит напечатать (CTRL+P) и повеситьв изголовье кровати до окончания курса эконометрики.Функция ρ(X) удовлетворяет условию K1(б).
Действительно,Упражнение. Вспомнить закон больших чисел и доказать, что если H10 неверна,то найдется j ∈ {1, . . . , k} такое, чтоn(νj − npj )2=npjpjνj− pjn2p−→ ∞.Осталось построить критерий в соответствии с K2.Пусть случайная величина χ2k−1 имеет распределение Hk−1 . По таблице распределения Hk−1 найдем C равное квантили уровня 1 − ε этого распределения. Тогдаε = P (χ2k−1 > C) и критерий согласия χ2 выглядит как все критерии согласия:δ(X) =H10 , если ρ(X) < C,H20 , если ρ(X) > C.Замечание 19. На самом деле критерий χ2 применяют и для решения первоначальной задачи о проверке гипотезы H1 = {F = F1 }.
Необходимо только помнить, чтоэтот критерий не состоятелен для альтернатив с теми же вероятностями попадания винтервалы разбиения, что и у F1 . Поэтому берут большое число интервалов разбиения— чем больше, тем лучше, чтобы «уменьшить» число альтернатив, неразличимых спредполагаемым распределением.Внимание! Опасность!70Замечание 20. Сходимость по распределению ρ(X) ⇒ Hk−1 обеспечивается ЦПТ,поэтому разница допредельной и предельной вероятностей имеет тот же порядок, что ипогрешность нормального приближенияb|P (ρ(X) > C) − P (χ2k−1 > C)| 6 примерно! max q np (1 − p ) jj(см. неравенство Берри — Эссеена для погрешности в ЦПТ), где b – некотораяпостоянная. Маленькие значения npj в знаменателе приведут к тому, что распределениеρ(X) будет существенно отличаться от Hk−1 .