1612725170-875f1dc1af30a046ee4b954c4f0d36bd (828896), страница 10
Текст из файла (страница 10)
После умножения на n исследуем асимптотическое поведение отдельного слагаемого из представления критерия. В силу теоремы Муавра – Лапласаимеем!22(νi − npi )2νi − npiνi − npi== (1 − pi ) p⇒ (1 − pi )ξi2 ,√npinpinpi (1 − pi )где ξi ∈ N(0,1) ; здесь мы учли, что νi =nPI(xj ∈ ∆i ) – сумма независимых бернуллиевскихj=1случайных величин с вероятностью успеха pi = P (x1 ∈ ∆i ) = P0 (∆i ).Трудность заключается в том, что упомянутые слагаемые в представлении статистики χ2зависимы между собой (так как ν1 +. .
.+νm = n), а стало быть, зависимы и определенные выше гауссовские случайные величины ξi . Отметим, что доказательство этого утверждения проводят с помощью многомерной центральной предельной теоремы. При этом предельнаяквадратичная форма будет иметь распределение χ2 с числом степеней свободы m − 1.Следовательно, для нахождения критических точек мы должны использовать таблицы распределения χ2 с тем или иным числом степеней свободы.Замечание. Следует иметь в виду, что это теорема предельная. Но может быть ситуация,когда некоторые величины pi близки к 0. Тогда при небольших n в силу малости знаменателя мы можем существенно превзойти критический уровень (даже если основная гипотезабыла верна!), что исказит наши выводы.
В случае, если νi близки к 0, а pi значимы, имеем(νi − npi )2≈ npi – тоже можем получить большой выброс, который выравнивается лишьnpiпри n → ∞, если гипотеза была справедливой. Поэтому при небольших объемах наблюденийна выбор разбиения желательно накладывать следующие ограничения во избежание появления такого сорта особенностей:1. νi ∼ npi ,2.
npi ≥ 8 ÷ 10.Критерий χ2 также называют критерием сгруппированных данных.Обобщенная теорема Пирсона. Рассматриваем проверку двух сложных гипотез, когдаосновная имеет вид H1 = {P ∈ {Fθ }}, где {Fθ } – некоторый параметрический класс, а конкурирующая есть классическая альтернатива H2 = H1 . От параметрического класса требуютсянекоторые свойства регулярности R∗ , близкие к условиям (R) в неравенстве Рао - Крамера.
Отметим, что параметрические семейства нормальных, пуассоновских и некоторых других распределений удовлетворяют условиям R∗ . Отличие от предыдущей схемы состоит в том,что не понятно, как искать pi = pi (θ) при неизвестном параметре. Предлагается θ заменить наОМП θbn .38Теорема. При сделанных предположениях и n → ∞mP(νi − npi (θbn ))2i=1⇒ η ∈ χ2m−1−dim(θ) .npi (θbn )Пример. Рассмотрим историческую задачу на применение критерия χ2 .
Рассматриваемюжную часть Лондона, которая обстреливалась во время второй мировой войны ракетами“ФАУ”. Ситуация была следующей: после того, как произошло 535 попаданий, немецкая пропаганда утверждала, что их ракеты могут поразить заранее выбранный объект размером сдом. Началась паника.
Решили обратиться к статистикам с вопросом: можно ли при имеющейся информации говорить о детерминированном выборе цели? Иначе говоря, осуществляется ли на самом деле прицельное бомбометание или “точки” бросаются наудачу.Пострадавшую часть Лондона разбили на 576 участков (n = 576) площадью в четвертьквадратной мили каждый. Далее подсчитали, сколько “пробоин” было на каждом участке.Получили таблицу сгруппированных данных:iνi022912112933 435 751где i – число “пробоин” в отдельно взятом квадрате, νi – число квадратов с i попаданиями.Возникает вопрос о том, какую гипотезу нужно проверять.
Если мы предполагаем, что бросание точек происходит наудачу (основная гипотеза), то в наперед заданный квадрат попадаем с1, при этом суммарное число испытаний (“пробоин”) равно N = 535. Повероятностью p =576теореме Пуассона о редких событиях распределение числа успехов будет идеально описываться распределением Пуассона с параметром λ = N p ∼ 0, 9. Как следствие основной гипотезы возникает новая: наблюдаемая случайная величина имеет распределение Пуассонас неизвестным параметром. ОМП для параметра λ хорошо известна:576X535bn = X = 1≈ 0.9,λxi =576 i=1576где xi – количество “точек” в i-ой группе. Принимая во внимание замечание, сделанное выше,объединим группы i = 4 и i = 5 в одну. По таблицам для пуассоновского распределения спараметром 0, 9 находимp0 = 0.41,p1 = 0.37,p2 = 0.16,p3 = 0.05,p4 = 0.01,dim(θ) = 1.Используя вышеприведенную таблицы сгруппированных данных, получаемmX(νi − nepi (θbn ))2i=1nepi (θbn )≈ 2.5,где ne = 576.
Значение 2.5 – это χ2 -расстояние между эмпирическим и гипотетическим распределениями. По таблицам для распределения χ23 при ε = 0.05 имеем cε = 7.81. Так как2.5 < 7.81, то основная гипотеза о пуассоновости принимается. Следовательно, принимаетсяи гипотеза о равномерности бросания “точек”.39Двувыборочные критерии согласия.Проводится n испытаний в одних условиях, а m – в других. Возникают две выборки x1 . .
. xnи y1 . . . ym (xi и yi независимы в совокупности). Требуется определить, изменилось ли распределение наблюдаемых величин после изменения условий проведения испытаний.Критерии Стьюдента и Фишера. Постановка задачи: пусть xi ∈ N(α,σ2 ) , yi ∈ N(α1 ,σ2 ) ,где α, α1 – неизвестны. Критерий Стьюдента проверяет сложную гипотезу H = {α = α1 }против конкурирующей альтернативы. Этот критерий основан на статистикеsm+n−2x̄ − ȳT =p 2,12+ n1nSx + mSymкоторая имеет распределение Стьюдента с n + m − 2 степенями свободы, где S·2 – выборочнаядисперсия, построенная по соответствующей выборке.Поясним, почему распределение точное, а не предельное. По следствию из леммы Фишера X и Sx2 , а также Y и Sy2 – независимы (ведут себя как причинно несвязные, хотя строятся по одним выборкам). По построению эти две пары не зависят друг от друга. Стало быть,X, Sx2 , Y , Sy2 независимы в совокупности.
Так как борелевские преобразования независимостине портят, то числитель дроби в выражении для T не зависит от знаменателя. При этом привыполнении гипотезы HrnSx2 + mSy2X −Ynm∈ N(0,1) ,∈ χ2m+n−2 .σn+mσ2qПолучаем вероятностную модель закона Стьюдента: ξ0 / 1r χ2r , т. е. T ∈ Tn+m−2 .Для проверки простой гипотезы о равенстве дисперсий двух независимых нормальных выборок с одинаковыми средними используется критерий Фишера, основанный на статистикеξ 2 + .
. . + ξn2со структурой отношения 1, где ξi , ξej ∈ N(0,1) – независимы в совокупности. Эта22eeξ1 + . . . + ξmслучайная величина распределена по закону Фишера Fn,m с параметрами n, m. В силу лемnSx2мы Фишера и уже проделанных элементарных преобразований∈ Fn−1,m−1 . ДальнейшееmSy2построение критерия согласия проходит по стандартной схеме.40.