Н.И. Чернова - Лекции по математической статистике (1115346), страница 15
Текст из файла (страница 15)
, Xn из нормального распределения со средним a и единичной дисперсией. Построим минимаксный, байесовский для r = 1/3,s = 2/3 и наиболее мощный размера ε критерии для проверки гипотезы H1 = {a = a1 }против альтернативы H2 = {a = a2 }, где a1 < a2 .ОглавлениеJJIIJIОтношение правдоподобия имеет абсолютно непрерывное распределение при любой из гипотез, поэтому критерий отношения правдоподобия 28 будет нерандомизированным, и достаточноописать только его критическую область δ(X) = H2 . Она определяется неравенством nn1X1Xf2 (X)22= exp(Xi − a1 ) −(Xi − a2 )> c.(21)T (X) =f1 (X)22i=1i=1Критерий будет байесовским при c = r/s = 1/2.
Упростим неравенство (21). ПолучимНа стр. ... из 179δ(X) = H2НазадВо весь экранУйтиСтр. 131приX>122 (a2− a21 ) −a2 − a11nln 2Например, при a1 = 0 и a2 = 1 критическая область имеет вид X >.12−1nln 2.Чтобы построить минимаксный и наиболее мощный критерии, запишем неравенство (21) вэквивалентном виде X > c1 , и искать будем c1 , а не c. Размер и вероятность ошибки второгорода равны соответственно√√√α1 (δ) = PH1 X > c1 = PH1 √n (X−a1 ) > √ n (c1 −a1 ) = 1 − Φ√n (c1 −a0,1 1) ,α2 (δ) = PH2 X < c1 = PH2 n (X−a2 ) < n (c1 −a2 ) = Φ0,1 n (c1 −a2 ) .√При α1 (δ)=ε получим НМК размера ε. Отсюда n(c1 −a1 ) = τ1−ε , где τ1−ε — квантиль√уровня 1 − ε стандартного нормального распределения. Тогда c1 = a1 + τ1−ε / n и НМКразмера ε имеет видτ1−εδ(X) = H2 при X > a1 + √ .nПри α1 (δ) = α2 (δ) получим минимаксный критерий.
Пользуясь свойствами функции распределения стандартного нормального закона, запишем√√√1 − Φ0,1n (c1 − a1 ) = Φ0,1n (c1 − a2 ) = 1 − Φ0,1n (a2 − c1 ) ,Оглавлениеоткуда c1 − a1 = a2 − c1 и c1 = (a1 + a2 )/2. Минимаксный критерий имеет видδ(X) = H2JJIIJIНа стр. ... из 179НазадВо весь экранУйтиприX>a1 + a2.2Пример 32. Имеется выборка X1 , . . . , Xn из нормального распределения со средним 0 и дисперсией σ2 , σ > 0. Построим наиболее мощный критерий размера ε дляпроверки гипотезы H1 = {σ = σ1 } против альтернативы H2 = {σ = σ2 }, где σ1 < σ2 .Отношение правдоподобия снова имеет абсолютно непрерывное распределение при любойиз гипотез, поэтому критерий отношения правдоподобия 28 будет нерандомизированным.
Егокритическая область δ(X) = H2 определяется неравенством Xn1σn11−X2i > c,T (X) = 1n expσ22 σ21 σ22i=1что эквивалентно неравенству X2 > c1 . Найдем c1 , при котором размер критерия равен ε:!2nXncnc112α1 (δ) = PH1 X > c1 = PH1> 2= 1 − Hn= ε.σ21σ1σ21Отсюда nc1 /σ21 = h1−ε , где h1−ε — квантиль χ2 -распределения с n степенями свободыуровня 1 − ε. Тогда c1 = h1−ε σ21 /n и НМК размера ε имеет видСтр.
132δ(X) = H2приX2 >h1−ε σ21.n8.ОглавлениеJJIIJIНа стр. ... из 179НазадВо весь экранКритерии согласияКритериями согласия называют критерии, предназначенные для проверки простойгипотезы H1 = {F = F1 } при сложной альтернативе H2 = {H1 неверна}. Мы рассмотрим более широкий класс основных гипотез, включающий и сложные гипотезы, акритериями согласия будем называть любые критерии, устроенные по одному и томуже принципу. А именно, пусть задана некоторая функция отклонения эмпирическогораспределения от теоретического, распределение которой существенно разнится в зависимости от того, верна или нет основная гипотеза. Критерии согласия принимают илиотвергают основную гипотезу исходя из величины этой функции отклонения.Итак, имеется выборка X = (X1 , .
. . , Xn ) из распределения F. Мы сформулируем ряд понятий для случая простой основной гипотезы, а в дальнейшем будем ихкорректировать по мере изменения задачи. Проверяется простая основная гипотезаH1 = {F = F1 } при сложной альтернативе H2 = {F 6= F1 }.K1.
Пусть возможно задать функцию ρ(X), обладающую свойствами:а) если гипотеза H1 верна, то ρ(X) ⇒ G, где G — непрерывное распределение;pУйтиСтр. 133б) если гипотеза H1 неверна, то |ρ(X)| −→ ∞ при n → ∞.K2. Пусть функция ρ(X) задана. Для случайной величины η из распределения Gопределим постоянную C из равенства ε = P (|η| > C). Построим критерий:H1 , если |ρ(X)| < C,δ(X) =(22)H2 , если |ρ(X)| > C.ОглавлениеМы построили критерий согласия. Он «работает» по принципу: если для даннойвыборки функция отклонения велика (по абсолютному значению), то это свидетельствует в пользу альтернативы, и наоборот. Убедимся в том, что этот критерий имеет(асимптотический) размер ε и является состоятельным.Определение 29.
Говорят, что критерий δ для проверки простой гипотезы H1 являетсякритерием асимптотического размера ε, если его размер приближается к ε с ростом n:JJIIJIα1 (δ) = PH1 (δ(X) 6= H1 ) → ε приn → ∞.На стр. ... из 179НазадВо весь экранУйтиСтр. 134Поскольку альтернатива H2 всегда является сложной, то, как мы уже отмечали в замечании 16,вероятность ошибки второго рода любого критерия δ есть функция α2 (δ, F2 ) от конкретногораспределения F2 из списка возможных альтернатив {F2 : F2 6= F1 }.Определение 30.
Критерий δ для проверки гипотезы H1 против сложной альтернативы H2 называется состоятельным, если для любого распределения F2 , отвечающегоальтернативе H2 , вероятность ошибки второго рода стремится к нулю с ростом объемавыборки:α2 (δ, F2 ) = PF2 (δ(X) = H1 ) → 0 при n → ∞.Свойство 10.
Для критерия δ, заданного в (22), при n → ∞:1. α1 (δ) = PH1 (|ρ(X)| > C) → P (|η| > C) = ε;Оглавление2. α2 (δ, F2 ) = PF2 (|ρ(X)| < C) → 0 для любого распределения F2 , отвечающего H2 .Иначе говоря, построенный критерий имеет асимптотический размер ε и состоятелен.JJIIJIУпражнение.
Доказать свойство 10.pУказание. По определению, запись ξn −→ ∞ означает, что для любого C > 0На стр. ... из 179P (ξn < C) → 0 при n → ∞.НазадЗамечание. Если вместо «ρ(X) ⇒ G» в K1(а) выполняется «ρ(X) имеет распределение G», то критерий (22) будет иметь точный размер ε.Во весь экран8.1.УйтиКритерии согласия: критерий КолмогороваИмеется выборка X = (X1 , . . . , Xn ) из распределения F. Проверяется простая гипотеза H1 = {F = F1 } против сложной альтернативы H2 = {F 6= F1 }. В том случае,когда распределение F1 имеет непрерывную функцию распределения F1 , можно пользоваться критерием Колмогорова.ПустьСтр. 135ρ(X) =√n sup|F∗n (y) − F1 (y)|.yПокажем, что ρ(X) удовлетворяет условиям K1(a,б).а) Если H1 верна, то Xi имеют распределение F1 .
По теореме Колмогорова ρ(X) ⇒ η,где η имеет распределение с функцией распределения Колмогорова.ОглавлениеJJIIJIб) Если гипотеза H1 неверна, то Xi имеют какое-то распределение F2 , отличное от F1 .pПо теореме Гливенко — Кантелли F∗n (y) −→ F2 (y) для любого y при n → ∞.Поскольку F1 6= F2 , найдется y0 такое, что |F2 (y0 ) − F1 (y0 )| > 0. Ноpsup|F∗n (y) − F1 (y)| > |F∗n (y0 ) − F1 (y0 )| −→ |F2 (y0 ) − F1 (y0 )| > 0.yУмножая на√n, получим при n → ∞, что ρ(X) =√pn supy |F∗n (y) − F1 (y)| −→ ∞.На стр.
... из 179K(y)Назад1Пусть случайная величина η имеет распределениес функцией распределения КолмогороваВо весь экран0.5K(y) =2 y2(−1)j e−2j,y > 0.j=−∞Уйти0.51yРис. 9: График функции K(y)Стр. 136∞XЭто распределение табулировано, так что по заданному ε легко найти C такое, что ε = P (η > C).Критерий Колмогорова выглядит так:δ(X) =H1 , если ρ(X) < C,H2 , если ρ(X) > C.8.2.ОглавлениеJJIIJIКритерии согласия: критерий χ2 ПирсонаКритерий χ2 (K.Pearson, 1900) основывается на группированных данных. Областьзначений предполагаемого распределения F1 делят на некоторое число интервалов. После чего строят функцию отклонения ρ по разностям теоретических вероятностей попадания в интервалы группировки и эмпирических частот.Имеется выборка X = (X1 , .
. . , Xn ) из распределения F. Проверяется простаягипотеза H1 = {F = F1 } против сложной альтернативы H2 = {F 6= F1 }.Пусть, как в параграфе 1.6, A1 , . . . , Ak — интервалы группировки в областизначений случайной величины с распределением F1 . Обозначим для j = 1, . . . , k черезνj число элементов выборки, попавших в интервал Ajνj = {число Xi ∈ Aj } =На стр. ... из 179Уйтии через pj > 0 — теоретическую вероятность PH1 (X1 ∈ Aj ) попадания в интервал Ajслучайной величины с распределением F1 .
С необходимостью, p1 + . . . + pk = 1. Какправило, длины интервалов выбирают так, чтобы p1 = . . . = pk = 1/k.Пустьρ(X) =kX(νj − npj )2j=1Стр. 137I(Xi ∈ Aj ),i=1НазадВо весь экранnXnpj.(23)Замечание 18. Свойство K1(б) выполнено далеко не для всех альтернатив. Еслираспределение выборки F2 6= F1 имеет такие же, как у F1 , вероятности pj попаданияв каждый из интервалов Aj , то по данной функции ρ эти распределения различитьневозможно.ОглавлениеJJIIJIПоэтому на самом деле критерий, который мы построим по функции ρ из (23),решает совсем иную задачу. А именно, пусть задан набор вероятностей p1 , . .
. , pkтакой, что p1 + . . . + pk = 1. Критерий χ2 предназначен для проверки сложнойгипотезыH10 = распределение X1 обладает свойством: P (X1 ∈ Aj ) = pj для всех j = 1, . . . , kпротив сложной альтернативы H20 = {H10 неверна}, т. е.H20 = хотя бы для одного из интервалов вероятность P (X1 ∈ Aj ) отличается от pj .Покажем, что ρ(X) удовлетворяет условию K1(a).На стр. ... из 179НазадТеорема Пирсона.