Ульянов (новое издание) (1115355), страница 25
Текст из файла (страница 25)
α также растет, а β убывает; при уменьшении же xкрит. αуменьшается, зато наблюдается рост β.То есть не возможно одновременно сделать128ошибки обоих родов сколь угодно малыми (при фиксированном объеме выборки).Обычно для фиксированного n (объема выборки) фиксируют α и среди всех возможных критериев с заданным уровнем значимости α выбирают наиболее мощный.Предположим, что есть выборка X1 , . .
. , Xn из L(X), с параметром θ ∈ Θ.H0 : θ ∈ Θ0 , H1 : θ ∈ Θ1 . Θ0 ∩ Θ1 = ∅.Определение 17.11. Пусть X — совокупность всех возможных значений (X1 , . . . , Xn ),S ⊂ X — некоторая область, называемая критической область.Тогда критерий, при котором при условии (x1 , . . . , xn ) ∈ S гипотеза H0 отвергается, называется S-критерием.В рассмотренном ранее примере S = [1; +∞).Определение 17.12. Пусть pn (y, θ) — функция правдоподобия, тогда функцияZW (S, θ) = pn (y, θ)dySназывается функцией мощности.Содержательный смысл функции мощности:Если Θ0 = θ0 , Θ1 = θ1 , т. е.
H0 , H1 — простые, тогдаZW (S, θ0 ) = pn (y, θ0 )dy = P(Y ∈ S|H0 ) = α,SZW (S, θ1 ) =pn (y, θ1 )dy = P(Y ∈ S|H1 ) − мощность критерия.SОпределение 17.13. S-критерий S∗ называется оптимальным критерием сзаданным уровнем значимости α, еслиW (S ∗ , θ0 ) = α,W (S ∗ , θ1 ) > W (S, θ1 ), (8)для любого S-критерия: W (S, θ0 ) = α.Если мощность #Θ1 > 1, то (8) выполняется для всех θ1 ∈ Θ1 , но в дальнейшембудут рассматриваться простые гипотезы.Определение 17.14. Пусть X — совокупность всех возможных значений (X1 , .
. . , Xn ),и введена функция ϕ : X → [0; 1], тогда, отвергая H0 с вероятностью ϕ(x1 , . . . , xn ),получаем рандомизированный, или ϕ-критерий.Оптимальный критерий с заданным уровнем значимости α существует не всегда.Если ϕ(x1 , . . . , xn ) = 1S (x1 , . . .
, xn ), то получаем S-критерий.Определение 17.15. ФункцияZW (ϕ, θ) = ϕ(y)pn (y, θ)dy, y = (x1 , . . . , xn )Rnназывается функцией плотности для рандомизированного критерия.129АналогичноW (ϕ, θ0 ) − уровень значимости,W (ϕ, θ1 ) − мощность критерия.Определение 17.16. ϕ∗ — оптимальный рандомизированнй критерий суровнем значимости α, еслиW (ϕ∗ , θ0 ) = α,W (ϕ∗ , θ1 ) > W (ϕ, θ1 ),для любого ϕ: W (ϕ, θ0 ) = α.Оптимальный рандомизированный критерий существует всегда.130Лекция 1818.1Лемма Неймана-ПирсонаПусть X1 , . . .
, Xn — повторная выборка из L(X), θ ∈ Θ;и относительно значений параметра имеем две простые гипотезы:H0 : θ = θ 0 ;H1 : θ = θ 1 ;pn (y, θ) — функция правдоподобия,p1 (y) = pn (y, θ1 ), p0 (y) = pn (y, θ0 );Тогда отношением правдоподобия называется величинаp1 (y).p0 (y)Определение 18.1. Критерии отношения правдоподобия — это критерии,p1 (y)основанные на отношении.p0 (y)Лемма 18.1. Для ∀α ∈ [0; 1] ∃ постоянные c > 0 и ε ∈ [0; 1] такие, что ϕ – критерий 1, p1 (y) > cp0 (y),∗ϕ (y) = ε, p1 (y) = cp0 (y), 0, p (y) < cp (y)10является оптимальным критерием, т. е. наиболее мощным среди всехϕ – критериев с уровнем значимости α.Замечание.
Если рассмотреть пример из прошлой лекции, где X1 из L(X) ∼N (θ, 1), H0 : θ = 0, H1 : θ = 2, то критерий отношения правдоподобия в данном случае естественен, т. к. берется та гипотеза, при которой график функцииплотности располагается выше. Стоит заметить, что, вообще говоря, нельзя положить c равным 1, так как при выборе c нужно отталкиваться от заданного уровнязначимости α.Замечание. ϕ∗ – критерий воспринимаем следующим образом:ϕ(y) = 1 ⇒ H0 отвергаем,ϕ(y) = 0 ⇒ H0 принимаем,ϕ(y) = 1 ⇒ H0 отвергается с вероятностью ε.Рассмотрим крайние случаи для α:α = 0 = P(H1 H0 ) (т.
е. мы никогда не допускаем ошибку 1-го рода), тогда(1, p1 (y) = 0, (но сюда мы никогда не попадем)ϕ∗ (y) =0, p0 (y) > 0, (здесь гипотеза H0 не отрицается)131α = 1 (всегда имеет место ошибка 1-го рода), H0 всегда отвергается, т. е.ϕ∗ (y) = 1.Доказательство. Доказательство будет состоять из двух частей: в 1-ой мы конструктивно укажем, как по заданному α найти c и ε, во 2-ой части будет доказанаоптимальность и то, что данный критерий обладает заданным уровнем значимости.1. Определим функцию g(c) = P(p1 (Y ) > cp0 (Y )) | H0 ) (т. е. случайный вектор Yимеет распределение, соответсвующее нулевой гипотезе).
Тогда1 − g(c) = P(p1 (Y ) < cp0 (Y ) | H0 ) = P(p1 (Y ) < cp0 (Y )1({p0 (Y )>0}) | H0 )p1 (Y )= P(< c | H0 )p0 (Y )1({p0 (Y )>0})= ф-ия распределения сл. в. z как ф-ия от c.Тогда можно выделить следующие свойства функции g(c) :1. g(c) не возрастает;2. g(c) непрерывна слева;3. g(0) = 1; g(+∞) = 0;Далее по заданному α определим cα следующим образом:g(cα + 0) = lim g(c) < α 6 g(cα ),c→cα +0если cα — точка разрыва функции g(c), в противном случаеcα : α = g(cα ).Для функции g(c) рассмотрим три возможных случая:1.
Функция g(c) терпит разрыв так, что ее график не пересекается с графикомфункции y = α. Т. е. в некоторой точке c0 g(c) разрывна иg(c0 ) > α, g(c0 − 0) < α. Тогда cα = c0 .2. Функция g(c) непрерывна и значение, равное α, достигается в единственнойточке c0 . Тогда, аналогично, cα = c0 .3. Функция g(c) непрервына и значение, равное α, достигается на отрезке [c1 ; c2 ].Тогда в качестве cα берем произвольную точку из отрезка [c1 ; c2 ].Таким образом определенное cα и есть искомое c из определения функции ϕ∗ (y). εже определяется следующим образом:во 2-ом и 3-ьем случаях (когда решение существует) ε = 0,α − g(cα + 0).в 1-ом случае положим ε =g(cα ) − g(cα + 0)1322. Уровень значимостиZW (ϕ, θ0 ) = ϕ∗ (y)p0 (y)dy =ZRnp1 (y)>cα p0 (y)Zp0 (y)dy + ε ·p1 (y)=cα p0 (y)Z= g(cα ) + (ε − 1) ·p0 (y)dyp0 (y)dyp1 (y)=cα p0 (y)= g(cα ) + (ε − 1)(g(cα ) − g(cα + 0))(g(cα ) + α − g(cα ) в 1-ом случае=g(cα ) во 2-ом и 3-ьем случаях= α для всех трех случаев.Таким образом показано, что ϕ∗ – критерий имеет уровень значимости α.Предположим, что произвольный ϕ – критерий имеет уровень значимости α, идокажем, чтоW (ϕ∗ , θ1 ) > W (ϕ∗ , θ1 )(1)Рассмотрим интегралZI = (ϕ∗ (y) − ϕ(y))(p1 (y) − cα p0 (y))dyRnZZ∗=(ϕ (y) − ϕ(y))(p1 (y) − cα p0 (y))dy +ϕ∗ > ϕ(ϕ∗ (y) − ϕ(y))(p1 (y) − cα p0 (y))dy =ϕ∗ < ϕ= I1 + I2 ;Покажем, что I1 и I2 неотрицательны.1) на множестве тех y, где ϕ∗ (y) > ϕ(y) > 0, выполнено также и ϕ∗ (y) > 0, и,следовательно, p1 (y) > cα p0 (y) ⇒ I1 > 02) аналогично на множестве тех y, где ϕ∗ (y) < ϕ(y) 6 1, выполнено также иϕ∗ (y) < 1, и, следовательно, p1 (y) 6 cα p0 (y) ⇒ I2 > 0Отсюда0 6 I = W (ϕ∗ , θ1 ) − W (ϕ, θ1 ) − cα (W (ϕ∗ , θ0 ) − W (ϕ, θ0 ))= {W (ϕ∗ , θ0 ) = W (ϕ, θ0 ) = α}.⇒ W (ϕ∗ , θ1 ) > W (ϕ∗ , θ1 ), и (1) доказано.18.2Равномерно наиболее мощные критерииПример.
Пусть X1 , . . . , Xn из L(X) ∼ N (θ, 1), H0 : θ = 0, H1 : θ = θ1 > 0.Тогда133"Ã n!#" n#XXp1 (y)1n−2xi θ1 + nθ12= expxi θ1 − θ12 > c= exp −p0 (y)22i=1i=1mnXxi > c 1i=1mX > c2Пусть α задано. Тогда P(X > c2 | H0 ) = α.√1Из H0 следует, что X ∼ N (0, ), поэтому n X ∼ N (0, 1) и, если uα определяетсяnиз равенства1 − Φ(uα ) = α,(2)тоuαcα = √ .nСледовательно, оптимальным критерием является следующее утверждение:uα"Гипотеза H0 отвергается, если X > √ ."nЗамечание. Так как условие θ1 > 0 не содержится в описании критерия, то критерий остается неизменным для всех θ1 > 0, т. е. этот критерий является равномернонаиболее мощным критерием для альтернативы H1 : θ = θ1 > 0.uαЗамечание. Если θ1 < 0, то X < − √ , где uα из (2), и данный критерий такжеnявляется равномерно наиболее мощным.Замечание.
Рассмотрим мощность построенного критерия в случае θ1 > 0 :uα1W (ϕ∗ , θ1 ) = P(X > √ | H1 ) = {X ∼ N (θ1 , )}nn√= 1 − Φ(uα − θ1 n).Замечание. Если θ1 ∼ 0, то W (ϕ∗ , θ1 ) ∼ α, т. е. мощность мала. Это можно объяснить тем, что в случае, когда альтернатива H1 близка к H0 , вероятность ошибкивторого рода довольная велика.Замечание. Если n → ∞, то W (ϕ∗ , θ1 ) → 1, т.
е. вероятность ошибки второго родастремится к нулю, и ее можно сделать сколько угодно малой, меняя объем выборки.134Лекция 1919.1Состоятельные критерииРассмотрим пример из предыдущей лекции . Пусть X1 , . . . , Xn из L(X) ∼ N (θ, 1),H0 : θ = θ0 = 0, H1 : θ = θ1 > 0. Используя лемму Неймана-Пирсона, построимн. м. к. (наиболее мощный критерий):uαX>√ ,nгде1 − Φ(uα ) = α — уровень значимости.(Этот критерий является равномерно наиболее мощным.)Несложно видеть, что прификсированном значении θ1 и при n → ∞ W → 1.Определение 19.1.
Критерий называется состоятельным, если его мощностьстремится к 1 при неограниченном увеличении объема выборки.Замечание. Таким образом, построенный выше критерий является состоятельным.19.219.2.1Критерий χ2 ПирсонаКритерий χ2 ПирсонаПусть X1 , . . . , Xn из L(X), где L(X) — дискретное распределение, при котором случайная величина принимает значенияa1 , . . . , akс вероятностямиp1 , . .
. , p k .И рассматриваются две гипотезы:H0 : pi = pi0H1 :kX(pi − pi0 )2 > 0∀i = 1, k,, т. е. хотя бы для одного i pi 6= pi0 .i=1Тогда по критерию χ2 Пирсона предлагается рассмотреть следующую статистику:пусть x1 , . . . , xn — реализация выборки, а ν1 , . . . , νk — набор чисел, составленныйпо следующему закону:135νi равно количеству встретившихся в данной выборки значений ai . Если H0 справедлива, то νi ∼ Bi(n, pi0 ).
ТогдаEνi = npi0 ,Dνi = npi0 (1 − pi0 ),kX(νi − npi0 )2χ =.npi0i=12То есть получена статистика χ 2 , или χ 2 – критерий.19.2.2Асимптотика для критерия ПирсонаПример. Рассмотрим следующие данные: в 2006 году в России насчитывалось 53миллиардера, из которых 12% родились под знаком Девы. Предположим, что исследуемая случайная величина принимает значения 1 (миллиардер родился под знакомДевы) и 0 (под другим знаком), т.
е. a1 = 1, a2 = 0. Тогда гипотезы H0 и H1 можносформулировать следующим образом:11H0 : p1 0 =(вероятность родиться под знаком Девы равняется).121211H1 : p1 1 6=(вероятность родиться под знаком Девы не равна , в данном случае1212121больше, т. к.> ).10012Предположим, что объем выборки n = 100 и ν1 = 12, тогда, используя критерийχ2 Пирсона, получаем, что χ 2 = 1.76. Если же справедлива H0 , то χ 2 ∼ 0. Тогдакритическая область S имеет видS = {χ 2 : χ 2 > χ2крит. },иα = P(χ 2 > χ2крит. | H0 ),причем найти из этого уравнения χ2крит. по заданному α довольно непросто.
Используем ассимптотический подход:(ν1 − np1 0 )2 (ν2 − np2 0 )2+= {ν1 + ν2 = n, p1 0 + p2 0 = 1} =np1 0np2 0¶µ(ν1 − np1 0 )2 (n − ν1 − n(1 − p1 0 ))2(ν1 − np1 0 )211=+=−=np1 0np2 0np1 0 1 − p1 0Ã!2 Ã!2(ν1 − np1 0 )2ν1 − np1 0Y1 + . . . + Yn − np1 0p= p==,np1 0 (1 − p1 0 )np1 0 (1 − p1 0 )np1 0 (1 − p1 0 )χ2 =где(Yi =1, если xi = ai ,.0, иначеПрименяем ЦПТ : выражение, стоящее внутри скобок сходится по распределению кстандартному нормальному, т.