Ульянов (старое издание) (1115357), страница 15
Текст из файла (страница 15)
Введем функционалϕ : X → [0, 1].Если есть выборка y = (x1 , ..., xn ), то проводится случайный эксперимент,состоящий в том, что с вероятностью ϕ(y) отвергается гипотеза H0 . Еслиесть S-критерий (это значит, что в выбранном пространстве S выбранкритерий), то½1, y ∈ S;ϕ(y) =0, иначе.Понятие ϕ-критерия - это обобщение понятия S- критерия.
ϕ-критерий рандоминизированный критерий, а S-критерий им не является. В случаеS- критерияZW (ϕ, θ) =ϕ(y)p(y, θ)dy,XZW (S, θ) =pn (y, θ)dy.SВ случае рандоминизированного критерияW (ϕ, θ) = Eθ ϕ(Y ),где pn (y, θ)-плотность Y .W (ϕ, θ0 ) = α,если в качестве параметра θ взять θ0 из нулевой гипотезы, а если взятьθ = θ1 из конкурирующей гипотезы, тоW (ϕ, θ1 ) = 1 − β.Определение 24.2. Рандоминизированный критерий с функционалом ϕназывается оптимальным (или наиболее мощным из всех ϕ- критериев)с заданным уровнем значимости α (обозначение Kαϕ ), еслиW (ϕ∗ , θ0 ) = α,W (ϕ∗ , θ1 ) = sup W (ϕ, θ1 )(2).ϕϕ∈Kα24 Лекция 10119Функцию правдоподобия pn (y, θ0 ) обозначим через p0 (y), а pn (y, θ1 )-черезp1 (y).p1 (y)−p0 (y)отношения правдоподобия. Критерий, основанный на отношений правдоподобия - это критерий отношения правдоподобия.Лемма 24.1 (Неймана-Пирсона).
Для любого α ∈ (0, 1) существуютC > 0 и ε ∈ [0, 1] такие, что ϕ-критерий с функцией 1, p1 (y) > Cp0 (y);ϕ∗ = ε, p1 (y) = Cp0 (y);0, p1 (y) < Cp0 (y).является оптимальным ϕ- критерием в смысле определения (2), которое дано выше.Лемма 24.2. Если α = 0, то½ϕ∗ (y) =1, y : p0 (y) = 0;0, иначе.p0 (y) = 0 значит, что вектор выборки сюда не попадает.
Уровеньзначимости- это вероятность ошибки 1-го рода. Если α = 0, то это значит,что мы не отвергаем H0 и не ошибаемся, если же α = 1 (всегда ошибаемся, всегда отвергаем H0 ), то ϕ∗ (y) = 1.Доказательство (Леммы). Часть 1. Пусть Y = (X1 , ..., Xn ). Положимg(C) = P (p1 (Y ) ≥ Cp0 (Y )|H0 )и рассмотрим1 − g(C) = P (p1 (Y ) < Cp0 (Y )|H0 ) == P (p1 (Y ) < Cp0 (Y ) · I{p0 (Y )>0} |H0 ) == P(p1 (Y )< C|H0 )−p0 (Y ) · I{p0 (Y )>0}функция распределения случайной величиныp1 (Y )p0 (Y ) · I{p0 (Y )>0}и отношение правдоподобия, а у функции распределения хорошие свойства ⇒ g(C) обладает следующими свойствами:1. g(C) - невозрастающая функция;2.
g(0) = 1, g(−∞) = 0;12024 Лекция 103. g(C) непрерывна слева.Пусть α- произвольное фиксированное число из [0, 1]. Для выбора Cα рассмотрим три случая:1) α1 : имеем одну точку пересечения с графиком;2) α2 : попадаем в участок постоянства функции;3) α3 : не попадаем ни на одну точку, или попадаем в ее разрыв. А теперьрассмотрим их по отдельности: 3) α3 :Cα :limC→Cα +0εα == g(Cα + 0) < α ≤ g(Cα ).α − g(Cα + 0); (*)g(Cα ) − g(Cα + 0)1) α1 : g(Cα ) = α;2) α2 : g(C) = α, ∀C ∈ [C1 , C2 ].Для случаев 1) и 2) εα = 0.На этом конструктивная часть доказательства завершается.Часть 2.
Докажем, что построенный критерий оптимален, т.е.а) имеет заданный уровень значимости иб) является наиболее мощным.Перейдем к доказательству пункта а).Zα = W (ϕ∗ , θ0 ) = Eθ0 ϕ∗ (y) = E0 ϕ∗ (y) =ϕ∗ (y)pn (y, θ0 )dy =XZZ=1 · p0 (y)dy + εp1 (y)>Cα p0 (y)p0 (y)dy =p1 (y)=Cα p0 (y)= g(Cα ) + (εα − 1)(g(Cα ) − g(Cα + 0)) = α.Так как ϕ∗ = 0, то третьего интеграла нет. Если g(cα ) − g(cα + 0) 6= 0,подставляем в формулу для εα (*).б) Пусть ϕ- произвольный ϕ-критерий с уровнем значимости α.Eθ1 ϕ∗ (Y ) ≥ Eθ1 ϕ(Y ) (3).ZZZ∗(ϕ − ϕ)(p1 − Cα p0 )dy =+ϕ∗ >ϕXϕ∗ <ϕ= I1 + I2 .Интеграл I1 идет по тем y, гдеϕ∗ (y) > ϕ(y) ≥ 0,т.е. ϕ∗ (y) > 0, а это тогда, когдаp1 (y) ≥ Cα p0 (y).Значит, если первая разность положительна, то вторая неотрицательна.Отсюда I ≥ 0. Аналогично поступаем с I2 .
Интеграл идет по области, где24 Лекция 10121ϕ∗ (y) < ϕ(y) ≤ 1 ⇒ ϕ∗ (y) < 1⇔ p1 (y) ≤ Cα p0 (y) ⇒ I2 ≥ 0.В итогеZ0 ≤ (ϕ∗ − ϕ)(p1 − Cα p0 )dy = E1 (ϕ∗ (Y ) − ϕ(Y ) − Cα E0 (ϕ∗ (Y ) − ϕ(Y ))).XТак как ϕ∗ (Y ) = α, то Cα E0 (ϕ∗ (Y ) − ϕ(Y )) = 0. Отсюда и получаемнеравенство (3). Это и завершает доказательство.25Лекция 11конкурирующие простые гипотезы, то есть выделяющие не класс распределений, а лишь одно.H0 : p(y) = p0 (y), θ = θ0H1 : p(y) = p1 (y), θ = θ1 , где p(y) - функция правдоподобия.Замечание 25.1 (К лемме Неймона-Пирсона).g(c) = P (p1 (Y ) > cp0 (Y )|H0 ); если g(c) разрывна (то есть распределениедискретно), то почти наверное ε ∈ (0, 1). Для непрерывных распределенийэто не всегда так.Пример 25.1.
Пусть (X1 , . . . , Xn ) - выборка из нормального распределения N (a, 1), где a - неизвестный параметр.H0 : a = 0H1 : a = a1 > 0y = (X1 , . . . , Xn )µ¶1(Xi − a1 )2√p1 (y) =exp −22πi=1nYp1 (y)= expp0 (y)ÃnX1(2Xi a1 − na21 )21!>cP xiПоскольку левая часть есть строго возрастающая функция отn , значит данное неравенство будет эквивалентно следующему: X = n1 (X1 +.
. . + Xn ) > c2 .Если верна гипотеза H0 , то распределение n1 (X1 + . . . + Xn ) ∼ N (0, n1 ).√Тогда nX ∼ N (0, 1);√P (X > c2 |H0 ) = P ( nX > c3 |H0 ) = α,√где α - заданный уровень значимости, а P ( nX > c3 |H0 ) = 1 − Φ(c3 ),если Φ(x) - функция распределения стандартного нормального закона.12425 Лекция 11Поскольку α - квантиль, то uα определена (ее можно узнать из таблиц,как решение уравнения 1 − Φ(uα ) = α).c3⇒ c3 = uα , c2 = √nСледовательно, по лемме Неймона-Пирсона X >uα√.nЗамечание 25.2. Данный критерий никак не использует значение a1 .
Следовательно, наиболее мощный критерий одинаков для любого a1 . А значит, этот критерий является равномерно наиболее мощным среди всехкритериев с заданным уровнем значимости, то есть Eϕ∗ (Y ) = α, E∗1 ϕ∗ (Y ) ≥E1 ϕ(Y ) для любого θ1 ∈ Θ1 и любой ϕ : E0 ϕ(Y ) = α.uαЗамечание 25.3. β = P (H0 |H1 ) = P (X ≤ √|H1 ) = {если верна гипотезаn√√√1H1 , то X ∼ N (a1 , n )} = P ((X −a1 ) n ≤ uα −a√1 n|H1 ) = Φ(uα −a1 n) ⇒1 − β = {мощность критерия} = 1 − Φ(uα − a1 n)Если a1 близко к 0, то мощность мала, то есть вероятность допуститьошибку велика. Поэтому при n → ∞ мощность уходит в 1.Определение 25.1. Критерий называется состоятельным, если его мощность стремится к 1 при n → ∞.Eϕn (Y ) → 1Если же рассматривать случай, когда H1 : a = a1 < 0, то отличие отранее рассмотренного случая будет заключаться в том, что гипотеза H1uα√α.принимается не при X > √, а при X < −unn25.1 Критерий Пирсона (критерий согласия)(X1 , .
. . , Xn ) - выборка из L(X) - дискретного распределения; X - дискретная случайная величина.a . . . akX: 1p1 . . . pkH0 : pi = p0iH1 : pi = p1i ,i = 1, kPk 01 2(p−p)>0,то есть хотя бы две вероятности различны (одна вероi1 iятность различаться не может, поскольку сумма всех вероятностей равнаPk (ν −np0 )21). χ2 = i=1 i np0 i - статистика критерия, где νi - частота появленияiзначения a1 в выборке (x1 , . . .
, xn ).Пример 25.2. На основании некоторых сведений было установлено, чтосреди всех миллиардеров 12% являются девами по знаку зодиака. Можноли из этого сделать вывод, что у "дев" больше шансов стать миллиардерами, чем у всех прочих знаков зодиака?25.1 Критерий Пирсона (критерий согласия)1251H0 : pd = 12то есть у всех знаков шансы равны1H1 : pd > 12то есть у дев вероятность становления миллиардером вышеВ данном случае, гипотеза H1 является односторонней альтернативой.
В1то время, как если ли условия гипотезы H1 звучали бы, как pd 6= 12, тоальтернатива была бы двусторонней.k = 2; a1 = 1, a2 = 0Имеется статистика: из 100% 12% - девы. Если k = 2, то ν2 = n − ν1 , p02 =1 − p01(ν −np0 )2(ν −np0 )2(ν −np0 )211χ2 = 1 np0 1+ 2 np0 2 = { p1 + 1−p= p(1−p)} = np10 (1−p1 0 ) =1211¸2·ν1 −np01√ 0np1 (1−p01 )210012−12 ' 1.76χ2 = q1100 · 12· 1112Критические значения для статистики - отличные от нуля, причем отдаленность определяется из уровня значимости.α = P (χ2 > χkp > 0|H0 ) (*)α - задан; χk p находим, используя приближение, то есть, если χ2 стремится по распределению к некоторой случайной величине Z (для ∀ yP (χ2 <y) → P (Z < y)), тогда P (χ2 > χkp ) → P (Z > χkp ).
Поэтому для нахождения χkp соотношение (*) заменяется на α = P (X > χkp ). Смысл данногоприближения - упрощение, поскольку случайная величина Z может бытьдостаточно простой.Если k = 2, то ν1 ∼ Bi (n, p01 ) - биномиальное распределение.Eν1 = np01 , Dν1 = np01 (1 − p01 )·¸2ν1 −np01√По центральной предельной теореме:→ Z 2 , где Z ∼00np1 (1−p1 )N (0, 1).α = 0.1, 0.05χkp = 2.71, 3.84χ2 = 1.76 < 2.71Следовательно, гипотеза "избранности"дев неверна.Theorem 25.1. χ2 стремится по распределению к χ2k−1 (overlineχ2 с k −1 степенью свободы) при n → ∞.Определение 25.2. Случайная величина имеет распределение χ2k−1 , ес2ли ее распределение совпадает с распределением Z12 + . . .
+ Zk−1, гдеZ1 , . . . , Zk−1 независимые N (0, 1) случайные величины.Для случая k = 2 теорема уже доказана (см. выше), для остальных случаев в данном курсе лекций она доказываться не будет.12625 Лекция 11Theorem 25.2. Критерий Пирсона является состоятельным, то естьP (χ2 > χkp |H1 ) → 1, n → ∞.26Лекция 12/*Было : X1 , . . .
, Xn из L(X)a1 , . . . , akp1 , . . . , pkH0 : pi = pi0 i = 1,¯kH1 : pi = pi12 dPki0 )χ̄2 = i=0 (νi −np−→ χ2k−1npi0νi = {число появлений ai в (x1 , . . . , xn )}Если χ̄2 > χкр ⇒ H0 отвергается*/Theorem 26.1. Критерий Пирсона является состоятельным, т. е.P (χ̄2 > χкр |H1 ) −−−−→ 1n→∞(26.1)Доказательство. Соотношение (1) эквивалентно:P (χ̄2 < χкр |H1 ) −−−−→ 0n→∞(26.2)2Pki1 −npi0 )=χ̄2 можно переписать: χ̄2 = i=1 (νi −npi1 +npnpi0{ Если справедлива H1 , то νi ∼ Bi (n, pi1 ). Для биномиального распределения мат. ожидание = npi1 }22PkPkPki1 )i1 −pi0 )i0 )= i=1 (νi −np+ 2 i=1 (νi −npi1p)(p+ n i=1 (pi1p−p= Z1 + 2Z2 +npi0i0i0nC1 (k)P (χ̄2 < χкр |H1 ) = P (Z1 + 2Z2 < −nC2 (k)) = {т.