Ульянов (новое издание) (1115355), страница 26
Текст из файла (страница 26)
е. все выражение сходится по распределению к распределению χ2 с одной степенью свободы. Таким образом, доказанаТеорема 19.1.∀z ∈ RP(χ 2 < z) → P(χ21 < z).136Теорема 19.2.∀z ∈ RP(χ 2 < z) → P(χ2k−1 < z),где k — число значений в дискретном распределении L(X),χ2k−1 — χ2 – случайная величина с (k − 1) степенями свободы.Пример. В рассмотренном выше примере о миллиардерахα = P(χ 2 > χ2крит.
| H0 ) ∼ P(χ12 > χ2крит. | H0 ),и при α = 0.1 получаем χ2крит. = 2.71, т.е. гипотеза H0 не противоречит данным.19.3Состоятельность критерия ПирсонаТеорема 19.3. Критерий χ2 является состоятельным, т. е.P(χ 2 =kX(νi − npi0 )2> χ2крит. | H1 ) → 1 при росте n, илиnpi0i=1kX(νi − npi0 )2P(χ =< χ2крит. | H1 ) → 0 при росте n.npi0i=12Доказательство.kkX(νi − npi0 )2 X (νi − npi1 + npi 1 − npi 0 )2χ ===npi0npi0i=1i=12= { при условии H1 : νi ∼ Bi(n, pi 1 ) ⇒ Eνi = npi 1 } =kkkXXX(νi − npi1 )(npi1 − npi0 )(npi 1 − npi0 )2(νi − npi1 )2+2+n==npi0npi0npi0i=1i=1i=1= Y1 + 2Y2 + nC1 (k), причем Y1 > 0, C1 (k) > 0.Тогда в терминах введенных случайных величин Y1 , Y2 надо доказать, чтоP(Y1 + 2Y2 + nC1 (k) < χ2крит.
| H1 ) → 0.Обозначим −nC2 (k) = χ2крит. − nC1 (k), причем C2 (k) > 0.И, т. к. Y1 > 0, достаточно показать, чтоnC2 (k)| H1 ) → 0, или2P(Y2 < −nC3 (k) | H1 ) → 0.P(Y2 < −P(Y2 < −nC3 (k) | H1 ) 6 P(|Y2 | > nC3 (k) | H1 ) 66 { по н-ву Чебышева } 6DY2.2n C32 (k)Для того, чтобы доказать стремление к нулю, достаточно показать, что DY2 6nC4 (k), а этот факт будет следовать из того, что EY22 6 nC4 (k). Покажем последнее137неравенство:Ã k!2X (νi − npi )(pi − pi )110EY22 = E=pi0i=1Ã k!2X(pi1 − pi0 )=E(νi − npi1 )6pi0i=16 { по н-ву Коши-Буняковского} 66 C5 (k)E= nC5 (k)kXi=1kX(νi − npi1 )2 =pi 1 (1 − pi1 ) = nC4 (k).i=119.4Обобщение классического критерия χ2Рассмотрим L(X) — дискретное распределение, при котором случайная величинапринимает значенияa1 , .
. . , akс вероятностямиp1 , . . . , p k .И нулевая гипотеза имеет вид:H0 : pi = pi0 (θ)∀i = 1, k, где θ = (θ1 , . . . , θr ).Тогда следует рассматривать2χ =kX(νi − npi0 (θ̂))2i=1npi0 (θ̂), где θ̂ — оценка для θ.(1)Теорема 19.4. Если функция pn (X, θ) достаточно гладкая, и θ̂ — оценка максимального правдоподобия для θ,то статистика, определяемая (1), сходится по распределению к χ2k−1−r .138Лекция 2020.1Критерий согласия Пирсона χ 2 для абсолютнонепрерывных распределенийПусть L(X) — абсолютно непрерывное распределение.
Разобьем вещественную прямую на интервалы следующим образом:Ã![ k−2[[(zi ; zi+1 ]R = (−∞; z1 ][zk−1 ; +∞).i=1В качестве νi берем число xi , попавших в Ci = (zi−1 ; zi ], считая z0 = −∞, zk = +∞.Сформулируем гипотезу H0 для функции плотности f (y)H0 : f (y) = f0 (y).ПоложимZpi = P(X ∈ Ci ) =f0 (y)dy = pi0 .CiДалее можем, как и ранее, считатьχ2 =kX(νi − npi0 )2→ χ2k−1 .npi0i=1Таким образом проведена дискретизация непрерывной задачи.Тем не менее, остаются нерешенными два вопроса:1.
выбор zi ,2. количество точек разбиения zi .Пример. Рассмотрим случай k = 2. Для любого симметричного распределения получаем p10 = p20 = 12 , и, как следствие, при разбиении вещественной прямой на двеполупрямые мы уже не можем различить два неравных друг другу распределения сфункциями плотности, симметричными относительно оси абсцисс. Т.
е. необходимо,чтобы дискретная модель максимально отражала непрерывную.Наиболее правдоподобное приближение непрерывной модели дискретнойполучается при достаточно большом (k) и при более мелком разбиении прямой длятех участков, где функция плотности f0 (y) принимает большие значения. С другойстороны, нельзя неограниченно увеличивать (k), т. к. при фиксированном объемевыборки (n) мы можем получить ситуацию, при которой многие νi будут равнятьсянулю, что не прибавит точности.13920.2Критерий независимости χ 2Пример. Допустим, что проведен опрос (n) выпускников некоторого учебного заведения( и имеется следующая выборка — X1 , .
. . , Xn , где Xi = (Z1 i , Z2 i ),1, если i -тый выпускник имеет красный дипломZ1 i =,0, иначе 2, если i -тый выпускник доволен работойZ2 i = 1, если i -тый выпускник нейтрально относится к работе .0, если i -тый выпускник не доволен работойТ. е. имеются две случайные величины: Z1 , отражающая распределение красныхдипломов, и Z2 , показывающая отношение выпускников к текущей работе. Тогдаможно сформулировать гипотезуH0 : Z1 и Z2 независимы,и по полученной выборке двумерных векторов попытаться определить, насколькоона соответсвует полученным данным.Рассмотрим следующую абстрактную модель: имеется выборка из (n) двумерныхвекторов X1 , . .
. , Xn , где Xi = (Z1 i , Z2 i ), νi j — число векторов из данной выборки, укоторых первая компонента равна bi , а вторая — aj , i = 1, l, j = 1, k. По гипотезеH0 случайные величины Z1 и Z2 независимы, т. е.pi j = P(Z1 = bi ; Z2 = aj ) = P(Z1 = bi ) · P(Z2 = aj ) = pi · · p·j .Положим2χнезав.l XkX(νi j − npi j )2=.npi ji=1 j=1Для мультиномиального распределения функция правдоподобия имеет видY νL=cpijij ,i,jи для рассматриваемой нулевой гипотезы получимL=clYpνi·i·i=1kYνp·j·j .j=1Можно показать, что оценка максимального правдоподобия для pi · и p· j таковаνi ·p∗i · =,nν· jp∗·j =.nАналогично случаю обощения классического критерия χ 2³νi· · ν·j ´2l Xk n νij −X2n=→ χ2kl−1−(l−1)−(k−1) = χ2(l−1)(k−1) .χнезав.ν·νi··ji=1 j=12Так же, как и ранее, для некоторым образом определенного χкрит., гипотеза H0 от22вергается при χнезав.
≥ χкрит. . Поскольку считать вероятность22≥ χкрит.| H0 ) довольно сложно, используем то, чтоP(χнезав.222≥ χкрит.| H0 ) → P(χ2(l−1)(k−1) ≥ χкрит.| H0 ).α = P(χнезав.14020.3Критерий независимости χ 2Рассмотрим (l) выборок из дискрентых распределений L(X1 ), . . . , L(Xl ), набор значений в которых одинаков — a1 , .
. . , ak :X1 1 , . . . , X1 n1 из L(X1 ),X2 1 , . . . , X2 n1 из L(X2 ),...Xl 1 , . . . , X1 nl из L(Xl ).По гипотезе H0 предполагается, что : L(Xi ) одинаковы, т. е. имеем задачу об однородности выборки. Пусть νi j — число элементов i-той выборки, совпадающих созначением aj , тогда H0 такова, что pij = pj ∀j = 1, k и сразу для всех i.2χоднор.l XkX(νij − ni pij )2==ni piji=1 j=1noν· j= pij = pj (H0 ) неизвестны, ОМП для них: p∗j =, n = n1 + .
. . + nl =n³ν·j · ni ´2l Xkνij −Xn=n→ χ2(l−1)(k−1) при k → ∞,ν·j · nii=1 j=1и222α = P(χоднор.≥ χкрит.| H0 ) → P(χ2(l−1)(k−1) ≥ χкрит.| H0 ),22≥ χкрит..т. е. H0 отвергается при χоднор.20.4Проверка гипотез и доверительный интервалПример. Рассмотрим выборку X1 , . . . , Xn из L(X) ∼ N (θ, 1),H0 : θ = 0,H1 : θ > 0.Тогда р. н. м. кр.
(равномерно наиболее мощный критерий) таков:uαпри X > √ гипотеза H0 отвергается,nгде α находится из уравнения 1 − Φ(uα ) = α.Аналогично, еслиH0 : θ = θ0 ,H1 : θ > θ1 ,р. н. м. кр. таков:uαпри X > √ + θ0 гипотеза H0 отвергается,nгде α : 1 − Φ(uα ) = α.141Допустим, что имеется нерандомизированный S-критерий ( S = S(θ0 )),т. е. если y = (x1 , .
. . , xn ) — реализация выборки и y ∈ S, то простая нулеваягипотеза H0 : θ = θ0 отвергается. Понятно, что H0 принимается при y ∈ S ,причем P(Y ∈ S | H0 ) = 1 − α.Рассмотрим случай n = 1, тогда множество всех значения выборки X = R,р. н. м. кр. : X1 > θ0 + uα , т. е.S = S(θ0 ) = {x : x > θ0 + uα }.Для ∀ θ ∈ R получимS(θ) = X\S(θ) ⊂ X,noS(θ) . С другой стороны,т.
е. имеем однопараметрическое семейство множествфиксировав произвольное x∗ ∈ R, определимnoT (x∗ ) = θ ∈ Θ = R : x∗ ∈ S(θ) ,тогда получим совокупность множеств {T (x)} в пространстве Θ.Предположим, чтоx ∈ S(θ)mθ ∈ T (x),(20.1)и, рассматривая вместо x случайную величину X1 , будем иметь1 − α = P(X1 ∈ S(θ)) = P(θ ∈ T (X1 )).Таким образом, область T (X1 ) в Θ в данном случае рассматривается нами как доверительная область для неизвестного параметра θ с коэффициентом доверия(1 − α).Можно двигаться и в обратном направлении: пусть T (X) — построеннаядоверительная область с коэффициентом доверия γ, тогда из (20.1)получим S-критерий с уровнем значимости (1 − γ).20.5Несмещенные критерииОпределение 20.1.
Статистический критерий называется несмещенным, если для любого значения параметра из альтернативы H1 мощность критерия неменьше уровня его значимости.Пусть X1 , . . . , Xn из L(X) ∼ N (θ, 1),H0 : θ = θ0 ,H1 : θ =6 θ0 ,α — уровень значимости. Можно применить лемму Неймана-Пирсона для построения критериев для альтернатив θ > θ0 и θ < θ0 :uαдля θ > θ0 критическая область X > θ0 + √ 1 ,nuα 2для θ < θ0 критическая область X < θ0 − √ ,n142где α1 , α2 : α1 + α2 = α. Тогда критическая область¾ ½¾½uα 1 [uα 2x1 , .
. . , x n : x < θ 0 − √.S = x1 , . . . , x n : x > θ 0 + √nnМожно показать, что1. мы получим несмещенный критерий только при α1 = α2 ,2. среди всех несмещенных критериев данный критерий с критической областьюS при α1 = α2 является равномерно наиболее мощным несмещенным критерием.Так как½¾uα 2S = x1 , . . . , xn : |x − θ0 | < √,nто из (20.1) можно получить доверительный интервалuαuαx − √ 2 < θ0 < x + √ 2 ,nnкоторый является доверительным интервалом наименьшей длины. Можно такжепоказать, что если получен доверительный интервал минимальной длины, тосоответствующий ему критерий будет равномерно наиболее мощным несмещеннымкритерием.143.