1625915143-9358bde957c0693ae60a95b83ad382f6 (843873), страница 18
Текст из файла (страница 18)
ПолучаемnpiΨn =kXsi = 266.84.i=1Если взять ε = 0.05, то из таблиц находим χ211 (19.7) = 0.95, т. е. Ψn > q = 19.7 сбольшим запасом. Гипотезу о равных вероятностях следует отвергнуть. Кстати, тотже вывод следует и для меньших значений ε, так как из тех же таблиц следует, кпримеру, что χ211 (45) = 0.99999....8.4.Построение критерия с помощью доверительногоинтервалаПредположим, что X ⊂= Fθ , θ ∈ R — неизвестный параметр. Наша задача состоитв проверке основной гипотезы H1 : θ = θ1 против H2 : θ 6= θ1 .Если мы имеем доверительный интервал для θ уровня 1 − ε (точный или асимптотический), то с его помощью можно построить критерий согласия (также точныйили асимптотический) уровня 1 − ε. Действительно, если при всех значениях θPθ (A(X1 , .
. . , Xn ) < θ < B(X1 , . . . , Xn )) ≥ 1 − ε,то и при θ = θ1 должно бытьPθ1 (A(X1 , . . . , Xn ) < θ1 < B(X1 , . . . , Xn )) ≥ 1 − ε.Поэтому мы отвергаем H1 , если θ1 ∈/ (A(X1 , . . . , Xn ), B(X1 , . . . , Xn )), поскольку такоесобытие имеет малую вероятность (не больше ε) при справедливости H1 . Критическое множество выглядит так:K = {(X1 , . . . , Xn ) : θ1 ∈/ (A(X1 , . .
. , Xn ), B(X1 , . . . , Xn ))}.838.5.Проверка гипотез в случае двух выборокВ этом разделе мы будем предполагать, что проведены две серии независимыхиспытаний, в результате которых имеем две независимые выборкиX = (X1 , . . . , Xn ) ⊂=FиY = (Y1 , . . . , Ym ) ⊂= G.Чаще всего проверяется основная гипотеза о совпадении распределений F = G.В этом случае критерии называются критериями однородности.
В других ситуациях проверяется гипотеза о совпадении только некоторых параметров распределенийF и G. С таких задач мы и начнем.Заметим предварительно, что теперь мы имеем n+m наблюдений, следовательно,выборочным пространством будет Rn+m и критическое множество K будет n + mмерным.Итак, пусть сначалаX = (X1 , . . . , Xn ) ⊂= Φα1 , σ12 ,Y = (Y1 , . . .
, Ym ) ⊂= Φα2 , σ22 .Все четыре параметра неизвестны.1. Проверка гипотезы о совпадении дисперсий. Здесь мы проверяем основную гипотезу H1 : σ12 = σ22 против H2 : σ12 6= σ22 . Заранее выберем малое число ε > 0,и пустьnn1X1X2X=Xi , SX=(Xi − X)2 ,n i=1n i=1m1 XY =Yi ,m i=1mSY21 X=(Yi − Y )2 .m i=1По теореме о свойствах выборок из нормального распределения2nSX⊂= χ2n−1 ,σ12mSY2⊂= χ2m−1 ,σ22причем эти случайные величины независимы, поскольку построены по независимымвыборкам. Из них можно построить случайную величину, имеющую распределениеФишера:221 mSY2n(m − 1)σ22 SX1 nSX:=⊂= Fn−1, m−1 .n − 1 σ12m − 1 σ22m(n − 1)σ12 SY2Если верна гипотеза H1 , т.
е. σ12 = σ22 , тоη=2n(m − 1)SX⊂= Fn−1, m−1 .m(n − 1)SY2С помощью таблиц распределения Fn−1, m−1 можно найти числа q1 и q2 такие, чтоFn−1, m−1 (q1 ) = ε/2, Fn−1, m−1 (q2 ) = 1 − ε/2. ТогдаP1 (q1 < η < q2 ) = Fn−1, m−1 (q2 ) − Fn−1, m−1 (q1 ) = 1 − ε.84Поэтому логично отвергать H1 , если η ∈/ (q1 , q2 ); вероятность этого события равна вточности ε, если верна H1 . ЗдесьK = {(X1 , . . . , Xn , Y1 , . .
. , Ym ) : η ∈/ (q1 , q2 )}.2. Проверка гипотезы о совпадении средних. Мы будем это делать в предположении, что дисперсии совпадают: σ12 = σ22 = σ 2 ; σ 2 по-прежнему неизвестно.Проверяется гипотеза H1 : α1 = α2 против H2 : α1 6= α2 .Здесь будет использоваться распределение Стьюдента. В силу того что X и Yнезависимы иX⊂= Φα1 , σ2 /n , Y ⊂= Φα2 , σ2 /m ,имеемX −Y ⊂= Φα1 −α2 , σ2 (1/n+1/m)и после стандартизацииX − Y − (α1 − α2 )v Ã= Φ0,1 .! ⊂uu11tσ 2+n mДалее, по свойству распределения хи-квадрат2nSXmSY2+⊂= χ2n+m−2 ;σ2σ2эта случайная величина не зависит от X − Y .
Таким образом,s2X − Y − (α1 − α2 )1nSX+ mSY2r:⊂= Tn+m−2 .n+m−2σ211σ+n mЕсли верна гипотеза H1 , то α1 − α2 = 0 иψ=rX −Ys⊂= Tn+m−2 .211nSX+ mSY2+n mn+m−2Из таблиц распределения Tn+m−2 находим число q такое, что Tn+m−2 (−q) = ε/2. ТогдаP1 (−q < ψ < q) = Tn+m−2 (q) − Tn+m−2 (−q) = 1 − ε.Следовательно, выбравK = {(X1 , . . . , Xn , Y1 , . . . , Ym ) : |ψ| ≥ q},мы будем иметь β1 = P1 ((X1 , .
. . , Xn , Y1 , . . . , Ym ) ∈ K) = ε.3. Критерий Колмогорова–Смирнова однородности двух выборок. ПустьX = (X1 , . . . , Xn ) ⊂= F,Y = (Y1 , . . . , Ym ) ⊂= G,где F и G — непрерывные функции распределения. Проверяется гипотеза H1 : F = Gпротив H1 : F 6= G. Мы построим асимптотический критерий уровня 1 − ε.85Пусть Fn∗ и G∗m — эмпирические функции распределения, построенные по выборкам X и Y соответственно. ВведемDn, m = sup |Fn∗ (y) − G∗m (y)|.yЕсли верна H1 , то при увеличении объемов выборок эмпирические функции расPпределения сходятся по вероятности к общему пределу, т. е.
Dn, m → 0. Следующаятеорема показывает, с какой скоростью это происходит (приводится без доказательства).Теорема Колмогорова–Смирнова. Пусть верна гипотеза H1 и общая функция распределения выборок непрерывна. Тогда для любого y > 0 при n → ∞, m → ∞µrP1nmDn, m < yn+m¶→ K(y) =∞X2 y2(−1)i e−2i.i=−∞Пусть q таково, что K(q) = 1 − ε. Положимr½¾nmK = (X1 , .
. . , Xn , Y1 , . . . , Ym ) :Dn, m ≥ q ,n+mт. е. мы отвергаем гипотезу об однородности, если расхождение между двумя эмпирическими функциями распределения достаточно велико. Тогда при больших nµr¶nmβ1 = P1Dn, m ≥ q ' 1 − K(q) = ε.n+m8.6.Дисперсионный анализ: однофакторная модельДисперсионный анализ объединяет значительное число задач математическойстатистики, в которых анализируется влияние тех или иных факторов на конечный результат. Мы рассмотрим здесь простейшую модель, в которой проверяетсягипотеза о влиянии одного фактора.Пусть имеется k независимых выборок(X11 , X12 , . . . , X1n1 ) ⊂= Φα1 , σ2 ,(X21 , X22 , .
. . , X2n2 ) ⊂= Φα2 , σ2 ,... ... ... ... ...= Φαk , σ2 .(Xk1 , Xk2 , . . . , Xknk ) ⊂Все параметры α1 , . . . , αk , σ 2 неизвестны. Проверяются гипотезыH1 : α1 = α2 = . . . = αk ,H2 : существуют индексы i 6= j такие, что αi 6= αj .Такая задача может возникнуть, к примеру, в следующей ситуации. Пусть наk станках производится изготовление (или обработка) одинаковых деталей. У каждой изготовленной детали замеряется некий параметр, скажем диаметр.
Он являетсяслучайной величиной вследствие неизбежных отклонений от стандарта. Мы получаем тем самым k выборок, предполагается, что на i-м станке изготовлено ni деталей.Гипотеза H1 утверждает, что не важно, на каком станке изготовлена деталь, фактор станка не играет роли. Это соответствует тому, что средние значения у всех86выборок совпадают. В то же время конкурирующая гипотеза объявляет о наличиисистематических отклонений для некоторых станков.Схема наших действий такова: мы будем строить из наблюдений случайную величину, которая при справедливости H1 распределена по закону Фишера с известнымчислом степеней свободы. Это и определит в итоге наше решение.ОбозначимN=kXnni ,i=1i1 XXij ,Xi =n i j=1nik1 XXXij .X=N i=1 j=1Теорема.
Если верна гипотеза H1 , тоP(N − k) ki=1 ni (X i − X)2⊂= Fk−1, N −k .P P i(k − 1) ki=1 nj=1(Xij − X i )2Доказательство. Предположим на время, что нам известны все параметрыα1 , . . . , αk , σ 2 , и применим к каждому наблюдению стандартизацию. ПустьXij − αiYij =⊂= Φ0,1 ,σi = 1, . . . , k, j = 1, . . . , ni ,ni1 XYi =Yij .ni j=1Запишем выражение для выборочной дисперсии, построенной по i-й выборке из стандартизованных наблюдений:nini1 X1 X2(Yij − Y i ) =Yij2 − (Y i )2 .ni j=1ni j=1Как и при доказательстве теоремы о свойствах выборок из нормального распределения, с помощью леммы Фишера устанавливаем, чтоniX(Yij − Y i )2 =niX√Yij2 − ( ni Y i )2 ⊂= χ2ni −1j=1j=1и эта величина не зависит от Y i .
Суммируя левые части по i, получаемQ1 =nik XX(Yij − Y i )2 ⊂= χ2N −k .i=1 j=1Отметим, что Q1 не зависит от Y 1 , . . . , Y k .Введем далееnikk1 XX1 XY =Yij =ni Y i .N i=1 j=1N i=1ТогдаQ2 ===kXi=1kX2ni (Y i − Y ) =kX2ini Y − 2Yi=1kXi=1√2( ni Y i )2 − 2Y N Y + N Y =i=1kX√√( ni Y i )2 − ( N Y )2 .i=1872ni Y i + (Y )kXi=1ni =Мы знаем, что Y i ⊂= Φ0,1/ni , поэтому√ni Y i ⊂= Φ0,1 . Далее,√kk √Xni √NX√N Y =ni Y i =ni Y i =N i=1Ni=1µ√√ ¶n1nk√√√ ,..., √=( n1 Y 1 , . .
. , nk Y k )T .NNÃ√√ !n1nkВектор √ , . . . , √имеет единичную длину, поэтому его всегда можно достроNNить до ортогональной матрицы, в которой он будет первой строкой. Воспользовавшись леммой Фишера, получим, что√kX√√Q2 =( ni Y i )2 − ( N Y )2 ⊂= χ2k−1 .i=1Напомним, что Q1 и Q2 независимы, поэтому случайная величинаQ2 /(k − 1)Q1 /(N − k)распределена по закону Фишера Fk−1, N −k .Вернемся к исходным наблюдениям.Yij − Y i =Xij − αi X i − αiXij − X i−=,σσσпоэтомуnik1 XXQ1 = 2(Xij − X i )2 .σ i=1 j=1Предположим теперь, что H1 верна, т.
е. α1 = α2 = . . . = αk = α. Тогда¶ni µkXij − αi1 XXX −αY ==.N i=1 j=1σσПоэтомуQ2 =kXi=1µniXi − α X − α−σσ¶2=k1 Xni (X i − X)2 .σ 2 i=1Таким образом, если верна гипотеза H1 , тоP(N − k) ki=1 ni (X i − X)2Q2 /(k − 1)ξ==⊂= Fk−1, N −k .P P iQ1 /(N − k)(Xij − X i )2(k − 1) ki=1 nj=1Теорема доказана.Перейдем к построению критерия. В полученном выражении для случайной величины ξ именно числитель чувствителен к систематическим отклонениям междувыборками, поэтому мы будем реагировать на большие значения ξ. По таблицамраспределения Fk−1, N −k находим число q > 0 такое, что Fk−1, N −k (q) = 1 − ε.
Инымисловами, если верна гипотеза H1 , то событие {ξ ≥ q} маловероятно. Поэтому отвергаем H1 , если ξ ≥ q, и принимаем ее в противном случае. При этом β1 = P1 (ξ ≥ q) = ε.889.9.1.Задачи линейной регрессииПостановка задачиПредположим, что в результате n-кратного повторения эксперимента мы получаем выборку (Y1 , . .