4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 47
Текст из файла (страница 47)
Если требуется построить систему совместных доверительных интервалов для конечного числа заданных линейных комбинаций Ц), ..., Л'„)), то из (5.65) имеем следующий результат: Р9 () ф иу (Х' Лг) (Лф~ ( Лф() + от (Х; Л ), г= 1, ° °, т)~ г. (5 66) Рассмотрим несколько примеров использования соотношения (5. 66). Пример 5.6 (совместные доверительные интервалы для ков4х)зициентов регрессии).
Пусть !~т~й и Л,=-(0...010...0), где 1 ьо стоит иа месте )„г=1, ..., т. Тогда Л;(1=()), Л;А-%,=а ° ° и на основании (5.66) Я +.а (Х))' а'"), с=1, ..., т)) — система совместных доверительных интервалов уровня ~7 для координат р , ..., () . В частности, при т = й получаем систему сов)т местных доверительных интервалов для всех координат ()„..., ()„. Пример 6.7 (оценивание средних). Положим Л =хи>, 1=1, ..., и. Тогда с помощью формулы (5.66) можно найти систему совместных доверительных интервалов уровня )Т для средних значений всех наблюдений Х,„..., Х„.
й 5.4. Общая линейная гипотеза нормальной регрессии 1. Понятие линейной гипотезы. При применении схемы нормальной регрессии на практике часто возникает необходимость проверить те нли иные гипотезы о значениях коэффициентов бм ..., ()„. В общем виде задача формулируется следующим образом: по наблюдениям Х =(Хп ..., Х,) требуется проверить гипотезу Н„„согласно которой коэффициенты регрес- сии ()м ..., 6„удовлетворяют некоторым заданным ограничениям, локалнзующим их допустимые значения в некотором подмноже- стве,%в )7'.
Если эти ограничения линейные, то говорят о ли- нейной гипотезе. Для линейной гипотезы подмножество Ю, яв- ляется линейным подпространством вида Л.=(5: Т()=1ь), (5.67) где Т вЂ” заданная матрица коэффициентов ограничений, 1, — вектор значений соответствующих комбинаций (предполагается, что си- стема Т!) =1, совместна), В дальнейшем будем считать, что мат- рица Т имеет размер т хй (т==й) и гаппТ=т.
Таким образом, в общем случае линейная гипотеза записывается в виде Н„. р ен ен Я,. В любом случае это сложная гипотеза, так как оставляет произвольным значение параметра ог: в терминах общего пара- метра модели 6=(р, пг) гипотеза Н, имеет вид Н,:Е =Е,=(б:() -=Я„п'>О). 2. г'-критерий проверки линейной гипотезы. Чтобы построить критерий проверки гипотезы Н„воспользуемся уже известным решением задачи доверительного оценивания (см.
п. 4 — 5, й 5.3) и принципом соответствия между теорией проверки гипотез и по- строением доверительных областей (см п. 4 $4.4). Напомним общую схему этого соответствия. Пусть имеется система 7-доверительных областей (бт(х), х еп ап,й") для некоторой параметрической функции у=а(а). Тогда подмножество выборочного пространства, задаваемое условием Хь,, =(х;а,~От(х)), определяет область принятия гипотезы Нь'а=по с уровнем значимости а=! — у. В данном случае согласно (5.58) — (5,59) 7-доверительная об- ласть для 1=Т!) имеет вид О„(Х)=(1;д,(Х, 1))3())(Х)) ~ —,Р, „.,~, поэтому область принятия гипотезы Нв:1=1в с уровнем значи- мости и= 1 — 7 задается условием .й„„=(х: От(х, 1„)/Я(В(х))( — Р Окончательно можно сформулировать следующий результат: критерий уровня значимости а для проверки гипотезы Нь .
'() ен ап,у„где Ю, определено в (5.67), задается критической областью .— ь 0т(х, ~.) (5. 68) т 3 (р (х)) Статистикой этого критерия является величина п — л 0т(х, )ь) Г- — ' = — (Т() — 1.) П- (Т() — 1.)73(()), (5.69) т 3(й) л !99 большие значения которой в соответствии с (5.68) являются критическими для проверяемой гипотезы. Построенный критерий называют р-критерием.
Критерий (6.68) можно получнть, исходя нз других соображений, Рзс. смстрны о. н. к. ! !» для ! н составим вектор откланеннй зтнх оценок от проверяемых знэченкй ТР†(е, Еслн гнаатеэе Не не верне, то весьмв вероятно, что зтв отклонення велнкн. Будем измерять степень отклонения с помощью нелнчнны ят(Х, (е), Тогда.
поскольку мвтемвтнческое ожндэпне квздрвтнчной формы можно преобрвэоввть следуюшнм обрнзом; е (ч вч) - ~ ь!ге (у!у,!-~д ь,, н +~ ьне (у!) е (у!!- ь! с/ = тг (ВЕ)+ Е (Ч') ВЕ ! Ч) [здесь к=О(Ч)], учитывая (б.!О), нмеем еп (х, т,) т,(о- о) + — е (т$ — ге)' о-хе(т()-те)- ея ! ! - а + - (тр - т,)' о- (тр — т,)» а": /И знак рввенствэ нмеет место только прн т() ге, т. е.
когда верна пулеввя гипотеза. С другой стороны, з (())/(л — Ь) — несмещенная оценка для ат всегда, т. е. безотнаснтельно к нстнннаму знвченню (). Поэтому у атношення г = '(1,(х. г.) (84) ( — числитель в среднем больше знэмевзтеля, когда гипотеза т ( л — л Не не верна, н поэтому большие знэчення г естественно рэссмэтрнвэть квк снвлетельствующне против гнпатезы Не. Из зтнх рзссужденнн также следует, что стзтнстнку г" можно счнтеть отношением двух независимых н несмещенных (пРн гипотезе Нэ) оценок ЛлЯ астэточной днспеРснн ах С такой интеР- претвцней н свнзен термнн дигперснонное ошнопмние, нспользуемый кногде для стэтнстнкн г (см.
и. 6 ! !.6). Для вычисления статистики г можно использовать такжеформулу й от з(р) т (5.70) ш 3(р) которая следует из (5.23). Таким образом, Р непосредственно можно выразить через условный Я (т. е. при условии Тй=(е) и абсолютный 8 (р) минимумы исходной квадратичной формы Я ())). В конкретных задачах условный минимум Ят зачастую находят непосредственно, поэтому представление (5.70) более удобно для практических расчетов, чем (5.69). Пример 5.8 (простая регрессия, гипотеза о наклоне линии регрессии).
Требуется проверить гипотезу Не: ()з =()м, фиксирующую значение наклона линии регрессии. В данном случае парач метр т = 1 и Ят = пцп У, (Х; — ()зэ(! — (),)з. Зтот минимум достиг гается при рх=Х вЂ” рэег', и его значение, учитывая соотношения зоб (5.27) — (5.28), можно записать в виде Ят= 5 Ф+Ф.— бэе)э ~ ((! — ()э. По формуле (5.70) имеем, что в данном случае статистика р=(п — 2)(()э — ()яе)'.5', ((, — Г)ту8 (8! а критическая граница в (5.68) выбирается равной р . Т как р! „=р т-а, х, «-з ак т-, х. -т =, к... где (ь, ч — р-квантиль распределения Стьюдента Я(п) [см.
замечание к формуле (5.60)), то р-критерий в данном случае сводится к критерию, критическая область которого определяется условием ! ймэ — ()ээ ! ~ (т-огк я-э что соответствует результату примера 5.4 й 5.5. Применение теории линейной регрессии Развитая в предыдущем параграфе теория проверки гипотез о коэффициентах регрессии имеет широкое применение. )х схеме регрессии могут быть сведены многие ги о матических ожиданиях нормальных совокупностей, к и тезы иног а имею д т форму, отличную от рассмотренной выше. Некото- , которые рые из таких задач рассматриваются в этом па аг г р рафе.
. Гипотеза о параллельности линий регрессии. Предположим, что имеется г)2 групп независимых наблюдений Х", ..., Хбз (=1, ..., г (и; — объем г-й группы), распределенных нормально с общей дисперсией пэ я средними ЕХ'-" = ЕХ; =Р! =8, +()е Ег, 1=1, ..., пп (=1, ..., г. (5.71) Другими словами, имеется г различных схем простой регрессии и проверяемая гипотеза Ио состоит в том, что все линии регрессии (5.71) имеют один и тот же наклон, т.
е. Не. Ртп'=...=-Р! . Такая гипотеза может встретиться, например, при проверке равенства нескольких скоростей роста, при сравнении нескольких способов ра тки и т. д. Покажем, что рассматриваемый случай можно свестн к схеме общей линейной гипотезы. Положим Х =(Х,, ..., Х„„Х„, = (8„...> пя,) =фг", „"„', и,, ..., ()т ) и введем матрицу Х раз- мером 2»хп, составленную из вектор. столбцов х(с) вида ! ... 1 0 ... 0 о О ... 0 Х ) з(а) з(л,)з(л,л!) з(л) ( 0 .. 0 /!" 1 ...
! /(г) /[г) ! "' л (5.73) (5.74) 202 В этих обозначениях вектор Х распределен по закону лас' (Х'р, а'В„). Таким образом, имеем частный случай (при ука- занном выборе х(с)) схемы нормальной регрессии. Гипотезу Н, можно записать в виде Но:()с — ()!=О. "* 5а.— па=О. т.
е в данном случае Н, задается (г — 1)-м линейно независимым со- отношением между коэффициентами регрессии и, следовательно, для ее проверки можно применить г'-критерий. Для этого надо найти абсолютный Я! — — Я(р) и условный Бт (т. е. при гипотезе Н,) минимумы по () квадратичной формы 3 (()) =,У', (Хс — х(п'5)' = 'У, '(Х',о — р,'о)'. (5.72) Е ! с,/ Нахождение 5! сводится здесь к минимизации выражения г 3(())=Х 3".
с-! где Я(с) = ~Ха (Х(с' — р)~) — ()а(01~/о)~, (=1, ..., г, /=! т. е. достаточно найти минимум каждой квадратичной формы 5(с) отдельно. В других обозначениях эта задача решена в примере 5.1, поэтому из (5.27) и (5.28) имеем, что минимум 3(') достига- ется при р! = 5(, 5а = ра, где (О " П) (О "(О лс ~чп (х(/о — л !о) (с/(о — /(") ()(о = Х(" — () (пе(с) л,. ~ (/(о — "')' /=1 с л.
л здесь Х(с) =- » Х/("„ /(/) = — У 1/(' н при этом предполагается, /=! с=! что для любого с = 1,..., г не вса числа 1,, ..., 1„, одинаковы). Ш (ас Таким образом, в данном случае 3, =- ч. ~ С(Х',и — Х«) — 5(ч(1,'о — 10)))'. с (/=с Введем следующие обозначения: лс л з1 (1) = ~ ~(1/(о — 1(с)), з) (Х) = У; (Х',0 — Х(/))', /=! /=с лг зс(Х, 1) = ~ (Хсо — Х(п)(1(о — Пп), (5.75) /=! Сс точностью до множителей — это выборочные дисперсии и кова- риация множеств (Х(", ..., Х,".') н !'11'), ..., 1('с)). Тогда нз (5.73) и (5.74) следует, что 5! можно записать в виде Зс=з!(Х)+...+з,"(Х) — зс(Х, !)/з";(1) —...— за(Х, 1)/з;(1), (5.76) Вычислим 5т Для этого минимизируем сумму )„(Х~/с) — ()!" — ()а/)с))а. Непосредственным дифференцированием можно проверить, что при любом фиксировании ()а минимум достигается при р!(и =Ь",, где Ь,'0 =Х(" — ра?(с), с'=1, ..., г, и сумма квадратов при этом равна ~ч„((Х(0 — Х(") — ра(1/(о — 1(с))] .
Минимум последнего выражения с, с достигается прн рз Ь„где Х(х/(" — Хссг) Я) — /л') , (Х, 1) +... + с, (Х, 1) ~~ П(/(е) / сг)а аа! (1) + ... + аа (1) с. / 1см. (5.75)], и он равен (Ч(х, !)+...+с,(Х, 1)) Т вЂ” З! ° ° ° Зг аа (О ! ) са (1) (5. 77) В данном случае параметры Ф и т в (5,70) равны соответственно 2» и г — 1, поэтому статистика г в силу соотношений (5.?6) и (5,77) равна г )/ г / г 'а ) ~ л)(1) с С ~ а,'.
(х, 1)/л (1) — ( ~', л,(х, О) г — ! / г 1/ ( 'Я аа (1) ) С ~ЧП а"-, (Х) — ~', Л,- (Х, 1) /М (1) ) )с=! / ас При гипотезе Нл эта статистика имеет распределение Снедекора Я (г — 1, и — 2»); следовательно, критическая область уровня значи- мости сх для гипотезы Н, определяется условием Р~л га 2. Критерий однородности. Пусть Х(', ..., Х',) — независимые наблюдения над совокупностью Ф"(р„ оз), 1 = 1, ..., Ф. Рассмот- рим гипотезу однородности Н,: р,= ...= )(м т.
е. прн гипотезе Н, все наблюдения производятся над одной н той же нормальной совокупностью . » ()с, о') с некоторыми (неизвестными) парамет- рами. Такая гипотеза возникает, например, при сравнении не- скольких различных способов обработки или процедур, условий, размещений и т. п. с целью выяснения, влияют ли различия 203 между ними на интересующий исследователя исход. Вообще подобная схема имеет места каждый раз, когда интересуются влиянием на исход эксперимента какого-то одного фактора Если число различных значений этого фактора (чнсло уровней, на которых может находиться фактор) равно й, то л,— число наблюдений, соответствующих <-му уровню фактора, а Х<со при 1=1, ...