Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 47
Текст из файла (страница 47)
77) В данном случае параметры Ф и т в (5,70) равны соответственно 2» и г — 1, поэтому статистика г в силу соотношений (5.?6) и (5,77) равна г )/ г / г 'а ) ~ л)(1) с С ~ а,'. (х, 1)/л (1) — ( ~', л,(х, О) г — ! / г 1/ ( 'Я аа (1) ) С ~ЧП а"-, (Х) — ~', Л,- (Х, 1) /М (1) ) )с=! / ас При гипотезе Нл эта статистика имеет распределение Снедекора Я (г — 1, и — 2»); следовательно, критическая область уровня значи- мости сх для гипотезы Н, определяется условием Р~л га 2.
Критерий однородности. Пусть Х(', ..., Х',) — независимые наблюдения над совокупностью Ф"(р„ оз), 1 = 1, ..., Ф. Рассмот- рим гипотезу однородности Н,: р,= ...= )(м т. е. прн гипотезе Н, все наблюдения производятся над одной н той же нормальной совокупностью . » ()с, о') с некоторыми (неизвестными) парамет- рами. Такая гипотеза возникает, например, при сравнении не- скольких различных способов обработки или процедур, условий, размещений и т. п. с целью выяснения, влияют ли различия 203 между ними на интересующий исследователя исход.
Вообще подобная схема имеет места каждый раз, когда интересуются влиянием на исход эксперимента какого-то одного фактора Если число различных значений этого фактора (чнсло уровней, на которых может находиться фактор) равно й, то л,— число наблюдений, соответствующих <-му уровню фактора, а Х<со при 1=1, ...
..., н,— сами наблюдения (результаты эксперимента). В этом случае говорят об одинарной классификации исходов. Сведем рассматриваемую схему к схеме регрессии. Для этого положим Х (Х», ..., Хли Х„+», ..., Х,) (Х',", ..., Х„",', Х',",... ..., Х„'",'), п=п,+...+ам 1 ... 1 О ... О ... О ... О О ... О 1 ... 1 ... О ... О Я ~! х<<! х<л!сз<л +»!... х<л! 1= ~О .......О ...
1 ... 1 (5.79) где в 1сй строке матрицы «. на местах с!»+...+н1 с+ 1, ..., и»+...+ос стоят единицы, а на остальных местах — нули, 1=1, ..., й (л,=О). Тогда Х„..., Х„независимы и Ж(Х,) = = <»4 (х<сг<», о'), !'=1, ..., л (здесь)«=(р„..., )с»)). Таким образом, имеем частный случай схемы регрессии, для которой требуется проверить гипотезу Н,: р« — 1»«=0, ..., р.» — )<! — — О (в данном случае Н«задается ()с — 1)-м линейно независимым соотношением между коэффициентами регрессии). Следовательно, можно прил<енить теорию Р-критерия. Для этого вычислим сначала Ят и 8„ т.
е. минимальные значения квадратичной формы 8 = ~,' (Х, — рс) <о при гипотезе Н» и без ограничений на параметры )» соответственно. Так как л! 8='~(Х<о-Х )*+,'~'нс(хп -р,)«, Х<с = — ' 7'Х)", с,! ! с=! то при отсутствии ограничений на <с„ ..., <»» минимум достигается при )»с =Х<сс, 1 = 1, ..., )с, и равен » л,. 8<=,У, '(Х<!' — Х<') =,У, 'зс, з," = ~,' (Х,'о — Х<")'.
(5.78) с <=! Далее имеем Ят=ппп '~~ (Х<о — )<)', на 'Я (Х',о †)' = сс с,с =,~~(Х)о — Х)'+л(Х вЂ” <»)«, Х= — „~~~~ Х,'", поэтому !. с Зт = ~,' (Хс< ' — Х) = Я<+ ~,' лс (Х"' — Х)' ' с с=! и минимум достигается при )с Х. Таким образом, в данном случае ~ лс <Х"' — Х)» л †«с « †! ~ «» с ! и при гипотезе Н, эта статистика распределена по закону Снеде- кара а(л — 1, и — й). Отсюда следует, что критическая область уровня значимости сс для гипотезы Н, определяется условием р~р»,» Отметим, что соотношение (5.79) можно интерпретировать как разложение полной суммы квадратов отклонений наблюдений от общего среднего («полной изменчивости») на сумму квадратов от- клонений каждой величины от соответствующего группового сред- него значения («изменчивость внутри групп») и сумму.квадратов отклонений групповых средних от общего среднего («изменчивость между группами»).
При этом так как при гипотезе Н, ЕЯт = Е~, (Х~п' — Х) = (л — 1) о', с. с л. » Е5» — — ~ Е,У, (Х)~! — Х<")'= 1 , '(лс — 1) а'=(и — й) о', с ! с=! ЕХ пс(ХП! Х) =Вот — ЕВ»=(й — 1)о», то каждая из величин Ц ' '1»1(Х)с! Х)» с,/ «:! л.'~ лс (Х Х) <з» „«,х (Х<< — Х"') при нулевой ги! потезе определяет несмещенную оценку для дисперсии о' и критерий Р можно считать критерием совместности независимых оценок <)» и я«(статистику р можно записать в виде г"=я»/<,с»). Такое разложение полной изменчивости исходных данных и его интерпретация характерны для дислврсионного анализа — раздела математической статистики, объединяющего совокупность статистических приемов, широко применяемых в самых разнообразных экспериментах„в которых наблюдения тем или иным способом классифицируются (разбиваются на группы) в соответствии со значениями некоторых факторов.
3. Двойная классификации. Рассмотренный в предыдущем пункте случай является простейшей схемой дисперсионного анализа (однн фактор), в которой решение получают с помощью методов регрессионного анализа. Рассмотрим применение регрессионного анализа е;це к одной имеющей большое практическое значение схеме дисперсионнога анализа, когда число факторов, влияющих на исход эксперимента, равно двум. Предположим, что исходэксперимента зависитотзначений двух Г Х = — ~ ХГ/.
Тогда, учитывая (5.80), имеем кз Г 5=! Я,'Е (ХГ/ — р, — !55 — 8/)2 = Х [(ХГ/ — Х!. — Х./+ Х,.) + Г, / + (У;, — Х., — аи)+(Х, — Մ— р/)+ (Մ— /5))5 = =,У', (ХГ/ — Х» — Х,;+ Х..)'+ з ~~ ~(Х» — Х.. — а!)5 + Г,! + г ~'~ (Х/ — Х.. — ии/)5+ гз (Х., — )5)5 (5.83) факторов Гт и С, причем фактор Л мажет находиться на г уровнях /т„..., /с„а фактор С вЂ” на з уровнях С„..., С,. Пусть, далее, при каждой возможной комбинации уровней обоих факторов производится ровно одно наблюдение, Обозначим через Х5/ (!=1, ..., г; /'=1, ..., з) результат наблюдения, соответствующего случаю, когда фактор Й находится на уровне /1» а фактор С вЂ” на уровне С/. Предполагаем, что наблюдения Х,/ независимы и распределены нормально с одинаковыми дисперсиями а' и средними значениями ЕХ!/= $!/=)5+а!+(),, где (5.80) 5 'У', п,= ~", [)/=О. (5.
81) ! ! Условия (5.80) и (5.81) означают, что оба фактора действуют независимо (в этом случае говорят, что они аддитивны). Действительно, если обозначать через а' и ))' действия факторов Н и С соответственно, то аддитивность означает, что з!/ =!х;+ 8;.
Если положить теперь р /х'+ р', !х! = !х!' — й' и р/ = 5; — р' (черта сверху означает среднее арифметическое), то получим соотношения (5.80) — (5.81). Такую схему удобно представлять в виде прямоугольной таблицы из г строк, соответствующих уровням /15, ..., Р,„и з столбцов, соответствующих уровням См, С,. Случайную величину Х!/ называют реагируюп(е/1: она описывает реакцию, вызываемую комбинацией (/с» С/) факторов /г и С. Из (5.80) получаем, чта ЕХ;/ для любых ! и / оказывается при условии (5.81) линейной функцией от г+з — 1 неизвестных коэффициентов р, а» 8/.
Таким образом, здесь также имеем частный случай схемы линейной регрессии и, следовательно, можно применить развитую выше теорию. Как известно, все положения теории нормальной регрессии основываются на анализе квадратичной формы 5 Я-,У;,У; (Х/-Ь,) . (5.82) 5=!!=! В данном случае удобно предварительно преобразовать эту форму — %5 ! %5 следующим образом. Обозначим через х.. = —, 5г х;/, Хь =, —,Г хп, Г,/ !'=1 так как все папарные произведения после суммирования исчезают. Оценки наименьших квадратов для коэффициентов регрессии— это значения параметров, которые обращают квадратичную форму (5.82) в минимум, поэтому нз разложения (5.83) следует, что в данном случае !5 = Х, а5 = Х!. — Х... 'и/ = Х,/ — Х...
(5.84) Из (5.83) и (5.84) также имеем, что минимальное значение формы Я равно Я,= у;(Մ— $„)5=~(Մ— Х» — Х.,+Х..)* (5.85) Найдем дисперсии полученных оценок. Так как Х,.= — ~~ Х!. = ! %5 ! ! =-' УХ., !=! !=! Но Х, 1 = 1, ..., г, независимы и 0Х» = а5/з; аналогично, Уз, / .1, ..., з, независимы и 0Х„= аэ/г; следовательно, Оа! = — а, 1)8/ — — — а', О!5 = — а'.
Г ! 5 " 5 ! ! (5.86) »и ы В соответствии с общей теорией (см. п. 4 э 5.3) отсюда находим, что у-доверительными ннтервалачи для параметров р, а! и 5/ являются соответственно [в данном случае параметр и — й в (5.51) равен гз — (г+з — 1) =(г — 1) (з — 1)1 (р,~ !05т! 5 ! 5!!,-5! [' Я5/[гз(г — 1) (з — Т[) (а!~!!! т!/5, ! -и 5-и ! Я5/[гз(з !))) (р/ + !п„1/5, м!Г-м )г Я5/[гз (г — 1)) ), где р, !х!, [1, и Я, определены в (5.84) и (5.85). Отметим также, что Я,/(г — 1)(з — 1) — несмещенная оценка о'. Рассмотрим теперь задачу проверки наиболее интересных в исследуемой ситуации гипотез.
Пусть требуется проверить ги. потезу Нэ" . а! =... = а, = О. (5.87) Другими славами, гипотеза Н,'" означает, что фактор Н не влияет на исход испытаний. Так, например, главныь! интересующим фактором может быть фактор С, соответствующий, например, раз. личным способам обработки, в то время как /с соответствует поэтому статистика г' )см. (5.70)1 имеет в данном случае следующий вид (при «и=« — 1): Р =Г(Х) = (э — 1),'У, '(Մ— Х..)* ~ 'У,'(Х,,— Х!.— Х,,+Х.,)'.