4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 48
Текст из файла (страница 48)
..., н,— сами наблюдения (результаты эксперимента). В этом случае говорят об одинарной классификации исходов. Сведем рассматриваемую схему к схеме регрессии. Для этого положим Х (Х», ..., Хли Х„+», ..., Х,) (Х',", ..., Х„",', Х',",... ..., Х„'",'), п=п,+...+ам 1 ... 1 О ... О ... О ... О О ... О 1 ... 1 ... О ... О Я ~! х<<! х<л!сз<л +»!... х<л! 1= ~О .......О ...
1 ... 1 (5.79) где в 1сй строке матрицы «. на местах с!»+...+н1 с+ 1, ..., и»+...+ос стоят единицы, а на остальных местах — нули, 1=1, ..., й (л,=О). Тогда Х„..., Х„независимы и Ж(Х,) = = <»4 (х<сг<», о'), !'=1, ..., л (здесь)«=(р„..., )с»)). Таким образом, имеем частный случай схемы регрессии, для которой требуется проверить гипотезу Н,: р« — 1»«=0, ..., р.» — )<! — — О (в данном случае Н«задается ()с — 1)-м линейно независимым соотношением между коэффициентами регрессии). Следовательно, можно прил<енить теорию Р-критерия. Для этого вычислим сначала Ят и 8„ т.
е. минимальные значения квадратичной формы 8 = ~,' (Х, — рс) <о при гипотезе Н» и без ограничений на параметры )» соответственно. Так как л! 8='~(Х<о-Х )*+,'~'нс(хп -р,)«, Х<с = — ' 7'Х)", с,! ! с=! то при отсутствии ограничений на <с„ ..., <»» минимум достигается при )»с =Х<сс, 1 = 1, ..., )с, и равен » л,. 8<=,У, '(Х<!' — Х<') =,У, 'зс, з," = ~,' (Х,'о — Х<")'. (5.78) с <=! Далее имеем Ят=ппп '~~ (Х<о — )<)', на 'Я (Х',о †)' = сс с,с =,~~(Х)о — Х)'+л(Х вЂ” <»)«, Х= — „~~~~ Х,'", поэтому !. с Зт = ~,' (Хс< ' — Х) = Я<+ ~,' лс (Х"' — Х)' ' с с=! и минимум достигается при )с Х.
Таким образом, в данном случае ~ лс <Х"' — Х)» л †«с « †! ~ «» с ! и при гипотезе Н, эта статистика распределена по закону Снеде- кара а(л — 1, и — й). Отсюда следует, что критическая область уровня значимости сс для гипотезы Н, определяется условием р~р»,» Отметим, что соотношение (5.79) можно интерпретировать как разложение полной суммы квадратов отклонений наблюдений от общего среднего («полной изменчивости») на сумму квадратов от- клонений каждой величины от соответствующего группового сред- него значения («изменчивость внутри групп») и сумму.квадратов отклонений групповых средних от общего среднего («изменчивость между группами»).
При этом так как при гипотезе Н, ЕЯт = Е~, (Х~п' — Х) = (л — 1) о', с. с л. » Е5» — — ~ Е,У, (Х)~! — Х<")'= 1 , '(лс — 1) а'=(и — й) о', с ! с=! ЕХ пс(ХП! Х) =Вот — ЕВ»=(й — 1)о», то каждая из величин Ц ' '1»1(Х)с! Х)» с,/ «:! л.'~ лс (Х Х) <з» „«,х (Х<< — Х"') при нулевой ги! потезе определяет несмещенную оценку для дисперсии о' и критерий Р можно считать критерием совместности независимых оценок <)» и я«(статистику р можно записать в виде г"=я»/<,с»).
Такое разложение полной изменчивости исходных данных и его интерпретация характерны для дислврсионного анализа — раздела математической статистики, объединяющего совокупность статистических приемов, широко применяемых в самых разнообразных экспериментах„в которых наблюдения тем или иным способом классифицируются (разбиваются на группы) в соответствии со значениями некоторых факторов. 3. Двойная классификации. Рассмотренный в предыдущем пункте случай является простейшей схемой дисперсионного анализа (однн фактор), в которой решение получают с помощью методов регрессионного анализа.
Рассмотрим применение регрессионного анализа е;це к одной имеющей большое практическое значение схеме дисперсионнога анализа, когда число факторов, влияющих на исход эксперимента, равно двум. Предположим, что исходэксперимента зависитотзначений двух Г Х = — ~ ХГ/. Тогда, учитывая (5.80), имеем кз Г 5=! Я,'Е (ХГ/ — р, — !55 — 8/)2 = Х [(ХГ/ — Х!. — Х./+ Х,.) + Г, / + (У;, — Х., — аи)+(Х, — Մ— р/)+ (Մ— /5))5 = =,У', (ХГ/ — Х» — Х,;+ Х..)'+ з ~~ ~(Х» — Х.. — а!)5 + Г,! + г ~'~ (Х/ — Х.. — ии/)5+ гз (Х., — )5)5 (5.83) факторов Гт и С, причем фактор Л мажет находиться на г уровнях /т„..., /с„а фактор С вЂ” на з уровнях С„..., С,.
Пусть, далее, при каждой возможной комбинации уровней обоих факторов производится ровно одно наблюдение, Обозначим через Х5/ (!=1, ..., г; /'=1, ..., з) результат наблюдения, соответствующего случаю, когда фактор Й находится на уровне /1» а фактор С вЂ” на уровне С/. Предполагаем, что наблюдения Х,/ независимы и распределены нормально с одинаковыми дисперсиями а' и средними значениями ЕХ!/= $!/=)5+а!+(),, где (5.80) 5 'У', п,= ~", [)/=О. (5. 81) ! ! Условия (5.80) и (5.81) означают, что оба фактора действуют независимо (в этом случае говорят, что они аддитивны). Действительно, если обозначать через а' и ))' действия факторов Н и С соответственно, то аддитивность означает, что з!/ =!х;+ 8;.
Если положить теперь р /х'+ р', !х! = !х!' — й' и р/ = 5; — р' (черта сверху означает среднее арифметическое), то получим соотношения (5.80) — (5.81). Такую схему удобно представлять в виде прямоугольной таблицы из г строк, соответствующих уровням /15, ..., Р,„и з столбцов, соответствующих уровням См, С,. Случайную величину Х!/ называют реагируюп(е/1: она описывает реакцию, вызываемую комбинацией (/с» С/) факторов /г и С. Из (5.80) получаем, чта ЕХ;/ для любых ! и / оказывается при условии (5.81) линейной функцией от г+з — 1 неизвестных коэффициентов р, а» 8/.
Таким образом, здесь также имеем частный случай схемы линейной регрессии и, следовательно, можно применить развитую выше теорию. Как известно, все положения теории нормальной регрессии основываются на анализе квадратичной формы 5 Я-,У;,У; (Х/-Ь,) . (5.82) 5=!!=! В данном случае удобно предварительно преобразовать эту форму — %5 ! %5 следующим образом.
Обозначим через х.. = —, 5г х;/, Хь =, —,Г хп, Г,/ !'=1 так как все папарные произведения после суммирования исчезают. Оценки наименьших квадратов для коэффициентов регрессии— это значения параметров, которые обращают квадратичную форму (5.82) в минимум, поэтому нз разложения (5.83) следует, что в данном случае !5 = Х, а5 = Х!. — Х... 'и/ = Х,/ — Х... (5.84) Из (5.83) и (5.84) также имеем, что минимальное значение формы Я равно Я,= у;(Մ— $„)5=~(Մ— Х» — Х.,+Х..)* (5.85) Найдем дисперсии полученных оценок.
Так как Х,.= — ~~ Х!. = ! %5 ! ! =-' УХ., !=! !=! Но Х, 1 = 1, ..., г, независимы и 0Х» = а5/з; аналогично, Уз, / .1, ..., з, независимы и 0Х„= аэ/г; следовательно, Оа! = — а, 1)8/ — — — а', О!5 = — а'. Г ! 5 " 5 ! ! (5.86) »и ы В соответствии с общей теорией (см. п. 4 э 5.3) отсюда находим, что у-доверительными ннтервалачи для параметров р, а! и 5/ являются соответственно [в данном случае параметр и — й в (5.51) равен гз — (г+з — 1) =(г — 1) (з — 1)1 (р,~ !05т! 5 ! 5!!,-5! [' Я5/[гз(г — 1) (з — Т[) (а!~!!! т!/5, ! -и 5-и ! Я5/[гз(з !))) (р/ + !п„1/5, м!Г-м )г Я5/[гз (г — 1)) ), где р, !х!, [1, и Я, определены в (5.84) и (5.85). Отметим также, что Я,/(г — 1)(з — 1) — несмещенная оценка о'. Рассмотрим теперь задачу проверки наиболее интересных в исследуемой ситуации гипотез.
Пусть требуется проверить ги. потезу Нэ" . а! =... = а, = О. (5.87) Другими славами, гипотеза Н,'" означает, что фактор Н не влияет на исход испытаний. Так, например, главныь! интересующим фактором может быть фактор С, соответствующий, например, раз. личным способам обработки, в то время как /с соответствует поэтому статистика г' )см. (5.70)1 имеет в данном случае следующий вид (при «и=« — 1): Р =Г(Х) = (э — 1),'У, '(Մ— Х..)* ~ 'У,'(Х,,— Х!.— Х,,+Х.,)'. (5.88) )=) !. ) При гипотезе Нс" статистика (5.88) имеет распределение Снедекора 5 (« — 1, (« — 1) (з — !)), поэтому критическая область уровня значимости а для Н,"' имеет вид ® )а = (х ° ) (х) ~ ~х-а, г-ь !«-з) )х-1) ) (5.89) Аналогично строится критерий проверки гипотезы Н .(),-...=8,=0 (5.90) о несущественности влияния на исходы испытаний второго фактора С. Здесь критическая область уровня значимости а для Нр" имеет вид (хо — х..)' Х)х= Х ° «(«1) ~ й1 — )! «-\ !) и )х-1) ~ (хп — х),— х.;+х.,)' ), ) (5.
91) Наконец, критическая область уровня значимости а для гипотезы Н' )а1=...=а,=й,=...=(),=0 о независимости результатов испытаний от влияния обоих факторов имеет вид 5 ~' (х,, — х..)~+ « ~' (х,! — х")~ . и:..ш:я к: «+х — 2 ~(хп — хь — хп-)-х..)с 'Вс-х, «+з-к )с-1) )и -1) Найдем, наконец, доверительные области для различных групп параметров схемы (5.80).