Шеффе Г. - Дисперсионный анализ (1185347), страница 57
Текст из файла (страница 57)
В трехфакториом анализе мы впервые сталкиваемся с труд-' ностью**), встречающейся в многофакторном анализе моделей *) Мм можем опускать индекс т. если число М наблюдений в кчейке' равно единице, '*) Эта же трудность возникает и в двухфакторном анализе, если проверить гипотезу Н = О. 4 тл. полныи тгкх. и многоолктопиып лиллиз 288 со случайными факторами; эта трудность состоит в том, что даже в предположении нормальности нс пригодны точные г-критерии для проверки некоторых обычных гипотез.
Нетрудно проверять взаимодействие трех факторов (т. е. проверять гипотезу а'„-в = 0) или взаимодействие двух факторов; так, взаимодействие (А Ус', В рг, С) проверяется с помощью отношения 55лвс/55„взаимодействие (А Х В) — с помощью 55лв/55лвс и т. д. Однако, как мы сейчас увидим, положение меняется, когда мы проверяем главные эффекты. Приближенный Р-критерпй Предположим, что нам надо проверить Н,: а„-' = О (Нв и Нс рассматриваются, конечно, аналогичным образом), Если мы можем предположить ат = О, то точный Е-критерий для Нл можно основывать на статистике 554/55лс. В этом случае 55лв можгю объединить с 55твс, так как они имеют одинаковые М(55), Если же мы можем предположить азл — — О, то мы можем проверять Н, с помощью 55л/55лн и объединять 55лс с 55„с.
Если бы мы могли предположить равенство нулю других компонент дисперсии, то читатель без труда бы получил точные критерии (если они существуют) для проверки стандартных гипотез, а также правило объединения в таблице, полученной из таблицы 7.5.1 вычеркиванием компонент дисперсии, которые предположены равными нулю. Однако если мы не можем предположить аз =0 или а"„- =О, то из этой таблицы нельзя найти точный критерий для Нл. Приближенный Р-критерий ") обычно строится следующим образом.
Запишем т =а";-1- Ма'-„, + КМазл + /Маши так что М(55л) =к+/КМа'. С помощью таблицы 75.1 т можно представить в виде следующей линейной комбинации: т = М (55лв) + М (55лс) — М (55лвс): ее несмещенной оценкой будет т = 55лв + 55лс — 55лвс Обозначим средние квадраты, стоягцие справа, соответственно кь 'сз, тз, так что т =т~+тз — тз. Величины т, (1=1,2,3) э) Нижеследующее легко получается из приближения распределения ли. Ивяной комбинации случайных величин Х'; этим приближением пользовался Сэттертвайт (Бапег))пчане, 1946), ссылаясь на Х. Ф. Смита Бокс (Вох, 1984а, стр. 294) показал численными расчетами, что это приближение должно быть хорошим, когда коэффициенты линейной комбинации положительны.
Здесь )лы используем дальнейшее приближение, основанное на оценках этих коэф. фициентов. гл. ь модели со слечхиными эхктояхмн независимы и распределены как т!Х', /чс где т! = М (т;), а ч,— число ст. св. ть Далее мы попытаемся приблизить т случайной величиной тХ',/ч, где ч определяется из условия, что т н тХ',/ч имеют одинаковые дисперсии (они уже имеют одинаковые 2т ~ т, средние). Мы приходим к условию — = 2 ~ — ', или У! . 2 Так определяется ч, но, к сожалению, оно выра! жено через неизвестные параметры.
Мы оцениваем ч с помощью 6= з . Приближенный г'-критерий для проверки Ф~ з ! 1 Ня получается с помощью отношения ЯБя/т, если мы будем считать его распределенным как 1КМал„+ т м Х~ ! /КМа'„+ т à — 1 х" т з — В1-!. ч причем константу ч будем заменять ее оценкой ч. Отсюда мы можем получить также приближение для мощности, выраженное через центральное Р-распределение. Это, очевидно, общий метод.
Его всегда можно применять, когда мы хотим проверять гипотезу Н„: а'„= 0 и когда 55 =га'„+т, и в таблице не существует равного т математического ожидания среднего квадрата. Тогда мы рассматриваем линейную комбинацию средних квадратов с математическим ожиданием т, приближаем ее величиной тх'„/~ и т, д. й 7.6. Группированный план В качестве примера рандомизированной модели со случайными факторами для группированного плана мы рассмотрим эксперимент с тремя факторами, в котором Т группируется по В, а  — по С.
Читатель может обратиться к иллюстрации этой модели в $ 5.3, относя!цейся к изменчивости некоторого данного показателя качества кусков ткани; в этой модели С относится к городам,  — к ящикам, Т вЂ” к кускам ткани. Мы будем пользоваться теми же обозначениями для различных объемов выборок, а именно: С подразделяется на ! уровней; на уровне ! фактора С фактор В имеет Х! уровней; на уровне (, / фактора В (т, е. на уровне ) фактора В, лежащем на уровне ( $ тл. ГРУППИРОЗЛННЫП ПЛАН 287 фактора С) фактор Т имеет Ки уровней; на уровне (, ), Ь фактора Т (т. е. на А-м уровне Т, лежащем на )см уровне В, который в свою очередь лежит на (-м уровне С) сделано Мн» измерений, (Несколько ниже мы будем полагать Кн — — К, Ми» = М.) Если уи» означает т-е из Ми» наблюдений, то мы положим ун» = тн» + ен» , (7,6,!) где «ошибки» (еи» ) независимы н одинаково распределены с нулевыми средними и дисперсией о', н независимы от «истинных» средних (тн»), Уместность ограничений, накладываемых на распределение (тн»), можно мотивировать следующим образом.
Предположим, что существует популяция уровней С, снаб. женных индексом и, из которой для эксперимента выбирается 7 уровней С. Все популяции будут идеализированно рассматриваться как бесконечные популяции. Назовем У„распределе. пнем популяции индекса и. Представим теперь себе, что для каждого и существует популяция уровней В, снабженных парой индексов (и, о); пусть У„~„ есть распределение популя. цни индекса о прн данном и. Далее мы предположим, что для каждой пары (и, о) существует популяция уровней Т, снабженных тройкой индексов (и, о, в); через У и»„обозначим распределение популяции индекса в при данных (и, о).
Пусть т(и, о, в) есть «истинное» среднее элемента с индексом (и, о, в), соответствующего последовательному случайному выбору сначала и по распределению У„, затем о по распределению Ую„затем в по распределению Ущ»,, Обозначим т(и,о,») (условное) среднее т(и,о,в) при фиксированных (и,о), вычисленное относительно У ~„,,', через т(и,»,») обо. значим (условное) среднее т(и, о,») при данном и, вычисленное относительно У„~,, через т(»,», ») обозначим среднее т (и,»,»), вычисленное относительно У,. Определим 7(и, о, в) т(и, о, в) — т(и, о, *), Ь(и, о) =т(и, о, «) — т(и, », *), с (и) = т (и, *, ») — т (», э, Ф), и = т (», Ф, »); тогда т(и,о,в) = и+ с(и)+ Ь(и,о)+ г(и,о,в). (7.6.2) Три случайные величины с(и), Ь(и,о) и ((и,о,в) имеют нулевые средние, так как, по определению, с( ) О, Ь(и, *)=О при всех и, ~(и, о, *)=О при всех и, о; (7.6.3) здесь замена в на звездочку в 7(и, о, в) указывает на вычисление (условного) среднего относительно У и», и т.
д. Следова- 288 ГЛ Ь МОДЕЛИ СО СЛУЧАЙНЫМИ ФАКТОРАМИ тельно, безусловные математические ожидания Ь(», «) и 1(», », ») также должны равняться нулю. Дисперсии с(и), Ь(и, о) и 1(и, о, ю) обозначим соответственно а', о' н о-'. Эти три случайные величины некоррелированы. Докажем это для Ь(и, о) и ((и, о, ю). Ковариация Ь(и, о) и ((и, о, ю) равна математическому ожиданию их произведения.
Если мы вычислим сначала условное математическое ожидание при данном (и, о), то получим в силу (7.6.3) М(Ь(и, о)1(и, о, ю) !и, о) = Ь(и, о) М(> (и, о, ю) ~и, о) =О; отсюда следует равенство нулю безусловного математического ожидания. Для других пар доказательство проводится аналогично. С помощью формулы (7.6.2) разность между т(и, о, ю) и р разлагается на части, которые могут Г>ыть рассматриваемы как соответствую>цне эффекты факторов С, В, Т; таким образам, в примере с городами, ящиками и кусками ткани с(и) является эффектом города и, Ь(и, о) — эффект ящика (и, о) нз города и, ((и,о,и>) — эффект куска ткани (и,о,и>) нз ящика (и,о).
Поскольку средний эффект ящика из города и, а именно Ь(и„), равен нулю, мерой этога эффекта будем считать условную дисперсию Ь(и,о) при данном и; мы будем обозначать ее 0(Ь)и). Однако в настоящей модели мы интересуемся преимущественно не отдельным городом, а популяцией городов. Поэтому естественно использовать среднее (т. е. математическое ожидание относительно У„) от Р (Ь)и) по городам. Обычно оно не совпадает с Р(Ь(и,о)) = а'; однако в нашей модели это совпадение имеет место; в самом деле, в общем соотношении (см. задачу 7.5) 0 (Ь) = М (О (Ь ) и) ) + 0 (М (Ь ) и) ) последний член обращается в нуль, так как М (Ь/и) = Ь(и, ») = = О при всех и.
Так же обосновывается мера о- "эффекта кусков ткани в ящиках. Пусть (иь...,и>) — индексы ! уровней С, выбранных для эксперимента; предполагается, что они представляют собой случайную выборку из У«. Пусть ((и>, о>), ..., (иь о,,)) — индексы 7> уровней В, выбранных в >ем уровне С эксперимента; препалагается, что оин представляют собой случайную выборку из У„>„ ((=1, ..., !), Наконец, пусть ((и>, о;, .с,), ..., (иь оь щА, ))— индексы К;; уровней Т, выбранных в >ем уровне В и Ьм уровне С эксперимента; предполагается, что они представляют собой слу- 9 та. Гнуппинов»ннып плАн 289 чайную выборку из У ~,, „,. Тогда (тц») в (7.61) имеет разложение лзц» = )»+ Сг+ Ьц + Гцю (7.6.4) где с;= с(пг), Ьц= Ь(ибо!), )ц» = Г(иьоп ге»).
(7.6.5) Поскольку 1ц» распределено как 1(и, о, гн), его среднее равно нулю, а дисперсия о'; аналогично Ьц н с~ имеют нулевые средние и дисперсии о' и о' соответственно. Величины (сг), (Ьц), ()ц») все попарно некоррелированы. Это можно проверить рассуждениями, уже знакомыми читателю. Предположение нормальности в этом случае представляется менее неприятным, чем в случае полной классификации, так как здесь вообще не появляются взаимодействия, в связи с которыми могли бы возникнуть противоречия с интуицией, Итак, все наши предпосылки имеют вид Ьц»м = )»+ с» + Ьц + Ьц»+ ец»т (1=1, ..., ); /=1,..., Уц 1=1, Кц', нз 1, ..., Мц»), где (с ), (Ьц), ()ц»), (ец» ) независимы и нормально распределены с нулевыми' средними и дисперсиями оз, о', оз, о', соответственно.