Шеффе Г. - Дисперсионный анализ (1185347), страница 55
Текст из файла (страница 55)
Из этих двух значений 1 то, которое дает меньшее значение Р(бал), является решением. Если 1з ~ 2, то надо взять 1 = 2. Это происходит, когда О «= 2п-'(п — 2)-'. Это означает, что при О, близких к нулю, лучше всего взять только две группы (1 = 2). С другой стороны, если 1з ) п(2, то мы должны взять 1 = п)2. Это произойдет, когда О ) 1 — Зп-'. Таким образом, при 0) 1 лучше всего выбрать план эксперимента, по которому в каждой группе имеется только два наблюдения (1 = 2). К сожалению, как это часто бывает в задачах на определение оптимального плана, решение зависит от значения неизвестного параметра, в нашем случае О.
Поэтому в формулах, определяюших оптимальное 1, мы вынуждены подставлять вместо 0 какую-нибудь оценку, основанную на предварительной информации илн на догадке. $7А. Полная классификация по двум признакам Если в эксперимент с рабочими на фабрике, описанный в О 7.2, ввести несколько различных станков, то мы получим пример классификации по двум признакам. Нам будет удоб. ~о '*) принять рабочих за фактор В, а станки за фактор А. Во многих случаях, например, когда все станки одной марки, естественно рассматривать фактор как постоянный. Настояшая трактовка фактора А как случайного подходит к тому случаю, когда все станки одной марки и модели и когда выполнено следующее существенное условие: станки, участвуюшие в экспери- *) Заметам, что для больших н мы имеем аснмптотнческя )з ив1(0+1) = рн.
ь*) По следующей причине: рассматривая в 4 8.! соответствующую смещанную модель, мы встретимся с понятием «вектора нстннных средних», который мы предпочитаем записывать, как я друтяе векторы в этой канте в анде вектора-столбца, а не вектора-строки. 276 гл. х модели со слгчлинымн факто»«ми менте, можно рассматривать как случайную выборку из некоторой популяции, причем мы хотим получить статистические выводы не об отдельных станках в эксперименте, а о всей этой популяции.
Идеализируя популяцию станков, мы будем считать ее бесконечной. Это предположение приемлемо, если, например, станки для эксперимента случайно выбираются из огносительно большого числа таких же станков на фабрике. Предположим, что в эксперименте имеется 7 станков, 7 рабочих, причем каждый рабочий работает на каждом станке К дней.
Мы будем включать сюда также случай К =!, когда в каждой ячейке имеется одно наблюдение; в этом случае индекс и может быть опушен. Обозначим уи„выработку 1-го рабочего за его й-й день работы на 1-м станке. Мы приходим к разложению уп» то+ еи», (7.4.!) где ти — «истинная» средняя выработка )иго рабочего на 1-и станке, еи» вЂ” «ошибка», а совместное распределение (ти) и (аи») частично выводигся из свойств рассматриваемой математической модели, которая представляется автору естественной и поэтому приемлемой, а частично получается из некоторых упрощающих предположений.
Мы будем предполагать, что так же, как и в я 7.2, рабочие из популяции рабочих отмечаются индексом о, причем через У, будем обозначать распределение популяции. Пусть индексом и отмечаются станки в своей популяции, а через У„обозначается соответствующее распределение. Мы будем предполагать и и о статистически независимыми, т. е. будем рассматривать комбинацию случайно выбранного станка с независимо н случайно выбранным рабочим. Обозначим т(и, о) «истинную» среднюю выработку рабочего о на станке и.
Подобно тому, как мы это сделали в $7.2, мы введем упрощающее предположение о том, что дисперсия о»(и, о) дневной выработки комбинации (и, о) относительно «истинной» средней т(и, о) равна постоянной а,', не зависящей от (и, о). Генеральное среднее от т(и, о) в двумерной поиуляг(ии людей и станков равно и = т(», »); замена и звездочкой означает здесь переход к среднему по станкам в популяции станков, т.
е. вычисление математического ожидания по распределению У'„; аналогично замена о звездочкой означает переход к среднему в популяции рабочих, т. е. по распределению У,. Среднее «истинной» выработки на станке и по популяции рабочих есть т(и;); величину разности между ннм и генеральным средним а (и) = т(и, ») — т (», «) (7.4.2) 4 Гл ПОЛНЛЯ КЛЛССИфПКАЦИЯ ПО ДВЭМ ПГНЗНЛКХМ 277 мы определим как главный эффект станка и в популяции. Аналогично определяется главный эффект рабочего п Ь(п) = гл(%, у) — гп(е, %). (7.4,3) Взаимодействие в лопуляиии станка и и рабочего о определяется как с(и и) = гп(и ") гл (и ь) — ~п (~ и) + гп (~, ).
(7 4 4) Эта величина имеет смысл совместного эффекта в популяции, что вполне аналогично соответствующему понятию из $ 4.1„ применяемому к конечным совокупностям станков и рабочих. Разложение лг(и и) = И+ а(и)+ Ь(п)+ с(и, и) (7.4.5) определяется членами, стоящими справа; теперь нам надо исследовать их совместное распределение. Из (7.4.2), (7.4.3) и (7.4.4) мы находим среднее значение а(е) = О, Ь(е) = О, с(и,е)= О для всех и, с(а,п)= О для всех и; здесь замена и или п точкой имеет тот же смысл, что и выше. Эти соотношения аналогичны соотношению а, = О и другим для конечных совокупностей (й 4.1).
Случайные эффекты имеют, таким образом, нулевые средние. Теперь мы докажем, что они некоррелированы (т. е. любая пара из этой тройки имеет нулевой коэффициент корреляции). В самом деле, а(и) и Ь(п) статистически независимы, поскольку независимы и и и. Равенство нулю ковариации с(и, о) с а(и) и с Ь(п) может показаться немного странным, так как функции с(и,о) и а(и) обе зависят от случайной величины и, а с(и,п) и Ь(п) — от и, Для того чтобы убедиться в равенстве ковариации с(и,п) с а(и) нулю, заметим, что она равна математическому ожиданию а(и)с(и,п), которое можно получить, вычисляя математическое ожидание )(и), где Г(и) — условное математическое ожидание а(и)с(и,п) прн данном и.
Но при этом условии и можно рассматривать как постоянную ((и)= М(а(и)с(и,о)~и)= а(и)М(с(и,о)~и)= а(и)с(и, ). Таким образом, ((и) = О при всех и, откуда М(((и)) = О. АнаДогично можно доказать, что Ь(п) и с(и, и) некоррелированы. Для дальнейшего нам понадобятся следующие компоненты дисперсии ол, о', ила. пл'= Р(а(и)), о'- = 0(Ь(п)), о~, = 0(с(и, п)). ГЛ. 7. МОДЕЛИ СО СЛУЧАЙНЫМИ ФАКТОРАМИ 278 Пусть в эксперименте участвуют 1 станков с индексами (иы...,и,) и 1 рабочих с индексами (он...,о!). Мы предположим, что (и<) — случайная выборка объема 1 из Я., а (с!)— независимая от нее случайная выборка объема У из <У'.. «Истинное» среднее тс! в (7.4.1) равно тогда то= т(иьо!); поскольку выше мы предположили, что «дисперсия ошибки» относительно т(и„о,) равна одной и той же величине о' для всех и; и оп то (еиа) в (7.4.1) имеют нулевые средние и общую дисперсию а,'.
Мы добавим еще упрощающее предположение, что (е<та) независимы, одинаково распределены и яезависимы от (т<!). В силу (7.4.5) (т<!) имеют разложение») т<! = р+ а<+ Ь;+ си, где а, = а(и;), Ь, = Ь(о;), с;! = с(иьо;). (7.4.6) Так как двумерные распределения (и<, о!) и (и, о) одинаковы, то (а!) одинаково распределены; то же самое можно сказать о (Ь!) и (с;!), причем М(а;) = М(Ь!) = М (си) = О, ы (а!) о„', 0(Ь!) = Ов О (си) олв и си некорретированы с а; и Ьь Из (7.4.6) видно также, что поскольку 7+ l величин (и!) и (о!) независимы в совокупности, то независимы в совокупности )+7 главных эффекта (а!), (Ь,), и с» статистически не зависит от ап при !' чи 1, от Ь, при /'Ф) и от с, при !'чь<,)'Ф), Теперь мы покажем, что все элементы множества 7+ 7+ О эффектов (а!), (Ь;), (с<!) некоррелированы.
Для этого нам нужно только доказать, что иекоррелированы с;! и сс„если !' =1 и )' Ф ) или !'Ф ! и /' =). Рассмотрим первый случай. Ковариадия с;! и сьг есть математическое ожидание с (и„о ) с (и<, о,). Вычислим сначала условное математическое ожидайие при данном и;; в этом случае и; можно считать константой, а тогда с(иьо;) и с(им сл) независимы, так как о! и э „будучи независимыми, независимы и при нашем условии. Обозначая результат д(и,), получим й(и,.) =М (с(ии и ) ~и,) М (с (ин о,) ~ и,.), Так как двумерные распределения (иьо!) и (и,о) совпадают и М (с(и, о) )и) = с(и, и) = О при всех и, то М (с(иь о;) )и) = О «) При распределении эффектов (и<), (Ь,), (со), полученных ниже, мы приходим к модели, являющейся специальным случаем модели, введенной Тьюки (Тц)сеу, 1949Ь). $ КС ПОЛНАЯ КЛАССИФИКАЦИЯ ПО ДВУМ ПРИЗНАКАМ 279 уп, — — и+ а/+ Ь, + сп+ епь, (а/), (Ь/), (с;/) и (е//ь) независимы, нор- мальны, имеют нулевые средние и дис- персии а'„, а'-, а'„-в, а; 'соответственно.