Шеффе Г. - Дисперсионный анализ (1185347), страница 56
Текст из файла (страница 56)
(7.4.7); Четыре 55 с индексами А, В, АВ и е (мы будем говорить, что эти 55 вычислены для главного эффекта А, главного эф- фекта В, взаимодействия и ошибок) определяются в терминах наблюдений (уиь) так же, как в таблице 4.3.1, и вычисляются, конечно, с помощью тех же самых тождеств, которые имеются в $4.3. Если в каждой ячейке имеется только одно наблюдение (К = 1), то мы не используем 55, (которое будет равно О с О степенями свободы). Подставляя (7.4.7) в определения 55, мы получим 55А = ./К ~, (а, — а, + с,. — с..
+ е/ — е„„)з, 55в=/Кх (Ь/ — Ь„+ с./ — с + е./,— е„.)з, 1 55лв = К 2.2. (с;/ — с;, — с,, + с„. + еп. — еи. — ели + е.„.)', / 55.=ЕЕЕ(; — .)' / Заметим, что в 55З не входят главные эффекты В, зато входят взаимодействия; то же самое можно сказать о главных эффек. тах А и 55в; в 55, входят только ошибки.
при всех и„откуда л(и/) = О при всех и; и Соч(с/и с,,) = М (у(и/)) =О. Аналогичным образом можно показать, чтоСоч(си, с/ ) =Опри 1'Ф 1. Если мы добавим предположение нормальности, т. е. будем считать эффекты (а/), (Ь/), (с//), (е„ь) совместно нормальными, то из некоррелированпости отсюда вытекает сразу их независимость в совокупности1 Независимость взаимодействия с(и, а) станка и и рабочего а от станка или от рабочего расходится с нашим интуитивным представлением о взаимодействии.
Это наводит на мысль, что в этом случае предположение нормальности не совсем корректно. Однако мы его примем для того, чтобы вывести интервальные оценки и критерии. Как обычно, вычисление математических ожиданий средних квадратов и несмещенность полученных из них точечных оценок остаются справедливыми и без предположения нормальности., Наши предположения можно теперь записать в виде гл.
т. модели со слкчлиными олктовлми Покажем, что в условиях 1! эти четыре 55 статистически независимы; для этого докажем, что следующие девять мно- жеств случайных величин статистически независимы: (1) (ак — а„), (П) (Ь~ — Ь,), (П!) (см — с ), (1Ч) (с„— с„), (Ч) (су — с;„— с„+с„,), (Ч!) (е, — е„,), (ЧП) (ем„— е„„), (Ч1П) (ен.— с, — е,ы+ е,„,), (1Х) (сна — ео„), Поскольку совокупность случайных величин во всех множествах нормально распределена, достаточно доказать попарную независимость этих множеств.
Множества (1) н (П) независимы, так как (а~ — а,) являются функциямн только от (аД, (Ь| — Ь,) — только* от (Ь;), а (а,) и (Ь;) независимы в силу И-предположений. По аналогичным соображениям (1) независимо от всех последующих множеств, (П) независимо от всех последующих множеств, и каждое из множеств (П1), (1Ч), ('Ч) независимо от (Ч1), (ЧП), (ЧП1), (1Х). Для доказательства попариой независимости множеств (1П), (1Ч), (Ч) рассмотрим фиктивную модель с двумя постоянными факторами и с одним наблюдением в каждой ячейке. Пусть в этой модели (су) играют роль наблюдений" ) с дисперсией ошибки пела, причем все параметры модели, кроме о'„л, равны нулю. Тогда (П1), (!Ч), (Ч) являются линейными формами от векторов, лежащих соответственно в трех из четырех взаимно ортогональных пространств из $4.2; поэтому эти три множества статистически независимы.
Сравнивая (еп,) с фиктивной моделью с двумя постоянными факторами н с К наблюдениями в каждой ячейке, мы получаем аналогичным образом статистическую независимость четырех множеств (Ч1), (ЧП), (ЧП1) и (!Х). Подобными же рассуждениями можно показать, что наши четыре величины 55 статистически не зависят от общего среднего у„,„= р+ а.+ Ь,+с,„+е„„,. Положим йч = а;+ с;„+е;„,; (д,) независимы и имеют распределение У(0, и'-), где а'„= =а",+У 'палл+У 'К 'оа, поэтому 55л — — УКУ.(д,— и,)' распре- 1 делено как Х' с У вЂ” 1 ст. св., умноженное на УКоа.
Следовательно, 55л — — М (55л) у',, где М (55л) = УКпл — — о«+ Колла + УКоал «) Фактически !ен! не наблюдаются, однако они имеют то же самое раснределеиие, что н наблюдения в нашей фиктивной модели. 4 2.4. полная классно!(камня по двкм признакам 281 Таким же образом можно найти распределение 55в, Что касается 55лв, то оно равно умноженному на К выражению ХЕ(й, — Ь/ь — й, + й„), (7.4.8) ! / где Ь/; = си+ е//,! величины (й,/) независимы и имеют распределение М(0, а'„) с а„=алв+ К 'а',.
Но (7.4.8) распределено как остаточное 55 в фиктивной модели с двумя постоянными факторами, в которой (Ь,/) — наблюдения, а все параметры, кроме а'-„, равны нулю, Наконец, распределение 55, одинаково с распределением 55 ошибок в фиктивной модели с двумя постоянными факторами с наблюдениями (е;,е) и т.
д. Таким путем мы найдем, что каждое из четырех 55 распределено как величина 72, умноженная на соответствующее М(55); числа степеней свободы и М(55) указаны в таблице 7.4.1. Т а блица 7А,!. Математические ожидания средаих квадратов в модели со случайными факторамя в случае двухфакториого аиаляаа и (яя! Степень еноболи а + Калв + /Кал ае2+ Ка2лв+ /Ка2лв ат+ Ка,' а / — 1 У вЂ” 1 А ~~в АВ осе (/ — 1) (У вЂ” 1) Н (К вЂ” 1) С помощью этих распределений мы можем строить критерий для проверки обычных гипотез. Если в классификации по одному признаку критерий для проверки гипотезы Нл.
ах=0 совпадал с таким же критерием в случае модели с постоянными факторами, то здесь караина будет иная. При гипотезе Нл 554 равно (а,'+ Котла))(2/ „ а 55А равно (а,'+ Котла) 72, где тлв =(! — 1) (Х вЂ” 1), поЭтому 55л/55в распределено как Р/,,л . Заметим, что в то время как в модели с постоянными факторами при гипотезе Нл отношение 55л/55, имеет Р-распределение, а отношение ЖЗА/55лв — нет (если а-'„в чь О), здесь при гипотезе Нл отношение 554/55лв имеет Р-распределение, а отношение 55А/55,— нет (если атв чь О).
Таким образом, Нл отвергается с уровнем ГЛ. К МОДЕЛИ СО СЛУЧАИИЫМИ ФАКТОРАМИ значимости п, если 55А/55АВ ) г': е-и еАВ. Мощность этого кри- терия определяется, как и в й 7.2, из соотношения 55А Ве+ К АВ + еВА = а Ат-ЬеАВ ~~ЯД "'+ КВАВ (7.4.9) справедливого при й. Мощность всех критериев этого пара. графа зависит только от центрального г"-распределения. Мы можем так же, как и в О 4.2, использовать (7.4.9), чтобы получить критерий для более общих гипотез О ( Ом где О= ОА/(а, '+ Ка' ), Нли доверительный интервал для О. Приближенный доверительный интервал для о~~ можно получить методом, который указан в конце О 7.2.
Аналогичные выводы можно сделать относительно о'. Если К ) 1, то мы можем делать некоторые выводы о ОА, используя отношение 55АВ/55е, распределение которого при Я равно умноженной на (о",+ Ка', )/о', центральной г"-величине с РАВ и!1(К вЂ” 1) ст, св. Точечные оценки для компонент дисперсии ОА, В-', а„'- и о'; легко получаются из таблицы 7.4.1 методом $7.2. Например, мы имеем А ( А АВ)) АВ ( АВ е)' (7.4.10) (Если К = 1, то мы можем оценить только а~+ ОАВ, а не о', и а'„ отдельно.) Методом, развитым в 0 7.2, легко также получить формулы для дисперсий этих оценок. Из этих формул можно увидеть, что 1А (ОА) стремится к нулю тогда и только тогда, когда 7 стремится к бесконечности, а 0 (оэа) стремится к нулю, когда ! и 7 стремятся к бесконечности, и не стремится к нулю прп 7 и У конечных и бесконечном К.
Такое поведение точечных оценок подсказывает нам, что мощность некоторых критериев стремится к пределу, меньшему единицы, когда число измерений определенным образом стремится к бесконечности; этот факт можно исследовать так же, как в 4 7.2. Например, это справедливо для мощности критерия, проверяюгцего гипотезу 0(ОВ, где О=ОА/(ос+ о', ) и ОВ О, если К = 1, 1 фиксировано и У стремится к бесконечности.
Анализируя данные по теории этого параграфа, мы можем построить таблицу днсперсиоиного анализа, аналогичную таблице 4.3.1, заменив столбец Ы(55) на соответствующий столбец из таблицы 7.4.!. а т.в. полнын тРех- и многоФАктовнын АнАлиз 283 ф 7.5. Полный трех- и многофакторный анализ Мы будем пользоваться обозначениями $ 4.5 для факторов, числа уровней, 55 и Ю. Пример трехфакторного анализа можно получить, добавляя в примере Э 7.4 со станками и рабочими фактор С, относящийся к партиям сырья. Обозначая уц» т-е наблюдение в ячейке' ) й 1, й, мы предположим, что уц» = тц»+ ец», где ошибки (ец» ) независимы, одинаково распределены с нулевыми средними и дисперсией а-', и независимы от «истинных» средних в ячейке (тц»). Если уровни каждого из трех факторов являются случайной выборкой из популяции, причем эти три выборки независимы, то, поступая так же, как в $ 7.4, мы можем, не теряя общности, записать т )»+ а»+аз+ ас + алв + ало+ алис (7 5 1) где обозначенные буквами а случайные эффекты некоррелированы и имеют нулевые средние, причем (ала) одинаково распределены с дисперсией ол, то же самое можно сказать про (ан) и о', ..., пРо (ала»с) и о'„н .
Если добавить пРедполо>кение нормальности (при этом остаются уместными замечания $ 7.4), то вся совокупность предположений выглядит так: уц» = тца+ ец», где тц» удовлетворяет (7.5.1) (пл) (пн) (плв) (пвс) (плс) (плес) (е П: независимы, нормальны, имеют нулевые средние и дисперсии сз, о', ..., с'„, ст соответственно. Действуя так же, как в $7.4, мы можем показать, что во« семь Ю (семь, если М =!), определенные в $ 4.5, независимы и каждое из них распределено, как уз, умноженное на соответствующее М (Я); М (Ю) и числа степеней свободы дэны в таблице 7.5.1. С помощью таблицы 7.5,1 можно обобщить правила, позволяющие написать математические ожидания средних квадратов без каких-либо вычислений, на случай сба: лансированной модели со многими случайными факторами. Эти правила помещены в $8.2. В этом случае ЯЯ также независимы н распределены, как )1а, умноженный на М(оо).