Шеффе Г. - Дисперсионный анализ (1185347), страница 36
Текст из файла (страница 36)
Мы получаем, таким образом, что любые два различных квадрата из этого множества могут быть выбраны с одинаковыми вероятностями. Чтобы каждый из всех (лгХгп) латинских квадратов мог быть выбран с одинаковыми вероятностями, мы должны случайно выбрать множество трансформаций с вероятностями, пропорциональными числу стандартных квадратов в этих множествах. Такой же результат может быть получен выбором квадратов с равными вероятностями из всех стандартных (т,'к', пг)-квадратов и последующей раидомизацией столбцов, строк и чисел (или только столбцов н строк, исключая первую строку).
За более подробными указаниями а) и таблицами читатель отсылается к введению к таблицам ХЧ и ХЧ! Фишера н Иэйтса (Р)з)гег гх Уа1ез, 1943). Мы можем рассмотреть применение схемы латинского квадрата в любом трехфакторном эксперименте, когда каждый фактор имеет лг уровней. При т' исследуемых «совокупностей условий» проводится лзз наблюдений так, чтобы каждый уро- *) В сельскохозяйственных приложениях, где стропи к столбцы плана являются фактическямн строкамн н столбпамн участка, статнствкн должны отличать квадраты, выбранные нмн для зксперимента случайно, от система.
тнческнх квадратов. Систематический (т)(т).квадрат являетсн одним нз 2т!-квадратов типа (5.1.2) или его зеркальным отображением, нли отличает. ся от одного нз них только перестановкой чисел. Систематический план, очевидно, приведет к смещению результатов, если имеются некоторые свойства плодородия участка (например, колебание по одной из диагоналей). Аналогичный вопрос возникает в плане случайных блоков, если «совокупности усло.
вийь появляются в каждом блоке в одном и том же порядке. Статистик, который отбрасывает систематический план, а затем случайно выбирает новый, может надеяться, что его выводы будут правнльнымк (сокращснне мно>кества планов, нз которого планы выбирались с равными вероятностями, кажется незначительным, поэтому выводы о «совокупностях условий, оспо. ванные на вычнслеаии вероятностей прн наибольшем множестве планов, не должны сильно отличаться от выводов, полученных с наименьшим множесзвом планов).
% з.!, лАтиискь!в кВАдРАты вень любого фактора появлялся точно один раз с каждым уровнем любого другого фактора. Так, если строки в (5.1.1) являются уровнями фактора А, столбцы уровнями В, а числа уровнями С !например, уровнем С, наблюдаемым со вторым уровнем А и четвертым уровнем В, является пять), то точно такую же схему эксперимента описывает латинский квадрат 54213 25134 13452, 32541 41325 в котором строки являются уровнями А, столбцы — уровнями С, а числа †уровня В, или квадрат 3 5 2 1 4 2 4 1 5 3 43521, 51342 12435 в котором строки, столбцы и числа являются уровнями В, С н А соответственно а). В дисперсионном анализе латинского квадрата с обычным предположением нормальности мы будем рассматривать вероятностные соотношения при условии, что для эксперилзеыга был выбран частным латинский квадрат.
Если латинский квадрат выбирается случайно 1как должно быть по соображениям, которые будут выяснены позднее), то вычисленные вероятности н математические ожидания будут условными в предположении, что был выбран частный латинский квадрат. Мы придаем особое значение симметрии в наших обозначениях. Наблюдения будем обозначать через (уз!а), где уиа является наблюдением в исследуемой «совокупности условий» с з-м уровнем фактора А, 1'-м уровнем В, й-м уровнем С.
Тройка (з,1,я) принимает только !их значений, заданных частным латинским квадратом, который был выбран для эксперимента. Мы обозначим зто множество тз значений !з,1, й) *) Эта единая трехмерная схема была описана выше тремя различными латинскими квадратамн, являющимися двумерными таблицами. Единая трехмерная картина такой схемы получится, если мы в кубической решетке из ш» точек, представлюощих полную трехмерную классификацию, отметим лн «совокупностей условии», используемых в плане, 1ВО ГЛ.
К ИЕКОТОРМЕ НЕПОЛНЫЕ КЛАССИФИКАПИИ через Р. Тогда основные предположения запишутся в виде С у =сс+«4+оса+«с+в.с„, (с', 1, л) ЕЕР, а: т случайных величин (вссв) независимы 1' и имеют распределение 111(0, о~), ! . — . — .= а,' = ас' = ас — 0 Обозначения («Ас) главных эффектов н т. д. остаются такими же, как в полном трехфакторном анализе Я 4.5). Дополнительные условия а,"= 0 и т. д., как обычно, не нарушают общности. Й-предположения включают аддитивность, илн отсутствие взаимодействий, между тремя факторами. Гипотеза нулевых главных эффектов фактора А будет обозначаться через НА. все «," — — 0; аналогично Нв.
все ав 0 н Н: все ос=О. В предположениях 11 минимизируем я ~~ су — 1с — а" — «в — асса. а,с..с о( 'с' С С АА. Прнравняем к нулю дР/дСА. После деления на — 2 получим и, с,мФв( сс~ (у — )с — аА — ав — ас) = О, с с с) Когда мы суммируем по (с,),й)ен Р, то мы суммируем по всем наблюдениям, так что для каждого с главный эффект а,' складывается т раз, н, следовательно, Е «А=Я(т«А) =О; (С.
С,АСФО аналогично для (асв) и («Д. Отсюда (с=у„„где у является средним арифметическим тз наблюдений (уссв), Из дм/даве = 0 находим (у „— )с — а," — ав — ае)=0 (513) где РА является множеством т пар (с,1), для которых (с,),я)ев ы Р, а й фиксировано, По определению латинского квадрата в тройках (с,1, й), составлясощих Р, каждое с и каждое 1 встречается точно один раз с каждым Й, а соответствующие Р, состоят из т пар (с,/), где с н 1' принимают каждое значение из множества (1,..., т) только один раз. Следовательно, ай= ~а"=О, ~, аз=~' аз=О, (5.1.4) ; —,,с — пп с $2д. лАтинскиа кВАдгдты !8! и тогда (5.1.3) сводится к ,„ас у„„является средним наблюдений, в которых С имеет уро. вень й.
Таким образом, н аналогично ад — у у ав у у 55.= Х увив — ~ (н ( ад 1 бв 1 йс)2 аква В "" гс2м В После возведения в квадрат, суммирования и использования дополнительных условий зто равенство может быть записано в виде 558 — — 552 — 55д — 55в — 55с, где УИА ' д ~У! ссьв> В ИА " с 55,п~ у2 а2 55 „~~ у2 (5.1.3) В предположениях 21 имеется 1+Зт параметров, подчиненных трем дополнительным условиям, так что г = Зт — 2, н следовательно, числом ст. св. для 55, является и — г = тв — Зт+ 2. Пусть 22 = И П Нс.
В предположениях ы мнк-оцеики могут быть получены посредством минимизации (у р ад ав)2 а, А 2)ВВ или из выражения для У, аналогичного (4.3.5). Любым из этих методов мы можем найти, что при вэ МНК-оценки для р, (а",) (а~) будут такими же, как в предположениях Я (хотя, конечно, ас „=О), и что минимумом (3.1.6) является Ув = Ус+ 55с, где 55 =т~(асв)2 вычисляется по (5.1.5), Число ст. св. 55с Если мы вычислим 55 ошибок по общей формуле 55, = =!1 У 1Р— 1~ 2) Р, то получим !82 Гл. г. некОтОРые неполные клАссиоикдции равно тп — 1. Таким образом, равна 55с/55„где — оос 55с = —, т — ! ' статистика т для проверки Нс — оое 55,= тв — Знт+ 2 В предположениях оз статистика У распределена г а, * ч +г.
Гипотезы Нл и Нв проверяются аналогично. Таблицей дисперсионного анализа является таблица 5.1.1. Т а б л и и а 5.!.!. дисперсионнма анализ (наХти) латинского квадрата Степень свободы и (зз! Сумма квадратов Источник дисперсии оол П! Х (У! У* ) а лов = ~ Х (У.!* У„.) ! лос = псХ (У.,а У.„) Х (у! -у..— а,1,го о — уен — у„+ 2у,„„)г па+ неп' ог+ товг о + пто~~ т — ! ти — ! пвт-Знт+ 2 Остаток ооп = ла (Уа!» Унт) ! т, г, м в «Полкан» сумма квадратов Математические ожидания средних квадратов, приведенные в таблице, вычисляются при й обычным способом и выражаются через ~(а!)г 2 (а~ ) ~(а~)' о'=, о'= ', о'= л на ! в щ ! с па ! Пространство размерности лгг линейных форм наблюдений (ут!А) может быть разложено на пять взаимно ортогональных пространств, а именно пространство у„„„и четыре пространства линейных форм, квадраты которых приведены в первых четырех строках второго столбца таблицы 5.1.1; размерностями этих пространств являются соответственно 1, нт — 1, т — 1, т — 1 и тг — Злт+ 2.
Это может быть показано применением «метода группированных е» ($ 2.9) к цепочке гипотез 11, оз! = й П Нс, ыг = оз! П Нв, озз = отг П Н,. Отсюда следует, что в предположениях 11 пять 55, т. е. тгуг, и первые четыре 55 в таблице независимы. Параметры нецентральности их нецентральных й з!. ллтинскна квадраты !83 )(в-распределений могут быть найдены обычным способом по правилу 1 ($2.6). Численные вычисления для латинского квадрата аналогичны вычислениям для двухфакторного анализа с одним наблюдением в ячейке ($4.2), но, кроме вычисления средних строки уы,), средних столбца (у„;,), нужно еще вычислить Вз средних у„а) для пт уровней третьего фактора и 55с по формуле (б.!.5).
Множественное сравнение, основанное на 5- или Т-методах, может быть легко перенесено на рассматриваемый случай. Влияние взаимодействий В полном р-факторном анализе с равными числами наблюдений в ячейках оценка любого сравнения главных эффектов, вычисленная в предположении отсутствия взаимодействия, остается несмещенной при нарушении этого предположения (хотя оценка дисперсии сравнения обычно при нарушении этого предположения не остается несмещенной). Пример такого случая мы приводили в плане двухфакторного анализа с одним наблюдением в ячейке ($ 4.8). Легко видеть, что это сохранится и в общем плане. Рассмотрим сравнение*) главных эффектов фактора; оценка такого сравнения является линейной функцией средних (у!), где через у! обозначено среднее всех наблюдений с г-м уровнем фактора.
Так как наблюдения, вошедшие в уь были просуммированы по индексам всех других факторов, то взаимодействия входят в М (у!) только в виде сумм, которые в силу дополнительных ограничений равны нулю. Это хорошее свойство не сохраняется в случае неполного анализа н, в част-, ности, в схеме латинского квадрата. Предположим, что мы обобщим приведенные выше ьа-предположения, вводя взаимодействия, так что у — )з+аА ! аа ! ас ( аАВ+аас+алс+<Авс+„, (б ! у) где главные эффекты (ал), (ан!), (аас) н взаимодействия (алан) (а~~во), (ал!ас), (алчэас) удовлетворяют обычным дополнительным ограничениям аА — аАВ аА — — аАВС аАВС аАВС при всех г, ), Й.