Шеффе Г. - Дисперсионный анализ (1185347), страница 26
Текст из файла (страница 26)
Сравнения главных эффектов Пусть тр = ~ с;а, является любой линейной функцией от (а;). с Множество х. всех таких тр совпадает с множеством всех сравнений истинных средних строки (А; = и + а, =Ч,.), так как '~. с,а, = ~ с(чы, где с( = с, — с. и, следовательно, ~ с( = О; * обратно, если ~ с(=О, то ~„с(чь= ~ с(аь тИнк-оценкой с является ар= ~ с;аь Оценки (а,) не являются независимыми, тогда как средние строки (уы) независимы. Следовательно, используя формулу ф= Х., с';уы, легко вычислить, что с-эоэ Оф= 5-метод ($3.5) применим к множеству Е сравнений средних строки с д = 1 — 1 и л — г = и,.
Может быть использован ') Часто таблииа содержит вместо средних неподеленяые суммы. В этом случае вычислении тоже проводятся с этими суммами вместо средних. Я предпочитаю средине; они стали уже привычнымн в обработке данных. Так как вычислительные машины имеют обычно автоматическое деление, даже когда иет автоматического умножения, то среднее легко получить, когда уже вычислена неподелснная сумма. Таким образом, нет необходимости записывать этн неподеленные суммы. (»8 ГЛ С. ПОЛНЫР! Ен 3- И МНОГОФАКТОРНЫИ АНАЛИЗ также Т-метод (э 3.6). Рассмотрение относительных преимуществ этих двух методов проводится так же, как в 5 3.7.
Кроме того, 5-метод можно применить с т! =1 к множеству всех линейных функций средних строки; к этому множеству можно применить распространение Я-метода, основанное на увеличенном размахе ($ 3.7), Средние столбца изучаются аналогично. Ортогональные соотношения Рассмотрим пространства, порожденные следующими четырьмя множествами линейных форм наблюдений: порождающее формы Размерность ! — ! Пространстао а а 2' ~е аг, а р! "ь (ти Уп Ун Ун+ У„) ! †! (! — !) (! — !) План случайных блоков Предположим, что нужно сравнить ! «совокупностей условий» на некоторых экспериментальных объектах, например, ! лекарств на некоторых животных, или ! разновидностей растений на некоторых участках земли.
Часто можно сделать более точное сравнение, если сгруппировать экспериментальные объекты в блоки по ! объектов так, чтобы объекты внутри блока были похожи друг на друга больше, чем на объекты других блоков; таким образом, каждый блок может состоять из ! участков, или из ! животных одного помета. Если имеется ! блоков, то можно применять полный двухфакторный анализ. Факторами являются «совокупности условий» с ! уровнями и блоки с ! уровнями. Такую классификацию по двум признакам назы- Две линейные функции в различных пространствах являются ортогональными и, следовательно, по предположению нормальности в й, они независимы.
Ортогональные соотношения дока. зываются «методом группированных та» ($2.9) так же, как в более сложном примере, с которым мы встретимся в 3 4.5. Удобно определить прямую сумму двух линейных пространств Я! и Ы'р как множество всех элементов 1! + 1ь 1! е= 2'! и !зепи'ь Обозначим прямую сумму через 2'! 92'ь Тогда пространством оценок, определенных в общей теории $1,6, является в этом случае Ы„(т!Ыа ЯЯ'„, а пространством ошибок †.У'е.
$ «2 двухфлкторнын АВАлиз с Одним !!Авлюдением гтв вают планом случайных блоков "), если внутри каждого блока 7 «совокупностей условий» распределяются случайно по ! экспериментальным объектам, причем каждый из Л способов распределения «совокупностей условий» по экспериментальным объектам должен иметь одну и ту же вероятность, выбранную для данного эксперимента, и если распределения в различных блоках независимы. Для получения такого распределения удобно использовать таблицу случайных перестановок, например, такую, как в книге Кокрана н Кокса (Сос)!гап о! Сох, 1957, гл.
15). Рассматриваемая нами двухфакторная модель нормальной теории совсем не отражает уточнений, полученных в результате хорошего разбиения на блоки. В самом деле, эта модель не подходит к тем экспериментам со случайными блоками, в которых причиной «ошибок» являются в основном различия между экспериментальными объектами, а не ошибки измерений; мы найдем в гл. 9, что эти ошибки коррелированы и что их дисперсии могут быть разными в различных блоках; предположения нормальности заслуживают меньшей критики, чем предположения о независимости и о равенстве дисперсий. Однако мы увидим, когда будем рассматривать в гл.
9 более реальную модель для случайных блоков, что выводы о сравнениях совокупностей условий, построенные по недостаточно реалистической модели нормальной теории, можно все же рассматривать как хорошее приближение, если позаботиться об описанной выше рандомизаг(ии размещения совокупностей условий по экспериментальным объектам.
Рандомизация В любом эксперименте, где совокупности условий размегдаются по экспериментальным объектам, нужно такое размещение раидомизировать. Рандомизацию можно получить при помощи бросания монеты, вытягивания карты, таблицы случайных чисел или случайных перестановок и т. д. Обычно на рандомизацию налагаются некоторые условия, поставленные мокелью. Например, в модели случайных блоков каждая сово- «) Этот план и некоторые неполные трехфакторные планы, рассмотренные а гл. 5, логически ие должны входить а часть 1 атой книги; однако у моего расположения сущестауют педагогические преимущества: (!) оценки и таблицы дисперсиоииого анализа, за исключением столбца М (оо), строятся по общей теории с нереалистической моделью части 1 (позднее распределения должны будут рассматрнааться заново и соотаетстаии с более реалистической моделью, для которой пока еще нет общей теории); (2) желательно, чтобы ати основные планм и асе указания о рандомизацни встретились аозможно раньше; ие нужно, например, откладыаать случайные блоки до гл.
9. Ь г, щ«фф« 1ЗО ГЛ. Е ПОЛНЫЙ Ь, 3- Н Х1НОГОФИКТОРНЫЙ ЛНЛЛ1!3 купность условий должна появиться точно один раз в каждом блоке экспериментальных объектов. Интуитивное оправдание рандомизации заключается в том, что в эксперименте, кроме контролируемых факторов, таких как А и В в двухфакторном анализе, могут быть еще неконтролируемые факторы, причиной которых являются различные средние экспериментальных объектов при различных совокупностях условий; желательно, насколько это возможно, предупредить их систематическое влияние на эффекты контролируемых факторов. Рассмотрим, например, сельскохозяйственную модель со случайными блоками.
Если блоки состоят из У участков, то они могут быть расположены по линии восток — запад, так что их плодородность увеличивается с востока на запад в каждом блоке. Если в каждом блоке разновидности растений появляются в таком же порядке, то их урожай будет увеличиваться в направлении увеличения плодородности, хотя действительного различия этих разновидностей нет. При размещении совокупностей условий по экспериментальным объектам из групп животных, населения и т. д.
рандомизация предохраняет выводы от систематического смешения, вызываемого непредвиденными смещениями, например, такими, как неконтролируемые факторы, возможное влияние которых не удается полностью устранить. Логическое обоснование рандомизации состоит в том, что на основе рандомизированной модели можно получать правильные статистические выводы. Вероятностная основа этой модели обеспечена не формальными рассуждениями, а действительным процессом рандомизации, являющимся частью эксперимента.
Оказывается, если рандомизированные модели являются наиболее подходящими в данном случае, то статистические выводы, полученные на основе соответствующей модели нормальной теории, будут хорошим приближением к более реалистическим рандомизированным моделям.
Однако чтобы извлечь пользу из удачного сходства этих двух моделей, нужно рандомизацию включать в эксперимент. $4.3. Двухфакторный анализ с равными числами наблюдений в ячейках Обозначим число наблюдений в (1,))-ячейке через й11. Сначала относительно (К41) мы предположим только, что они не все равны 0 (кроме случая, когда общее число наблюдений а является нулем); в полном анализе все К1; положительны, Однако некоторые результаты, которые мы получим здесь и в 3 4.4, в дальнейшем потребуются для неполного анализа. В некоторых вопросах анализ с неравными (4111) будет значи- з кк ьэхктояныи лиллиз с ялвиыми числлми нлвл.
им тельно сложнее, чем с равными; мы сначала найдем решение для равных (Кп), а к общему случаю вернемся в следующем параграфе. Если через уи» обозначить й-е наблюдение в (1,1)-ячейке, а через  — множество пар ((1,1)), которые соответствуют не- пустым ячейкам, то наши предположения запишутся в виде упь=пи+ем,, й; (ень) независимы н распределены 1т'(О, и'), й = 1, ..., К;1, (1!) ен О.