Шеффе Г. - Дисперсионный анализ (1185347), страница 35
Текст из файла (страница 35)
Показать, что получится такая же таблица, если мы сначала к столбцам (1)чу).таблицы величин (уч) применим функции (М,), а затем к строкам полученной таблицы — функции (Ь,). Доказать, что (М„) являютси ортогоиальными функциями от (у,с). Доказать, что при з ) 1 и г ~ 1 функции М„принадлежат введенному выше «пространству взаимодействий» 2'. 4.19. Обозначим предположения, состоящие в том, что у!" ~с! имеет распределение й?(Х (), а~г), через ю; Х„й (где ()и — любая мнк-оценка 8 в предположенаих е) обозначим чеРез т)»» а (!У вЂ” т)и!!з — чеРез Уи.
ПУсть з!" х П = )(т)и) Явлаетса пРоизвольной*) фУнкцией от т)н (фУикпии 1 должна быть выбрана до рассмотрения результатов наблюдения вектора у). Пусть ь — такая же линейная функция от в, как ц„от у, т, е. если ()и —— Ау, т)и= Х„АУ Ву, то ь=Вж Предположим, что ранг Х„г„, так что У /оз распределена )( с ч =а — г„ст. св. Определим 2 551-6 — ь!Р(з'(у — ч ))'. Доказать ""), что 55с и мн — У'1, поделенные на аз, в предположениях ю независимы и имеют йюраспределения с 1 и чи — ! ст. св, соответственно. Отметим, что функцию !! и — ь !1-'55с при ю можно рассматривать как квадрат коэффициента регрессии (гл.
6) остатка у — т)и на з. Указание. При ю у — т)вне зависит от т)и. Рассмотреть условное распределение 55с и 5и — 551 при условии тй„при этом условии я будет постоянной, а я'(у — з)н) =я'(1 — В)у — линейной формой от у; затем продолжить рассуждения так же, как в доказательстве теоремы $4.7. 4.20. Получить теорему 4 4.8, используя результат задачи 4.19.
Указание. При помощи обозначений с двумя индексами определить 2 л ((т) ) формуламя ясг т)сс, где т)с!=9+а!+()С. ") Предполагается только, что эта функция измерима по Ворелю и что определенная ниже при помощи этой функции величина 11 з — ь(! отлична от нуля с вероятностью единица. ") Случай, когда з = с(т)н) определяется формулами г,. = а (т) — Ь)э, где а и Ь вЂ” константы, был установлен Тычки (Тпкеу, !966). 174 ГЛ.
4. ПОЛНЫЙ 2ь 3 И МНОГОФАКТОРНЫЙ АНАЛИЗ Таблица И Уровень С Уровень В Уровень А О 2 уровень ! уровень ! 8 17 22 7 26 34 10 24 39 5 !1 !6 3 !7 32 5 !4 33 8 !3 20 !О 24 34 9 24 36 4 !О 15 5 !9 29 4 16 34 Вопросы а) и б) являются такими же, как в задаче 4.!О. в) Уровни фактора В соответствуют трем равноотстоящим количествам соли. Разбить Вбв иа две «ортогональные ст. св,» для линейных и нвадратпчных эффектов.
Какие выводы? 4,2!. Рассмотрим геометрическую интерпретацию существования взаимодействий между качественным фактором н количественным; предположим, что фактор А качественный и имеет ! уровней, а  — количественный и его 7 уровням соответствуют значения (ог) непрерывной переменной о. Пусть через тр(о) обозначено истинное среднее, нли регрессия вмо уровня А, тан что в обозначениях, введенных в конце 6 4.1, Пн = 49(ог).
Рассмотреть гра. фнкн 7 функций (у)4(н)) н показать, что (А Х В)-взаимодействия отсутствуют тогда и только тогда, когда эти графики отличаются только параллельным сдвигом в направлений, перпендикулярном к о-осн. 4.22. Пусть г! = 4)(и, о) †регресс, веденная в б 4.! для того случая, когда обе переменные являются количественными. Рассматривается случай квадратичной функции 4)(а, о), так что 4) = Ао+ Аги+ Аьо+ А44ив+ Аыи*+ Ажио, где все А являются постоянными.
а) Доказать, что преобразование, приводящее к аддитивности по и и о в смысле $4.1, существует тогда н только тогда, когда или Авь = О, илн г! = В(н — с) (о — !7) + К, илн 4) = (Еи+ Ео+ 0)2+ Н, где Ев+ Ев ~ 0 к точки (и, о) принадлежат одной из полуплоскостей Ен+ Ео+ С е О или > О. б) Доказать, что всегда существует ортогональное преобразование от и, о к и', о' такое, что ц является аддитивной по и' н о'. 4.23.
В таблице И приводятся данные еще одного эксперимента в форме полной классификации по четырем признакам. Наблюдается влажность (в граммах) выборок из некоторого пищевого продукта, Уровнями фактора А являются три сорта соли, уровни В соответствуют количествам солей, уров. нями С являются количества кислоты н уровнями Р— две различные при. меси. Глава 5 НЕКОТОРЫЕ НЕПОЛНЫЕ КЛАССИФИКАЦИИ: ЛАТИНСКИЕ КВАДРАТЫ, НЕПОЛНЫЕ БЛОКИ И ПЛАНЫ С ГРУППИРОВКОЙ й 5.1. Латинские квадраты Предположим, что в эксперименте исследуется р факторов, причем в-фактор имеет 1ч уровней (д = 1,.,р), так что имеется тч' =!А ...
!, ячеек или возможных совокупностей условий. Напомним, что планирование эксперимента мы называли полным р-факторным анализом, если в каждой ячейке имелось по крайней мере одно наблюдение. Часто это бывает невыполнимо, и тогда мы должны упростить схему эксперимента, допустив, что в некоторых ячейках не будет наблюдений; такое планирование мы назовем неполным р-факторньтм анализом. Во всех планах эксперимента, представляющих интерес, подмножество ячеек, в которых проводятся наблюдения, выбирается по некоторой схеме. Нашим первым примером будет латинский квадрат с р = 3.
Схема латинского квадрата является неполным трехфакторным анализом, в котором все три фактора имеют одно и то же число гп уровней, а наблюдения проводятся только в гпа нз тпэ возможных совокупностей условий, которые выбираются по описанной ниже схеме. Преимущество этого метода по сравнению с полным трехфакторным анализом заключается, конечно, в том, что наблюдений требуется в пт раз меньше; его главное неудобство, как мы позднее увидим, заключается в том, что а ализ существенно опирается на предположение аддитивности и может быть огиибонным, если в действительности взаимодействия присутствуют.
Более очевидным ограничением является то, что все факторы должны иметь одно и то же число уровней, Схема латинского квадрата *) возникла на основе сельскохозяйственного эксперимента. Предположим, что нужно срав- ") Это определение дано Фнюером (грнэпаг, 1926); оно включает рандомнэацню, описанную в этом параграфе позднев. 1тб гл. з. някотоныя ннполнын кллссиеиклцни нить пять сортов пшеницы.
Для этого в эксперименте, проводимом по схеме латинского квадрата, прямоугольное поле делят на 25 одинаковых прямоугольных участков, расположенных в пять строк и пять столбцов. Каждый сорт должен выращиваться на пяти участках так, чтобы он один раз встречался в каждой строке и один раз в каждом столбце. Если сорта занумерованы числами 1, 2, 3, 4, 5, то они могут расположиться так: 43521 31452 (5.1,1) 1 5 2 3 4. 52! 43 243! 5 *) Эффект типа (1) можно рассматривать как сумму (2) и (3) в спе.
цнальном случае, когда (2) и (3) являются линейными функциями от но. мера строки и номера столбца соответственно. '*) В теории рандомизации (4 9.3) статистика У имеет дискретное распределение, порожденное действительной раидомизацией в энсперименте. Дли (л~'э( т]-квадратов гисло значений (не обязательно различных), принимаемых статистикой Х, равно У = (т — !)15 , где 5 явлиется числом «стаи. дартиых квадратов» (это понятие определено ниже] в множестве, нз которого мы случайно выбираем один. Если мы выбираем из всех существующих стандартных квадратов (в этом случае 5 равно своему макснмальномузна.
Такое квадратное расположение чисел (или других символов), когда каждое число появляется один раз в каждой строке и один раз в каждом столбце, называется латинским квадратом. В моделях, которые обычно используются, предполагают, что «истинное» среднее участка равно сумме эффекта строки, столбца и среднего урожая сорта (т.
е. равно эффекту разновидности плюс генеральное среднее). Этот случай возможен, если среднее участка является суммой среднего урожая сорта и эффекта плодородия, причем (1) эффект плодородия может быть линейной функцией ах + (гу + с от декартовых координат (х,у) плоскости поля; или (2) имеется «колебание плодородия» параллельно строкам, т. е.
эффект плодородия, осредненный по участку, будет функцией только строки; или (3) то же самое предположение для столбцов; илн а) (4) эффект плодородия будет суммой (1), (2) и (3). Однако этот сельскохозяйственный пример по соображениям, аналогичным тем, которые упоминались в связи со случайными блоками ($4.2), не является обычной моделью с предположением нормальности, по которой ошибки независимы, а их дисперсии равны. Тем не менее, если латинский квадрат выбран наудачу некоторым способом (который мы сейчас опишем), если число сортов больше четырех *') 4 в.1.
ллтннскнв квлдплты н если сорта не взаимодействуют по строкам и столбцам, то мы можем ожидать, что статистические выводы, полученные на основе обычной модели с предположением нормальности, будут хорошим приближением к верным заключениям, полученным на основе более реалистической рандомнзированной модели (гл. 9). Существование латинских квадратов любых порядков следует из примера ! 2345 23451 345! 2, 45123 (5.!.2) 5!234 12345 25!34 3425 !.
43512 51423 Из стандартного (т Х лг)-квадрата мы можем получить гп)(пт — 1)! квадратов, сделав пт! перестановок столбцов н (лз — !)! перестановок строк, оставляющих первую строку чению), то Юэ = 1, бз — — 1, 5~ — — 4, Яз = бб, оз = 9408. Общая формула для Я неизвестна.) Таким образом, У при т = 4 принимает 24 значения. При гипотезе отсутствия различия между сортами эти значения нужно брать с равными вероятностями. Получившееся дискретное распределение плохо приближается на концах а-пределами непрерывного я.распределения.
который может быть обобщен на квадраты любого порядка, Если столбцы латинского квадрата переставлены, то, очевидно, результат тоже будет латинским квадратом; аналогично для строк, а также для любых перестановок чисел. Для рассмотрения способа случайного выбора латинского квадрата удобно ввести следующее определение: совокупность латинских квадратов, получаемую из единственного квадрата перестановкой строк, столбцов и чисел, назовем множесгволг трансформаций. Канонической формой любого (пг,'эг',гп)-латинского квадрата называется стандартный квадрат, который получается перестановкой столбцов, приводящей к первой строке вида (1,2,...,гп), и последующей перестановкой строк, приводящей к первому столбцу вида (1, 2,..., т); при этом первая строка уже не будет переставляться.
По этому определению (5.1.2) является стандартным квадратом; стандартный квадрат, соответствуюший (5.1.!), имеет вид !та ГЛ. З. НЕКОТОРЫЕ !ГЕПОЛНЫЕ КЛАССИФИКАЦИИ на месте. Можно доказать, что все этн т!(лг — 1)! квадратов различны и что, таким образом, число различных квадратов с одной и той же канонической формой, т. е, стандартным квадратом, равно из!(т — 1)!.
Отсюда следует, что число различных квадратов в множестветрансформаций равнолз!(пг — 1)!, умноженному на число стандартных квадратов в этом множестве. Чтобы случайно выбрать латинский квадрат из множества трансформаций, мы можем взять любой квадрат из этого множества, а затем рандомизировать столбцы, строки и числа. (Подходящим способом перестановки множества числовых объектов, в нашем случае — строк-столбцов нли «чисел», является использование таблиц случайных перестановок Кокрана и Кокса (Сос)згап сс Сох, 1957, гл. 15).