Шеффе Г. - Дисперсионный анализ (1185347), страница 47
Текст из файла (страница 47)
Однако слово «влияние» в вероятностных контекстах не всегда имеет ясный смысл. Если мы вспомним два примера, рассмотренных выше, и допустим, что распределения отметок (гп) не одинаковы в разных колледжах (так что по введенной выше интерпретации «совокупности условий» влияют на значения г), то в первом примере колледжи должны «влиять» на оценки, полученные поступающими, и это противоречит обычному смыслу этого слова е), тогда как во втором примере колледжи должны «влиять» на подготовку студентов по английскому языку — в этом случае нет противоречия с обычным смыслом слова.
Чтобы уменьшить эту смысловую путаницу, мы будем стараться не употреблять выражений, которые к ней приводят; с этой же целью напомним нашу точку зрения: общий двумерный случай, рассмотренный нами, является частным случаем еше более обшего случая, в котором независимые переменные случайны, а все распределения по основным предположениям являются условными при заданных значениях независимых переменных. Тогда ковариациояный анализ может быть применен к получению критериев, которые ') Автор здесь не совсем прав: слово «влиять» в рассматриваемом при.
мере часто можно понять и в обычном смысле; так, например, одни колледжи пользуются большей известностью и в них идут более подготовленные, а это, конечно, приведет к более высоннм оценкам на вступительных экзаменах. (//рп,н. перев.) ГЛ. В. КОНАРИАЦИОННЫП АНАЛИЗ 234 имеют правильные уровни значимости, нли интервальных оценок с правильными доверительными коэффициентами.
Однако решение об использовании этих критериев нли оценок должно рассматриваться отдельно в каждом приложении. Всякий раз, когда факторы изучаются количественно, имеется опасность экстраполяции результатов за пределы данных. Когда экспериментатор контролирует значения независимых переменных, он должен выбирать их значения с учетом того, какие значения могут принимать независимые переменные в последующих применениях его результатов. Отметим, что модель, учитывающая случайные ошибки контролируемых переменных, изучается в $6.5. Мы видим, что осторожность в приложениях и интерпретации ковариационного анализа является еще более необходимой, чем в дисперсионном анализе. Необходимость соблюдения осторожности н два возможных вида ошибок были тщательно сформулированы М.
Дж. Кендаллом *) !его термин «днсперсионный анализ» включает «ковариационный анализ»): м .. мы должны особо подчеркивать, что дисперснониый анализ, подобно другим статистическим приемам, ие является мельницей, которая может автоматически перемалывать данные без опасений или предусмотрительности со стороны оператора. Дисперснонный анализ является более деликатным инструментом, который может быть использован, когда необходимы точные результаты, однако ои требует умения таи же, кзк и энтузиазма, чтобы применить его наилучшим образом. Читатель, иоторый просматривает литературу по этому предмету, будет иногда находить сложные анализы, применяемые к данным, чтобы доказать некоторые факты, которые почти очевидны из тщательного рассмотрения данных до начала анализа, или он будет находить результаты, установленные без указания «значимости», без всякой попытки их критической оценки.
Это не является поводом для постоянного напомнив. ння о необходимости осторожности в использовании современных теоретиче. ских приемов, а говорит о том, что дисперсионный анализ приводит к инте. ресиым выводам лишь в том случае, когда используемые данные, к которым применялся диснерсионный анализ, заслуживают этого применения». й 6.2. Построение формул ковариационного анализа по соответствующим формулам дисперсионного анализа Предположим, что данные были собраны по некоторой стандартной схеме, например по схеме одно-, двух- нлн многофакторного анализа, латинского квадрата, неполных блоков или по другой возможной схеме. В этой книге мы будем изучать отдельно эти случаи.
Пусть для каждого наблюдения зависимого переменного у мы получаем также множество Ь независимых переменных г!, ..., г». Предположим далее, что для анализа данных мы должны будем допустить, что М)у,), матема- «) Тйе Абчапсед ТЬеогу о! 51а11з11сз, М. сг. Кепда11, Сваг!ез гзг!!!!и, Еопдоп !1945), т. П, стр. 245. Ф е.т. постноннин еогмтл конлнплцнонного лнллнзл ззб тическое ожидание наблюдения, равно сумме двух выражений, где первым является выражение, которое обычно рассматривается в дисперсионном анализе, а вторым — линейная комбинация значений независимых переменных с коэффициентами. Таким образом, первое должно быть равно ~ х/!б/, где (х/!) / ! являются элементами матрицы Х', а (р/) — эффектами, которые должны рассматриваться в дисперсионном анализе; вторым выл ражением должна быть ~ г/д/, где г/! является значением не/ ! зависимого переменного г/, при котором наблюдалось переменное уь Примеры таких моделей были приведены в 9 6.1.
При подходящем выборе матричных обозначений уравнение модели запишется в виде М(г/)=Х'Р+Х'у. Мы, конечно, могли бы применить общую теорию гл. ) и 2 к анализу данных. Здесь число р+й параметров соответствует числу р обшей теории, а параметры (й!,..., й,; у!,..., уь) соответствуют параметрам обшей теории (р!,...,Р,). Однако цель этого параграфа ") заключается в том, чтобы дать другой метод. Назовем «соответствующей задачей дисперсионного анализа» в рассматриваемой схеме случай обычного дисперсионного анализа, т. е. случай, ь где члены 2 г//у/ не включаются в М(у!), нли, более фор/ ! мально, случай, где мы допускаем, что все у/ — — О.
В этом параграфе мы узнаем, как нужно изменить вычисления в соответствующей задаче дисперсионного анализа, чтобы получить решение задачи ковариационного анализа. Для этого требуется, чтобы решение соответствующей задачи дисперсионногоанализа было несложным.
Если это так, то новый метод является обычно более простым, чем непосредственное применение общей теории гл.) и2. В этой главе удобно обозначать основные предположения задачи коварнационного анализа через ь), а символ ь) сохранить для основных предположений соответствующей задачи дисперсионного анализа. Предположим, что ь) и й заключаются в следующем: ьй: ум" '! имеет распределение й/(Хйм '!+ У'у!«" и, о 1), ь)! у!"" ! имеет распределение /(/(Х'й'л" в, п~1). Компоненты (Р!,...,Р,) вектора б являются эффектами в соответствующей задаче дисперсионного анализа; они могут быть «) Важнебнгнй результат этого параграфа был получен Рао (мао, !946) другим путем.
ГЛ. З. КОВАРИАПИОННЫй АНАЛИЗ главными эффектами, взаимодействиями, эффектами блоков или дРУгими эффектами. Компоненты (Ть...,уь) в задаче ковариационного анализа являются коэффициентами регрессии при й независимых переменных (гь...,га), соответственно*). Мы будем обозначать )-й столбец Г через ы (ги гта гга) .
Этот столбец состоит иэ значений, принимаемых )'-й независимой переменной г;; гп является значением г; в (-м наблюдении у~ независимого переменного у. Читатель, желающий принять новый метод без доказательства, может воспользоваться готовыми результатами, изложенными в разделе этого параграфа, озаглавленном «Вычисления»; для чтения этого раздела нужно знать, что через (1о и Д обозначены соответственно матрицы квадратичных форм Уо и У от наблюдений (у~уз,...,у„); Уго и У„имеют свое обычное значение, которое они должны иметь при проверке гипотезы Оа относительно (()() в соответствующей задаче дисперсионного анализа.
Если мы обозначим )-й столбец Х' через $ь так что $, = (х(ь хль ..., хт«) ', а М(у) через т), то Ч = Х'()+ ГТ можно записать в виде т) = И~+ " + 5Д, + Т1~~ + ... + Та~а. (6.2.1) Пространство, порожденное (йь ..., 'й»), удобно обозначить через Ур вместо У„ как было до этого, а пространство, порожденное (йь ..., и„ ьь ..., ~ ), через У;,. Если г является размерностью Уо, то мью будем предполагать, что размерность У-, равна г + й; это эквивалентно такому предположению: если т = г(Х'), то г + й равно рангу составной матрицы (Х'Х'), столбцами которой являются Д1 ..., $ю Ьь ..., ~ь).
Причиной ') Иногда требуется, чтобы независямое переменное входило в уравнение модели с различными коэффипиентами регрессии; например, в задаче сравнения крахмала (5 6.1) козффипиент регрессии прочности, зависящей от толщины пленки, может предполагаться различным для различных сортов крахмала (в этом случае может быть также разумно считать «постоянный член» И+ иг для каждого сорта равным нулю).
Теорию данного параграфа можно применить и в этом случае, если определить некоторое число искусственных независимых переменных (нх число раино числу различных коэффядиентов регрессии) так, чтобы г-я независимая переменная во всех наблюдениях была ранна нулю, за исключением наблюдений с г-и коэффипиентом регрессии; однако в этом случае, возможно, проще вернуться к обшей теории гл, 2. $62.
ПОГТРОение ФОРмул кОВАРиАиио!О!ОГО АнАлизА Рзт этих предположений является то, что мы хотим, чтобы коэффициенты регресии (тД были однозначно определены при любом заданном 21 в (6.2.1), а также, чтобы они являлись параметрическими функциями, допускающими оценку. Дока>кем, что (т!) однозначно определяются по нашим предположениям. Выберем базис (а>,...,а,) в уа', заменяя $ в (6.2.1) соответствующими линейными комбинациями а и собирая коэффициенты при м, получим Ч = с!а! + ... + с,а, + тД! + ... + уД„ (6 2,2) Так как (а!, ..., а",ь!, ., ьА) является базисом в у'-„, то координаты (т!) должны быть единственными.
Мы будем предполагать, что наложено 1 дополнительных условий Н'6=0, где 11' является (1'>!',р)-матрицей. По этим условиям и по Й параметры (6!) определяются однозначно; это будет совсем очевидным в приложениях. Необходимые и достаточные условия единственности Щ даны в теореме 3 Ч 1.4. В рассматриваемом случае существует единственное решение ря, удовлетворяющее нормальным уравнениям и дополнительным условиям ХХ'(),=Хд, Н'(4,=О. (6.2.3) Предположим, что решением является ()и = Ау; тогда, подставляя его в (6.2.3) и замечая, что полученные равенства верны при любом у, найдем соотношения ХХ'А = Х, га"А = О, (6.2.4) которые будут полезны.
Мы будем обозначать мни-оценки (1 и у в предположениях (1 чеРез ()а и т-,„; УА единственна, так как (У!) допУскают оценкУ. Позднее мы покажем, что ()-„может быть выбрана однозначно, если наложить дополнительные условия Н'()„- = О. Итак, Чя = Х'()я является проекцией у на )>я; мы можем записать т)а = Ряу, где Ро — — Х'А. Нам потребуются соотношения РЗ=Р и Р'=РГГ Они верны для любых матриц преобразований проектирования. Первое очевидно, так как если мы проектируем 21я на у'я, то снова получим 21О, следовательно, Ря(Ряу) = Рву при любом у. Второе может быть получено умножением (6.2.4) слева на А' гл.е.