Шеффе Г. - Дисперсионный анализ (1185347), страница 48
Текст из файла (страница 48)
конанилционнып анализ (получим А'ХХ'А = Ро) и последующим транспонированнем э). Если мы запишем пРоекцию У иа УВ в виде з)о —— Х'Ц+Е'тн = =Р-„у, то найдем Ро(Рйу) = Р и, или Р„Р- = Р„, так как з)о может быть получено проектированием сначала у на Уй, а затем проектированием результата из Уо. Если мы определим (6.2.5) то для любого у векторы Дпу и (4у будут проекциями и иа ортогональные дополнения (см. конец приложения 1) пространств Уо и У- соответственно.
Используя (6.2.5), мы найдем, что йр',=а„а;=41, и Е.ай=44. Вычислим сначала ук. Умножая Р„д = д — Х'66 — Я'Т,- (6,2.6) слева на чТп, полУчим Е Р=ń— а,г''.-, (6.2.6а) так как ЦпХ'66 =О (Х 66 является линейной комбинацией (йг) н, следовательно, входит в Уп). Вектор 41йу ортогонален Уп, а значит и Я. Так как (ь',) являются строками Х, то ХЯ-у=О и из (6.2.6а) находим г (Е.д — Е„г'у„) = О, нлн ХЕ„Х'УВ = гдпд. (6.2.7) э) Профессор Роберт Внйсман указал мне, как симметричность Ро, матрнцм преобразования проектирования, может быть легко доказана непосредственно без использования (б.зн).
При помощи выбора ортогонального базиса, полученного распространением ортогонального базиса а Р„ на Р„, Рп может быть приведена к диагональной матрице Э с г первамн диагональными элементами, равными 1, а остальными О. В любой другой системе координат Рп имеет еил Т'ВТ, где Т ортогональна. Матрица Т'ОТ снимет. рична, так как Р симметрична. Покажем теперь, что (й,л, й)-матрица УДоХ' не вырождеиа. Так как лЯпГ = ЯоХ')'ЩпЕ'), то по теореме 7 приложения 11 ХЦпХ' = г(АХ'), й столбцов (41оьг) матрицы ЯпЯ' должны быть линейно независимыми. Действительно, если мы подставим ~г = Ряьу+ чгоьг для каждого~у в (622), то увидим, что з вл.
постгоенив еогмтл ковлгизциоиного хнллизл язв любой вектор из )'й является линейной комбинацией векторов (а;), (Рог) из Уа и векторов Явь;), ортогоиальных к Уа, так что векторы Я~Дг) должны порождать ортогональное дополнение Уд в Уа, которое по лемме 10 приложения 1 имеет размерность (г+ й) — г = Ь. Теперь мы можем разрешить (6.2.7) относительно Т-„ уп =(х()~х') 'Уясну.
(6.2.8) Матрица Оч находится при решении соответствующей задачи дисперсионного анализа как симметричная матрица квадратичной формы 9'а, являющейся 55 ошибок при 11 У'а =!! У Ч )) =!! У Ра» () = )) Юа» )) = = (4М) '((Ьд) = УМа» Для вычисления (1а заметим, что вектор Д-у ортогоналеи к Щ, так как он ортогонален к УО; следовательно, ХДау = О. Подставляя в это равенство (6.2.6), получим хх'Уй = х (у — г'уй).
(6.2.9) Так как система (6.2.3) имеет единственное решение ОО = Ау, то мы видим, что (6.2,9) имеет единственное решение, удовлетворяющее равенству Н Ой — — О. Это решение находится по формуле Ц =А(» — Х'уй) которую для дальнейшего исполь. зования перепишем в виде 66 = Ау — ~ у -А~,. (6,2.10) Нам нужно еще вычислить УО, являющееся 55 ошибки в задаче ковариационного анализа. Если мы обозначим через Н, гипотезу, состоящую в том, что у = О, то й = От () Й и, следовательно, да — Уй равно 55 числителя статистики я для проверки Нт в предположениях Й, Но из $ 2,7 мы знаем, что 55 числителя может быть также вычислено по формуле уй(а 'Г ) уй, (6.2.11) где через Гт обозначена ковариационная матрица вектора уй, вычисленная в предположениях Я.
Теперь из (6.2.8) Г, = (ау')-' гЕ,Г„О,г'(г(у,г') ', где Г„=оЧ. Так как Я,',=9„, то Г, = '(гонг')-'. (6.2.12) гл. к ковлгилиионныи анализ 240 Подставляя в (6.2.11) и приравнивая к У, — У;„получаем искомый результат У; =У,— т', (ге,г') то, который с помощью (6.2.7) можно записать в виде У; =У, — Уп (габор). (6.2.13) Наконец, предположим, что На является гипотезой относительно ((),), для проверки которой мы хотим вычислить Р-критерий в предположениях 14, зная г-критерий в 11. Если НВ определяется д линейно независимыми параметрическими функциями от (6!), которые допускают оценку при Й, то они допускают оценку и при Й, так как оценка, являющаяся несмешен.
ной прн ьа, будет, конечно, несмещенной и при ьх с: 14. Обозначим через гв и й предположения ы= На()й, й= На()Ц, Так как ы = Нт () 14, где Н является гипотезой т = О, то мы можем получить Уа из У, заменяя 11 и 0 иа г» и й в приведенной выше теории вычисления Ув по У„. Из равенства У„=у'44 у, где (г симметрична, следует, что а9 Я' не вырождена. Доказательство проводится так же, как для ЕДоа', нужно использовать базис (г — д)-мерного пространства г'„в аналоге равенства (6.2.2) для векторов (г+ й — д)-мерного пространства га.
Тогда, аналогично (6.2.13) и (6.2.7), получаем Ув = У вЂ” у' (79„у), где ч является решением 21~ Е'та = ЕЦ, у. Вычисления Нам нужны значения — (и+1)(в+2) величин, которые мы 1 будем обозначать через (т~,, в), где каждое 1 и о может быть любой из й+! величин у, гь ..., гь и тьпу = т,ьа. Этн значения определяются формулой РН~ю, а = 1 Явв, где каждое т н п может быть любым из Ь+ 1 векторов у, ~ь ... ..., ь„. Этн значения вычисляются из тождеств, используемых в соответствующей задаче дисперсионного анализа для вычисления Уо = у'Яву, т. е.
из тождеств, которые дают Уо как результат сложения и вычитания некоторых сумм квадратов значений зависимого переменного р. Таким образом, если Уо зависит от 55 вида ~С4[7.4(р)]х, где Ех(у) является линейной 4 ез. постнопнип оопмнл ковлрилционного анализа 941 Число ст. св. т.п равно а — г+ Ь. Обычно тРебУетсЯ полУчить мнк-оценки (()1,".,()нр. ДлЯ их вычисления заметим, что в задаче дисперсионного анализа каждое Рсп (1= 1,...,р) является известной линейной формой значений зависимого переменного у, например 6с и = 1!(у) (6.2.16) Образуем такую же линейную форму для каждого независимого переменного, а именно 1~(г1) для 1= 1, ..., Ь.
Тогда, как следствие (6,2.!0), получим, что оценка ~, в предположениях 14 равна л Рп й =11(у) — ~'. Фп 61~(ат) ° ") Если Ь ( 3, то вычисление обратной матрицы через алгебраические дополнения (теорема 4 приложения П) является совсем простым. Если Ь)З, то можно использовать метод Гаусса — Дулиттла; см.
Рао (йао, 1939), стр, 30 — 31, или Даайер (Пгтуег, 193!), стр, 191. (6.2.16) формой значений у, то лег, таким же способом зависит от выражения ~,СаЛа(1) Ла(п). Читателю, не понявшему такое описание вычисления (типо), рекомендуется немедленно посмотреть, как оно применяется в $ 6.4.
Будем обозначать (Ь Х Ь)-матрицу ЕЯоЕ' через Мо, а (Ь;н',1)-вектор ЕЦоу через то) (61)-элементом Мп является т... и, а (61)-элемент пто равен т, и и. Теперь мы запишем Ь уравнений (6.2.7) для Ь коэффициентов регрессии (у й) в новых обозначениях М„у;, =шп и решим их. Если Ь ) 1, то следует посмотреть, нужно ли решать этн уравнения при помошн вычисления обратной матрицы Мй' "). Если мы знаем, что позднее нам потребуется оценить все дисперсии и ковариации (у1;,), то мы должны вычислить Мо', так как по (6.2.12) оценка ковариационной матрицы ув предположениях И равна з Мц, где за является 55 оши- 2 -1 бок в ь). Вычислив векторы лап и у-, мы можем найти их скалярное произведение г тоуй = пз, „пу, о + ...
+ гп, „ой„й, вычитая его из 55 ошибок в задаче дисперсионного анализа, по формуле (6.2.13) получим 55 ошибок в задаче ковариационного анализа Уй = Уп - ш'уй. (6.2.14) Гл. к кОВАРихционный Анллиз В формуле (6.2.16) член — у! 61!(з ) естественно назвать поправкой к р!,о от регрессии по г!, Следовательно, для каждого 6!, которое требуется оценить в предположениях Й, мы вычисляем значения (6.2.16) его оценки и значения такой же линейной формы от независимых переменных, а затем применяем (6.2.16) . Если На определяется д линейно независимыми линейными ограничениями на Щ и мы должны вычислить критерий для На в предположениях Й по известному критерию На в й, то наши вычисления проводятся аналогично вычислениям У6 по Уо. Мы начинаем с тождеств для вычисления У„в задаче днсперснонного анализа, где У является суммой 55 числителя н 55 знаменателя статистики У для проверки Ня в предположениях 11.
Используя такие же тождества, мы вычисляем (1/2) (и+ 1) (6+ 2) величин (!и!,,,), где !и!,, определяется как 1'9 и, если 5„= у'Я у. Пусть через М„обозначена (йХЬ)- матрица, элемент !, 1 которой равен е...1,, а через т„обозначен (ЬХ1)-вектор с элементом 1„1, равным и,,„,„. В дальнейшем обратная матрица М„' не будет использоваться, поэтому мы просто решим систему Ь уравнений с й неизвестными (Ф!, в~ ум а)! чтобы получить й элементов вектора ув.
Эти элементы используются так же, как в (6.2.14), для вьинслення Уз = ӄ— т'у . Сумма квадратов числителя статистики У для проверки Нв в предположениях Й вычисляется как У вЂ” У-, а 55 знаменателя равно Уй! числами ст. св. являются д н и — г+6, Доверительные множества нлн критерии для проверки гипотез, включающие только коэффициенты регрессии (у!), могут быть получены методом доверительных эллипсондов (Ц 2.3 и 2,4). Для этой цели потребуются некоторые, или все, элементы ковариацнонной матрицы оценок (у о-); легче всего онн могут быть получены по формуле (6.2.12), которая показывает, что ковариационная матрица равна оМо Если вычислены а — ! оценки (р! я), то могут также потребоваться их дисперсии и коварнацни.
Для вьиисления дисперсий н ковариацнй величин (61 61 по формуле (6.2.16) полезно отметить, что два множества случайных величин (1!(у)) н (у -), входящих в формулы, являются в предположениях Й независимыми. Покажем это. Мнк-оценка уз - является несмещенной прн условиях Й, 4 вд. пгимер с одним ипзлвисимым пеппмннньгм 243 и следовательно, является также несмещенной при ь), так как при ь) ее математическое ожидание равно нулю. Таким образом, при ьг зта линейная форма принадлежит пространству ошибок (конец $ !.6), а любая й(у) = Рьо прн ь) принадлежит пространству оценок; отсюда следует, что два множества линейных форм ортогональны. Следовательно, оии являются независимыми как в Й, так и в Й (все эти утверждения сделаны н предположении, что наблюдения независимы и нормально распределены с равными дисперсиями).
По-видимому, нет простого способа получения выводов, содержащих ((эг) и (уг); но зта задача возникает не так часто, как решенная нами. Если она возникнет, то можно, конечно, использовать общую теорию гл.1 и2. $6.3, Пример с одним независимым переменным Мы рассмотрим случай однофакторного анализа с одним независимым переменным. Реальные задачи, в которых может быть использован этот анализ, описаны в связи с (6.1.1).
Основные предположения зададим в форме") Ун-— -6,+Угн+ем (1=1, ..., 1; 1=1, ..., У,), (ег1) независимы и имеют распределение )т'(О, от). Соответствующий дисперсионный анализ в предположениях ь), по которым у = О, был проведен в $3.1. Было получено 55 ошибок ы'о=к л (уы уг*)' (6.3.1) для вычисления которого использовалось тождество я =Хапуг — Хуут. (6.3.2) Чтобы применить теорию В 6.2, мы должны вычислить три величины тлю о, пткг, о и тгг, о.
Для определения птг,, о рассмотрим (6.3.1), как сумму квадратов линейных форм «) Для полноты в этом примере н в примере следующего параграфа мы должны добввнть условие иа ранг матрицы (Х', Я'), установленное после (6.23). В этом примере оно приводит к тому, что по крайней мере при одном 1 не выполняются рявеистввго г, = ... гм.