Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 43
Текст из файла (страница 43)
Если метод Дулиттла применялся к (6) то первые с)а строк и столбцов матриц А' и А4 будут такими же, как и в случае применения передового реаения к левой части уравнения АюВао= Са, (6) а первые да строк матриц С* и С булут такими же, как и в реаультате причеиепия передового решения к правой части 16). Таким образом, Ва АгиВэ = СаСт, где С = „С,/ . с-=("„). Можно было бы отметить, что из метода сокращения Дулиттла следует метод вычисления определителя. В 9 8.2.3 было показано. что результат передового решения удовлетворяет уравиепию РА= А'. Таким образоч,! Р(~ А(= )А'~. Так как определитель треугольной !!атриды равен произвелецию ее диагональных элементов, то ( Р! = 1 и ! А ( = ( А' , '= = И а*,'! Этот реаультат остается справедливым, если вме! ! сто матрицы А рассматривать любую положптельио определенную матрицу (с соответствующим видоизменением !О т.
Андерсон 290 ПРОВЕРКА ОБП1ПХ ЛННГИНЫХ ГНПОТГЗ 1Гл. в матрицы р). 11оэтому его можно использовать лля вычисления (МХя! и (МХ !. 8.7.2. Доверительные области. Мы рассмотрели критерии лля проверки гипотезы В1 = В1, тле В1 — звланпая матрицз. Обычным способом можно, исхоля из семейства критериев, получить ловсрительную облвсть для ВР Из прнвслеппой выше теории мы знаем, что с вероятностью 1 — а выборка тзкова, что )Агаев! ! Идя +.
(В1я — ВП (А 1 — А,зАзз Аз1) (Й1я — В1)' ~ ~~ (1Р, т, в (а). (7) Таким образом, если мы сделаем такое утверждение относительно доверительной области, что В, удовлетворяет условию ) Вгйя1 >ив,в „(а),(8) ( МВя + (В1я — В1) (А11 — А1ХАтз А11) (В1я — В1)' где (8) интерпретируется как неравенство относительно В, =- Вп то с вероятностью ! — а выборка будет такова. что это утвсржлепис булет верным. Т с о р е и а 8.7.!. Область (8) в пространстве В, явлнетсн доверительной областью для В, с коэффициента.и доверия 1 — а.
8.8. Проверка гипотезы о равенстве средних значений нормальных распределений с общей ковариациоиной матрицей В одномерном анализе хорошо известно, что многие гипотезы могут быть выражены в виде гипотез относительно коэффициентов регрессии. То жс самос справедливо и в соответствующих многомерных случаях. В качестве примера рзссмотрим вопрос о проверке гипотезы о том, что средние значения, скажем, 17 нормальных распрелелений с обшей ковариациош1ой матрицей равны между собой.
злй гипотгзА О РАВенстВе сРедних знАчений 291 Пусть у)1) — наблюдение над совокупностью М(р)1), Х), э= 1, ..., М,; 1= 1, ..., )). Нулевая гипотеза М) )211) 12)ч) (1) Чтобы свестн залачу к задачам, рассмотренным ранее в этой главе, положим Х=(.Ф Хэ... «„ХЧ 1... Х,„)= (у)1) )))1) ф)) у)21 )))ч) ) (2) где М= М,+ ... +М . Пусть Х=(«1 «2 ° ° ° «Ф, «я~а). «Й)— 1 ! ... 1 0 ... 0 0 0 ... 0 1 ... 0 (3) 00...00...0 1."11 М, 0 ...
О О М, ... О Ав ~~~~«« 0 0 ... М, М ММ2...ММ (б) б .',"Цу й)за= (;), ')и) ~и~'„э)2) . „~ч)', уге-1) ~ч; у)1)), (О) 'Аа а т. е. «,„= 1, если М, + ... +М) )< к~(М)+ ... + МО «,„=. 0 в остальных случаях (1= 1, ..., д — !) и « „=! (при всех э). Пусть В=(В, В2), где В,=(р,,— р...., р,,— р), ч' ''" ч- ч (4) В2 рч Тогда х, булет наблюдением над совокупностью М(В«„, Х), а нулевая гипотеза бул)РТ В, =О. Таким образом, мь) можеч использовать изложенную выше теорию для нахождения кри- тсоия для проверки этой гипотезы. Имеем пвовггкл овд!их,лингпнык гипотез !гл.
а Здесь Ага — — М и Ст=,~~у!„'~. Таким образом, Оа Йа = ~~~~ ~У~ ~ 11/М) = У ь» Ж2 = ~~р ~х х„' — уМ«' = ~~~ у~~)уй' — Муу' = са = Х (уи' — «що — у)'. и» Для Йа мы испольауем формулу М2л = ~~~х,х'„— ЯаАЙл =,Я х„х„— СА 'С. Пусть 1 0 ... 0 0 0 ! ...
0 О (8) 0 0 ... ! 0 — 1 -1...— 1 1 тогла 1 0...0 0 01...00 0 0 ... ! 0 1 1 ... 1 ! Таким образом, СА С =СР Р"'' А Р РС =СР (РАР) РС = Х у." Ц 0 ... 0 »)» и,., а » » 0 0 ... М ,~~ у!и —,«~~ у!и =,~~ М,у!ОУ", !10) Ъ1 где у(') = — ~ у(". Поэтому ())! 24 а ' (а(Х вЂ” ча, у(()уп)' ~~~~~ (т) у(()у(()' = а а —.апиу(й (11) Легко видеть, что в том случае, котла 18()) = ...
=р(8). Х является оценкой матрицы Х, Хя — средним взвешенным оценок Х, произведенных по отдельным выборкам. Если нулевая гипотеза верна, то ( МХ ~)'))(Х ) распределена как Ую ~ ) „, где п = М вЂ” (). Следовательно, при уровне значимости в область, при попадании в которую иы отвергаем гипотезу, определяется неравенством '~ < и... „(). (12) (Р(е ( Заметим, что )((Х. — ))) Х =,'~', я())у () й(уу (, а (~я~', уи)у)(()' аЧР~ )() у,()у(О ) — ч)1 )т( (уо) ) ( (() ) (13) Легко видеть, что, когда р = 1, этот критерий сводится к обычному гч-критерию ~ Р(((у (') — у)' в ) Р~ ) „(в). (14) а ~1Уа Приведем припер. Йапные заимствованы из резулыатов изучения Б а р н а р д о и 111 египетских черепов.
Четыре (=()) генеральные совокупности состоят из представителей следующих периодов: до династии фараонов ((= 1), с 6 до 12 династия (1 = 2), с 12 ло 13 династии (1 = 3) и линастия Птолемеев (1= 4). Четыре (= р) измерения (компоненты вектора у~й) представляют максимальную ширину. базиальвеолярную длину, высоту носа и базибрегматическую высоту. 8.8) ГнпотгзА о РАВенстВе бведяги( Йнлагйиии 293 294 пяоивяка озщнх линвннь>х гипотвз !гл, а Числа наблюдений таковы: М,=91, Мт=!62, Мз — 70, М,=75.
Данные представлены в следующем виде: г,,!» та ~<з> ~ач>) !33,582418 134,265432 !34,371429 135,306667 98,307692 96,462963 95,857143 95,040000 50,835165 51,148148 50,100000 52,093333 133,000000 134,882716 133,642857 131,466667 9661,997470 445,573301 1130,623900 2148,584210 445,57%01 9073,115027 1239,211990 2255,812722 1!30,623900 1239,211990 3938,320351 1271,>>54662 2148,584210 2255,812722 1271,054662 8741,508829 Иа этих даннь>х находим 9785,178098 214,197666 1217929248 2019,820216 214,197666 9559 460890 ! 131,7! 6372 2381,126040 121 7,929248 1131,716372 4088,731856 1133,473898 2019,82>>2!6 2381.126040 1133,473898 9382,242720 Отношение определителей равно ) Фтя 1 2,4269054 Х 10' У вЂ” — — 0,8214344. (18) ! >>>2 1 2,9544775 Х 1О' Здесь М=398, и=394, Р=4 и >7=4. Такял> образом, и = 393.
Так как и лостаточпо велико, то можно допустить. что — гл !и !7„ з зы распределена как ут с 12 степенями свободы (если нулевая гипотеза справедлива). В нашем примере — т >п У = 77,30. Поскольку 1е4-ная точка значимости у>>т-распределения равна 26,2, гипотеза рй> = рп> = = р!а> = рм> отвергается '). 8.9. Обобщенный дисперсионный анализ Возможно прямое обобщение одномерного дисперсионного анализа на случаИ векторных случайных величин, Это обобщение приводит к анализу сумм квадратов векторов ') Приведенные выше вычисления сделаны Барт лег том [8!.
озовшгнныи диспггсионныи анализ 295 зэ1 МУ! =р+Лг+«1, 1=1, ..., г;,/=1, ..., с, (1) с ограничениями Х Л! = Х «1=0' г-! ' !.! (2) дисперсия Гг) равна ет; величины Г!1 независимы и распределены нормально. Проверить, равны ли нулю действия столбцов, — это все равно, что проверить равенства «г = О, / = 1, ..., с.
Хорошо известно, что эту вадачу можно рассматривать как задачу регрессионного анализа, если ввести фиктивные фиксированные величины. Пусть лсо, О ы1 ан, гг = 1 =О, Й=(, й чь д й= /, А+ у. сов,!1=1 =О, Тогда (1) можно записать в следующем виде: М)О=Реев, О+ Х)'алло, О+ Х "авва.гу (5) а-1 ' «-1 (т. е. сумм вида ~Ч' х х'). Фактически это обобщение уже было рассмотрено в предшествующем параграфе для задач днсперсионного анализа, содержащих простую классификацию. В качестве другого примера рассмотрим таблицу с двумя входами. Допустим, что нас интересует вопрос о том, равны лн нулю воздедствия элементов столбца.
Мы сделаем обзор анализа для скалярных величин. а затем проведем анализ в случае векторных величии. Пусть Гг1 (! = 1, ..., г; у = 1, ..., с) — совокупность гс случаиных величин. Предположим, что ПРОВЕРКА ОБЩИХ ЛННГЙНЫХ ГИПОТЕЗ !ГЛ. Я д~ю. и ° ° «оо, и аю,и з!о,ы «оо, и ° зоо, ЗОП П ° ЗЕ~, ~г (б) яз.чяется вырожденной (например, строка 00 равна сумме строк !О, 20, ..., ГО), то нужно разработать регрессионную теорию.
Когда это делают, то обнаруживается, что критерий, указываемый регрессионной теорией, есть обычный Е'-критерий днсперснонного анализа. Пусть 1 чсч 1 жч 1 ъч — у/.= —,~~ уг/, У./= —,~~, у,./ (у) Г, / а = Х (1' — 1'/ — У. + У")' = ь/ = ~ 1';/ — с ~ Уи — г ~,', 1'./ + Гсу, А/ / Ь =г~(г'./ — Г..) =г~'г',/ — гсу„, / / !8) Тогла Ь'-статистика будет определяться формулой а с — ! о ( — !) (г — !) (9) Если верна пулевая гипотеза. то эта величина имеет Р-распределение с с — ! и (г — !)(с — !) степенями свободы. Отношение правдоподобия, требуемое для проверки гипотезы, равно гс/2-й степени величины а+Э 1+(с — 1)/[(г — 1)(с — 1)) Ь' ' (!0) Обратимся теперь к многомерному дисперсионному анализу.