Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 48
Текст из файла (страница 48)
(6) (4) Если 47= 2. то последугогцие члены разложения можно получить, используя результаты 9 8.6. Если рг —— 1, то имеем 1 2р+ 11 7' = — р (р — 1), и = М вЂ”вЂ” 2 б Т = — (2р — 2р — 13), Р(Р 1) 2 з 288 Тз 3240 (Р— 2) (2р — 1) (Р + 1); (7) Р(Р— П другие члены получены Б о к с о м (1!. Если р1=2(р=247), то 13 7=29(д — 1), и =57-- 44+ 0 Т, = — 2 — (Ь7 — 847 — '7) 4 (47 — 1) 7 (8) Второй ооон - лы 15 71/б !5 691'6 15 6776 16 73/б — 0,0007 — 0,0021 — 0,0043 — 0,0036 11/24 15!6 235748 0,0033 0,0142 0,0303 0,033 ! 12,592 !8,307 24,996 б 10 15 В таблице 12 указан порячок приближения выражения (6) прп р,=1. Во всех случаях о выбирается таким образом.
что первыи член равен 0,95. Таблица 12 328 пРОВГРКА ГипОтГзы О нГзхвисимости [ГЛ 9 9.6. Пример В настоящем примере используются материалы исследования о затратах времени в промышленности (А б р у ц ц н ]1] ). Исследовалось время, затрачиваемое разными работниками на швейной фабрике при выполнении различных элементов операции глаженья одежды. Всю операцию глаженья можно разделить на следующие шесть элементов: !. Одежда размещается на гладильной доске. 2. Разглаживаются короткие швы. 3.
Одежда перекладывается на гладильной доске. 4. Разглаживаются длинные швы на три четверти. 5. Разглаживаются остатки длинных швов. 6. Одежду вешают на вешалку. В этом случае х, представляет собой вектор измерений над индивидуумоы а. Компонента х[, — это время.
затраченное на выполнение 1-го элемента операции. М = 76. Данные (время в секундах) обработаны, получены выборочные вектор среднего значения и ковариацнонная матрица 9,47 25,58 13,25 31,44 27,29 8,80 2,57 0,85 1,55 1,79 1,33 0,42 0,85 37,00 3,34 13,47 7,59 0,52 1,58 3,34 8,44 5,77 2,00 0,50 1,79 13,47 5,77 34,01 10,50 1,77 1,33 7,59 2,00 10,50 23,01 3,43 0,42 0,52 0,50 1,77 3,43 4,59 Выборочные стандартные отклонения равны (1,604; 6,041; 2,903; 5,632; 4,796; 2,141). Выборочная корреляционная я.п случАИ ЛВух мнОжестВ случАйных Величин 329 матрица имеет вид ( 1,000 0,088 0,334 0,191 1,000 0,186 0,384 0,186 1,000 0,343 0,384 0,343 1,000 0,262 0,144 0,375 0,040 0,080 О,! 42 0,173 0,123 0,262 0,040 0,144 0,080 0,375 0,142 1,000 0,334 0,334 1,000 0,088 0,334 0,191 0,173 0,123 9.7.
Случай двух множеств случайных величин В случае двух множеств случайных величин (о=2) случайный вектор Х, вектор результатов наблюдений л„, вектор средних значений р и ковариационная матрица Х разбиваются на части следующим обрззом: Для исследователей представляет интерес проверка гипотезы о взаимной независимости шести случайных величин. Часто при изучении затрат времени предлагается новая операция, в которой элементы комбинируются иным способом. В новой операции некоторые элементы могут повторяться по нескольку раз, а некоторые могут быть выброшены.
Если оказываются независимычи величины, обозначающие время, затрачиваемое на различные элементы операции, то естественно считать, что и в новой операции они останутся неаависимыми. Тогда распределение затрат времени на новую операцию можно будет оценить, пользуясь средними значениями и дисперсиями, вычисленными для остальных элементов. В этой задаче отношение правдоподобия У равно У = ))7( =0,472. Так как объем выборки велик, то можно пользоваться теорией асимптотических разложений: т = 433/6, у'=15 и — гл1пУ=54,!. Так как точка значимости для й цраспределения с 15 степенял~и свободы равна 30,6 при уровне значимости 0,01, результат оказывается значимым.
Мы отвергаем гипотезу о независимости: значения затрат времени на различные Эглементы операции нельзя считать независимыми. ззо ПРОВЕРКА ГИПОТЕЗЫ О ИГЗАВИСИМОСТИ 1Гл э Нулевая гипотеза о независимости предполагает, что Е!г-=б, т. е. что Е имеет вид (2) Отношение правлоподобия для проверки этой гипотезы равно 1А! 1 А!! ! ° 1АЫ1 В 9 9.4.2 было показано, что когда справедлива нулевая гипотеза, распределение этого отношения правдоподобия совпадает с распределением Ур, р, !ч ! р, отношения правдоподобия для проверки гипотезы о коэффипиентах регрессии (глава 8). Исследуем вопрос о том, каким образом связаны проверка гипотезы о независимости двух множеств случайных величин и проверка гипотезы о том, что регрессия одного иножества на другое равна нулю, !!> Условное распределение Х! при условии Х~! = х!' представляет собой 1ч(р!и+ В(х„'! — р,г), Еп,)=АГ1В(х!г! — х!'!) -, ч, Ен,), Где В=Е!ЗЕЙ Е!!.г=Е ! — ХПЕжХм, и ч='-рп + -~ В(х!'! — р!'!) Пусть Х„" = Хи!, г, "= ~(х!," — х"') 1), В*=(Вч) и Е'=Хили Тогда условное распределение Х„' представляет собой М(В*г', Е*).
Это распределение гакого же вида, как то, которое было изучено в главе 8. НУлеваЯ гипотеза о том, что ХИ=О, эквивалентна нУ- левой гипотезе В=О. В главе 8 доказано, что при фиксированных х!'! критерий для проверки этой гипотезы (оспо. ванный на отношении правдоподобия) имеет вид ~ ~ (х„' — В'г„') (х„" — и'„г„')'1 ! Х('. — ВЫПВН.: — В'..."")! где * (1! Вг =Ч Х*=Х ° Матрица в знаменателе У равна (6) Матрица в числителе равна ~ )ха .е 412А22 (х» х )] Х Х (х~'~ — х "— А)2Агг (х,'" — х' ')( = Ан — А!2Атг'Аг!.
Следовательно. ~ Ан — А)гА22'Аг, ~ ~ А ~ ) А(! ! ! А)1) ° ! Агг ~ (8) что в точности совпадает с )г. Выясним, почему распределение У = 2' при условии, что верна нулевая гипотеза, у" зависит от того, фиксированы Х( 12) или нет. В главе 8 бы показано, что, когда зерна нулевая гипотеза, распределение У аависит только от р, (г! и М вЂ” (уг и не аависнт от а,. Таким образом, условное распределение (Г при Х, = х'„ не зависит от хх, ! совместное распределение У 12) г( .22).
и Х(2) является проиаведением распределения У и распределения Х( ), в частное распределение (г совпадает с этим услов- (2) ным распределением. Это доказывает, что распределение р (прн условии, что верна нулевая гипотеза) не зависит от того, являются ли Х(2' фиксированными или они ииеют какое-нибудь распределение (нормальное или нет). Обобшив этот результат, покажем, что для () > '2 распределение У при условии, что верна нулевая гипотеза 92) СЛУЧЛй ДВУХ МНОЖЕСТВ СЛУг!ЛЙНЫХ ВГЛЙЧИН 882 332 ПРОВЕРКА ГИПОТЕЗЫ О НЕЗАВИСИМОСТИ (гч з О НЕЗЗВИСИэЩСтн, НЕ ЗаВИСИт От РаСПРЕдЕЛЕНИЯ ОДНОГО НО- жества случайных величин, например Х(еэ.
Имеем Аез ° ° .4«а К= ' Азз ... 4эе ~Аэ(~ ~ Азз! А, ...Аее Аеэ ° .. Аее Ае,, А Х... 1А ~ ~ ! — У(К2... Уе 1. 19) Когда верна нулевая гипотеза, распределение г'(, согласно ранее доказанному, не зависит от распределения Х,' ',..., Х„'еэ. (2) Рассужлая таким же образом, находим, что распределение 1'~ не зависит от распределения Хы ~, ..., Х,'е'.
Следовательно, (lэ () распределение )г(, ..., У , не зависит от распределения Х(е . 'Теорема 9.7.1. Распределение эг при условии, что верна нулевая гипотеза о независимости, совпадает с распределением, приведенным в этол главе, если э7 — 1 множеств имеют совместное нормальное распределение, даже когда одно множество распределено не по нормальному закону. Возвратимся к случаю (7=2. Некоторый интерес прелставляет обобщение понятия коэффициента корреляции, характеризующего вззнмосзязь двух случайных величин,— понятие «вектора коэффициентов норреляции», характеризующее взаимосвязь двух множеств случайных величин. Одно такое обобщение основывается на определителях (таким же путем, как получается обобщенная дисперсия при обобщении понятия дисперсии).
В случае двух скалярных случайных величин Х, и Хз «коэффициент чужеродности» будет (1О) О', где а),2 = М (Х, — рха) (11) представляет собой дисперсию Х, относительно ее регрессии на Хг, когда МХ,=МХ2 —— О (12) М(Х, Ха)=8Х2 (13) )г) В случае двух векторов Х ' и Х) регрессионная матрица равна В = ХиХгг (14) регрессии на Х~~ и обобщенная дисперсия Х' ' относительно 1» будет ~ М ((Х"1 — ВХ"') (Х㻠— ВХ"))') ~ = = ! Х» — ХНХ!г Х211 Так как обобщенная дисперсия Х' ' равна 111 ! МХ)')Хп)' ~ = ! Хн !, — (15,' )Е! !Е22! ' (16) то векторный коэффициент чужеродности равен ~ ЕН Е12Е22'Е21 ~ ! Е ! !Е ! !Е11!' Е22! Выборочным эквивалентом (17) является просто Ъ'.
Квадрат коэффициента корреляции между двумя скаля- рами Х, и Хэ можно заХать в виде 22 (Ы (18) ! где аа(Ь) — дисперсия функции регрессии. Обобщенная дисперсия ВХ)г' равна ~МВХ (ВХ ) )=~ Х19Х22 Хм ~. (19) Следовательно, квадрат вектора коэффициента корреляции равен о е„ )Е Е Е ) )т (90) ! Е» ! ) Ен ! ' ! Е22 ! 9.7) СЛУЧАЙ ДВУХ МНОЖЕСТВ СЛУЧАЙНЫХ ВЕЛИЧИН 333 пРОВКРкл ГипОтезы О незлвисимости (гл. э При р,= рг [20) переходит в [Л)1[ [Ви( [В)П (21) Конечно, предложенная мера связи множеств величин не является вполне достаточной характеристикой, так как отбрасывается информация о двух множествах; другими словами, ш (г) отношение между Х и Х' ' невоз) ожно характеризовать одним числом. В главе 11 этот вопрос будет исследован более глубоко.
Будет установлено, что «канонические корреляции» выражают зависимость между Х' ' и Х( незави(') сл симо от коордип а гн ых систем Х ' и Х( '. (0 (г) Другие способы проверки независимости множеств случайных величин основываются на методах, изложенных в главе В. Гипотезу о том, что подвекторы Х'", ..., Х("' взаимно независимы, можно рассматривать как гипотезу о том, что Х' ' не зависит от Х'), ..., Х~~~, что Х' не зависит (1) (я) (Ф (т> от Хи),..., Хм~ и т. д. нли, другими словами, нак гипотеау о том, что регрессия Х' на Х' ), ..., Хм' равна нулю н т. д.
ЛИТЕРАТУРА Абруцци [Ц; Бокс [Ц; В альп и Брукнер [Ц; Г амб е л и Л и т т а у е р [Ц; Г и р )п и к [41; Д э й л и [Ц; К е л л и [2[; Н а р а и н [4[; У и л к с [6[, [10[, стр. 242 — 245. ЗАДАЧИ 1,0000 0,4249 — 0,0552 — 0,0031 0,1927 0,4249 1,0000 — 0,0416 0,0495 0,0687 — 0,0552 — 0,0416 1,0000 0,7474 0,1691 — 0,0031 0,0495 0.7474 1,0000 0,2653 0,1927 0.0687 0,1691 0,2653 1,0000 ПУсть х(1) =[хи ха) и хй) =[хм х„х,). ПРовеРить гипотеаУ 1. Пусть х,— скорость арифметических вычислений, х,— способности к арифметике, х) — интерес к интеллектуальной деятельности, х( — интерес к общественной леятельности, х, — деловая активность. Келли 1[Ц, стр. 114) паблюлал следующиекорреляции межлу последовательностями испытаний иал 109 учениками по зтнм признакам: задачи о том, что х" ' ие зависит от х", полок<ив уровень значимости .4И равным !%.