Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 23
Текст из файла (страница 23)
е. Ть Мг Рр м (а) (М вЂ” 1) р Выбор уровня значимости может зависеть от мощности критерия. Этот вопрос иы рассмотрим в 9 5,4. Тт-статистика просто вычисляется по выборке. Положим А '(х — р„)=Ь. (3) Этот вектор является решением уравнения АЬ =(х — р„). (4) Если вектор Ь получен иа уравнения (4), то Т' М 1 — И(» ро) Ь. (5) Таким образом, нет нужды вычислять А ' или Я '.
В самом деле, если для решения уравнения (4) испольэовать метод Дулиттла (()оо1!Ше), то нужно лишь следовать за передовым Следствие. 5.2.1. Пусть хо ..,, х,д — выборка из совокупности М(р„Х) и Т = И(х — ре) 3 (х — рь). Тогда величина (Та1(И вЂ” 1)1 1(И р)/р) имеет нецеитральиое Р-распределение с р и И вЂ” р степенями свободы и параметром М(р — ро) Е ((ь рь) Если 1ь = 1ьо то это Р-распределеиие является центральным. Приведенный выше вывод Те-распределения принадлежит Баукеру (сообщено в частном порядке). Плотность нецентрального Р-распределения и таблицы распределения рассматриваются в 9 5.4, !Гл в овозп1яниАя ж стАтистикА решением. В 4 8.2 показано, что передовое решение получается посредством умножения (4) слепа сначала на матрицу р (такую, что рА является треугольной матрицей), ° ! а аатем на матрицу Р , где Р— диагональная матрица с диагональными элементами, равными соответствующим диагональны« элементам РА.
В правой частн прн этом полу-! чаетсЯ сначала Р(х — Ре), а затем Р Р(» — Рв). ПоэтомУ (тт(х — р,)1' (ГР ')ч(х — р,)) = =(х — рз) г'Р в'(х — ро) =(» ро) '4 (» ре) так как с Р гт= А ', Летали этой процедуры н доказательство приведены в $ 8.2. Интересно отметить, что 7«/(7«' — 1) является ненулевым корнем уравнения ) М(х — рв)(х — р )' — ЛА( = О, (6) Л е и м а 5.3.!. Если ч — р-мерный вектор,  — нввыролсденная матрииа порядка (р )( р), то ч В 'ч является ненулевым корнем уравнения !!чч' — ЛВ ! = О.
(7) Доказательство. Ненулевой корень уравнения (7), скажем Л! связан с характеристическим вектором р уравнением чч'р = Л!Вр. (8) Поскольку А, ~ О, то ч'ф + О. Умножая (8) слева па ч В ', получаем (ч В '«) (ч р) = )ч (ч р), (9) что и доказывает лемму. В случае, рассмотренном выше, ч = У М (х — р„) н В = А. 6.3.2. Доверительная область для вектора среднего значения.
Если р есть среднее значение распределения М(р, Х), то, как мы знаем, вероятность получить выборку обьема !ч' со средним х н выборочной ковариацпонной матрнцей Ю такую, что Ф(х р) $ (х р) ( Твт(и) (1О) 151 пяимсисиия г-статистики аз! равна 1 — а.
Таким образом, если для конкретной выборки произвести вычисления по формуле (10), то утверждение относительно р, выраженное формулой (10), будет справедливо с доверием 1 — з. Совокупность точек, координаты которых удовлетворяют неравенству М (» пз) о (» пз) ~( га(з) (1 1) обрззуст в р-мерном пространстве внутренность и границу эллипсоида с центром в точке », размеры и форма которого зависят от $ и а (рис.
3). Мы утвсрждзем, что р лежит внутри этого эллипсопдз. Эллипсоид (1!) является мр случайным, так как выборка случайна. 6.3.3. Проблема двух выборок. С другим случаем применения Т'-статистики мы сталкиваемся при проверке гипотезы о том, что среднее зна- Рис. 8 ченнс одной нормальной генеральной совокупности рвано среднему значению другой нормальной генеральной совокупности при условии, что ковариационныс матрицы этих совокупностей рваны, по неизвестны. Предположим, чтоу!'>, ...,уи! — выборка из сово- 1' ''" м! купности М(рн>, Х), 1=1, 2.
Мы хотим проверить нулевую гипотезу (ь! 0=рп'. уп! распределен М(рп>, (!/М,)Х). Следовательно, при условии, что нулевая гипотеза справедлива, )ГМ,Мз/(М, -)- Мз) ()ки —,)Км) РаспРедслсн М(0, Х). Положин л; Ф,+Мз — 2 ~ЧИЖ ) )Ж У ) + «=1 Ф1 -'-Х(ли — У"цги — У"т) (~ь «-.! Фзэм1-2 Тогда (М, + Мз — 2) 3 будет распределена, как ~~'„', У,Е„ а 1 где У„распределен М(0, Х). Таким образом.
овопгценнля тьстлтистикл 152 !Гл а распределена как Та с 57, + И, — 2 степенями свободьь Критическая область для уровня значимости п определяется неравенством (ЛГ, + ЛГт — 2) Р 7 )~ )Ч ! Н вЂ” 1-Ер,н,.н,-р-~ (а) 2 Р Мы можем, очевидно, на основе Тт-статистики построить доверительную облзсть для ф'! — !ьп!. Рассмотрим пример, заимствованный из работы Ф иш е р а (5!. Пусть х, — длина чашслистика, ха — его ширина, ха — длина лепестка, хч — его ширина. Было произведено 50 наблюдений над совокупностью 1г(з чегзгсо!ог (1) и 50 наблюдений над совокупностью !г!з ас!оза (2). Полученные дзнныс могут быть представлены в следующем виде (в сантиметрах): 5,936 2. 770 хгп = 4,260 (! 4) 1,326 5,006 3,428 1,462 (15) 0,246 19,! 434 9.0356 9,7634 3,2394 9,0356 11,8658 4,6232 2,4746 988 .= 9,7634 4,6232 12,2978 3,8794 3,2394 2,4746 3,8794 2,4604 Величина 7т)98 равна 26,334, а 7т/98 Х 95/4 = 625,5.
Эта величина является высоко значимой (по сравнению с Е'-точкой для 4 и 95 степеней свободы). 5.8.4. Проблема д выборок. После рассмотрения приведенного выше примера Фишер производит третью выборку из генеральной совокупности, ковариационная матрица которой предполагается такой же, как и ковариационные матрицы первых двух генеральных совокупностей.
Он производит аналогичные 50 наблюдений над 1г!з ч!гп!п!са. Имеются ПРИ МЕ ИЕ Н И Я Г!. СТАТИ СТИ К И 153 а.з1 теор е тп чес к ие основания считать генетические структуры этих трех видов такими, что некто р ы среди и х ан а че и и$', трех генераль н ы х совокупностей удовлетворяют условию Зр!!! = — р!а!+ 2рй1, (17) где р!з! — вектор среднего значения третьей генеральной совокупности, Это частный случай следующей общей проблемы. Пусть («!11~ (в=!, ..., М,; 1=1, ..., 1)) — выборки нз совокупностей, распределенных соответственно И(р!1!. Х) (1=1, .... !у), Проверим гипотсау Н: ~ 1!рн1=6 (! 8) где р1, ..., 'р' — данные скалярные величины, (а — данный вектор.
Величйна Т' равна Те=с~ ~- ~,«!1! — ~р) о (~л.'. рг«'1! — р, (1н) ',1=! / где (20) 121) 1 вч с Н Дгг' (22) 1=! Эта величина Тэ имест Т'-распределение с ~~ М1 — д степе! .! няни свободы. Фактически в своем примере Фишер допускает, что ковзриационпые матриць! трех генеральных совокупностей могут бь!ть разными. Поэтому он использует метод, описанный в э 5.6. 6.3.6.
Проблема симметрии. Рассмотрим вопрос о проверке гипотезы Н: ич — -р! — —... =р по выборке Р «и .... «А1, произведенной из совокупности Н(р,Х), где ововгцаниля га-стать!от!!КА !Гл ! 154 р'=(рн ..., р 1, Пусть С вЂ” любая (р — 1) Х р ранга р — 1 такая, что Са =О. матрица порядка (23) где а'=(1, ..., 1).
Тогда у„=Сх, (с=!, .... Ж), (24) имеет среднее аначенис Ср и ковариациопную матрицу СХС'. Гипотеза Н состоит в том, что Ср=О. Статистика, которую нужно использовать, равна т' = Лгу'8-'у, (25) где !т — 1 ъ! у=~ т У„=Сх. «" 1 126) и 1 8= — (У вЂ” У)(У.— У) = дà — 1 «аи «=! ж 1 = — С у (х„— х)(х„— х)' С'. (27) а -.! у, = 1«' — Š— %'+ 5, Ус=8 уз — — ?г7 — 5.
(28) Выло произведено 28 наблюдений. Эта статистика имеет 7Я-распределецне с !т' — 1 степенями свободы для (р — 1)-мерного распределения. Она является инвариантной относительно любого линейного преобразования в (р — 1)-мерном пространстве, ортогональном вектору е.
Следовательно, эта статистика нс зависит от выбора С. Пример такого рола приводит К. Р. Р а о !71. Пусть И вЂ” количество пробки на северной стороне пробкового дерева; Е, о и %' определяются знзлогично. Множество этих четырех величин, соответствуюцгих одному дереву, рассматривается как наблюдение над четырехмерной нормально распределенной совокупностью. Вопрос ставится так: одинаковое ли количество пробки имеет пробковое дерево с каждой стороны? Сделаем преобразование: Расппсдглгние Р-стлтистики Вектор среднего значения равен у = — 4,50 (29) ковариационная матрина для у равна 128,72 61,41 — 21,02' $ = 61,4! 56,93 — 28,30 — 21,02 — 28,30 63,53 (30) Величина 7"/(И вЂ” 1) равна 0,768.
Статистику 0,768 Х 2573= = 6,402 сравнивают с точкоп значимости Р-распределения с 3 и 25 стспсняин свободы. Эта величина является значимой при 1е4-ном уровне значимости. 5.4. Распределение Т'-статистики при наличии конкурирующих гипотез; функция мощности ж »и= у„—,„ В 9 5.2.2 мы показали, что (7"фп)(й7 — р)/р имеет не- центральное Р-распределение, В этом параграфе мы рассмотрим вопросы, касах>шнсся непентральных ут- и р-распределен..й, табулировання и применении последнего распределения к залачам, связанным с Т'-статистикой, Нензральное у~распределение сеть распрсделенис суммы квадратов независимых (скалярных) нормально распределенных случаиных величин с математическим ожиданием 0 и дисперсией 1.