Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 24
Текст из файла (страница 24)
Нспснтральное ут-распределение является обобщением центрального ут-распределения на случай, когда математические ожидания слагаемых отличны от нуля. Пусть р-мерный вектор У распределен й7(», 7). ьт — ортогональная матрнпз, элеиентами первой строки которой являются (гл. з Овоип1яннАЯ г'стАтистикА ТОГда У=АГУ раенредЕЛЕН !ч'(Х, У), ГдЕ (2) т= р' ч'ч Положим 1г= г' У=УХ= ~з 7!. Тогда 1:1 (см. $ 5 2,2) В' = ~! Г! имеет у -рзспределение с р — 1 степенями свои! 2 2 1-2 боды (задача 5 главы 7), а совместная плотность распределения вероятностей г.! и Ф' равна 1 - — !21-тр — =е 2 р' 2я 1 1 — 1р-П-1 -- ю те 2 е 1 — !р-и г[ (р 1)1 Совместная плотность распределения всроятпостей величин (г = В'+ 71 и Е1 получается посредством подстановки 2 тв = о — лз (определитель равен 1): 1 «-о (4) Совместная плотность (г и У = и!(р' ьг равна (пгг! = )го!ги) ! — !р-з! оЛ „г е! 1 о (б) 112 !/2221໠— ~! +21ч!р~ — !р-3! - — ~~ +21+!г) — гр-21сч т г, =Се тез е *=Се Авз т — ,(3) 24 .1 «-о где ! С ' = 22 1/яГ [ — (р — 1)~.
РАСПРЕДЕЛЕНИЕ ГьСТАТИСТИКИ 157 Допустимый интервал для я! при фиксированном о есть ( — 'г/со. 'у' о), а допустимый интервал для и есть ( — 1, !). Если рял (5) проинтегрировать почлепно по переменной и, то члены с нечетными а дадут в результате нуль как интегралы от нечетных функций. )(ля вычисления лругих инте— г 1 градов мы сделаем подстановку и = усе (ди = — де/ у' е) н, используя обь!чные свойства бета- и гамма-функций, получим ! ! (1 — иг)' игеди=2 / (! — и')' иггйи= -! о е)г 'Р 'е' г д е ГГ2 (Р— 1)~ Г(В+ — ) =ВГ2(р — 1), р+21 — ! .
(6) Г( — 'р+З) Такиц образоа!, плотность распределения вероятностей У равна / „ --,-!и+е! — Р-! -~ (т!)Еоя (~ 2) (2.;!)! ! 2г Ру а-,е Г(. -р+й) Это плотность нецентрального Хг-распределения с р степенями своболы и параметром тг. Т е о р е и а 5.4.1. Если р-мерный вектор У распределен /!/(ч, 1), то У = У'У имеет плотность распределения вероятностей (7), еде т == ')!сч'ч.
Пусть У имеет пецентральное )(г-распределение с р степенями свободы и параметром тг, а Ф' не зависит от У и имеет Хг-распределение с т степенями свободы. Найде! плотность распределения вероятностей величинь! Е =(У/р)/(Ф'/т), т. с. п тотность нецентрального Е-распределения с параметром т'. Совместная плотность У и В' равна произведению (7) на плотность В', которая равна ! ! ! 2 г Г (-т)твг е г --т ! г! ъ —,т-! — — !е Ь ) ОВОВН1ТН1ИАЯ Г'-СТАТИСТИКА (гл. 3 Совместная плотность Е и В'(до =рп1й/"/т) равна 1 е 2' — ю 11.~-Р/163) е Х 1) — И ТР2 ' 2 1Р~ ~1+2 В-е (22)!Г1 Р+Р~ Частная плотность распределения вероятностей, получаемая интегрированием (8) по .Тз от 0 до оо (см.
$ 4,2.2), равна (2в) Г(я+2-), /,' р+ Х,, Р. 2 р о (2Ф)! Г ~ — р+ Р) 1 ре ту еГ~ — т) Г ~ — (р+ т)+Р~ Х , . (9) — 1р+м1+ В (1+ Р//т) Т с о р е м а 5.4.2. Если У имеепс неиентральное у2-распределение с р степенями свободы и параметром 22, а не зависящая от У случайная величина 12' имеет у'-распределение с т степенями свободы, то Е=(У/р)/(Ф'/т) имеет плотность (1О). Если Т =/Т/(м — рв)Я (х — ре) построена по выборке объема /т/из совокупности /А/(12, Х), то величина (Т2/п) (Лà — р)/р имеет нецентральное р-распределение с р и /А/ — р степенями с1ободы и паРаметРом ЛГ(Р— Рв)'м (12 — (ье)=22. Из (1О) 'Используя формулу улвоения для гамма-функнии (2~) 1 = Т(2Д + 1) = 1' (р + — ) р (р + 1) 2 2/ )/ ан получаем плотность 1 (22/2)2 (РД/т)2 Г ~ — (р+т)+З) (10) 2 ) З(Г( — Р+ 21) (1+Ру/т) ~ 159 РАСПРЕДЕЛЕНИЕ ГАСТАТ1!СТИКИ ал1 следует, что плотность распределения вероятностей величины Т' равна 1 и 1 — Рез-1 е м «о (тг/2)4 [(14)7(Л4 1)[е г [ )у [ ЗД ( — ) Л ( Р)) а о '411'~ — Р+ 4) [1+ (14)7(лг П[е (.! 1) Тэнг [1] составил таблицы вероятностей принятия нулевой гипотезы (т.
е. вероятностей ошибки 11 рода) для различных значений те и доверительных уровней 0,05 и 0,01, Его значениЯ степеней свободы Л н 7е соотвстствУют нашим Р [1(1) 8[ и п — р+1 [2, 4(!)30, 60, се[, а параметр связан с нашим параметром т' соотношением (12) '=)' + ! ~ — )3(1) 8~.
Его таблицы точек значимости составлены ~() /11 12) д т' 7(т + 57 — 1). П р и м с р. Предположим, что р = 4, и — р+ 1 = 20. Мы хотим проверить нулевую гипотезу р =0 при 144-ног4 уровне значимости. Нам хотелось бы знать, с какой вероятностью мы принимаем нулевую гипотезу при в = 2,5 (т'= 31,25). Эта вероятность равна 0,227. Если мы считаем, что принять нулевую гипотезу при 744, р, и Х таких, что те=31,25, менее невыгодно, чем отвергнуть, если она верна, то может оказаться целесообразным использовать критерий так, как это предполагалось раньше. Однако, если ошибка первого рода примерно равна ошибке второго рода, то наиболее разумным кзжется желание иметь возможно меньшую вероятность ошибки 1! рода.
Так, если использовать 544-ный уровень значимости, то вероятность ошибки П рода (для в= 2,5) будет равна лишь 0,043. Эмма Л е м е р [! [ Составила таблицу значений в для данных уровня значимости и вероятности ошибок П рода. Ее таблицы могут быть испол1,зованы для нахождения таких значений т', при которых вероятность принять нулевую гипотеау при р чь 0 достаточно мала. Например, если мы на основе выборки для данных р и Х хотим отвергнуть нулевую гипотезу р=О, то мы должны выбрать М так, чтобы 1гл в ововшсннля г-статистика велич~на Ир.'Х р, = -.' была достаточно большой, При этом, -! конечно, возникают трудности, состояшие в том, что обычно мы не знаем точно значении )ь и Х 1а стало быть, н тя).
по которым мы хотим получить определенное значение вероятности отвергнуть гипотезу, Распределение Те для случая, когда нулевая гипотеза неверна. получилн раанычи методами Хсу [!), а также Р. Бозе и С. Рой )1). б.б Некоторые оптимальные свойства критерия Т' В этом параграфе мы покажем, что в определенном классе критериев критерий Та является наилучшим, и наметим краткое доказательство этого. Пусть на основе М наблюдений хн ..., Хы над совокупностью И1)ь, Х) нужно проверить гипотезу р = О. Сначала мы рассмотрим класс критериев, основанных на статистиках А = ,'~,(х. — х)(х„ — х)' и х, которые являются инварнангпыми относительно преобразований А' = САС' н х' = Сх, где С в невырождснная матрица. Преобразование х„ *= Сх не изменяет инварианчности задачи; т. е. а терминах х„ *мы проверяем гипотезу Мх, =О прн условии, что х,', ..., х,'„ — Ф наблюдений над многомерной нормальной генеральной совокупностью.
Представляется цслесообразныч потребовать, чтобы решение было также инвврнантным относительно этих преобразований. Это значит, что следует искать такую критическую область, которая не изменяется при нсвырождспном линейном преобразовании координат (т. е. область, не меняющуюся при переходе к лругой системе координат). Т с о р с м а 5.5.1. Из всех критериев для провергги гипотезы )ь =О по выборке хн ..., Хы из совокупности М 1р, Х), оеноеиниых на статистиках х и А = = ~~~~ ~(х, — х) (х„— х)', инеариантных относительно пре. образоеаяий х'= Сх, А* = САС' 1С вЂ” невыролсденная .иат'- рииа), критерий Та является равномерно наиболее мощным.
Доказательство. Во-первых, как мы видели ай 5.2.1, любой критерий, основанный на Т'-статистике, является инвариантным. Во-вторых, этот критерий является единственной нскотог ыв свойства г.кннтвгня 161 инвариантной функцией, так кзк из инвариантностн С(х, А) следует, что /(х, А) = /(х'. 1), где только первая коорди- Г-, 1- пата вектора х' отлична от нуля и равна 1'х'А х, (Существует матрица С такая, что Сх =х" и САС'=/.) Таким образом, /(х, А) зависит только от х'А х.
Поэтому инвариантный критерий до.чжсн быть основан ца х'А х. В-треть— 1 нх, мы можем применить (Л с и а и н 111) фундаментальную лемму Неймана — Пирсона к распределению Т' (см. (11), й' 5А), чтобы получить равномерно наиболсс лгощцый критерий, основанный на Тг, при простой конкурирующей гипотезе -. = /ьгр Х р. Наиболсс мощный критерий для проверки гипо- 2 ' — 1 тсзы 12 = О основзн на отношении (11) к той жс формуле (11) при т'= О. Этот критерий состоит в том, что 1 1 е+«-1 г' '" с<е ' («2/2)' (С«/и) (1+С«/и) Г ( — (ит-1)+ ) «=О «1 г ('- р+.) 1 1 р-1 --1« Н г! (С«/и) (1+ С«/и) Г ~ — (и+ 1)) ,(1 ) Г ( — р) 1, «ь (««/2)" Г ~ — (и+1)+«~ 1 1+С«и) ' (1) Г( (и+1)) .