Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 15
Текст из файла (страница 15)
1 а((1 — Р') а«а2« алаи (! — Р2) 2")Ги Г ( — и) Г ~ — (и — 1)~ " Х 1 ~ 2 (и + а)~ 2«+«а) «а2 "(1 — р / 1 1 — л — (и -3) со « (! — Р') (1 — '*) Х (2Р') )ч11(„+а)1, (33) ) .Г( — л) Г! — (и — !)~ «3 Константу можно видоизменить, используя формулу удвоения Г(л) Г(г+ — ) =')гиГ(2г)/22« '. Теорема 4.2.2. Коэффициент корреляции выборки объема И из двумерной нормальной совокупности с коэффицивнто,и корреляции р распределен с плотностью 1 1 — л — (л -3) со — )ч) — (и + а)~, (34) (и — 2)! и .аы а! ! 2 «О вдв п=М вЂ” 1. распределение величины г впервые было получено Ф ишером (1].
Им же предложена другая форма этой плотности 1 1 — л — (л-3) (1 — Р')2 (! — г')2 с(и ' )соз 1( — х) )1 1 и 1[ - — ~~ ° (38) и (и — 2)! Д"- [ ) 1 —.* 1~„.„1 КОтсрая ПОЛуЧаЕтСя Из (28) ЗаМЕИОй ац На из-а И а22 Па иеа. Х о те л л н н г (9) провел исчерпывающее исследование распределения г. Он предложил следующую форму плотности, которая получается из (28) с помощью приведенного т. Алдерсал 98 вывооочныв коэеенциянты корриляции !гл.е выше преобразования: ! 1 и — ! Г(л) , (1 — р')' (1-г')' Х е т о -Ы-з1 г(+!) 1 г1 1 . 1 . 1+рг1 Х(1 — рг) з à — — и+— (2' 2' 2' 2 /' (36) где Пусть конкурирующая гипотеза состоит в том, что р) ро.
Тогда мы отвергаем гипотезу Н, если выборочный коэффициент корреляции больше го, где г„выбирается так, чтобы ! — Г(г„) М, р„) равнялось уровню значимости к, В случае, когда конкурирующая гипотеза заключается в том, что р ( оо, мы отвергаем гипотезу Н, если выборочный коэффициент корреляции меньше г„', где г„' выбирается из условия Г(го') М, р )=к. Если конкурирующая гипотеза состоит в том, что р чь о„, то гипотеза Н отвергается, если г попадает в одну из областей г) г, и г(г,', где г, и г,' ') р = 0(.1),9 означает, что р = 0; 0,1; 0,2; ...; 0,9. Г( Ь.. ) у г(о+И Г(ь+)) г(с) хУ 37) г(л) г(ь) г(с+В т о — гипергеометрическая функция.
Ряд в (36) схолится бы- стрее, чем ряд в (34). Хотеллииг рассмотрел методы инте- грирования плотности, а также вычислил моменты г. Функция распределения величины г, Р ) г ( г') = Г(г*) М, о), (38) табулироваиа Дэвид [2) для') р=0(,1) 9, М=З(1)25, 50, 100, 200, 400 и г"= — 1(,05)1. (То, что мы обозна- чаем буквой М, Лазил обозначает буквой и.) Из (34) ясно, что Г(г*) М, р) = ! — Г( — г') М, — р), так как плотность распределения величии г.
р равна плотности распределения величин — г, — р. Эти таблицы мохо1о использовать во многих статистических процедурах. Во-первых, рассмотрим проблему использования выборки для проверки гипотезы Н:о=р. (39) ат! кОэФФициент кОРРеляцни двумеРной ВывОРки 99 выбираются так, чтобы [! — Р(г, [7ч', р„)~+ Р(г,'[4ч', рв) = я. Дэвид предложила выбирать г, и г', из условия 1 — Р(г,!4т7, рв) = Р(г', ( М, рс) = — к. Она показала [1[, что ! для М ) !О, [р[ ( 0,8 эта критическая область близка к области несмещенного критерия для проверки гипотезы Н, т. е.
критерия, функция мощности которого имеет минимум в точке Вг Следует указать, что любой критерий, основанный на выборочном коэффициенте корреляции г. является инаариантным относительно преобразований х',„ = с,х,„+ г[, [к = 1, ..., !ч'; ! = 1, 2, с, ) О), причем г является единственным инвариантом достаточных статистик [задача 19). рассмотренная выше методика для проверки гипотезы Н: р = р„прн конкурирующей гипотезе р ) рв описывает равномерно наиболее мощный критерий из класса всех инвариантных критериев [см. задачи 29, 30 и 31).
Пример. Предположим, что требуется проверить гипотезу р = 0,5, используя 5Я -ный уровень значимости, по выборке обьема !5. Конкурирующая гипотеза состоит в том, что рчь 0,5. По таблицач Дэвид получа м [интерполированием) Р(0,027[ 15; 0,5) = 0,025 и Р!0,805[0,15; 0,5) =- =0,975. Следовательно, мы отвергаем гипотезу р=0,5, если выборочный коэффициент корреляции г меньше чем 0,027 или больше чем 0,805. Во-вторых, мы можем использовать таблицы Дэвид для вычисления функции мощности для критерия проверки корреляции. Если область значений г, при которых гипотеза Н отвергается. определяется неравенствами г ) г, н г ( г,, то мощность критерия является функцией истинного коэффициента корреляции р, [! — Р(г, ~ М, р)[+ [Р(г, '~ М, о)[; она равна вероятности отвергнуть нулевую гипотезу, если коэффициент корреляции генеральной совокупности равен р.
В качестве примера найдем функцию мощности критерйя для проверки гипотезы р = О, рассмотренного в предшествующем параграфе. Область значений г !односторонняя), при которых гипотеза отвергзется, определяется неравенством г) 0,5494 при 5',4-ноч уровне значимости. Вероятности отвергнуть гипотезу приведены в табл. 3. График функции мощности приведен на рис. 5. 100 ВыБОРОчные кОэФФициенты кОРРеляции [Гл. ч Таблица 3 Всронтиосто Втронтиосто ! — 1,0 — 0,8 — 0,6 — 0,4 — 0,2 0,0500 0,1376 0,3215 0,6235 0,9279 1,0000 0,0000 0,0004 0,0032 0,0147 0,0 0,2 0,4 0,6 0,8 1',О \ В-третьих, вычисления 1(звид дают возможность получить доверительные интервалы лля р.
При заданном 57 величина г' (определяющая точку значимости) является одной Рис. 5. функцией р, скажем Л(р), а г,— другой функцией р, скажем уз(р), так что (Л(р) < <.уя(р)!Й— (40) Ясно, что если г, и г, 'выбираются из условия 1 — г'(г, ~ М, р)= 1 = — а=г'(г,'(М, Р), то 7,(Р) и Уз(Р) ЯвлЯютсЯ монотонно возрастающими функциями р. Если функция р =)', '(г) является обратной к функции г=Л(р) (1=1, 2), то неравенство Д,(р) < г эквивалентно' ) неравенству р < 71 (г), ') точка (гс (Р), Р) на пеРвой кРивой находитса левее точки (г, Р), а точка ~г, г', '(г)) — выше точки (г, р). дт) коэээициинт коэвпляции двхмвэноп вывозки 101 а г < У (р) эквивалентно у '(г) <р. Таким образом, (40) можно переписать в виде Р ! Г'-'(г) < р < У, '(г)~Р~ =1 — .
Это равенство указывает, что вероятность получения такой выборки, чтобы интервал (г" '(г), г, '(г)) содержал параметр р, равна 1 — а. Поэтому этот интервал является доверительным интервалом для р с коэффициентом доверия 1 — а. Для фиксированных Ж и а кривые г = Л (р) и г = ут(р) выглядят так, как показано на рис, 6.
При проверке гипотезы Рис. б. р = ре пересечение прямой р = ре с обеими кривыми дает точки значимости г, и г,'. При построении доверительного интервала для р по выборочному коэффицкенту корреляции г* мы находим значения у-'(г*) и у, '(г') как точки пересечения прямой г=г' с двуми кривыми. Дзвид приводит эти кривые при и=0,1; 0,05; 0,02 и 0,01 для разных значений М. Одно. сторонние доверительные интервалы могут быть получены использованием лишь одного из написанных выше неравенств.
Для нахождения доверительных интервалов вместо кривых могут быть использованы также таблицы функции 102 выгояочныя коэеннцнннты кояяеляцин !гл а Г(г «М, й). Если выборочный коэффициент корреляции равен г', то у-'(г') — такое значение р, что — а = ! 2 =-Р «г <г'«р« = Г(г*«дг, р) и аналогично ут '(г) — такое значение р, что — а=Р(г> г !р) =1 — Г(г'«И, р). Интер- 1 2 вал между этими двумя значениями р, (у," (г'), у, ' (г )), является доверительным интервалом. В качестве примера рассмотри ю доверителыпай интервал с коэффициентом поверня 0,95 при условии, что коэффициент корреляции выборки, построенной по 1О наблюдениям, равен 0,7952. Используя график !! у Дэвид, находим два значения: 0,34 и 0,98.
Следовательно, мы устанавливаем, что О 34 < з < 0,98. Интересно посзщтреть, каково отношение правдоподобия для проверк~ гипотезы й = ре при условиц, что дана выборка хн ..., хи из совокупности с законом рзспредслепия М(Р,Х). где «ь =(«ьн ра), ан — е-',, аы — — ем —.— ра,аз и вез =его Функция правдоподобия может быть записана в виде (х~ — н~) 2 )(г(х~ н~) (хт — на) + )(((хе — нг) Р, аа ча (42) Находя максимум (42) в области изменения параметров (2 (область параметров !) определяется неравенствами ат ) О, ет) О, р < 1). получаем е',я= ад)й«, а~ =а„/И, р„= I у' ~=аж,«/аца„, р.,а —— хн р., =х,.
Если максимум (42) находится в области изменения параметра а (а получается нз 2, когда р=яе), то р, =х, и рт„—— хм так как квадратичная форма относительно х,— рч и хз — рм стоящая под знаком экспоненты, является отрицательно определенной (и. стало быть, имеет пзксимум, равный нулю). Посте этого мы можем находить максимум логарифма выражения (42) по переиенным а, и аг: 1п К вЂ” М!па — М !п а — — М!п(1 — Рг!— г 2 ер 1 ра„ам агг! 2 ( рг) ~ э 0 ,г ~ Приравнивая нулю частные производные, получаем )ч 1 / ал а) ",з е-г- !.-~/, 1,/=1, 2, (44) ап аи Ре - " = М(1 Ре) Г б 0 т (45) Складывая (45) прн 1=1, / — 2 и 7=2, /=1, получаем = —" — 2Р„=" — + — „,," = 2М(1 — Рг).