Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 19
Текст из файла (страница 19)
Этот результат можно получить, исходя из геометрических 124 вывоРОч>!ые коэФФицигнты коРРеляции (гл. г л> !т-! а>~ — ~> (х,„— х,) (х1„— хГ) = ~> л>„з),. (10) в=! а ! Удобно будет называть множественный коэффициент корреляции, определенный в терминах з> «множественным коэффициентом корреляции без вычитания среднего». При вычислении В приходится извлекать квадратный ! корень из отношения а>>>А>и а>>> к ап. Поскольку А вычисляется прямо по наблюдениям, то особая техника требуется — ! лишь для вычисления а>пАгг а>>>. Вычисления такого рода рассматриваются в 4 5.3.1.
4.4.2. Распределение выборочного множественного коэффициента корреляции в случае, когда множественный коэффициент корреляции генеральной совокупности равен нулю. В силу (5) Ф а>>>А~ ап> Ог а„ (1! ) тогда -! ! к а,>>Агг а,>> ац — а>А»г ап> ап г — (12) а!! ап ап 1 — Яг — 1 -! >гг ап, Атг а,',> 1 — Ла а>г (1З) соображений, илн доказать из предшествующего результата способом, аналогичным тому, который был использовал при доказательстве соответствующего утвер>каспия для Я. Рассмотренные геометрические интерпретации целиком даны в терминах векторов, лежащих в (И вЂ” 1)-мерной гиперплоскости, ортогопалыюй к прямоИ, образующей равные углы с осями координат. В 4 З.З было показано, что в этой гипсрплоскости вектор (хп — хп ..., хпт — х,) может быть представлен в виде (з>>, ..., з! и,), где з>,— координаты, соответствующие (М вЂ” 1)-мерпоИ системе координат в гиперплоскости. Тач же было показано, что новые координаты получаются из старых посредством преобразования х>,— — ~г л! Ь>„, гдс В являстся ортогоиалыюИ матрицей с поз-! следпей строкоИ (1>>у'М, ....
!>>у'М). Поэтому Для (! = ! следствие 4.3.2 утверждает, что если р= О, т. е. ю — е м4 г если Я=О, то ан распределен как,, У„, а а44!Агг а(п— 4 ! М-! как ~'., ь'„, где !'; — независимые, одинаково распредеи=н-р+1 лепные случайные величины с законом распределения -! )!7(О, ан г) Поэтому а4!.г/он.г и а4ВАгг а;н7о4!.г независимы и имев!2 уг-распределения соответствеппо с гт' — р и р — ! степенями свободы. Таким образом, Лг )!! — Р а44!Ага~а,4!/44! г У Р 1 — 444 Р— 1 ан.~ен, Р— 1 2 Х,, Л вЂ” р =Ее ! „, (14) Хяг р — 1 Р- -Р имеет Е-распределение с р — 1 и )!! — р степенями свободы. Плотность распределения вероятностси Е равна Понтону плотность распределения вероятностей величины (1б) равна Г ! -- (74' — !) )! ! ! 2 1 уе-г(1,;,г у 4н-Р4-! (2 ! (2 1 (17) Т е о р е м а 4.4.!.
Пусть )4 — множественный коэффициент корреляции между Х, и Х' ! =(Хг, ..., Х ) (определенный формулой (б)! — получен ло выборке обзема !т' из совокупности М(р, Х). Если Я=О(т. е. 4л! множествениыи коэФФицие4!т коРРеляции 125 128 пывояочныя коэФФи|гиГ||ты коРРеляг!ии !Гл 4 (опо ..., „)=о|,! — — О=()), то (йх)(1 — )с)з! ((М- ру(р — !)! имеет Г-распределение ср — 1 и !!! - р степенлми свободы. След)ет заметить, что р — 1 есть число компонент вектора Х н М вЂ” р= И вЂ” (р — 1) — 1. Если рассматривать мномсестзеппый коэффициент корреляции между компонентой Х, и 4| остальными компонентами, то эти числа будут равны соответственно о и И вЂ” у — 1. Можно показать, что отношение Й»Д! — Ях) представляет собой величину, с которой часто приходятся иметь дело в регрессионном анализе (или методе наименьших квадратов) при проверке гипотезы о том, что регрессия Х, па Х, ..., Х равна нулю.
Если гг чь О, то распредетение Я получить значительно труднее. Этот случай мы рассмотрим в 9 4.4.3. Теперь рассмотрим статистическую задачу проверки гипотеаы Н: |х = О по выборке обьема М нз совокупности Ж(р, Х). Я есть множественный коэффициент корреляции генеральной совокупности между Х, и (Х, ..., Х ).! Так как )с )~ О, то копкурируюшая гипотеза состоит в том, что )! ) О. Выведех! критерий отношения правдополобия для проверки этой гипотезы.
Функция правдоподобна равна ((р*, Х*)= 1 ехР— 2 7~(М,— Р')'Х' '(М,— Р*) (2«) х (18) Результаты наблюдения пам даны, ь является функцией неопределенных р' и Е*. Пусть «! есть область в пространстве параметров «л, соответствуюшая пулевой гипотезе. Отношение правдоподобия ') равно |пах б О|', й*) !г*, 2*й и (19) глаз б (и*, л*) п,л йц ') В оригинале «Тве !Ше|й|ооб гапо сгцег|оп». Чтобы не путать эту величину с критерием яак алгоритмом лля проверки гипотез, мы здесь н в дальнейшем это название велнчвны Ь будем переводить не как критерий отношения правдоподобия, а как отношение правдоподобия.
(8рим. перев.) 4 4! Множественный кОэФФициент кОРРеляции 127 Критерий отношения правдоподобия состоит в гоч, что если ) меньше некотороИ наперед заданной константы, то путевая гипотеза отвергается. Иптуитивпо ясно, что нулевая гипотеза должпа отвергаться, если плотность распределения вероятностей иаблюдепнИ при наиболее благоприятпоч выборе параметров согласно пулевой гипотезе намного меньше плотности, полученной при наиболее благоприятном неограниченном выборе параметров. Критерии отношения правдоподобия обладают рядом важных асимптотических своИств (Вал ьд [1)). В большинстве задач, относящихся к многомерным нормальным распредслепиям, эти критерии являются оптимальпыпи или, по крайпей мере, разумпьы|и.
Здесь ы является прострапством параметров р', Е*, причем Е' — положительно опрсделеппые матрицы; и — область в этом пространстве, где /т = тг/ип!Ета'и4п/'угеп — — О, т. е. -! где и!Е22 и!и= О. Последнее условие вследствие того, что матрица Е22 является положительно определеппой, эквива-! лептио условию и!41=0. Максимум фупкции /.(р', Е*) при кзменении параметров в области й достигается прп р*=- р = « М и Е'= Е =(1//4/)А=(1//!/) ~ч,'4 («„— «)(«„— «)' и равен а 1 ! 1 — рл! - — ря гг2 2 шах /.(р*, Е*)= Р', Х*ЕИ 2 Р42 (2 )' 1д12 (20) /.(412*, Е*1!ио! =О)= ! ! ехр ~ — 2 ~4 ", ~ Х 1 1 1 -т (х!„— Р!)21 а! (2к) 2 а! 2 — !Р-П42 * ~ Л! (2„)2 ~И* )2 (21) Первый множитель принимает максимальное аиачение Ф при Рг=р,,=х, и еп = а4! — — (1//!/) ан, а второИ вЂ” при функция правдоподобия Е(р*, Е') при значениях параметров в области и равна 128 ВЫБОРОс!НЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ <ГЛ.
4 р<2!'= р<~<=к<~1 и Хгг — — Х ° =(1<)«) Аги Максималы<ее зиаче- иие фуикиии правдоподобия равно 1 1 — М --М Мг 2 шах Е(р*, Х*)— Р*. 2'Е сь (2 )2,2 1 1' — <р-1!М вЂ” — <р-ИМ Мг 2 (22) 1 <р-!!м — 'м (2е) ! А!2[ (24) Поскольку [гсг[(1 — )12)[ [(сьг — ру(р — 1)[ является моиотоииой функцией )1, то из рассмотрения эквивалентного критерия следует, что это оглашение больше некоторой константы. При Я=О это отиошеиие имеет Р~ 1 м -распределение. Следовательно, область значений Й. Бри которых гипотеза принимается, определяется неравенством у<2 Дс Р (25) где Рр 1 м р(а) есть (веРхиЯЯ) точка зиачимоств, соответствующая уровню значимости а. Теорема 4,4,2. Если м<, ..., к — выборка из совокупности 1«(р, Х), то критерий отношения правд- подобия, соответствующий уровню значимости а, для гипотезы )1=0, где )т — множественный «оэффициенп! коррелнции генеральной совокупности между Х< и Хг, ..., Хр, описьсвается неравенством (25), в котором с< — выборочный множественный коэффициент корреляции, определяемый по формуле (5).
Таким образом, отиошеиие правдоподобия равно [см. (5)[ 1 — м 1 Л= =(1 — яг)2 (А)2 — М (23) 2 — м — м а,< [А!2[ 2 Критерий отношения правдоподобия лает критическую область Л к„Ле, где Ль выбирается так, чтобы при Я =О вероятность неравенства Лк.) была равна а (уровню значимости). Рассмотренный критерий, очевидно, эквивалеитеи следующему критерию: си множГстВГи!сь!и коэфф1п!НГит коРРГляиии 129 Так как плотпостс, распределения вероятностей величины Й монотонно возрастает с ростом Й (см.
Э 4.4.3), то можно утверждать, что для проверки гипотезы Й =-0 критерий (25) является равномерно паиболсе мощным в классе всех кри- териев, зависящих от Й. Поскольку Й ипвариаптеп относи- тельно преобразований х,„=- схс, +г( и х„= Сх„-~-е и а! Гп является лишь единственной ипвариаитиой функцией доста- точных статистик (см.
задачу 20), то ъсожпо утверждать, что критерий (25) является равномерно наиболее мощным ишсариаптпым критерием. В качестве примера рассмотрим данные, приведенные в конце Э 4.3.!. Выборочпый миожествеипый коэффициепт корреляции определяется из 1 г,е г,е ~ 1,00 0,80 — 0,40) Поэтому Й=-0,802. Если пам нужно при уровне значимости 0,01 проверить гипотезу о том, что урожай се !а пе зависит от количества вссешшх осадков и температуры воздуха. то мы вычислим (Йз/(1 — Йз)! ((20 — 3))(3 — 1)) = 15,3 с Гз и(0, 01) = 6,11 и получим значимый результат.
Поэтому мы отвергаем пулевую гипотезу. Следует заметить, что критерий для проверки независи- мости случайной величины Х, от вектора (Хп ..., Хр).=Х! 1 эквивалептеи критсрию, заключающемуся в том, что если регрессия Х, иа хсзс (то есть условпое матемагическое ожи- дапие случайной величипы Х, при условии Хз — — хж ... ..., Х = х ) равна р, +р(х!р! — р!а!), то вектор коэффи-1 циеитов регрессии будет пулевым.
р =- а!!!Аеэ является обычной оцешсой, получепиой по методу паимепьших квад- ратов для случайпой величины р с математическим ожида- ппем р и ковариацпоипой матряцей сч! еАщ, когда Х, -1 !т) фпксиРовапы; аиа(()с! — Р) ЯвлЯетсЯ обычной оценкой веди- чипы еи з, Таким обРазоы (см. (13)), Й' Ас — р р.веер' И вЂ” р (27) ! — Йт р — 1 ли, р — 1 5 т: Андерсон ВЫВОРОЧ!!ЫЕ КОЭФФИ)!ИЕНТЫ КОРРВЛЯЦИИ )ГЛ ! является обычной )"--статис)якой для проверки )ниотезы о том, что регрессия Х, иа хг, ..., х равна нулю, Интересно отметить, что й является единственной функ- цией параметров р и Х, инвариантной относительно изме- нений расположения случайных величин, масштаба Хи а также относительно иезырождепных линейных преобразо- ваний вектора Х ). Аналогично этому, й является единствен- )2) иой функцией х и Х, достаточного множества статистик для р и Х, ннвариаптной относительно подобных преобра- зований.
4.4.3. Распределение выборочного множественного коэффициента корреляции в случае, когда множествен- ный коэффициент корреляции генеральной совокупности не равен мулю. В этом параграфе мы найдем рзспредсле- ние й для случая, когда пулевая гипотеза неверна, и убедимся в том, что это распределение зависит только от множествен- ного коэффициента корреляции генеральной совокупности Я. Сначала мы рассмотрим условное распределение величины )т Д1 — ))' ) = а!1)А22'а!)у аи.г при Х~, ) = в~, а = 1, ..., п.
12) !2) В этом случае величины Х). Иеззвисимы и распределены по законам А!!)рх ви 2), где )8 = и!и Хгг и аи г = чи— !2) Ф вЂ” а!НЕгг а!и. Эти условия совпадают с услозиячн тео- ремы 4.3.2 при У, = 21„, Р = )), гв„= в~~)(г = р — 1), Ф =Фи.г. л) = н. Поэтому аи,2= а)1 — а!))АЙ а)и соответ- ствует ~~р~ 1'„1; — ОНО, а л)1.2)си.г имеет уг-распределение 1 с и — (р — 1) степенями свободы. Величина а!ИАю)а,)) —— -1 Ф =(а)1)Аю)А22(а)1)А22) соответствует ОНО н распределена как ~У~(а=н — (р — !)+1, ..., и), где О(()',)=аи,г и Ул(и„„,, ..., и„)=ГГ-', (28) где ГНГ'=1'1Н = Р '(Р') ~.