Андерсон Т. - Введение в многомерный статистический анализ (Андерсон Т. - Введение в многомерный статистический анализ.djvu), страница 17
Описание файла
DJVU-файл из архива "Андерсон Т. - Введение в многомерный статистический анализ.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 17 - страница
В качестве критической области при 544-иоь4 уровне значимости используем область > 1,96. (79) )Г~ЛЛ, — 3) + 1/()У, — ' 3) в) При условии (б) предположим, что Р, =ра=р. Как использовать результаты обеих выборок, чтобы получить совместную оценку Р) Так как дисперсии л, и гт равны соответственно 1/(М, — 3) и 1/(М2 — 3), то лгы 44ожеи оценить ч величиной (л' — 3) + (лг — 3) (80) )У~ + 2У4 — 6 и использовать это для оценки р посредством соотношения. обратного к формуле (72). г) Пусть г — выборочный коэффициент корреляции, полученный по М наблюлениям.
Как получить доверительный интервал для Р7 7(ы знаем, что приближенно Р ~ — 1,96 < )г М вЂ” 3 (г — ") < 1,9611 = 0,95. (81) Отсюда следует, что ~ — 1,96/угМ вЂ” 3+я, 1,96/)ГМ вЂ” 3+я) является доверительным интервалом для ".. Чтобы получить доверительный интервал для Р, воспользуемся тем, что р= =Й".=(ес — е- )/(ег+е -), что является монотонной функцией С.
Таким образом, для р получается следующая доверительная область: (й~г — =') <; <(й(г+ ' ). (82) 112 ВыБОРОчные коэФФициенты кОРРеляции !гл. л 4.3. Частные коэффициенты корреляции 4.3.1. Оценка частных коэффициентов корреляции. Частные коэффициенты корреляции — это коэффициенты кор- реляции условных распределений. В $2.5 было покзззно, что если вектор Х рзспределен М(р„ Х), то условное рас- пределение подвектора Л"') при условии А"2) = х!) (где Х'= =(Х") Х)~) )) есть М))р)')+В(х") — р)')). Хц,г), где В = Х 12Х22, ХЦ,2 = Хп — Х12Х22 Х21.
Частные корреляции гл ' при данном х! ' являются корреи) (2) ляцням и, вычисляемыми обычным путем из Х)1.2. В этом па- раграфе мы интересуемся статистическими проблемами, свя- занными с этими коэффициентами корреляции. Сначала рассмотрим проблему оценки. Предположим, что у нас есть выборка объема М из совокупности М (р, Х).
Что является оценкой наибольшего правдоподобия для чз стных коэффициентов корреляции р, , )у- мерного век- !2 2+1, ..., р тора Х) )Р Мы знаем, что оценкой наибольшего правдопо\1) лобия для Х является )ч \ кч Х= — у (х.— х)(х,— х)', (3) а 1 где х=(1/М) ~ х,. Соответствие между Х и Хц.г, В и Х взаимно однозначно ввиду (!) н (2) и Х„= ВХЕР (4) Хп = Хп.г+ ВХ22В' ° (5) Из следствия 3.2.1 получим, что оценками наибольшего правдоподобия для матриц Хц.г, В и Х„ являются Хп 2=ХИ вЂ” ХиХИ Хю й =Х)гХ22 н Хгг.
Кроме того, оценками наибольшего прзвдоподобия для част- ных коэффициентов корреляции являются ~)/ 2+1 Р)12+1 -., р— г чи 221, ..., рч1,.2г1, ..., р 1, )'=1, ..., 2, (()) ЧАСТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ из 4 31 гле а — элемент 1-й строки и уцго столбца магга+1," р трицы 211.г. Теорема 4,3.1. Пусть хм..., Хн — выборка обьема 111 из совокупности 141(р, Х).
Оценка наибольшего правдоподобия для частных коэффициентов коррелиции первых 4у компонент при финсированных осгпальных р — о компонентах, Р11 1 дается следующим образом: а11.4*1, ... р ~1! 4+1, ".. Р ъ/а„а ' а11 4+1, ..., р агу е+1, ..., р где -1 (агрчь1, ..., „) = Аи — АиАгг Ам = Ац м (8) < Ап А1г'~ А11 Аю1 Оценка р114 1 обозначаемая через г,, на- 114+1, ", р' 1! е+1, " р' зывается выборочным частным коэффициенлгом корреляции между Х, и Х1 при фиксированных Х+Р ..., Х, Можно дать лве геометрические интерпретации вышеприведенной теории. В р-мерном пространстве хц ..., хн представляют УУ точек.
Выборочная функция регрессии х'" =- х'" + В <хкй — х' 1) (1О) есть (р — 4у)-мерная гипсрплоскость, являющаяся пересечением о гиперплоскостсй размерности р — 1: р хг =хг+ ~З~ рг (х — х), 1=1, ..., 4у, (11) 1 е+! гле х, ху †текущ коорлинаты. Злесь рц является элементом матРицы Й = а41змгг = АиАгг . 1-Я стРока В есть (рг +и ..., Рг ). Каждый член правой части (11) является функцией срелнеквалратичной «регрессии» х, на х +и ..., х .
Это означает, что если мы спроектируем точки хц ..., хн на гиперплоскость координат хо х +Р ..., хр, то (11) 1!4 зыворочныв козвснцнвыты корреляции !гл а будет плоскостью регрессии. Точкз с координатами р х, =х,+ л,'а ~, (х),— х)), 1=1, ..., ~у, (12) ч с! х =х, /=д+1, ..., р, лежит на гиперплоскости (11). Разность мсжлу 1-й координатой точки .х„и 1-й координатой точки (12) равна уы— =х,„—.
х,+ ~ ~, (х)„— х) для!=1, ...,д и Олля /„1 лругих коорлинат. Пусть (13) Ур« Эти И точек можно мыслить как точки д-мерного простран- М ства. Тогла Ац.з= ~ У„У.. «! Выборку можно интерпретировать также, как р точек И-мерного пространства. Пусть х! — — (хп, .... хдч) — /-я точка ихр+, —— -(1.....!) — (р+!)-яточка. Точка с координатами (хр ..., х,) может быть записана в внлс хра +и Проекция г, на гиперплоскость, образованную вскторачи х +о ... ''" ар+! равна р ' р+~+ l р«~ это ближайшая к х, точка на гнпсрплоскости, Пусть х,— вектор, проведенный из точки г, к точке хр т. е. х, — х*,, или, что то жс, этот же вектор, перенесенный одним из копцов в начало коорлинат. Векторы хн ..., га являются проекциями векторов до ..., х на гиперплоскость, ортогональную к х +,, ..., ар+и Поэтому х,'г,=ам есть квадрат модуля г, (т.
е. квадрат расстояния от точки х, до точки х~). Отношение гарт/ р' х~г, «ду = гы чти „, р равно косинусу угла между а, и хх а.з1 ЧАСТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ 115 В качестве примерз на исследование частной корреляции рассмотрим данные Х у к е р а 111 по урожаю сена 1Х,) в центнерах на акр, весенним осадкам (Хз) в люйиах и количеству весенних дней (Хз) с температурой воздуха выше 42' г в Англии за 20 лет, Оценки РР а,(= 1/ан) и р0 таковы: 1ь=Х= 4,91 =( ~.~а ), Рж 1,00 0,80 — 0,40 Рю = 0,80 1,00 — 0,56 1 — 0,40 — 0,56 1,00 (15) ~ Рз1 Рзз Из полученных коэффициентов корреляции видно, что урожай сена и количество осадков положительно коррелированы, а урок<ай сена и температура воздуха, а также количество осадков и температура воздуха отрицательно коррслированы. Какую интерпретацию можно дать отрицательной корреляции между урожаем сена и температурой воздуха? Является ли высокая температура причиной низких урожаев или, может быть, она связана с небольшим количеством осадков и, слсловательно, с низким урожаем? Чтобы ответить на этот вопрос, рассмотрим корреляцию между урожасл~ и температурой воздуха при фиксированном количестве осадков, т.
е. используем приведенные выше данные для оценки частного коэффициента корреляции между Х, и ХФ Получаем' ) = 0,097. а, за, (16) Такиы образом, если лействие осалков не учитывать, то урожай и температура оказываются положителыю коррелирован- 1) Мы производим вычисления с матрицей Х так же, как это делали бы с матрицей л. Пб ВЫБОРОЧНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ [ГЛ. Ь ными. Следовательно, как большое количество осадков, так и высокая температура повышают урожай сена, но в большинстве случаев большое количество осадков наблюдается при низкой температуре, и наоборот.
4.3.2. Распределение выборочного частного коэффициента корреляции. Частные коэффициенты корреляции. как показано в теореме 4.3.1, вычисляются из матрицы Ап,г= = Ан — А1гАтг Аг[ так же, как и обычные коэффициенты корреляции из матрицы А. Чтобы получить распределение этих коэффициентов корреляции, л[ы показали, что А расы-! пределепа как ~~ У,п„, где Е,— независимые и одинаково а — ! распределенные случайные величины с законом распределения [1[(0, Х).
Чтобы найти распределение выборочного частного коэффициента корреляции, мы докажем аналогичный результат. Этот результат получается из следующей теоремы, которая установлена в бо.чее обшей форме, так что ее легче будет использовать в дальнейшем. Теорема 4.3.2. Предположим, что УО ..., Г не завислщие от гг„векторы, распределенные М(Гтп„, Ф), где ти„— г-мерный вектор. Пусть б= ~ Г,ти„Н, где Н= ~тгг„то„' — невырожденнап матрина.
Тогда случайнал величина ~ г'„г', — ОНО распределена так же, как 1 я — г ~~П ~У„(у„где У,— не зависящие друг от друга, а также а ! от О векторы и каждый из них распределен О[(0, Ф). Доказательство. Пусть В'=(тон ....то ) и à — квадратная матрица, такая, что РНР'=1 (см. теорему 6 приложения 1); тогда г"" Н Г =1.
Положим Ез=ИУ; тем самым [т'= Р'Ег. Т>гда Е Е' = р%%'Г = р ~~'., то„то'р' = ГНР' = 1. (17) а=! Таким образом, т-ыерные строки матрицы Ез являются ортогональнымн и нормированными. Можно найти матрицу Е, 131 члст1!ые коэФФициеиты коРРеляции 117 с т — г строка!!и и т столбцами такую, что матрица (18) будет ортогональной (см.
приложение 1, леммз 2). Пусть теперь У=(У1, ..., У„,)=47Е или У= УЕ' (т. е. (1„= = ~ е„.,У-,). По теореме 3.3.1 столбцы матрицы 47, скажем в !7„, независимы и одинаково распределены, причем ковариациоииая матрица каждого столбца будет Ф. Среднее значение 47 равно М(7=)4КЕ =Г)згЕ =ГР ''Е(Е',Е)=(ОГР-'). ОИге'=(У%'И )И(И НУ') 1)ЕЕ (Р ') Н Г ЕтЕ«ер~ =и~ ~Е,Е,(Е,'Е,)и =и~ ~(ОУ)и = ( Е„У' !г',!7„. (21) а а«-«+1 Таким образом, ~ у„г„' — С НО = чЭ: и„и„'— (У„!«'„= ~~ ~!г',47„. (22) аа«а-га1 а ! «=1 Теорема доказана. Из приведеииых выше рассуждений получается, что если Г=О, то МеУ=О, и мы получаем следуюшее Следствие 4.3.!.
Если Г=О, то матрика бИО', определеннан е теореме 4.3.2, распределена тан же, Длв завершения доказательства теоремы 4.3.2 нужно показать, что а! — г ~ )г„)г,— ОИО'= ~ 47,(7 . (20) По теореме 3.3.2 Х ~'.У," = Я 47.и„'. аа! «а! Кроме того, 113 ВыБОРОч1!ые коэФФиш1п!ты кОРРеля<!ии <гл 1 кпк ~, ()„()„, где (а, — незиаиеи.чые, одиникоао риса юа-аа! пределеннме пекгпори с законом распределения М(0, Ф). Теперь мы таким же образом найдем распределение матрицы А,!.г в той же форме. В теореме 3.3.1 бь<ло поп-! казано, что А распределена так же, как ~~~', й„й„, где п,— а 1 независимые, одинаково распределенные векторы с законом распределения И(0, Х).