Андерсон Т. - Введение в многомерный статистический анализ (Андерсон Т. - Введение в многомерный статистический анализ.djvu), страница 18
Описание файла
DJVU-файл из архива "Андерсон Т. - Введение в многомерный статистический анализ.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 18 - страница
Разобьем вектор й, па двз подвектора размерности р и р — <у соответственно (23) й!..... Ян 1 при 4 =и<, ..., с~ч-1=як' 1 равна <П <1< - е<1! О! 11 <и Ф 1 П п(е,~о,й) Ю-! Ц Ц п(еа <О, Хгг) " 1 п(е,!О, Х) пф') О, Хгг) и-1 = Ц и (и'.и ~ ВЯ"„1, Х!Ог).
(24) где гг = ХЫЩ и Х!1.1 =- 2<1 — Х!гл'гг лг<. Применим теорему 4,3.2, считая, что Я<<! = Уа, п<„1= еп„, М вЂ” 1 = п<, р — 4< =г, В = Г, Х<<.г=Ф, Аи =Ъ Уа)'«, А<гАгг~ = С, Аег — — Н. В результате получим, что условное распределение а А!! — (А!1Агг')Агг(Агг'А<г)=Ан,г при Я<ю=п<г' совпадает М-1-<Р-11 с рзспределением ~г С е<', где С вЂ” независимые, одна ! а а' а наково распределенные случайные векторы с законом распределения И<0, Х!!.г).
Так как это распределение не зависит от (я,"!), то справедлива следуюнгая л<-! Тогда Аы= л е„~.. Условная плотность распределения и! ~/!' а .! яз! члстные коэФФН!1иенты коРРгля!1ии 119 Теоре из 4.3.3. )Иатрица Ан.я=А)! — АЫАюАю Раен-)-)р — в) пределена так же, как ~~ еу б', где()„— независил)ые, аа! одина)сова распределенные веки)оры с законом распределения )!)!О, Х)!.з). В качестве следствия получасы Следствие 4.3.2. Если м)с=О(3=0), то мав)рица и- )-)р-т -! Ап,з распределена так же, как ~а 1).11, а АЫАю Ам— а ! ы-! так же, каь' г ()11', гдв 4)„— независимые, одна н-)р-и иакова распределенные векторы с законом распределения ))1(0, аа!!.з). Отсюда следует, что частный коэффициент корреляции г)!.в+), ... р выборки, построенной по М наблюдениям, распределен так жс, как обычный коэффициент корреляции выборки, построснной по ))à — (р — о) наблюдениям над генеральной совокупностью с коэффициентом корреляции р)у е ), ..., р.
Т с о р е и а 4.3.4. Если функциыо распределения коэффициента корреляции г,.~ выборки объема Л) из нормальной генеральной совокупности с коэффициентом корреляции рИ обозначить Е(г ! И, р,.), то функция распределения частного коэффициента корреляции гг!..в„!, р выборки объема ))1 из нормальной генеральной совокупности будет Е(г 1 !)! — (р — и), р)у.да), „р). Это распределение было получено фишером а 1924 году.
4.3.3. Проверка гипотез и доверительные области для частных коэффициентов корреляции. Поскольку распределение чзстного коэффициента корреляции г)!.е,! выборки объема М из совокупности с частныь! коэффиш)ситом корреляции р)рв+), р, равным некоторой величине, скажем р, совпадает с распределением обычного коэффициента корреляции г выборки обьсма )а' — (р — а) из совокупности с соответствующим коэффициентом корреляции р, то все нстолы получения статистических выводов относительно обычных коэффициентов корреляции могут быть использованы и для получения статистических выводов относительно частных коэффициентов корреляции.
Методика для получения выводов 12о выьорочные коэееицпьнты коряьляции 1гл.4 относительно частных коэффициентов корреляции точно такая же, как и для получения выводов относительно обыч- ных коэффициентов корреляции, за исключением того, что !и' заменяется иа М вЂ” (р — д). Для иллюстрации этого при- ведем два примера, П р и и е р 1. Предположим, что по выборке объема й! иам нУжно пОлУчить довеРительный интеРвал дла Ры,а+~ „, р. Пусть выборочиый частный коэффициент корреляции равен гы,ч+, р, Методика состоит в том, чтобы использовать диаграммы Дэвид для М вЂ” (р — д). Для примера, приведен- ного в конце $4.3.1, иам могло бы понадобиться найти доверительный интервал для рц.з с коэффициентом дове- рия 0,95. Выборочный частный коэффициент корреляции равен гсьз=0,790.
Используем диаграмму (или таблицу) для й! — (р —,у) = 20 — 1 = 19. Интервал есть 0,52 < рц з < 0,92. Пример 2. Предположив, что, имея выборку объема )т, мы используем я-величину Фишера для приближеииого критерия значимости для гипотезы р,, =рв при дву- сторонней коикурируюшей гипотезе. Положим 1 1+г ь„1 2 = — 1П 2 1 — О!.,+! ..
л' Г, 1п + Р0 . 1 1 (25) 2 1 — рч' т рв — о — и — зс — с~ р мости иормироваииого иормальиого распределения. В примере, приведенном в конце э 4.3.1, мы могли бы пожелать про- верить гипотезу р~з.з — — 0 при 5% -иом уровне значимости. В этом случае чв — — 0 и я=')г20 — ! — 3 (0,0973)=0,3892. Эта величина, очевидно, ие является значимой (!0,3892) < < 1,96) и, следовательно, у иас иет основания отвергать нулевую гипотезу, 4.4. Множественный коэффициент корреляции 4.4.1.
Оценка множественного коэффицвента корреляции. Множественный коэффициент корреляции между одной случзйиой величиной и миожествоч случайных величии был определен в Э 2.5 для совокупности. В этом параграфе мы для простоты рассмотрим множественный коэффициент 44! множествн!ныи коэееипиГнт корреляции 121 корреляции между Х, и множеством Хг... „Хр( ставить индексы при (т нет необходимости. Случайные величины вссгда можно перенумеровать так, чтобы рассматриваемый мцожествсцный коэффициент корреляция был коэффициентом коррсляпив между первой вз цвх и остальными (все цснужпыс всличицы могут быть опушены).
Тогда мцожсствсш(ый коэффициент корреляции генеральной совокупности будет равен о 9лгг9 т/ 9х229 я /о(ц ляг о(ц (1) где р, в(ц и Егг определяются из соотношений (2) Г о(ЦД22 ' (3) По данной выборке хц ..., хм(1>('> р) мы оценим матрицу л матрицсй о=[((((()(( — 1)[а> илв л( о ! ~(Ц ~22 1 -! и вектор р — вектором р= а(НХ~~ =а(ИАж. Выбороч!!Ый множественный коэффициспт корреляпив определим по формуле о / й= 9?ъ~Ф' э /о(цг> о(,>, /а(,>Агг>2(,> о>! о>! а„ Так как )>!, а(ц, .ьгг мы можем определить как взаимно одцозцачпос преобразование матрицы л;, то в силу следствия 3.2.1 эта опенка является оценкой цаибольшего правдоподобия для (г.
Справедливо также другое выражение для !г' [см. (20) $2.5[! 1 — )(2= „ >Й| )А! (6) о„>лог( а„[А [ гс и р имеют такис жс свойства в выборке, как Й в Р в генеральной совокупности. Так, например, из всех (р — 1)- ВыгОРОчиые кОЭФФицигиты кОРРеляиии (гч. ( 192 мерных векторов-строк (2, определяющих линейные комбинации (Кх, коордцнаг вектора х , вектор (К= р дает (2! (2! мицнмум суммы ь( [(х,« — х,) — (1(х„— х )1 . Прежде «..! — 1 всего заметим, что так как р.=а(!(А22, то и ~2 [(х„— х,) — р(х„! — х'1)](х,' — х' ') = а(и — рА22 = О.
««1 (7) Таким образом, к ~~~(, [(х,« — х,) — аг(х. ! — х'2')] .= а-1 = ~2 ][(хы — х,) — ~3 (х', ' — х' ')]+ ф — ф(х~! — х2')]2 = «..1 и = Х [(х1а х() — р(х«х )] +(р — (7)А22(р — (2) . (8) Так как матрица А22 нвляется положнтельцо определешюй (за исключением случаев, когда получецные выборки имеют пулевую вероятность), то минимум (8) достигается, когда 27 — р =О. Тем самым утверждение доказано. Само минимальное значение равно л( ~~."( [(х(, — х,) — Р (х~ ! — х'~!)] =- ни — ~Аю Р' =- а ! -1 = аи — а,(!Аю ац, — аи.2 (9) (как определено в и 4.3 при (7=-1).
Эгону результату можно дать интересную геометрическую интерпретацию. )((-2(ерн(вй вектор с ц-й компонентой хы — х; является проекцией векторз с а-й компонентой х!« нз плоскость, ортогональную к прямой, образующей равные углы с осями координат. У нас есть р таких векторов. (з(х — х ) является а-й компонентой вектора в гиперпло- (2) (2) скости, образованной последни м и р — 1 векторами . Так как (8) является расстоянием между пе р и и м вектором н линейной комбинацией оставшихся р — 1 векторов, то дх',и — х' !) является компонентой вектора, который дает е() м1гожественныи коэФФицигнт коРРеляции (23 минимум этого расстояния, Интерпретация формулы (7) такова: вектор с компонентой (х„— х,) — ~(х„— х ) орто- "/ (2) (2П гонален к каждому из последних р — ! векторов.
Такиа( образом, вектор с компонентой Р (х. — х ) является (2) (2) ) /Зг( гг -'"гг 2( /г)) Рис. 7. проекцией первого вектора на гиперплоскость (рис. 7). Кицйрат длины проекции вектора равен 22 (р(х„'' — х )! =рАтгр)=п())Ааааа(), а 1 а квадрат длины первого вектора равен ~ч'.,(х) — х,)а=пн. % Поэтому гс равно косинусу угла между первым векторои и его проекцией на гиперплоскость.
В Э 3.2 мы видели, что обычный коэффициент корреляции равен косинусу угла между двумя векторами (в плоскости, ортогональной к прямой, образующей равные углы с осанн координат). Другое свойство Й состоит в том, что эта величина равна максимуму коэффициента корреляции мем(ду х,„и линейными комбинациями координат вектора х~. Гг) Этому соответствует следующая геометрическая интерпретация: )т есть косинус наименьшего угла между вектором с компонентами (х„— х,) и вектором, лежащим в гиперплоскостн, образованной остальными р — ! векторами.