Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 13
Текст из файла (страница 13)
Бь~л рассмотрсн также третий вид корреляции — множественная корреляция, которая представляет собою меру аависимостп между олной случайной величиной и множеством лругих случайных величин. В этой главе мы рассмотрим выборочные эквиваленты этих величин. Эти эквиваленты являются точсчнычи оценками соответствующих величин совокупности. Будут получены также распределения выборочных коэффициентов корреляции, рааработаны критерии лля проверки гипотеа и научены доверительные интервалы.
В случас пориальных совместных распределений рассиотрснные коэффициенты корреляции являются естественными мерами зависимости между случайными величинами. Для генеральной совокупности они являются единственныии параметраин, кроче расположения (математического ожидания) и масштаба (диспсрсии). Выборочные коэффициенты корреляции возникают как естественные оценки коэффициентов корреляции генеральной совокупности.
Так как выборочные средние аначения и дисперсии являются оценками расположения и масштаба, то аыбооочные коэффициенты корреляции 86 в!ягОРОчн!ле кОЭФФи1!игл1т!я кОРРеляции !Гл, ! Гт. е. нормированныс выборочные вторыс моменты) лают исю возможную информацию о коэффициентах корреляции генеральноИ совокупности. Выборочные коэффишюнты корреляции являются функциями достаточных статистик, ко!орые инвариантны относительно преобразований расположения и масштаба. Коэффициенты корреляции генеральной совокупности являются функциями параметров, инвариантными относительно этих жс преобразований. В «теории регрессии» или методе наименьших квалратов одна иа величин рассматривается как случайная или «зависимая», а другие — как фиксированные илн «неаависнмые».
В теории корреляции мы рассматриваем несколько величин как случайные и трактуем их олинаково. Если исхолить из нормального совместного распределения и зафиксировать все величины, кроме одной, то получится модель метода наименьших квалратов, поскольку математическое ожнланис случайной величины в условном распределении является линейной функцпеИ фиксированных величин. Выборочные коэффишюнты регрессии, получаемые по методу напиши ших квалратов, являются функциями вь1борочных лисперсий и корреляций.
Прн проверке независимости мы увидим, что к одним и тем же критериям мы приходим в разных случаях гт, е. прн нормальном совместном распределении илн прн условном распрелслепии в мстолс наименьших квалратов). Вероятностная теория в случае, когла верна нулевая гипотеза, однз и та же. Распределение критерия согласия в случае, когда нулевая гнпотеаа не верна, различно в двух случаях. Если все величинь! можно рассматривать как случаиные, то используется теория корре.1яции, приведенная ниже; если же только олма величина является случайпоИ, то используется метод наименьших квадратов !который подробно рассматривается в главе 8).
4.2. Коэффициент корреляции двумерной выборки 4.2.!. Распределение выборочного коэффициента корреляции в случае, когда коэффициент корреляции генеральной совокупности равен нулю. Проверка гипотезы о некоррелвроваиностм. В э 3.2 было показано, что если имеетси выборка гиз р-мерных векторов) х1, ..., Хл! из ег! коэееипнгнт когггляцин дпзмгппоп выгонки 87 нормальной совокупности, то для коэффициента корреляции между Х! и Х (двумя компонентами случайного вектора Х) получается следуюшая оценка наибольшего правдоподобия: !т (хг, — х;) (х», — х ) »=1 / Чч (хг„— х!) ~/ Ч»ч (х — х ) а 1 а 1 где хг,— 1-я компонента вектора х„и л» вЂ” 1 Ъ1 х,= —, „хкс ! В этом параграфе мь! найдем распределение величины г», предполагая, что коэффициент корреляции генеральной совокупности между Х! и Х равен нулю, и увидим, как можно использовать выборочный коэффициент корреляции для проверки гипотезы о том, что коэффициент корреляции генеральной совокупности равен нулю.
Для простоты рассмотрим г, . Аналогичным образом исследуется, очевидно, и любой другой коэффициент г;,. Так как гю записит лишь от первых двух координат каждого из векторов Х,, то очевидно также, что для нахождения распрелеления гю нужно знать лишь совиестное распределение величин (хп, х„), (хвп х,!), ..., (х»п, хг,м). Сле. допательно, рассматриваемую проблему можно сформулировать в терминах двумерного нормального распределения.
Пусть х,*, .... х' — векторы результатов наблюдений над совокупностью Рассмотрим а»2 г= (4) игу= Х (хг,— х!)(х), —.ту) ((,,г=1, 2), (5) 00 пь1БОРОчпые кОэФФипиепты кОРРеляпии 1гл 1 х, определяется по формуле (2). (Здесь х1„— 1-я компонента вектора х,.) Из Я 3.3 мы видим, что аги аи и ате распределены как а1) — ~ч,", л„а „(1, У = 1, 2), (б) а 1 тле п=М вЂ” 1, а вектор (аг х,„) распределен .1(') (...'„": )1 и не зависит от (г1, е,~) при и 4= р. Пусть л1 =(лп, ..., е1„), 1=1, 2. Эти два вектора можно рассматривать как векторы и-мерного пространства (рис. 4).
Рис. 4. Козффипиент корреляции равен косинусу угла 0 между х1 и лм Чтобы найти распрслеленис соз О, мы найдем сначала распрелеление с(К 0. Поскольку л, =(» — ба1)+ Ьхп мы выберем скалярную величину д как функпию Е1 и аа так, чтобы векторы аа — бх1 и 0х1 были ортогональны. Тогда 1 а1а1 с( 0=01 р (а, — аа1)' (а, — Ьа1) Если вектор г1 фиксирован, то оси координат можно повернуть так. чтобы первая ось проходила в направлении х,.
кт! кОэФФнциент кОРРеля!!ин пйтмкРноп ВыБОРки 89 Тогда у вектора (!а! только первая, а у вектора яа — ба! только вторая координата отлична от нуля. Покажем, что если р = О, то с1д 0 пропорционален 1-распределенной случайной величине. Условное распределение величины Лт„ при Л4„ =- яы (ааглавпые буквы используются для обоаначения случаиных величин) есть М(ра!„, Рт), где р =ра )е! и а =ее(1 — р~) (см. 5 2.5). Совместное распределение координат вектора Еа пРи Условии, что Х! =во есть М(Ра4, аат), так как Еы неаависимы.
Точнее, совместная плотность распределения вероятностей Ф! и Е равна частная плотность распределения вероятностей Е! равна Л Ц и (я4„~ О, ат!) =п(л4(0, от!У); следовательно, условная плотность распределения Ет при л! = л! равна совместноя плотности распределения вероятностей Е! и л, деленной на частную плотность распределения вероятностей 2! (в точке г!), т. е.
Пусть д=Утг4/я!г4(=а!!/а!!). так что М!(Š— (и) =О, и пусть 1' = (Е, — ол,)' (Уа — (!л,) = 2Д вЂ” Ь~|', г, ( = а!а — а!а( пи). Тогда с(д'0 =д ~I а„~Ъ'. Врашенне осей координат сводится к отысканию ортогональнои матрицы С порядка (и )к п), первая строка котороя /1! булат ( — ) л', где се=а'х. 14) !' ! 1" Применим теорему 3.3.1, полагая Х,=Уж. Пусть г'„= = ~я~~ с,а2аа. Величины (г',) независимы и распределены а 90 ВыБОРОчные кОэФФиниьчгт12 кОРРРля!!ии !ГЛ 4 нормально с дисперсией ае и математическими ожиданиями Му!=~ сг ргг — 2 2 — 'рс, 11 с л~з !1 1 1 1=1 ч л Му„=,у с„,321,=~с ~~~~~ с.гс„=-О, хРВ1.
1 г ! (8) (9) Имеем Ь = — ~' 7. „г„/,У, г2„= с ~ 7.,с, /сг = 'г',с н по лемме 3.3.1 1~ = лЧч 72„ — Ь ~~' гяы = ~~' 1'« — у~ = ~~' )'2, (1 О) 1 в 1 а 1 а 2 что пе зависит от Ь. Лемма 4.2.1. Если векторы (7.„, 72„), (и=1, ..., и), независимы и одинаково распределены с законом распределения (!), то условные распределения величин Ь= ~,',7 „7ы,!~ 7."„и (l а2 = — Чгх(7 Ь7 )2 х2 й при 71„— — г„(х — — 1, .... и) будут соответственно Ь!(Р, аггее) (се= — ~ г',) и уг-распределение с и — 1 степенями свободы; кроме того, Ь и Ъ' независимьг. Если ь = О, то р = О; поэтому условное распределение Ь есть гу (О, ог!сг), а условное распределение величины (11) — — 1 а!!а!!!а!! г! !2 г! 2 ат агг!агг . г — - а!21)г а,,ага )г и — 1 — ='-'='=" '-'— 1 — ~а!2/(ац~~2.) ~ г = 1г п — 1 — =.
(12) Поэтому (гп — 1 г/1/1 — сг имеет условное 1-распределение с и — 1 степенячи свободы. Плотность распределения является условным 1-распределением с и — ! степенями сво- болы. Ио эта случайная величина равна чт! кояФФи!тигит коппгляции двуь!БРИОЙ ВыБОРки 91 величины Г раа!и Г~-- л) и — — — (1+ „',), (15) )гл:1 Т 1-(л — 1)~)ги (2 (15) 51 ге'" = Р ~ — (М вЂ” 1)) Г ( т + — ),/~ 1/ и Р ~ 2 (М 1) -1- т1 ); в частности, дисперсия равна 1/(М вЂ” 1). и плотность распределения вероятностей величины )р'.— = г/")!г1 — гв равна — ! — - — (1+ че') '!2 ) (14) Г~-!.