Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 68
Текст из файла (страница 68)
нан дер Варден ° !о«з В некоторых случаях корреляция между двумя величинами х н у целиком или частично вызывается тем, что существует значительная корреляция между х и у, с одной стороны, и третьей случайной величиной 2 — с другой. Можно попытаться исключить зависимость от 2, заменив х я у такими величинами Гл.
ХП1. Корреллцил Зто Числитель (4) можно записать так: С, ат1 — ЛЯ гу — ее Я хг+Л1АЯ гг = г = рц, о„оу — Леуео уете — ур„еклеее -, 'ЛАите . Если в этом равенстве Л и ре заменить их значениями (2) и (3), то получим б(х — Лг) (У вЂ” 1'г) = (оег — Е-оУ.) ', (8) Точно так же вычисляются аг . =,о(х — Лг)г = (1 — ог ) оег ет', = Я(у — 1лг)' = (1 — ог ) о' (6) (у) Если все эти выражения подставить в (4), то найдем алу — Е *ау. и*а ~е 1е 11 — е, 11 — еее Для того чтобы получить оценку для Е,щ„заменим в формуле (8) истинные коэффициенты корреляции о выборочными г. В результате получим (8) Б. ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Е*е~ Возпнкает тот же вопрос, что и в предыдущем параграфе: сколь велик должен быть частный коэффициент корреляции т„м, чтобы можно было утверждать, что между х — Лг и у — лег действительно существует зависимость? Или, иными словами, е„у — е„, еу, гее м —— Г '1' 1 — По 11 — ~; Формулу (9) можно было бы вывести так жс, как была выведена формула (8).
Для этого нужно бы было определить, какие линейные комбинации х" = х — аг и у" = у — Ьг имеют с г выборочный коэффициент корреляции, равный нул|о, В этом случае выборочный коэффициент корреляции между х" и у" задавался бы формулой, в точности совпадающей с (9). Отсюда следует, что т,, не изменится, если х заменить на х — Лг, а д — на у — елг, где Л и 1л — произвольные числа.
Действительно, выборочные коэффициенты корреляции между г и линейными комбинациями х" = х — аг и у" = у — Ьг равны нулю, а поэтому при замене х на х — Лг и у на у — 1лг линейные комбинации х" и у" остаются неизменными. Таким образом, при изучении СВОйСтВ СЛУЧайНОй ВЕЛИЧИНЫ Рлл,, МЫ ВСЕГДа МОЖЕМ ЗаМЕНИтЬ х и у величинами х' и у', пекоррелнрованными с г, т. е. мы можем ЗаРапес ПРЕДПОЛОжИтЬ, ЧтО О„е = ОУ, = О.
зт1 В 6В. Чаетнне коэффициенты корреляции какие значения ет,, следует считать чисто случайными, если х — Лг и у — (лг, в действительности, независимы? Согласно сделанному выше замечанию, мы можем при этом предположить, что Л = р. = О, следовательно, с„е = с = О. р1ы пойдем еще дальше и предположим, что х, у, г — независимые, нормально распределенные случайные величины. Если их дисперсии равны единице, то совместная плотность вероятности будет задаваться формулои з ? — — — з (л'.~. о еи 1'(х, у, г) = (2я) е (10) При этих предположениях мы должны найти функцию распределения П(с) случайной величины глони Эта функция определяется кратным интегралом Н(с) = р(г,оы < с) = =Щ Щ?(хь У~ г1) ?(х Уо гн)пх~ "У . еег (11) где область интегрирования задается неравенством г М < с. Как и в у бб, с помоьцью ортогонального преобразования можно выделить распределение выборочных средних х, у и г, Для этого мы вместо х,, у, и г„введем ир с и и таким образом, чтобы ин с, и ю, были пропорциональны х, у и г соотвстсзвенно.
Коэффициенты ортогоналыюго преобразования для с и ж выберем тс жс самые, что и для и, Если положим, длн краткости, [ис) =- иене +... + мос„, (12) а [ив) н [сес] определим аналогично, то выборочные коэффициенты корреляции буду г задаваться формулами 1'[ии] (ет) 1(ипЯ(ияо] ~ 11оо] (тит] Преобразованный интеграл выглядит точно так же, как первоначальный интеграл (11), но только с заменой х, у, г на и, с, ю. Так как определение области шпегрирования г „, ( с не зависит от и„с,, иен то можно произвести интегрирование по этим переменным и получить где область интегрирования задается неравенством г „1, ( с.
24и Гл. Х[[Г. корреляция 372 В формуле ([4) мы сначала произведем интегрирование по и,, „и„, е,,, е„, а затем по ва,..., аея. В качестве внутреннего интеграла получим 1 1 — „[оо! — „[сс! =)) О- Как и в $ б7, введем теперь ортогональное преобразование переменных и и е, считая и: псстояи[ым: и,' = 'а[„и., е,' = ~~'а, е,. ([6) При этсм коэффициенты выбираются таким образом, чтобы, в частности, имели место равенства (ии), (ев! ) (иао! ) (иаг) (! 7) и, следовательно, иа иа еа еа ! (ии! ! [и'и'! ! [ее! ! (е'е'! (ие! [и'е'! )'(ии-! (ее! ! (и и Це е ! ' Тогда ([5) перейдет н интеграл 1 = ... е " с(и'...
[(и'„А;... ае,',, (!8) <де иа — постоянная величина, и область интегрирования, как и прежде, задается неравенствсм гае!, ( е. При этом (и'е'! — и а !' '' "1 '' ~ [и'и'! — иа 1 (е'е') — еа иа еа+... + ил ел ~'. +...+Е ''а+...+..' Так как определение области интегрирования пе зависит от и', и е,',, то, интегрируя по этим переменным, получим с „,ис Формула (20) показывает, что интеграл 1 нс зависит от ю„ ., и„, следонательпо, множитель 1 можно вьпгести за знак 1 1 = 2я ...
) е ' с1и.„'... [1и,', с(е.',... [1е„'. (20) 373 у Ва цасыние колффициен(яи корреляции интеграла (14) и затем проинтегрировать по и,, ю, Таким образом, заменив и', ... на и,, ..., получаем ( — я+а( 1 — „(а(е аи' ео~-, -и,'~ Н(с) = (2п) )... ) е " (7ио... (!(Ьи (21) где область гнтегрирования определяется нерсвснс,всм е < с, а т, в силу (19), задается формулой (22) Сравним теперь инте(рсл (21) с интегралом (1О), вычисленным в 3 67. Ранее имелось 2(п — 1) переменных интегрирования и„..., и, и в„..., о„, те~срьже таких переменных имеешься 2(п — 2): и,, ..., и, и ое„, ьо Облас|ь интегрирования для интеграла (1О) 4 67 определялась неравенствами ее<а, '<Ь, т<с.
Но если а и Ь устремить к бссконечнссти, то область интегрирования будет задавиться одним неравенс1рсм т < с. Таким образом, инте(рал (21) являсзся частным случаем интеграла (1О) 3 67, пс э гому справедлива теорема: Функция распребеления выборочного частного коэффициента корреляции т„е равна функции распределения обычного выборочного коэффициента корреляции т, вычисленного по двум рлдам чезависимых. нормальна распределенных случайных в~личин хм ° ° 'х„, и у„..., у„„с тои" лишь разницей, что количества переменных в каждом рябу равно не и, а и — 1.
Еще раз напомним, что эта тесрема справедлива лишь в том случае, когда справедлива гипотеза, согласно катер(й х — 7а, у — ра и а являются нез.внсимыми, нормально распределенными случайными величинами, При 31(!м наиболее важным является требование независимости; что же касаечся чрсбсвания нормальней распределенности, то оно менее существенно, Согласно э1сй теореме, для проверки зависимости случайных величин х — -да и у — раможпо воспользоваться табл. 1З,считая число наблк>лений равным и — 1 вместо и.
в. ГеомГтгичаскоа истолковлнис Результаты, полученные в этом и в предыдущих параграфах, можно выеьстн геометрически. Пусть, например, п = 4 и пусть (им и„ие), (ьм ом ве) и (ес„ш,, и,) — компоненты трех векторов ц, и и ц7, расположенных в трехмерном пространстве.
В этом случае [ии) представляет собой квадрат длины вектора ц, [ио) — скалярное произведение Гл. ХПТ. Корреляция 374 и и и, и ㄄— косинус угла Р между ц и и. Плотность совместного распределения случайных величин м> и <>< 1 1 — л - 1 — „. [ии]- [ии] (2п) е показывает, что нсе шесть векторных компонент м> и п7 взаимно независимы и распределены нормально. Этот же вывод останется справедливым и в том случае, если к м] и пг добавить еще и . Указанный зак<и> распределения инвариантен относительно ортогональных преобразований. Таким образом, если одну из новых осей координат направи,ь вдоль вектора ц, а две другие ь Рис. 36.
Рнс. 33. ортогональные оси расположить в плоскости, перпендикулярной ц, то в новых координатах одна компонента <>' вектора и будет параллельна вектору и, а две дру~ие компоненты буду> перпендикулярны ц. При этом все компоненты независимы и подчиняю<ся нормальному распределснин>. Компонента <>', параллельная ц, распределена нормально с единичной дисперсией, а сумма квадратов компонент, перпендикулярных и, подчиняется распределеник> Хя с двумя степенями свободы, Обозначим эту сумму квадра>ов и"~.