Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 67
Текст из файла (страница 67)
В формуле (10) можно сначала интегрировать по и„..., сл, а затем — по и„..., ил. Прп внутреннем интегрировании по с„.. „ел величины и следует рассматривать как постоянные. Введем ортогональное преобразование переменных и, считая и фиксированными: все = Ьеесе +... + Ь„,и„, есл — Ьлеие + . + Ьлл"л (11) где коэффициенты первой строки определяются формулами Ьи = — ' (4 = 2...
п). 1ие+ .. + лл (12) Так как случайные величины и, и и, не зависят друг от друга н от остальных и„е,,..., ил, с„то х и у не зависят друг от друга и от в'„, в' а т. Разумеется, х и у распределены нормально с дисперсией 1/п, Поэтому нам осталось исследовать лишь распределение случайных величин вв, в„'и г, являющихся функциями от и,, е,, ..., ил, ел. Эти функции задаются формулами (6), (7) и (8). Постараемся вычислить вероятность события в„' < а, ~т < Ь, т < с, (9) Эта вероятность равна интегралу а 67.
Коэффициент корреляции как признак зависимости Зал Сумма квадратов коэффициентов Ь21 равна единице, следовательно, в силу 5 13, коэффициенты остальных строк можно определить таким образом, чтобы все преобразование было ортогональным. Тогда внутренний интеграл запишется так: 1" 1" — — Ео! г р 1 = ... 1 е 2 ° Нов... с(о„=)... ) е 2 ' с?и'з...с!и„. (13) Согласно (12), л «в"2+ ° ° ° + илол и 2 1 «в+... + и„ следовательно, т— У ~+...+, У .'+...+,*, Если положим ес'., +... + и;"; = Св, (14) (18) то, в силу (8) и (14), г и е,' окажутся зависящими лишь от и~е иС2: (и — 1) ез = и' + мз +...
+ и,', = м2 2-)- Се, (16) е 2 2 Сл — э с!го с?С (18) где область интегрирования определяется неравенствами С~О, соз -1- Се = (я — 1) ео ( (и — 1) Ь, — = г < е. Усо'+ С' (19) Интеграл Х не зависит от ие, поэтому в формуле (10) множитель ? можно вынести за знак интеграла. Тогда получим (20) (!?) У в+Се Для того чтобы вычислить интеграл (!3), мы вместо еоз,..., иол введем полярные координаты Г, р„ ...,4~„ ,. Так как неравенства (9), определяющие область интегрирования, не зависят от угловых переменных, то можно сразу же проинтегрировать по р,, ~р„з и, положив зев = во, записать внутренний интеграл (13) в виде с л.
Х111. Корреляция зае где область интегрирования задается неравенством я ~ и,'. = (я — 1) ех ( (и — 1) а. (2! ) Если в этом интеграле также ввести полярные координаты Х, ср',,..., ср„' „то снова можно будет проинтегрировать по угловым переменным. В результате получим 1 à — -„и Мт СЕ~ е "- Хя-ЯЫХ-= 1 1., 1 = а ) е - 'Х вЂ” эс(Хе '-' Ья-'сс*С е ' с(ю, (22) где область интегрирования задается неравенствами (23) < е. ) со' + Р Само собой разумеется, что этот результат справедлив не только для области специального вида (9), но также и для произвольной области С в пространстве переменных е-„", е', г. Пусть С' — преобразованная область. расположенная в пространстве новых переменных Х, Ь, ю, которые определяются равенствами Хи == (и — 1) —.
е'„ 2 ил сея + !,е = (я — ! ) — ", ат (24) (25) а О, ю= =(си — ! — ' )' '+Сг (26) Знаменатели аэ, сг' н о„добавлены для того, чтобы формулы были справедливы й тогда, когда сг„и стх не равны единице. В этом случае области С соответствует вероятность 1 1, 1 Р С = И' = а~~~е а Х" я с!Х ° е з' Ья-з с(Г ° е а' с!со (27) где интегрирование распространяется на преобразованную область С'. Постоянную а, конечно, следует определить таким образом, чтобы интеграл по всему пространству Х~ О, ь ~ 0 равнялся единице. е 67. Козффициент корреляции как признак заеисимости Зет Результат можно сформулировать так: уз = и, Ьз = о и и являются независимыми случайными велишнами с плотностями вероятности и-з 1(и) = ае е - и з, 1 (28) г'[ — ~2 3 1 а-4 д(е) =азе з о '-' (29) аз = Г(п — '~ 1 Ци) = .е '1'йк (30) Поэтому тз и ьз подчиняются распределеншо тз с и — 1 и и — 2 степенями свободы соответственно. Сяучайная величина ю распределена нормально с нулевым средним значением и единичной дисперсией.
Теперь легко можно вывести распределение выборочного коэффициента корреляции г. Сначала равенство (26) разрешим относительн> ь' н затем построим отношение С = — Ул — 2 =- )ги — 2, е4 )'1 — ее (31) Так как ю имеет нормальное распределение и ьз подчиняе ся распределению тз с и — 2 степенями свободы, то, согласно 3 28, случайная величина 1 подчиняется распределению Стьюдента с и — 2 степенями свободы. Зная границы для 1, соответствующие обычным уровням значимости (5, 2 и 1ое„), и пользуясь формулой (31), немедленно получаем границы для выборочного коэффициента корреляции г. Этн границы табулнрованы в табл.
13, в конце книги. Таблица 13 применяется следующим образом: если в результате практических вычислений получается такое значение 7, абсолютная величина которого превосходит границу г,. из табл. 13, то случайные величины х и у считают зпвисимьики. Относнтелыю уровня значимости этого критерия можно сказать следующее.
Гя, Х1П. Корреляция Если х и у зависимы и если, согласно этому критерию, независимость отвергается„то в данном случае никакой ошибки не возникает'. Может быть и другой случай, когда х и у независимы и распределены приближенно нормально. В этом случае истинный уровень значимости критерия приближенно равен 2ф, так как именно с таким уровнем строился точный критерий для проверки независимости двух нормальных случайных величин. Имеется и третий случай, когда х и у независимы, но их распределения существенно отличаются от нормального. В этом случае истинный уровень значимости критерия может оказаться несколько больше, чем 2Ф. Однако если х и у обладают конечными дисперсиями и и достаточно велико, то отклонение истинного уровня значимости от 2ф не будет значительным.
Это происходит потому, что случайные колебания т определяются главным образом случайными колебаниями числителя ~ (х — х) (у — у). (32) Если и велико, то х и у можно приближенно заменить истинными средними значениями х и у. Тогда вместо (32) получим ~,' (х — х) (у — у). Это выражение представляет собой сумму большого количества независимых слагаемых, квадратичное отклонение каждого из которых равно о„т .
Следовательно, согтасно центральной предельной теореме (3 24 Г), эта сумма распределена приближенно нормально с нулевым средним значением н дисперсией гифтз. Знаменателем т является (и — 1)в„а„, следовательно, этот знаменатель приближенно равен пег„ят . Поэтому при и — случайная величина т распределена асимптотически нормально с нулевым средним значением и дисперсией 1/и, безотносительно к тому, распределены х и у нормально или пот. Таким образом, при п - истинный уровень значимости стремится к 2(3. Для конечных, не слишком малых и отклонение от 2ф не очень значительно.
Пример 47 (из книги: Р!вьсг В. А., яьвмвмгв1 ттесьог!в Гог ВевепгсЬ%огйегз, 11$Ь еб., Ех 27). В восточной Лпглин в течение 20 лет (с !885 по! 904 г) г Строго говоря, этот критерий предназначен для проверки независимости случайных величин з и у, распределенных нормально. В остальных случаях этот критерий употребляется для проверки гипотезы Е = О. При таком ястолкованни мощность критерия оказывается вполне удовлетворительной.
Если же этот критерий применяется для проверки независимости случайных величин с распределениями, отличными от нормального, то, как показывает пример в предыдущей сноске, мощность критерия может оказаться очень малой. Автор не затрагивает вопроса опенки мощности этого критерия, а рассматривает лишь вероятность ошибки первого рода.— Прим. перев. Э 88.
Частные казффициенты корреляции велись наблюдения за урожаем пшеницы и количеством осадков осеншо. В рсзудьтатс оказалось, что урожай пшеницы и осенние осадки связаны отрицательной корреляцией, равной — 0,63. По таблице находим, чго 0,56 является 18«.ной границей лля г. Следовательно, взаимосвязь между осадками и урожаем пшеницы можно считать доказанной, $68. Частные коэффициенты корреляции А. ПОНЯТИЕ ЧАСТНОП КОРРЕЛЯЦИИ' Х' = Х вЂ” лса И У =У вЂ” )г2, которые некоррелированы с 2 (слово «некоррелированы»означает, что коэффициент корреляции равен нулю). Возникает вопрос. какова будет при этом оставшаяся корреляция между х и у? Сначала мы займемся изучением этого вопроса для истинного коэффициента корреляции о„у. Если х = у = = О. то «г а () 1 Множители А и 1л нужно выбрать так, ««тсгбы имели место равенства «слг Х 2 = Я(Х2 — А2г) = О, 0, у'2 = ~,(туа — р.аз) = О.
Отсюда находим .тг акга ка г г с' г' (2) ау Еуг — . «Частный коэффициент коРРелЯции» о,«1, опРеделЯетсн фоР- мулой ~с (х — Аг] (у — !ш) Е.в г =Е* ° =- (4) ге к — Лг лгу — лг г Автор пользуется здесь терминами «очишенные«козффнцненты корреляции н «очищение«(ьсгс!шягс льоггс1выопз йосГ!1ысптсп, Ваге!пцишя], которые хорошо соответствуют логпческону замыслу теории чнстнои карре. ляции. — Прил«. ред. 24 В, л.