Андерсон Т. - Введение в многомерный статистический анализ (Андерсон Т. - Введение в многомерный статистический анализ.djvu), страница 16
Описание файла
DJVU-файл из архива "Андерсон Т. - Введение в многомерный статистический анализ.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 16 - страница
(46) 0 1ю ч ч 1 г а Вычитая (45) прн 1=1, /=2 из (45) пои 1=2, /=1, получаем ац/а,' = агг/а' = аг('аг, !1ОэтомУ а' рагаг .а М(1 (47) Таким образом, ~Ф вЂ” Ря) 'г 1 аиагг Ряг а а~ваги~ (48) 1 — Рта Максимум функции правдоподобия равен ! з а г г (2я) (! — Р„гу а а (60) ег! козээииирит корррляции двкмирнон выворки 103 104 ВыБОРОчные коэФФициенты кОРРеляции !гл л При изменении параметров в области й максимум функции правдоподобия равен 1!Гч е Н, ! ! ! — 1Ч вЂ” О! — ГГ (2 )1ч (! го)2 „2 „2 шах Ь= я (51) Следовательно, отношение правдоподобия равно (1 — ро) 2 (1 — гт) 2 Г (1 — р„) (1 — !'2) $ у .
(52) и!а* Е ( 1 — рог)О! ~ (1 — р,г)' / или рос+ (1 — ро) Р1 — с Г) 22 2 Рос + ! Ро рос — (! — Р2) р 1 — с г<— р„с +! — р„ (54) Таким образом, критерий отношения правдоподобия для провеРки гипотезы Н: Р = оо пРк конкУРиРУющей гипотезе Р чь Ро дает область тех значений г, при которых гипотеза отвергается, в виде г ) г, и г < г';, но г, и г', выбираются не так, чтобы вероятность каждого кз неравенств (54) была равна а/2, когда гипотеза Н верна, а так, чтобы г, и г,' имели вид правых частей (54) при таком выборе с, чтобы вероятность обоих перзвенств была равна а.
4.2.3. Асимптотическое распределение выборочного коэффициента корреляции; л — распределение Фишера. В этом параграфе мы покажем, что если об ьем выборки возрастает, то выборочный коэффициент корреляции стремится к нормально распределенной случайной величине. Распреде- Критерий отношения правдоподобия состоит в том, что (1 — Р2)(1 — гт)(! — р г) < с, где с выбирается так, чтобы вероятность этого неравенства в случае, когда выборки произведены из нормальных генеральных совокупностей с коэффициентом корреляции ро, была равна заданному уровню значимости. Критическая область может быть аналогично описана неравенствами (рос — р'+ 1) го — 2росг+ с — 1+ рэ) О, (53) »л) коэеаицнвнт коиянляцин двтмвянои вывоякн 165 ление конкретной функции выборочного коэффициента коррелляции, функции Фишера (Ф и ш е р [21), дисперсия которой почти не зависит от корреляции генерзльной совокупности, еще быстрее стремится к нормальному.
Сначала докажем многомерную центральную предельную теорему. Теорема 4.2.3. Пусть»'!»я, ... — независимые и одинаково распределенные т-мерные векторы с математическим ожиданием МУ, =ч и ковариаиионноа матриИей М(»г„— ч)(ӄ— ч)'= Т. Тогда при п-ьоо распредеи ление вектора (1Е' »Еп)~,(ӄ— ч) стремится к И(0, Т). а=! Доказательство. Пусть »р (б и)=Мехр Еиг'=У.(»'„— ч), (55) и 1 где и — скаляр, а Š— т-л!ерный вектор, При фиксированном Е »ии(Е, и) можно рассматривать как характеристическую и функцию случайной величины (!/~Г п) ~' (Г'», — МЕ'У,). По а=1 одномерной центральной предельной теореме (см.
К р амер 121, стр. 238) предельным распределением этой случайной величины является И(0, Е'ТЕ). Следовательно, для любых и и Е 1 — ич' г» 1!)ш ч»и(Е, и) =е (56) и.+ сю (для а=О используется особое к очевидное рассуждение). При и=1 и любом Г 1 кч 11т М ехр ЕЕ' = » и (»,— и) ' у-„Ь а=1 1 — » т» Так как функция е з непрерывна прн Е=О, то сходимость будет равномерной в некоторой окрестности точки Е = О. Теорема доказана. Теперь мы хотим показать, что выборочная ковариационная матрица имеет асимптотичсски нормальное распределение, когда объем выборки неограниченно возрастает.
106 пывояочные коэФФицнснты кОРРеляции 1гл. 4 Т е о Р е м а 4.2.4. !ТУ с т ь А (п) = лч«(Մ— Х ) (Х, — Хн)', «1 где Хп Хм ... — независимые случайные векторы, распределенные И(у„Е! и и =)«Г — 1. Тогда распределение вектора В(л) =(1['Гlл) [А(л) — пЕ[ асимпспопгически нормально с нулевым ее!старом среднего значения и ковариаииями МЬц (и) Ьгц (п) = асье)! + ацо)ь. (58) 1)оказатсльство. !<ак показано раисе, А(л)= ~лл,л„, «=! где лс, ла, ... — независимые случайные векторы, распределенные М(0, Е). Г!редставим элементы произведения Х,Х, в виде вектора (59) Как показано в $2.6, моменты вектора У, можно вычислить, зная моменты вектора Х,.
Имеем МЛ„Е „=а<р МХс„х „хь,2г„= а гаь + о,.ьо, +-оцо.чо М (аыс. „— а, )(Е~,Е~„— оь!) = ос~ар+ апаса. Таким образом, вектор!а У„, определенные формулой (59). удовлетворяют условиям теоремы 4.2.3, где элементы вектора ч играют роль элементов мзтрицы Е, расположенных в векторной форме, а элементы матрицы Т определены выше. Если элементы матрицы А(п) расположить в векторной форме аналогично (59), скак!ем в виде вектора )У(п), и то Иг(л) — пч = ~л (ӄ— ч).
По теореме 4.2.3 вектор ««! (1с')гл)[)У(л) — пч1 раснрсделен асимптотичсски нормально «.21 кояФФициент кОРРеляции дВумеРнОЙ ВыБОРки 107 с нулевым вектором среднего значения к ковариационной матрицей вектора У„, что и требовалось доказать. В особенности пас интересует коэффициент корреляции Ац (л) г(а) = Р"Ап (л) А77 (и) (60) для некоторых Ю и / (Е чь 7). Это выражение может быть переписано в виде г(л) = Сы (л) (61) УСп (и) СЬ (л) ' где С,«(л) = А «(и)/У ед ч««. Множество Сл (и), С)7(л) и Сы(а) распределено так же, как ь и ~( ~" )(Х«,Е~,) ~И( ' ~ "~(2ы/у'е„, Л„/фго ), (62) где (лы, Е,„) — независимые одинаково распределенные векторы с законом распределения )ч 1 ~, ~ Л и р= Р =чД/еда~.
Пусть Сп (л) (7(а) = — С (и) С, (л) (63) (64) 2 2Р2 2Р Т 2ра 2 2р 2р 2р 1+ р' (66) Тогда вектор )ьп(0(л) — Ь) будет асимптотическн нормаль- ным с нулевым вектором среднего значения и ковариацион- ной матрицей 108 ВыБОРОчныя кОэФФициенты кОРРеляции [Гл. з А[(0. ф,'Тщ,). (66) Эта теорема, по сушеству, доказана в книге Крамера [2), стр. 401. Очевидно, что вектор з7(п), определенный формулой (63), с Ь и Т, определенными соотношениями (64) и (65) соответственно, удовлетворяет условиям теоремы.
Функпия 1 1 из Г= — з=и и ги (67) удовлетворяет этим условиям. Элементы вектора [р равны з — — ии ги. г~ = — — р. 2 3 1 г [ль 2 дс дзз! 1л=ь 1 3 [ ! — — ии ги 2 з' ' [ль 28 дс ди, [. ь (68) 1 1 и 'и г =1 !л=ь дс д"з [л=ь и )'(Ь) = р, Асимптотическая дисперсия величины у'п (Г(п)-Р) ') рйзп ([(л) = В означает, что ([(и) сладится к Ь по вероятности; см. зздачу 12 главы 3. Теперь воспользуемся обшей теоремой. Теорема 4.2.5. Пусть У(п) — т-мерный случайный вектор, Ь вЂ” фиксированный вектор.
Предположим '), что рйш У(п) = Ь и ее!стор )I п ((! (и) — Ь) исимптотичесзси л-зсо нормален А7(0, Т). Пусть о!= Г(и) — функция вектора и, для которой в окрестности точки И=Ь существуют ду(и) ~ первая и вторая производные. Пусть, далее, 1-я компонента вектора [р .
Тогда предельным распре- делением вектора )Гп (Г" ((7(п)) — Г" (Ь)[ будет равна ( 2 ( )~ — — р,— — Р, 1) 22 2 ' 2 ' )~ 2р 2Р2 2 29 1 Р 2 1 Р 2 2рз+ р4 (! р2)2 з з ! р) (69) Таким образом, мы получаем следующую теорему. Те ар с ма 4.2.6. Если г(п) — коэффициент корреляции выборки обаема )44'(=и+!) из нормальной совокупности с козффициентом корреляции р, то случайная величина )ггп (г(п) — р)/(1 — рз) [или [гМ(г(п) — р)/(! — Рз)1 асимптотически нормальна с параметрами О и 1. Из теоремы 4.2.5 следует, что если функция У(х) имеет первую и вторую производные в точке х=р, то случайнзя величина [уп [7" (г) — 7(р)[ асимптотически нормальна с нулевым математическим ожиданием и дисперсией — )'(! — Р)'.
Часто в качестве 7 (х) полезно выбирать такую функцию, для которой асимптотическая дисперсия является константой (в данном случае единицей), не завися4цей от параметра р. Такая функция удовлетворяет уравнению У(Р) 1 2 2(1 +1 ) ° (70) Таким образом, в качестве 7(х) можно взять функцию — [!п(1+ р) — !п (1 — р)! = — !п [(1+ р)/(! — Р)[.
1 1 Величина а — 1и— 1 1+г 2 1 — г (71) К21 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ДВУМЕРНОЙ ВЫБОРКИ 109 116 ВЫВОРочные коэФФициенты кОРРеляции [Гл 4 называется л-величиной Фишера. Обозначим Г = — [п —. 1 1+Р 2 1 — р' Т е о р е и а 4.2.7. Пусть величина л определена по формуле (71), где г — коэффициент корреляции выборки объема /1/(= и+ 1) из двумерной нормальной совокупности с коэффициентоль корреляции Р; 'ь — величина, определепнап по формуле (72).
Тогда случайная величина )/й(з — [) асимптотически нормальна с математическим ожиданиел[ 0 и дисперсией 1. Можно показать, что с довольно хорошей точностью (72) М -[+ — ', 2п ' М(з — ь) — М ~г — ' — — ), 1 l, рд' п — 2 ! 2п)' Последняя формула получается из представления в виде (78) (74) М (з — С)г (76) + 4 + в-, и 4пь и дзет хорошее приближение при малых ра/пг. Хотел- л и нг [8! приводит моменты г с точностью до и а. Важным свойством случайной величины е является то, что она сходится к нормально распределенной случайной величине гораздо быстрее, чем е.
Д з в и л (2) произвела сравнение между табулироваппычи вероятностями и вероятностями, вычислен- ными в предположении, что г распределена нормально. Она рекомендовала при /т/ ) 25 рассматривать г как нормально распределенную случайную величину с матемзтическим ожи- данием и дисперсией, определяемыми по формулам (73) и (74).
Теперь покажем, как может быть использована теорема 4.2.7: а) Предположим. что по выборке объема Д/ мы хотим пРовсРпть гипотезУ Р = Ре пРи конкУРиРУющей гипотезе Р чь Ре, Вычислим г, а затем г по формуле (71). Положич ( = — !и— 1 + Ра 2 1 — рь Тогда при бьь-ном уровне значимости область тех значе- ний з, при которых гипотеза отвергается, определяется не- равенством УМ З~л (,~ > 1,86.
(77) аи кОэФФициент кОРРгляции двумсРКОИ ВИБОРки 111 Точнее вта область определяется неравенством 'гг М вЂ” 3 ) г — че — — ре/(М вЂ” 1) ) > 1,96. (78) б) Предположим, что у нас есть выборка объема М, из одной генеральной совокупности и выборка объема М из другой генеральной совокупности. Как проверить гипотезу о том, что коэффициенты корреляции этих генеральных совокупностей равны, Р, =Р2? Из теоремы 4.2.7 следует, что если нулевая гипотеза верна, то разность г,— гт (где гг и г2 определяются по формуле (71) для двух выборочных коэффициентов корреляции) распределена асииптотически нормально с математическим ожиданием 0 и дисперсией 1/(М, — 3)+ +1/(М вЂ” 3).