Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 42
Текст из файла (страница 42)
(12) (10) где ~!а,з- — первые Аз+1 членов разложения гг ехр — ~!гага ' В реву.чьтате получается следующее нредставление для гр(!) (которое мы здесь не используем): ! гч р(!)=ее!')=ео якз(1 — 2В) з ~~'.,а (1 — 2В) -)-я»и гг 0 (13) 282 ПРОВЕРКА ОБ!НИХ ЛИНЕЙНЫХ ГИПОТЕЗ !ГЛ В а Я,„е! — остаточный член. С другой стороны, гт Ф (Г) = — — !л (1 — 2И) + ~~) ш, [(1 — 2И) ' — 1[+ Ит!. !, ( ! 4) г ! где ! т т =(! — вг! ".*р );.,!! — г!г! ' — Ъ'.,Ч-Ф.„~- г г ! ! т =(1 — 2И) т Ц~1+ш,(! — 2И) '+ г ! т + 2!шг(! — 2И) ...[ ~я~1 — шг+ —, шг —...)+ГСт!.! г=! ! =(1 — 2И) з [1+ Т!(Г)+ Та(Е)+ ... ... + Тт И) + )г .г[, (16) где Т, И) — член в разложении, содержащий ш',! ...
ш'г, ~ гг, = г; например, Т, (Е) = ш, [(1 — 2И) ' — 1[, Тт (Г) = ша [(1 — 2И) — 1[+ + — ',[(1 — 2И) ' — 2(! — 2И) '+1[. (!В) (17) В большинстве приложений хе — — с 8 и уг — — е(78, где га и г(! — константы, а 8 — перемеппая (которая растет с увеличением обьема выборки). В этом случае, если р выбран так, чтобы (1 — о)ха и (1 — р)у! имели пределы, то йг = 0(8 1~~'!). В (16) мы группируем все члепы ш',! ... шаг, ~!а!ттг, потому что опи имеют порядок 0(8 ').
!!Агтг! = ~~'., 0(ХА !т+!Г)+ ~~'., 0(У !т!г!) (16) В (14) мы разложили д(б) таким же образом, как и у(1), и привели подобные члены. Тогда (г) ф (О лсимптотнчасков назложвнив 8.61 !. / — (1 — 2И) а е- п*гИ. [ 2з СО ! ! д,(з)=, Р е 2' г( — о) (19) Пусть ! 8 (г) = 1 — (1 — 2И) а Т,(1) е-!" гИ и 2ч (2О) ! †:в Тогда п.чотность распределения вероятностей величины рМ будет 'о т ,/' р(1) и'!И =,гав (з)+)т кч !т 2п ОЭ т!)но =Кг(з) + и! [Кг!-т(з) Кг(е)[ + ю! + [ <оз [КГ „4 (з) — Ку (е)[+ -2- [Куь! (з) — 2КГ! а(з)+аГ(з)[ + °" + Ящ (з) + Йщ,.!. (21) Пусть и,(зо)=~ З,()~~, )(„'„=~ Я,'„',,Ь..
(22) о о Функция распределения величины Мо выражается через функцию распределения величины рМо, которая является Заметим, что Т, (С) — полипом степени г в разложении ! -! з~ (1 — 2И), а каждый член выражения (1 — 2И) а Т, (1) ! есть константа, умноженная па (1 — 2И) У для целых о.
! Известно, что (1 — 2И) а есть харзктеристическая функция ут-распределения с о стапелями свободы, т. е. 284 пРОВеРкА Овн!их линейных гипОтез 1Гл. в интегралол! от плотности, а именно Р (М < Мо) = Р (РМ < оМ Д = ~у (/Г (РМо) + ~Д4 ! -1- Г =1 (Х~~<РМВ)+~~(Р ~Х~~!а <РМ!!! Р ~Х~Г <РМ ))+ +гоъг!Р !х/44 <РМо~ Р ~ху <РМо()+ 3 + 2 (р (Х/44 <РМо! 2р(Х~/+з <РМо~ + +Р!Х/<РМо)))+ ...
+(/.(РМ,)+г.'„е (23) Остаток /с,„ь! есть О!8 ), Послелнее утверждение может Г -!ю П! быть проверено непосрелственно (в самом деле, чтобы доказательство было строгим, необходимо проверить, что зта оценка равномерна дзя каждого остатка). Во многих случаях желательно выбирать о так, чтобы ы! было равно нулю. В таком случае использование лишь одного первого члена (23) дает ошибку порядка 8 Дальнейшие детали, касаюпгиеся разложения в ряд, можно найти в работе Б о к с а 11!.
Теорема 8.6.1. /гредположим, что для всех числ!о мни.иых й МФ'ь дается формулой (1), причем выполняется (2). Тогда функйия распределения величины — 2о!п Ю' дается формулой' (23). Гели хь ) с„8. у ) б 8 ь ь ' / / (сь ) О, б/) 0) и (! — о)х„и (1 — о)у/ имеют пределы, где р может зависеть от 8, то ошибка, /с 4! есть Ч 0(8 '~~н).
Бокс рзссмотрел также вопрос о приближении распределения величины — 2о1п Ф' Р-распределением. Он обнаружил, что можно сделать так, чтобы ошибка такой аппроксимации имела порядок 6 з. Мы не будем останавливаться на аппроксимации Е'-распределением, 8.6,2. Асимптотическое распределение величины Х. Теперь мы применим теорему 8.6.1 к распределению величины — 2 1п )!. отношению правдоподобия, рассмотренному ».61 Асимнтот1И1Гское РАЗлОжениЕ в И' 8, 3 . Положим Ю' = А. «- и м о и сит величины А равен П'Ь("- + 1- «+""~) м~» К'; (24) и ~-,(--"+ -+- 1 1 / 1 и это справедливо для всех И, для которых гамма-функция существует, включая и чисто мнимые й.
Пусть а=А=,в 1 1 ! к» вЂ” — — М, !» = — ( — 1)+ 1 — «), р» — — — (1 — р) М, 2 ' 1l 2( та+ ~)' ! 2( Мы видим, что 11 1» ( — Н! — р) А' — ч+ ! — «) ~ — — ((1 — р) м — а+1 — «) г 2ш1= ) 1 »-1 2Р ! 1т 2!(1 — р) М-яг+1 — «1 !1 + 2 Н1 — р) Аà — я»+1 — «) 1 — рФ 2 2»сч ~ — 2 Н! — р) Ф вЂ” г!»+1 — «) д1+ 41 + 2) †.~'~' ! — 2 (1 — р) Мф- 26» — 2+ (р+ 1) + д1-~- 2), (26) 2рАГ Чтобы это было равно нулю, необходимо, чтобы 1 Аг- я — 2 (р + я + 1) и (3$) Тогда Р ~ — 2 М ! А ~< г ~ = Р ( — гл1п У» и ~ ~ ~( в) = )Хм ~~в) + яй ( )ХР»»1~~~) )Х»и < а))+ +»И [!1( )Хру,,»4 ) )Хр»,4 ))— 1 Тв(Р (Х~лр,+» ~4 в) 1' (Х»р, 4 «)))+ йа, (28) где 1 т = р1'/ = /'/ 4/2 — 2 (Р + Ч1+ 1) рв1(рг+41,— 5) «2 (29) (30) 2 «4 = — "+19 -,) 13р4+ Зд41+ 10р2472 — 50(р + 172)+ 1591.
(31) 1 Так как )1=(/~2 „, где а=1'/ — 17, то (28) дает Р1 — т1п(/,,„,„<2). Т е о р е и а 8.6.2. Функция распределения величины — т 1п (7Р,„, „дается формулой (28), где т = ив 1 — 2.(р — 471+1), а «„и «4 определяются соответственно по формулам (30) и (31). Остаточный член есть О(М ).
Если используется первый член (28), то ошибка имеет порядок М , сели второй, то Ж , н если третий '), то М Второй член всегда отрннатсльный и достигает максимума при е= )/(р171+ 2)(р471) (приближенно равном р17, +1). При р)~ 3. 471~3 «„/тг <~(рз+47~)/т)2/96, а величина второго члена больше — 0,005 [(рз+ 172)/т12 и меньше нуля. При р)~3 471)~З «4 <«2 а величина третьего члена меньше чем («2/тг)2. Весьма приближенное правило состоит в том, что использование первого члена обеспечивает точность до трех десятичных знаков, если рт+а21 <т/3. В качестве примера вычислений рассмотрим случай р = 3, 471=6, М вЂ” аз= 24 н я=26,0 (!ОЙ-ная точка значимости распределения т21з, 18=р471). В этом случае «2/т'=0,048 и второй член равен — 0,007; «„/т4=0,0015, а третий член равен — 0,0001.
Таким образом, вероятность того, что — 19!п(/з в 1 <26,0, равна 0,093 с точностью до трех десятичных знаков. ') Бокс показал, что член порядка М ' равен нулю, и указал коэффициент, который используется в члене порядка Ф в, 286 пРОВГРкА ОВ1них лнненных Гипотез (Гл а 287 АСИМПТОТИс!ЕСКОЕ РАЗЛОЖЕНИЕ а.з1 Таблица 9 дает и редста в лен ие о точности этих п р ибл ижений; в приближениях и сп ользуется только первый член Разложениа.
У р То Ас е та бУл иРована длЯ 5 о4 - ных точек значимости (Бокс (Ц приводит больше примеров.) Таблица 9 Испоаазовапне -21п 1. Нспоаазо. ванне -на1п 11 Точное значение р ь 26 Таблица В 9 8.5 содержит точки значимости прн бз4-ном уровне значимости для р=3, о!=3 и л от 3 до 10, Таблица 10 дает точки значимости для — л! !п У при и, изменяющемся от В до бесконечности. Таблица 10 Точки значимости для — яз 1п Ума „ 17,4 ! 22,3 !~ 12 — 14 17,3 22,2 ( 15 — 21 17,2 22,1 ~ 22 — 28 17,2 22,0 ~ 29 21,9 21,8 21,7 21,7 17,1 17,0 17,0 16,9 8 9 10 11 Величина (28) при я=16,92 (5о4-ная точка значимости дчя уэ) равна 0,9440 при л = 10; 0,9487 при л = 21 и 0,94959 при и = 37. Таким образом, при и ) 2! достаточно взять первый член, чтобы получить бо4-пый уровень значимости с точностью до 0,001.
0,925 0,883 0,849 0,819 0,766 0,850 0,564 0,752 0,352 0,232 0,935 0,892 0,856 0,82'1 0,778 0,924 0,883 0,849 0,8!9 О,?67 0,849 0,564 0 752 0 350 0,236 288 ПРОВЕРКА ОБЩИХ ЛИНЕЙНЫХ ГИПОТЕЗ 1ГЛ 6 В з л ь д и Б р у к и е р [! [ получили асимптотическое разложение для — 21ЕХ. Бартлетт [5[ предложил использовать точки значимости, соответствующие у~-распределению, для — лг!п У, а К. Р. Р а о [7[ видоизменил разложение Вальда и Брукнера с целью получить [28).
8.7. Проверка гипотез о матрицах коэффициентов регрессии и доверительные области 8.7.1. Проверка гипотез. Предположим, что нам даны векторы наблюдений х,, ..., хл, вместе с фнкснровзнными вектоРами гп ..., Еаг, где х„ — наблюдение над совокУпностью М(ВЕ,, В). Пусть В =" (В, В,) и «„ =(г.и, г н ) где В, и а1„'~' имеют д,(=д — о ) столбцов. Нулевая гипотеза Н состоит в том, что В~=ВБ [1) где В~ — определенная матрица. Предположим, что желаемый уровень значимости равен а. Процесс проверки гипотезы состоит в вычисления величины и= [Дг2а [ [2) [ле 1 и сравнении ее с Ур,ю,„[к), точкой значимости Ур,и „-распределения для уровйя значимости а.
Для некоторых случаев этот критерий проверки можно получить из теории распределений, приведенной в 8 7.5.2, а в других случаях его можно получить нз асимптотической теории, если использовать достаточно большое число членов. С другой стороны, можно вычислить Р [Ур, „, ( У[. Если эта вероятность окажется меньше а. то йулмевая гипотеза отвергается. Теперь рассмотрим проблему вычисления величины [2). Если мы положим у„=х„— В',а~'~, то у. можно будет рассматривать как наблюдение над совокупностью Р7[А»„, В), где Ь =[А, Ь,) =(В, — В,ВЗ).
Тогда нулевая гипотеза Н будет состоять в следующем: А,=О. В этом случзе Ху„у„'= ~2~ х,х„' — В;С',— С,В1 +В",АПВ, (3) ~ у,х,' = С вЂ” В*(А, А, ). [4) аги ГипотезА о коэФФи!!иентах РеГРессии 289 Таким образом, проблема проверки гипотезы В! = В! эквивалеитпа проблеме проверки гипотезы бс! = О, тле Му„ = !)гл„. Исходя из этого, предположим, что задача состоит в проверке гипотезы В,=О. Тогда МЕ,„=,'.„-Е,к' — аааоАюй;„, МХ = ~ж,х'„— ВяАВ'. В 9 8.2,2 мы показали, как по методу Дулиттла вычие сляется ВзАВя, а следовательно, и Мд'я. Ясно, что ВанАюВа можно вычислить апалогичиым образом.