Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 47
Текст из файла (страница 47)
е. Хц). Как доказано в в б.2, равенство (6), ! 1 —, рм гпах 7.(р, Х) = , , е (б) Ро Х (2о)г ' !Р. !2 ' 1 КРИТЕРИЙ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ 817 где м Хп„-)7 у, (х.п — х1ОКх.' — х ) ° (14) а 1 Если разобьем А и Хя так же. как Х: Аи А!2 А!а Аю Аю ... А!а А, Ат ... Аее Хп Хи . ° Хь! ~я! Хю ° ° Хая (и) Ха, Ха, ...
то увидим, что Хп =Х,! = — Ан. Отношение правдоподобия равно ! гвах б(И, Ха) 1 и и а Н л И!Х,1™ Гй (18) 1А1 1()А ) Критическая область проверки гипотезы по критерию отношения правдоподобия имеет вид ~~~) (е), (17) где )1(а) — такое число, что вероятность (17) равна е, когда Х=Ха. (Остается показать, что такое число можно найти.) Пусть (18) ~[ 1 Ан! )~ ~, Ъ'(е). (19) 1 —,М Тогда ). = 1'я является монотонно возрастающей функцией (г.
Критическую область (17) можно записать также в виде 31Е пРОВеРкА ГипОтезы О игзависи!!Ости 1Гп. э Теорема 9,2,1, Пусть кн ..., хн — выборка из М наблюдений над совокупностью М(р, Х), где к„, р и Х разбиты на рп ..., р строк (и столбцов в случае Х), как показано в (1), (2) и (3). Отношение правдоподобия для проверки гипотезы о взаимной независимости (( множеств компонент задается формулой (16), где А, определяемая в (10), разбита на части согласно (15). Критерий оп(ношения правдоподобия задается формулой (17) или зквивалентной ей формулой (19), где (г определяется формулой (18), а ) (е) или У(е) выбираются таким образом, чтобы достигался уровень значимости е.
Так как гы — — а(/)/аиа1(, то имеем !А! — — ~)~! П "и (20) где ) 1! ) 12 ' ' ' Ю!д )~2\ )~22 К2д гч =(г„) = (2! ) )~д! ~д2 ' ' ' Од( Р(+ "(Р( ! Аи ! = !)дц! Д а((. ( Р(+. Р( !+! (22) Таким образом, (г =— !.4! !(('! (23) Д!Аи! Д!йи! Следовательно. Ъ' можно целиком выразить через выборочные коэффициенты корреляции.
Величину )г можно интерпретировать при помогци обобРдснной диспсрсии. Каждое множество (хп, ..., «;А,) можно рассматривать как вектор в М-мерном пространстве; множество (хи — х,, х, — х,) = зо например, является проекцией на плоскость, перпендикулярную прямой, которая образует равные углы с осями координат. Определитель (А! представляет собой квадрат объема р-мерного параллелепипеда, построенного на векторах зи ..., з„.
Определитель )Аи! представляет собой квадрат объема (р,-мерного) КРИТЕРИЙ ОТНО1ПЕНИЯ ПРАВЛО!ТОДОВИЯ З1й 9И параллелепипеда, построенного на векторах из Г-го множества. Если каждое множество векторов ортогональпо любому другому множеству 11. с. )А', = О, 1 +у), то квадрат объема 1А( равен произведению квадратов объемов 1 Ан~. Например, если р = 2, р, =- рт — — 1, то это утверждение сводится к слсдуюпгсму: йлощадь параллелограмма равна произведению сторон, сели углы между его сторонами прямые.
Если множества почти ортогональны, то определитель 1А( близок к Д 1Ап! и обьем У близок к единице. Отношение правдоподобия обладает следуюшии свойством инвариантпости. Пусть С вЂ” произвольная невырожденная матрица порядка рп и пусть С, 0...0 С 0 Ст''' 0 (24) 0 0 ...С А", = ~'(хчп — хигп(х в х э) ' = » М~( = С~ ~л~~ ~(МΠ— хи~~(х~~' — хьи)' С'. = С,А С' (25) и А" = САС'. Поэтому 1 А*1 1 САС'1 Ц(А*„! Ц(С,.А„С1~ 1С~ 1А1 1С'1 1А1 ибо ~ С1 = П ! С,!.
Таким образом, критерий ициарнангщг относительно линейных преобразований каждого ',ммгиаотаи. Пусть Сх,=х'. Тогда критерий для проверки независимости в терминах х„тождествен критерию лля проверки независимости в терминах х„. Пусть матрица А* = = ~кл(х, — х')(х„— х )' разбита на подчатрицы (блоки) Агр Тогда 320 пРОверк» гипОтезы О нгз»нисимости 1гл э Нараин 141 показал, что критерий, основанный на И, являстся строго несмсщснньы, т. с. вероятность отвергнуть нулевую гипотезу больше, чем уровень значимости, если эта гипотеза неверна (см. также 1»эйли 11) ). 9.3.
Моменты отношения правдоподобия прн условии, что справедлива нулевая гипотеза Чтобы найти точки значимости У(а) (использованные в формуле (19) 9 9.2), мы хотим найти распределение 1' при условии, что справедлива нулевая гипотеза. Матрица А = МХя распределена по закону В'(Хс, а), где а = !ч' — ! и Хс определяется по формуле (6) 9 9.2, Распределение вероятностей матрицы Ан —— )ч'Х!! является распределением Уишарта пг(Хн, а) и так как при нулевой гипотезе Х" не зависит от Х"', то матрица Ан распределена независимо от А!) (1 и !).
Момент /!-го порядка отношения ( А1/1Ас! =Ъ' равен М/»= / ° ~ ) А (» Д ~ Ан ! К(Хс и) Х ! ! ! — (р-р-и / 1 )( ( А (а ехр ( — —, зр Хс А1 г(А = 2 )2» l '''/ Д)Ан~ '~К(Хс а+26) Х ! )(!А!т ехр( — —,зрХс'А))г)А, (1) где К(Х, а) определяется по формуле (7) 9 8.4, а интегрирование проводится по !!А = г(аи... г)арр, где А — все неотрицательно определенные матрицы. Член в скобках представляет собой плотность распределения (г'(Х, а + 29).
Интсграл от этой плотности по всем элементам А! прн (Ф / лает частную плотность распределения вероятностей Аи, ..., А , которая является произведением плотностей тв(Ан1 Хн, а -г 29). (Следует отметить, что интегрирование нГКОТОРь!Г РАспРГдГДГния Вн! не включает ~Ац .) Таким образом, (1) переходит в 1 )С ехр( — — зр Х11 А11) 4(А11~ = 2 К(Ес,л+26) а-а-,/ ' ' ',/ ( "' + 1 1 1 — (и Р— 1) ! ! -1 Х ) Ан ~ В ехр ~ — — зр Х11 Ан) г(АН— К(ЕВ, н) '1 4 К(Ен, н+2й) щ К(ЕВ, в+26) П К(Ен, и) Так как (Х~ = П!Хн !, то (2) сводится к Р С П (2 ( + )+ 1П !П (2 (и+ МУ" 1-! !г-! (3) Поскольку О (У (1, эти моменты определяют распределение У единственным образом. Следует отметить, что номенты не зависят от ХВ.
Таким,рбразом, распределение У не зависит от неудобных пара%етров, когда справедлива нулевая гипотеза. 9.4. Некоторые распределения отиогдения правдоподобия Зная моменты величины У, в некоторых случаях можно вывести точное распределение; некоторые примеры приведены в $9.4.2. Вывод некоторых формул основывается на представлении У в виде произведения независимых случайных величин (9 9.4.1); в принципе распределение У можно представить как интеграл от совместной !Плотности вероятности независимых величин. Для определения точек значимости !! т. Андсрсон 322 ПРОВЕРКА ГИПОТЕЗЫ О ИЕЗАВИСССАСОСТИ !ГЛ 2 полезныч оказывается асимптотическое разложюисе, которое исследуется в в 9.5.
9.4.!. р как произведение независимых случа9ных величии. Момент /с-го порядка величины )» равен Т[ — (л+! — с)+Л) 1[ (л+ ! /)~ — (л+! — С) с 2 с Г! —,(л.1! — /;+А! а Рс 1'[ — (я+1 — р; — с) + а ~!'[ — (л+ ! — /)~ с 2 с с 1 — (л+1 — р — /) 1С вЂ” (л+1 — /)+Ь~ где Р, = Р, + ... + Рс Р Это выражение можно переписать следуюсцсссс образом: 1 ~ — (л Ь ! — /) ~ Г~ — (в+ 1 — рс — /) )-6 ~ ! ~ — р, М~а П и!2, 2 с р[ — (л+1 — рс — /)~ 1'[ — р,) р[- (л.1 1 — /).~. й ~ а Рс П ДВ '[ — (л+! Рс /) Рс)Х С 2 / 3 2 С С Х х' — (ля! - РС - С) 2 и- С вЂ” Р.-С (1 — х) 2 ' с/х.
(2) з Таким образом, распределение величины )» совпадает с рас- 2 ( л -... и И!И»,), „»„........,. С 2 / 1 1 1- 2 вероятности величины 2 с равна р[х; — (л-)-1 — р,-/), — Р,з!. Когда р, четно, рс — — 2гс, !.ь 1, то, пользуясь форгсуссой удвоения для гамма-функции Г[а+ — )Г(а -)- !/= 'ус ТГ(22.+ 1)2 ~, нвкотоныв тлспрвдвлвння можно привести выражение для момента Ь-го порядка вели- чины У к виду 9 а П ~ .Пг Г(п+ ! — Р! — 2а+26) Г(п+1 — 2а)1 ! 2 ~ ~~-1 Г(п+! — Рг — 2Ф) Г (и + ! — 2Д+2й) ~ а = Ц 1 Д В (и + 1 — Р, — 2(г, р!) )4 г-я '1 а.! х"'! л! та т» ~(! — х)Р! 1г(х .
(8) ХУ ч Таким обраэом, распределение величины )г совпалает с расе ° Р ° П!ПГ ) 2 плотность распределения )ы имеет вид р (у; и+ 1 — Р,— 2й, р!). 9А.2. Некоторые частные случаи распределений. В некоторых частных случаях можно получить точное выражение для распределения величины У=) вт Случаи 1: у=2. В этом случае момент й-го порядка величины )' равен т~-(п+! — )+Л~ ~ Г~ (п+! ))~ Г~-;( + — )~ - Г~;-(+ — Л)л~ Г ! — (п — р., -.~- 1 — !) + а ! Г ~ — (в + 1 — !)~ (2 г ! !( -(п рт+! !)11( (и+! !)+а~ Глава 9 п=И вЂ” 1 Глава 8 ч2 Ч1 р Рт Р1 !1ь Это выражение имеет тот же вид, что и формула (1О) 9 8.4, причем имеют место следующие соответствия между параметрами: 324 пРОвеРкА п1пОТГзы О 3!езАВисимости [ГЛ Э Таким образом, распределение У при 3) = 2 совпадает с распределением Урл р„л3-1-рс Ряд специальных случаев уже рассматривался в ф 8.5. Случай 2: 3)=р.
Здесь р,=[, и проверка гипотезы о независимости является проверкой некоррелированности каждой пары переменных, В Э 9.4.1 показано, что велир-1 чина У имеет такое же распределение, как П ХР где ! 1 вероятности Х, равна Х, независимы н плотность Р~; —,( — [), —,[~ 1 1 Рассмотрим случай р = 3. Если К = В ~ 2 (и — ! ), — ~ В [ — (п — 2), 1~, то Р (У ( ю] = — Р ~Х!Х2 (о) = 3 ! 3 1 =К ~ / х' (1 — х)2 у' ![у с[х +. о о 1 3/л ! — |л-Ц-1 --1 — |л-2)-1 +К / ! х2 (! х)2 у2 г[уг(х л е 1 1 2 /' - |л-1)-1 2 =К вЂ” — / х' (1 — х) 2 в)х + л — 2 ~./ о 1 3 1 +о' [ х2 (1 — х)2 3(х~= =К.'2~ Б — Б ~' - -Ч+ 1 — |л-2) + 2ю2 агсейп У 1 — о( =у„~-( — 1), -~+2В ~ — ( — 1), -;~ Х 1 )4 о' агся!и У! — о. (5) Случай 3: р,= ...
=р =2. В ф 94,! показано, что в этом случае распределение У совпадает с распределе- НЕКОТОРЫЕ РЛСПРГДЕЛГНИЯ зм! Р (У ~<о) =Р (Х,Х «< ~/о) = =К / / х"-б(1 — х)зул-4(! У)с!ус(х+ о 1 Уэ(ь + К ~ / хл-б (! х)3 ул-4 (! у) 4(у 4(х уо о = В" (л — 5,4) ~ хю-б(1 — х)34(х о —, 1Л-З1 1 1 3 +К ~'х-3(! „)З,„х л — 3 УУ вЂ” (л-31 ! 1 сз — — 1 х-'П вЂ” х)зтзх = л — 2 У ! -! — !л-31! л 3 = lу — (л — 5.4) + В (и — 5,4) оз ~ — — — (л — 1) ~ф 3 П7 151 — — (л — 4) о +-~ — л — — оз— 2 16 21 3 1 з — — (л — 2) о!и о — — (л — 3) оз !по~. 2 2 (6) Это распределение приводит Уилкс (6).
Случай р,=1, 1=1, 2, 3, является частным случаем распределения Унлкса') 1 ) В формуле Уилкса вместо Г! — (Н-2-!)~ должно быть Г! '! 2 Г~-(л 2 — !)~. 1 О-! ниеь! Ц Х» где Х! независимы и плотность вероятности Х! ! 1 имеет вид р(х; л — 1 — 2!. 2!). Рассмотрим теперь случай 47= 3.
Пусть К '=В(л — 3,2)Х М В(л — 5.4). Тогда прн р, =1, р = ! и рз — — — 1. Унлкс вывел также распределение для р, = 1, ря — — рз= 2; для р, = 1, Рз — 2, рз= 3; дла Р, = 1, Рз — 2, Рз = — 4 н дла Р, = Рз = 2, Рз= 3. Вальд и Брукнер [!) указали метод вывода распределения в случае, когда не более чем одно р, печетпо. Легко видеть, что тот же результат в(ожно получить, применив формулу удвоения, чтобы упростить выражение для моментов, и проинтегрировав произведения бета-функпий.
9.0. Асимптотическое разложение распределении величины Х (отношения правдоподобии) ! Момент Ь-го порядка величины Л= (гу равен Ц ~Щ ' !ив.в т! — с!) ) ! 1 г ! где коэффипиент К выбран таким образом, чтобы МЛе=-.1, Это выражение имеет тот же внд, что н формула (!) $8.6, причем Ф о=р ((=Р 2 ' ' 2 (У вЂ” )+Р(+ ", +Р, ! ( р(+ ''' +Р(- +1' ''' р\+ ''' +РР (=1.... д. (2) Тогда ('= 2 !Р(Р+ 1) — ллр((Р(+1)) = 2 (Рз — ~л~~РВ ! 1 ! =е = — (1 — р) А(, 2 Для того чтобы второй член разложения уничтожился, выберем р следующнв! образом: р — ! 2( з Урз)+9( ! У з) б(в((р' — Ур') 326 пРОВеРкА гипОтгзы О незАВисимогти !Гл 9 951 АСИМПГОТИЧЕСКОЕ РАЗЛОЖГНИЕ ВЕЛИЧИН!т1 327 Пусть Р ~Р1 2 т 2 2 3(рз — ~рз) Тогда иг — Тз/лгз, где, как показал Бокс (1(, 4 Х 4 5( й урзг) (Рз ХРЗ)з — 72( г ~РЕ)' Пользуясь изложенным в 9 8.6, мы получаем разложение: Р ( — и!Н)г (о) = = Р ),(йг ( о) + — ттт- ~Р (узг ( о) — Р !)(з ( о)1+ 0 (пг з).