Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 5
Текст из файла (страница 5)
Распределение линейной комбинации нормально распределенных величин; независимость величин; частные распределения Одной из причин изучения многомерных нормальных распределений является то, что частные и условные распределения, полученные иэ многомерных нормальных распределений также нормальны. Более того, линейные комбинации нормально распределенных величин также распределены нормально. Сперва мы покажем, что в результате невырожденпого линейного преобразования вектора, совместное распределение компонент которого нориально, мы получаем вектор, совместное распределение компонент которого также нормально. Теорема 2.4.!.
Пусть р-нерный а»кагор Х распр»- делен дг(Р, 2'). Тогда »' = СХ распределен М(СР, СЕС') для невырожденных С. Доказательс гво. Плотность распр»деления г' получается из плотности гг(х!р, л) распределения Х путем замены х на у такое, что х=С (21 32 многомгяное ноямяльнов васпяндслгния !гл.а РАСПРЕДЕЛЕНИЕ ЛИНЕЯНЫХ КОМВИНАЦИП дЗ и умножением на определитель преобразования (2), который ревен п1об ! С 1~. Этот определитель можно представить в виде п1об! С ~ = =ттр 1 1 — тон!С~ У ~~,~ 1 1л1 1А1 ~СПх~ с" = 1 СЕС' 'т Квадратичная форма в показателе плотности а(л1(а, Е) есть Я=(х — р,)'Е '(л — р,). (4) Преобразование (2) переводит Я в (г =(С 'у — р)'Е-'(С-'у — р) = =(С 'у — С 'Ср) Е '(С 'у — С 'Ср,)= =(С '(у — Ср)1 Е '(С '(у — Сп)~= .
=(у — Ср)'(С ')'Е 'С '(у — Ср)= =(у — Ср)'(СЕС') '(у — Ср), (5) так как (С 1) =(С') 1, согласно свойству транспонированных матриц, и СС = Г. Таким образом, плотность распределения вероятностей У будет ~(С 'у))ь, Е) п1ой(С! 1 ! =(2к) а Р ~СЕС'~ Техр ~ — — (у — Ср)'(СЕС') '(у — Ср)]= — — л(у! Ср, СЕС'). (6) Теорема доказана. Пусть теперь рассматриваются два множества случайных величин Хн ..., Х и Х +н ..., Хр, заданные в виде векторов Х,+1 Х11= Х т. Аеаереее 84 мпйгочеРное 1>оРИАльное РАсппеделеиие !Гл.
а Зги случайные величины образуют случайный вектор Х, х-( )= Х (8) Предположим теперь, что р величии имеют совместное нора>альное распределение со средними значениями мх!" = р>'>, мхйз = 1Р (9) и ковариацнями М(Хич — !Р)(Хйз р>")'=Х, м (х>й — р1'>)(х>'> — ~Р)' = х„= 0 (10) (11) (12) (Ха>=Х>а=0). Мы говорим, что случайный вектор Х быя расчленен в (8) на подвекторы так, что вектор (13) был расчленен подобным же образом на подвекторы и что матрица Хы Хж 0 Х~ (14) была таким же образом расчленена на подматрицы (см. приложение 1, >1 3). Покажем, что Х и Х' ' независимы и нормально рас- 1Ц >а> пределены. Обратная к Х матрица есть РАСПРРДЕЛРНИЕ ЛИНЕИН))Х КОА!ГИНА)П)П Таким образом, квадратичная форма в «оказатезе плотности п(Х)(А, 2') есть <',> = (х — )<)' л' 1(х — 12) = !' А» О '( ) х(1> — (Ап)') — ((Х<1) р(!)), (Х<2) — р(2))~) ' '~<) х,,'Ц» — »1 /Х(П (1)), +< (А ) х (х )< )=<~~+<к (16) где (17) <О2 =АХ вЂ” 1А ) Х22 <Х 12 ).
Отметим также, что 1Х) = (2'и) ° 1222(. Плотность распределения Х может быть записана следующим образом: 1 п(х)11, Х) =,, е (2л)2 1Е(2 ! ! 1 -2 О~ 1 -е о* 1 1 е 1 2 2 — (р -ч) (2л) 1 Е» 12 (2л)2 <Е 12 = п(х">(Р<'>, 2>») ° п(х(2>/ Р(2>, 2~22). <18) Частная плотность распределения Х дается в виде интеграла [1) » ~ ... ~ п(х(Р, 2') а)хе+1 ...
<(Хр —— =и( )1(А<'). ЕЫ у." Г (х<зчр)п), Хю) г(х,+1 ... ((хл = ОО ОЭ = п(х(1]! р(1), Х«). (19) «): Таким образом. частное распределение Х'1' будет <)<( ('>, 2' ); точно так же част«ое распределение Х'2' будет М( <2>, Х ). Значи, ит, совместная плотность распределения Х , ..., Х <и ° 1 ° Р 2О М МНОГОМГРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (Гл. 1 является произведением плотности частного распределения ХР..., Х и плотности частного РаспРеделениЯ Хе+и..., Х, поэтому оба множества величин независимы. Если мы имеем некоторое подмножество множества случайных величин, то мы всегда так можем перенумеровать эти величины.
что данное подмножество образует Х~ ~. Этим доказывается достаточность условия следующей теоремы. Теорема 2.4.2. Если совместное распределение величин Хп ..., Хр нормально, то необходимым и достаточным условием того, что некоторое подмножество втих величин не зависит от подмножества, состоящего ил остальных величин, является равенство нулю всех ковариаций величин одного подмножества и величин другого. Необходимость следует из того факта, что если Х, из олного подмножестпа, а Х нз другого, то для любой плотности распределения вероятности (см. 5 2.2.З) вы —— М (Хг — Р,) (Хе — Р ) = (хг — йг) (х) — р)) / (хп ..., х,г) у(хе.ьп ° ° °, хр) )г, Хс(хп..., с(х, = ~ ...
~ (х; — рг) у(хп..., х ) г(хг... с(х Х )( ~ ... ~ (х.— р )~(х, Р ..., хр)дхе,, ... дх =О. (20) Так как в, =а,о р,. и в, чь О (мы молчаливо предпола- О ~)О гаем, что л невырожденная), то условие а,.=О эквивалентно О тому, что р, =д. Таким образом, если одно множество вегу личин некоррелировано с остальными величинами, то оба множества являются незазнсимымн. Следует подчеркнуть, что заключение о независимости величин при равенстве нулю их корреляции делается в предположении, что эти величины нормально распределены, но обратное утверждение всегда верно. рассмотрим случай двумерного нормального распределения, Тогда Х ' =Хн Ха = Х,. р, ' = рп р!" = р,, Ен=вгг=оп нг а1 п1 еи тл1 РАСПРЕДЕЛЕНИЕ ЛИНЕЙНЫХ КОМЗИНАНИЙ 37 уп> = Хщ+ ТХ'2', уа1 Х(2> (21) (22) где Т выбирается так, чтобы компоненты г'' были некоррелированы с компонентами 1" ~ =Х~ ~. Матрипл Т должна удовлетворять уравнению = м(хги — тхев — мхн> — тмхсц)(хпн мх'")' = = М'((Хн' — МХИ1)+ т(ХЕП МХ121))(Хем МХпз)' = Хж+ ТХю.
(23) Таким образом, Т= — Х~2Х22 и )ни = Хги — Х~Х~'Хп'. Вектор (24). (25) 2 Х22 — — ага= ог и ХИ=ХИ вЂ” — аж — — а,агр,г, Поэтому если Х и Хг имеют двумерное нормальное распределение, то они независимы тогда и только тогда, когда они некоррелированьь Если они некоррелированы, то частное распределение Х, нормально с математическим ожиданием р, и дисперсией а;.
Приведенное выше рассуждение доказывает также следующее следствие. Следствие 2.4.1. Если Х распределен М(р, Х) и если некоторое множество компонент Х некоррелировано с другими компонентами, то частное распределение этого множества является многомерным нормальны.м распределением со средними значениями, дисперсиями и ковариациями, определяемыми иэ соответствующих компонент р, и Х. Теперь покажем, что зто следствие справедливо также, если дза множества не являются незавнсимыии. Мы расчленили Х, р и Х, как и раньше. Произведем невырожденное линейное преобразование подзектороз 38 МНОГОМЕРНОЕ НОРМАЛЫ1ОЕ РАСПРЕДЕЛЕНИР (Гл ! является результатом невырожденпого прсобрзз виъщ Х и поэтому распределен нормально с м !2~22 = ч (26) 6 (У.
У') = М(У вЂ” ч)(У вЂ” ч)' = М(ЫГ21 ч!2!)()ЯН ч!1Г)' Ч(()яг! ч!21)(УЛ2! ч121~ ! н (27) д!! — д!22)22 2)2! 0 0 Х„)' так как = М ((Х и — (21п) — Х!2Е22'(Хп' — (ь!")~ ~(Хп' — рн')— 12! " ~12~22 !Х (ь )! м11 м!2м22 м21 м!2м22 м21 + + ~!2~22 ~22Х22 ~2! = ~1! — Х!2ч22 Ег!. (28) Таким образом, е'~ ' и г" независимы и, сосласно следствию Н! !2! 2 4.1, Х'2'= е"! имеет частное распределение И()ь!2', д21). Поскольку нумерация компонент Х произвольна, мы можем сформулировать следующую теорему. Те о р е ма 2,4,3. Если Х имеет распределение 1!!'((ь, м), то совместное распределение нели1торого множества !сомпоненп1 Х является многомерным нормальным распределением со средними значениями, дисперсиями и но. вариациями, определяе.мыми изсоответсп1ву.о1цих компонент р и Х. Рассмотрим преобразование (29) г =,ох, 39 РАЕПРеделшсиг.
линеиньт комгинАцин где Я содержит д компонент, а 0 — действительная матрица порядка су Х р. Математическое ожидание Я есть МХ =0р., (30) а ковариапионнзя матрица есть и (г — 09) (г — 0,. У = 0Х0'. (3!) Случзй, когдз су =р и 0 не вырожлена, был рассмотрен выше. Если с) ~( р и 0 имеет ранг д, то можно найти такую магрицу Е порядка (р †) )( р, для которой преобразование ( )=( )х (32) является невырожденным (см.
приложение 1, $3). Тогда для Я и Ь' существует совместное нориальиое распределение и, согласно теореме 2.4.3, частное распределение У нормально. Такич образои, лля матрицы 0 ранга ст (причем Х имеет певырождзнпое распределение, т. е. плотность вероятности) мы доказали слелующую теорему. Т е о р е и а 2.4.4.
Если Х распределен ссс'(!А, м), то Я=. 0Х распределен !!(0р, 0Х0'). где 0 есть матрица порядка сг Х р и ранга о~.р. Конец настоящего параграфа посвятим несобственному, или выролиденно.ссу, норпальному распределению и распространению теоремы 2А.4 на случай любой матрицы 0. Вырожденное распределение есть распределение в р-мерном прос гранстве, которое концентрируется в подпространстве меш,шего числа измерений, т. е. вероятность попадания в множество, не пересекающее подпространства, равна нулю, В случае вырожденного нормального распределения масса сосредоточена иа линейном подпространстве (т. е.