Андерсон Т. - Введение в многомерный статистический анализ (Андерсон Т. - Введение в многомерный статистический анализ.djvu), страница 6
Описание файла
DJVU-файл из архива "Андерсон Т. - Введение в многомерный статистический анализ.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 6 - страница
на пересечении некоторого числа (р — 1)-мерных гиперплоскостей). Пусть у — мпомсесгво координат подпространства (число координат равно размерности полпространства), тогда подпространство может быть задано пзраметрически в виде х = Ау+ А, где А есть матрица порядка р )( с), а ) — р-мерный вектор. Предположим, что У нориально распределен в су-ссерном поднрострапстве; тогда мы скажем, что Х= А)х +А (33) 4О МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ИГЛ 2 имеет несобственное, или вырожденное, нормальное распре- деление в р-мерном пространстве. Если МУ= ч, то МХ= = Ач.+)в= р. Если М(У вЂ” ч)(У вЂ” ч)'= Т, то М (Х вЂ” р) (Х вЂ” р.)' = МА ( У вЂ” ч) (У вЂ” ч)' А' = А ТА' = Е, ВЕВ'= (34) где тождественная матрица имеет ранг г (см.
теорему 6 приложения 1). Преобразование вх-в-( (36) определяет случайный вектор У, ковариационная матрица которого есть (34), а среднее значение (36) Так как дисперсии компонент Упв равны нулю, то с вероятностью единица У '= ч~~. Теперь расчленим В так: .Ит~ (г> -1 (зу) Следует заметить, что если р ь д, то матрица Е вырожденная и не имеет обратной, и поэтому мы не можем написать нормальную плотность для Х. В самом деле, Х совсем не может иметь плотность распределения, так как из равенства нулю вероятности попадания в любое множество, не пересекающее д-мерного пространства, следует, что плотность распределения вероятностей равна нулю почти всюлу.
Теперь заиетич, что, наоборот, если среднее значение Х равно р и ковариационная матрица Х имеет ранг г, то Х можно записать в виде (ЗЗ) (за исключением нулевой вероятности), где Х имеет произвольное распределение и У, состоящий из г((р) номпонент, имеет соответствующее распределение, Если Е имеет ранг г, то имеется невырожденная матрица В порядка р )4 р, такая, что тц РАСПРЕДЕЛЕНИЕ ЛИНЕИНЫХ КОМВИНАЦИИ 4! где С состоит из г столбцов.
Тогла (33) принимает вил (')га) ) Х=В '1 =(СР)~ „~-С)г)н+Ррц). (33) 1гп) Таким образом, с вероятностью единица Х= С)г)п-+ Р Р), (39) что имеет вид (ЗЗ) (где С заменяет А, )го'заменяет У н Рта) ваменяет А). Далин теперь определение нормального распределения, которое включает и случай вырожденного распределения. О п р е д е л е н и е 2,4,1, Говорят. что р-мерный случайнмй вектор Х с МХ= р н М (Х вЂ” )ь) (Х вЂ” р)' = Х нормально распределен (или распределен )ч'()ь, Е)), если сугцествует преобразование (ЗЗ), в котором число строк матрицы А равно р, а число столбцов равно рангу г матрицы м' и г-мерный вектор У имеет невырожденное нормальное распределение с плотностью распределения --1ь-.) т !ь-1 1 йе (40) Ясно.
что если Х имеет ранг р, то А ь1ожно взять равным У н )1 равным О; в этом случае Х= — )г н определение 2,4.1 согласуется с изложенным в 9 2.3. Теорема 2.4.5. Если Х распределен 1ч'()ь, д), то Х= РХ распределен !ч'(Рр, Р'ЕР'). Эта теорема включает случаи как невырожленного, так и вырожденного распределения Х, а Р может быть невырожленной и иметь ранг, меньший о.
Так как Х может быть выражен формулой (33), тле г имеет невырожденное распрелеление г!(ч, Т), то мы можем написать Х = РА)г+ РЪ., (41) где РА — матрица порядка д Х г. Если ранг Р 4 равен г, то теорема доказана. Если же ранг Р 4 меньше г, например ж то ковариационная матрица величины Х РАТА'Р' =- 4 (42) 42 мнОГОИГРное ИОРИАл! ИОе РАспРелглРние [гл т имеет ранг з. Согласно теореме 6 приложении 1, существует невырожденная матрица (43) такая, что Г,ЕГ! Г~ЕГ» ~'» ГЕР = ЕаЕЕ! ГгЕГг ) (Г»ОА) Т(Г»ОА)' (РОА) Т(Г,ОА)! ГУ Ох , (44) (Р3ЪА) Т(Г,ОА) (Е»ОА) Т(Г ОА>')»,О б/ ' Таким образо»», л»атрица Р»РА имеет ранг а согласно теореме, обратной к тепрел»е 1 приложения 1, и матрица РРРА=О, так как каждый диагональный элемент (ЕсОА) Т(ГД1)' есть квадратичная форма относите.чьно элементов соответствующей строки Г,РА с положительно определенной матрнцей Т.
Поэтому ковариационная матрица величины гтд есть (44) и Е~= Г РАУ+ЕР).= О +ЕР = О +ЕР~" (45) Ясно, что О! имеет невырожденное нормальное распределение. Пусть Р ! =(О! 0,). Тогда к=О,и,+И, (46) что имеет вид (ЗЗ). Таким образом, теорема докааана, Все выводы настоящего параграфа можно проиллюстрировать, рассматривая введенную в предыду»цем параграфе геометрическую интерпретацию. Плотность распределения вероятностей величины Х постоянна на эллипсоидах (51) Э 2.3.
Так как преобразование (2) является линейным преобразованием (т. е. изменяет оси координат), то плотность распределения г' постоянна на эллипсоилах (у — С(А)' (СТС') ' (у — Ср) = (е. (47) Частное распределение Х' ' является проекцией массы распре»н деления Х в»)-мерное пространство первых») координатных осей. Поверхности, на которых плотности распределения постоянны, также являются эллипсоилачи. Ясно, что проекция массы на любую прямую нормально распределена.
УСЛОВЯ)2Г РАСПРГЛЕЛГПИЯ 2.Б. Условные распределения и множественный ноэффициент корреляции 2.5.!. Условные распределения. В этом параграфо мы понажсм, что условные распрслелспия, полученные иа совместного пор)ального распрслеления, така(е нормальны.
Условпыс распрелеления имеют особенно простую природу, так как срелние аначепия зависят от зпачсний фиксированнь(х случайных величин только липеяно, а лисп(рсии и коварпации вообще не зависят от значении фиксированных случайных величин. Теория частной и множественной корреляции, рассматриваемая в этом параграфе, была первоначально излох!сна П и р с о н о ч 111 для трех величин и далее разработана (О л о и (11, 121 Пусть вектор Х„пасет распрелеление И((ь, Х1 (Х не вырождена) и разбит, кан и раньше, па два полвектора с о и (р — (1) компонентамп соответственно. Применим алесь алгебраические результаты, изложенные в б 2.4. Совместная плотность распрелелепия вероятностей У = Х вЂ” ХмХ22 Х (и (11 - ! (г) и у'2'=Х(2' есть а !Уп [ рп~ Х ' Х22 Г'Ф Х Х(2Х22 Хг()ВАУФ1рн) Х22) Плотность распределения всроятпостеи Х ' и Хон тогда может и) быть опрелслсна нз этого выражения путем подстановки х — Хг)Х2 х вместо Я и х вместо и (опРеделитель (1) - 1 (21, (11 ОВ, (21 этого преобразования равсп 1).
Совчестная плотность распределения вероятностеи Х' и Х ' равна н) у (х('). »гг)) =, схр — — [(х(') — (ь(!))— 1 1 1 — Х(2Х2) (х — 12 )! Хп 2!1!(х — 12 ) — Х(2Х!г [х ' — 12 )[[ Х ус —, ехр( — -~-[х — р 1 Хи (» — 12' ')[, ~2) - (р-ч) (2Ч У 12ы1 44 МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ.2 где ХП.2 — Хп Х12Х22 Х21 ° (з) Эта плотность вероятности должна быть п(х((ь, Е). Условная плотность вероятности К ' при данном значении К ' = х (11 (21 (21 равна частному от деления (2) на значение частной плотности вероятности величины Х'' в точке х' ', которое равно и) (21 и(хгг>()ь(21, Хю), т. е. второму множителю в (2).
Тогда частное будет равно /'(Х(1((Х(21)=, ЕХР ( — — 1(Х(11 12(1>) ! 1 1 Х12Х22 (х 12 )] Х11 2 ((х — 12 ) — Х12Х22 (х — 12 )] ~ . (4) Ясно, что х(2> состоит из р — (у компонент. Плотность вероятности У(х">(х(21) явяяЕтСя (у-мернОИ нормальноИ плотностью со срелним значением М (К"1 ! х"') = (ь(п+ Х(2Хю'(хпй — р"1) = ч(х(~), (5) и ковариационноИ матрицеИ М ((Х(п — ч(х"')ЦХ"' — ч(х"1)]' ~ х"1] = = ЕП.2 = ХΠ— Х(2Х2/~Х21. (6) Следует заметить, что среднее значение Х' при данном х' (11 (21 является просто линеИной функцией х(2', а ковариационная матрица К' ' при данном х' ' вообще не зависит от х' '.
(11 (21 (2) Определение 25.1. Матрица Е(2Е22' называется матрицей ковффициентов регрессии х(О на х( 1. Элемент (-й строки и /'-го столбца матрицы ХжХю часто обозначается через Р(/ Е+1, ..., /-1, /+1, ..., р Вектор (ь()+х(2ею (х(21 — (ь(21) часто называют фуньцией регрессии. Пусть о,, является элементом /-й строки и /-го 1/ ет,",р столбца матрицы Еп.т. Мы назовем его частной «овариицией. УСЛОВНЫЕ РАСПРЕДЕЛЕН»Я Определение 2.5.2.
Выражение )' ')) аь), ...,р У аП.а+), ...,р назмвается частным коэффициентом корреляции между Х, а Х при фиксированных Х» ..., Хя. Нумерация компонент Х и число д произвольны. Следовательно, это определение служит лля нахожлення условного распределения любых )) компонент случайного вектора Х, если ланы лругие р — д компонент. Действительно, можно рассматривать частные распределения некоторых с компонент вектора Х н определить условное распределение. некоторых )у компонент, если даны лругне с — о коипонент. Т е о р е м а 2.5.1. Пусть компоненты вектора Х разделены на две группы, образующие подвекторы Х') и Х').
Допустим, что среднее значение р, подобным же образом разделено на рн) н р)2), и предположим далее, что ковариационная матрица Х вектора Х разбита на Х», Хн, Хю, которые являются ковариационными матрицами соответственно векторов Х)'); Х) ) н Х' )) Х) ). Тогда, если распределение Х нормально, то условное распределение Х' ' при данном Х' '=х' ' также нормально о) )2) (2) со средним значением р»)+Х)2Х~~ (х) ' — р) )) и коварнацнонной матрнцей Х» — ХпХ22 Х2).