Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 11
Текст из файла (страница 11)
он равен Уо(кетах; м чуччХ =з Мздз~,. Это доказывает желаемый результат. Для того чтобы дать геометрическую интерпретацию ан и и,т/у' ина,, мы рассмотрим линию, образуюшую равные рис. 3. углы с осяын координат; эта линия проходит через начало и точку (1, 1, ..., 1) (рнс. 3). Проекция у, на вектор а=(1, 1...., 1) будет ( ) (. (~" ~ еу! а —,) а = — е.= х а=(х, х, ..., х). Разложим у, на два вектора: х,е — проекцию у; на прямую, образуюшую равные углы с координатными осями, и у, — х;а — проекцию у~ на плоскость, перпендикулярную к последней прямой, Длина у,— х;е равна (у,'. — х,е) (у, — х,е)' =,~ (х,„— х,)т„ т. е.
Иап — — ан, ПеРенесем У,— х,а и У вЂ” х1а такич обРазоч, чтобы концы обоих векторов находились в начале координат; а-я координата первого вектора будет х„— х„ а а-я координата второго будет х„— хд Косинус угла между ОЦЕНКИ ПАИБОЛ1ИПЕГО ПРАВДОПОДОБИЯ з а! этими двумя векторами равен (у; — х!е) (у! — х)е)' )с (у; — хсе)(ус — х,е) (у) — х7е)(у) — хге) ~~~ (хм — хг) (х), — х)) (7 ~' (х1„— хс)~~ (хге — х)) И качестве пРимеРа вычислений РассмотРим данные таблицы 1, заимствованные у С т ь ю д е н т а (1 1, Таблица Лееерстео В Летерстео Л Боеьооо Измерецие хп — — 1,9 показывает увеличение времени сна в часах дяя пеРвого больного прп применении снотворного лекарства А и хи = 0,7 — увеличение числа часов сна для первого больного прп применении лекарства В и т.
д. Предполагая, что каждая пара (т. е. каждая строка таблицы) является 11аблюдением над И((ь, Х), мы обнаружим. что 2,84 3,20 ир =ф 'отвеете,7959 (8 будет определена ниже). ! 2 3 4 5 6 7 8 10 х, 1,9 О,н 1,1 О,! — О,! 4,4 1,6 4,6 $4 хт 0,7 — 1,6 — 0,2 — !,'г — О,! 3,4 3,7 0,8 0,0 2,0 Ч4 ОЦРНКЛ ВЕКТОРЛ СРЕДНЕГО ЭНЛ'!ЕН1!Я !гл. 3 3.3. Распределение вектора выборочного среднего; заключение о среднем значении, когда ковариационная матрица известна м л' !ч МУ„= М .
с„„Х! = лл с.,МХ., = лл с,!р! = э,. (1) э! ч!, Ковлрнзпионнзя матрица векторов У, и У равна В(У, У ) = М (У вЂ” ч ) (ӄ— т.) = =М ~ ~'с„(Х,— р,)1~Х с,(Х,— р,)' ! 1~-1 н л с~зсмМ (Хв 11 ) (Х» ра) ' лл с~',!' е3Д Б 1 * ',е-1 н = — ~~ с,!с!!Х = 3„Х; 1 (2) 3.3.1. Теория распределения. В одномерном случае выборочное среднее рвспрсделено нормально и не зависит от выборочной дисперсии. Аналогично выборочное среднее Х, определенное в ф 3.2, распределено нормально и не завнсит От Х. Чтобы доказать этот результат, мы произведем преобразование множества векторов наблюдений.
В связи с тем, что этот вид преобразований применяется неоднократно в этой книге, сначала докзжем более общую теорему. Теор ем в 3.3.1. Допустим, что Х,, ..., Х, незивисимы, причем Х„риспределен Ш(р„, л ). Пусть С= (с„)— м ортогонильния митрици. Тогди У„=~ с, ХЭ риспределен В-1 п И(ч„Х), где ч,= ~ с,ЗР! и УР ..., У» независимы. ь ! Л о к з з з т с л ь с т в о. Совместное распределение множества векторов (У,( нормально, тзк клк все множество компонент является мнол!еством линейных комбинаций компонент (Х„(, совместное распределение которых нормально.
Математическое ожидание У„равно зз) олспяядвлгнив впктоол вывооопного сояднгго 75 где 3«есть символ !(ронекера (ь,.=-1 нрн а=Т и =б при а вь Т). Отсюда видно, что 1", не зависит от )', и У„ имеет ковариационную матрицу Х. Применим также следующую общую лемму. Ле и ма 3.3.1. Если С=(с,)) орпсогональна, то ~, Х,Х,= «=! м и = лл У„г'., где г', = лы с.ЗХ . 'Ч, ', '%!, «=! з ! Л о к а з а т е л ь с т в о. ~ уу„' =,'р;р с„зхз ~ с,,х,'= — ~ ~у с.,с. 1хзх,'= = ~3,„Х,Х,'= — ~ Х)Х',.
(3) Пусть Х, ..., Хм независимы н одинаково распределены с законом распределения М(р, Х). Существует ортогональная матрица В=(Ь„З) порядка И)( М, последняя строка которой будет (4) Это преобразование мо!кно представить в виде поворота в Й-мерном пространстве, при котором прямая, образующая равные углы с осями координат, переходит в М-!о ось координат (см. $ 3.2). Пусть А = Л!Х, где Х определена в ф 3.2, и пусть г, = ~ (!.зх . Тогда г„= — 1 д,«хз = ~, '-= 'х, =- ~ги».
Согласно лемме 3.3.1, (б) !т — ! А = ~ х,х„' — ихх' = ~, г,г,' — г„г,' = ~, г«г.'. «=1 «! а ! Так как гм не зависит от го ..., гл! ,, то Х не зависит от А. Так как Ь)г„=) 3„)МХ.«=~' —,' р= ~"йр, (3) 76 оцгнкл вактопл спяднкго знл гния !гл. а то Угт РаспРедслен И( )г ИР, Х) и Х=(1Дг Й)Уп РаспРе. делен И(р. (1/И) Х!. Заметим, что МХ„= ~в йаЗМХэ = лл !1аг!ь = ~~ Ь„адвгч УИР = О.
а чь И. (9) Теорема 3.3.2. Среднее значение выборки объема И из генеральной совогсупности И(р„Х) распределено И!р, (1!И)Х) и не зависигп огп Х, лвллвгигейсп оценкой наибольшего правдоподобия длл Х. ИХ распределена лак лг-1 ~~'.; УУ„, гдето„распределен И(О, Х) и не зависит отйв(а чя р). а 1 Заметим, что Ю-1 1 а1 У вЂ” 1 МХ = — М т Х Х„' = — — Х.
И в а " И 1 Таким образом, Х является смещенной оценкой Х. Поэтому мы определим ! ! кт $= — ! А = У вЂ” лэ (ха — х)(х„— х)' (11) как выборочнуго ковариационную мапгрицу. Она является несмещенной оценкой Х, и ее лиагональные элементы являются обычными (несмещенным и) выборочными дисперсиями компонент Х. 3.3.2. Критерия и доверительные области для р, когда Х известна. Важными статистическими проблемами явля1отся проблема проверки гипотезы о том, что вектор среднего значения нормального распределения является данным вектором, и связанная с ней проблема определения доверительной области для неизвестного вектора среднего значения. Мы рассмотрим здесь этн проблемы в предположении, что ковариационная л1атрнца Х известна.
В главе 5 мы рассмотрил1 случай, когда ковариацпонная матрица неизвестна. Для одномерного случая основой для выбора критерия или доверительного интервала служит тот факт, что разность между средними значсниял1и выборки н генеральной совокупности распределена нормально с математическим ожиданием, равным нулю, и известной дисперсией; тогда таблицы нормального распределения могут быть использованы для ЗЗ1 ОЛСПОВДВЛЯННЯ Вихтоох вмаооОЧНоГО Соапивгп 11 точечных оценок или вычислении доверительных интервалов.
В иногомерном случае будет использован тот факт, что разность между векторами среднего значения выборки и среднего значения генеральной совокупности распределенз нормально с вектором среднего значения, равным нулю, и известной ковариационной матрицей. Можно установить пределы для каждой компоненты на основании распределении, по неудобства такой процедуры состоят в том, что сам выбор пределов является отчасти произвольным и дает критерии, довольно бедные в некотором отношении; больше того, такие пределы трудно вычислять, так как таблицы пригодны только для двумерного случая. Методы, приведенные ниже, дают возможность простых вычислений и к тону же могут быть подвергнуты общей интуитивной теоретическо)) проверке. Эти методы основываются на следующей теореме. Теорема 3.3.3. Если т-мерный вектор У распределен И(0, Т) (невырожденное распределение), то У'Т ~У имеет ут-распределение с т степенями свободы.
!1 о к а з а т е л ь с т в о. Пусть С вЂ” невы рожденная матрица, такая, чзо СТС'=1, н положим л =СУ. Тогда л нормально распределен со средним значением МУ= СМУ=О и ковариационной матрипей Мл л' = МСУУ'С' = СТС' = /. Но У Т 'У=У. (С') Т С У=У (СТС') Е=Е'Я, что является суммой квадратов компонент л. Так как компоненты л независимы и распределены И(0, 1), то л'л=У'Т 'У имеет )(юраспределенне с т степенями свободы (см.
задачу 5 главы 1). Так как У И(Х вЂ” )ь) распредечен И(0. ?'), то из теоремы следует, что И(Х вЂ” и)'Х '(Х вЂ” р) (12е имеет )(т-распределение с р степенями свободы. Это важное положение мы применим при выборе критериев н доверительных областей для р. ув оценка вектоРА сРРлнего знАчения !гл, а Пусть )(Я(а) — такое число, что Р (Х~«РХР(а)~ =а. Тогда ( р) ( [ь))у ()! — . (13) (14) ( р) ( рч)>Х ().
(15) Если мы получим выборку, удовлетворяющую (15), то нулевая гипотеза отвергается. Интуитивно ясно, что всроятность отбросить гипотезу больше а, если [А значительно отличаетси от р„, так как в пространстве л (15) определяет эллипс с центром в р„, и если р отстоит далеко от ра, то плотность вероятности Л сосредоточена в точке у границы или вне эллчпка. Доказательство теоремы 3,3,3 ноже~ быть расширено, чтобы показать, что М(Х вЂ” рз)' Х (Х вЂ” р„) имеет нсцентральное Хз-распределение с р степенями свободы н параметрои %(р — рв)' Х (р — р„), когда Х есть среднее значение выборки обьема дг нз совокупности )ч'(р, ?) (дано Р. Бозе [1[, [2[). Теорему 3.3.3 первым доказал К.
П и р с о н [2[. Теперь рассиотрим следующее утверждение, слсланное на основе выборки со средним значением л: «Среднее значение распределения удовлетворяет условию И(л — р')' Х (л — р") ~(уа (а) (! 6) как неравенству относительно р*». Из (! 4) видно, что вероятность получения выборки, для которой указанное утверждение правильно, ранна ! — а, так как событие в (!4) эквивалентно тому, что это утверждение ложно, Таким образом, множество р*, удовлетворяющих (!6), является определением двверительной области для р с доверительным уровнем 1 — а. В р-мерном пространстве х (15) является поверхностью и внешней частью эллипсоила с центром в рв.