М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 19
Текст из файла (страница 19)
Действительно, выберем в !с" новый ортонормироваииый базис, приняв за е~=а/Цай. Пусть в иовом базисе вектор 11 имеет координаты (2ь Хь...,2,)=2, причем 2 — стандартный нормальный вектор; вектор а имеет координаты (Цай, 0,...,0).
Таким образом, Ц(1+аЦ'=-(2,+ ЦаЦ)'+'~' 2т, 1-2 (16) м (Ц()+аЦт)и))йа(Ц() Цт-.и), (17) которое легко вывести из (16), учитывая следующее очевидное неравенство: У(!21+ЦаЦ !)г)>У(!21!)х), г>0. Про случайные величины, связанные знаком неравенства (17), говорят, что одна нз иих стохастичегки болыие другой. ф 13. ДОВЕРИТЕЛЬНОЕ ОЦЕНИВАНИЕ И ПРОВЕРКА ГИПОТЕЗ В ЛИНЕйНОй МОДЕЛИ С НОРМАЛЬНЫМИ НАБЛЮДЕНИЯМИ 1. Распределение вектора оценок.
Мы будем рассматривать линейную модель: т'=ОХ'+ое, Ма=О, )7 =7, У= (Уь..., У,), 6= (Оь..., 6,), г(н, е=(еь .,е ), Х=(х'ь...,к,1, х1=(хи,...,хы), 1=1,...,г. Эбозначим через У пространство, порол;денное столбцами матри'1ы Х, в котором лежит неизвестный вектор среднего: И=МУ=О~к~+...+О,х„=ОХ', (2) 109 Распределение сл.
в. (16) называется неиентральнылг т'-раслределениеи с н степенями свободы и параметром иецеитральиости 6= Цайт. ° ДЛЯ ПОСЛЕДУ1ОЩИХ ПРИМЕИЕннй СДЕЛаЕМ ЕщЕ одно ЗаМеЧаннЕ. Между распределениями вероятностей величии ЦЩ!' и Ц11+айт имеет место прп ЦаЦФО неравенство Размерность У обозначим через Ы=б)ш У.
Наилучшая линейная несмещенная оценка вектора среднего равна 0=0~х~+... +О,х,=ОХ'=прт 7. Оценка дисперсии раина (см. (16) $10) Э = (л — ~() — ' ~! пр „~„уй'. Если векторы хь...,х, линейно независимы, то О, 1=1,...,г, од- нозначно определены и могут быть представлены формулой О= т'Х(Х'Х) '. В противном случае разложение (2) однозначно определяет только такие параметрические функции а~О~+...+а,О„которые являются линейными функциями от координат вектора т1: аО Ьц'=ЬХО', Ь=(бь...,Ь„), т. е. параметрические функции с коэффициентами, подчиненными условию а ЬХ.
(4) Наилучшей для аО' является оценка Ьт", где Ьы У и удовлетворяет (4). В этом параграфе мы дополнительно предположим, что вектор е является стандартным нормальным. В таком случае нормальными являются векторы оценок О, т) (при этом МО=О, Я-=о'(Х'Х)-', е Мц =Ч. )т- =-о'Х(Х'Х) 'Х'), н а также любой набор наилучших оценок параметрических функ- ц«й Ь,ц,..., Ь,ц', где Ь;ыУ, 1= 1,...,й. Оценка дисперсии (3) является независимой от ~1, О и от любой совокупности оценок параметрических функций (см. п. 4 $ 12), а ее распределение с точностью до параметра масштаба совпадает с К'-распределением: пРл,сг У=пРл стт)+ пРл,~гоа=пРл„~гое, так что (и — б)т У) Ф/оз = 11пр ~„е1Р имеет распределение 11' с числом степеней свободы л — б)т У.
110 2. Доверительные области для параметров н параметрических функций. Обозначим через до элементы матрицы (Х'Х)-'. Тогда 0; имеет распрелсленне /т'(Оь о'оо), а сл. в, (О' — О,);(о г' до ) =- ((О; — О;)/(о 'г' чо ))/(о/о) имеет /-распределение с числом степеней свободы и — г/, где с(= =дпп 1', что позволяет строить доверительные интервалы для О, а виде В~ — х~ «, (/-е)о У~Ь < Ос<~~+х1 — м(! ~)о ) йи (5) где х„(/„,) — сс-квантнль распределения ! . Обычно представляет интерес одновременное доверительное оценпванне ряда параметров или параметрических функций.
Рассчитать вероятность одновременного выполнения нескольких не- 6 авенств типа (5) хотя и возможно, но весьма затруднительно. ной способ одновременного доверительного оценнвання коэффициентов О (или параметрических функций) заключается в построении доверительного эллипсоида. Рассмотрим этот метод в применении к оценке всего набора 6= (О„...,Ог).
Воспользуемся тем, что П-т)=прг т-а=яре(т-т)) =о прг е, и, следовательно, величина о э!!й — т)!!т о з!!(8-8)Х'!Р о э(8-6)Х'Х(0-6)' имеет распределение Х' с числом степеней свободы д=д!щ У и. не .зависит от оценки дисперсии о~. Поэтому сл. в. с/ ' о э ! ! й — т) !! т = с/ 'о т (8 — О) Х'Х (Π— О) ' (6) имеет распределение Ек -ж так что с вероятностью 1 — а выполняется неравенство й 'о э(Π— 0)Х'Х(0 — 6)'~~х~-,(Р;пя е).
Допустим, что матрица Х имеет полный ранг; И г. Тогда область переменных (Оь...,О,), удовлетворяющая (7), представляет собой эллипсоид, являющийся сс-доверительным множеством в пространстве параметров /7": неизвестная точка (Оь...,О,) накрывается эллнпсопдом (7) с вероятностью 1 — я. Заметим, что доверительный эллипсоид (7) (при с(=г) получается из следу1ощего не зависящего от выборки эллппсопда: г- ОХ'ХО ~х, „(Ге я,) растяжением с коэффициентом о и переносом на вектор 8. 111 Линейная модель (1) фактически определена подпространством г', в котором лежит вектор среднего Ч; а-доверительным множеством для вектора Ч является Н-мерный шар (д=б(т 'г'): и 1!Ч вЂ” Чэ ~~х1- (где-а), Ч~ г.
(8) Выбирая различные базисы в пространстве г', будем получать для координат вектора Ч в этих базисах описанные выше и-доверительные эллнпсопды; в частном случае, когда базис ортонормировапный, эллипсоид превращается в шар. Если г'* — подпространство У размерности з, то аналогично (8) можно записать а-доверительный эллипсоид для Ч,=пр„~Ч.
Полагая Ч,= пр„Л. имеем з ~п ЦчУч — ЧДэ~4х~ а(Еь,ь-а), ЧЕУ. (9) В развернутой форме (9) имеет вид — 11пр в(Т вЂ” Ч,)11э1( — 11прл, „ат11~) <х~ „(г,, ~), Чан 1'. (10) 3. Проверка гипотез с помощью доверительных эллипсоидов. Рассмотрим линейную модель У= т1+ ое, ЧЯ Р', (1!) где неизвестный вектор среднего Ч лежит в заданном линейном подпространстве У" размерности А До тех пор пока мы работаем с данной моделью, предположение Чен'гэ не подвергается сомнению. Естественной гипотезой в линейной модели оказывается предположение о том, что Ч лежит в некотором подпространстве размерности й(д: Ьс:-Ь"'. Назовем это предположение гипотезой Н. Иначе можно записать Н: пр,,и~ «Ч =-О.
Рассмотрим и-доперптельиый эллипсоид (10) для вектора Ч,= пр,, Ч, Р =У~б У', з = д — й. В соответствии с методологией, которую мы уже неоднократно применялп в гл. 1, если а-доверительный эллипсоид содержит вектор О, то гипотезу Н: Ч.=О следует принять на уровне значимости а. Подставляя Ч,=О в (10), получаем статистику критерия для проверки гипотезы Н в виде 1 „,/ ! Р = — 11пр„э~„» 7~1- "~ — „((пр„,~„~ Уй'); (12) в предположении Н она имеет Р~-ь -э-распределение. Оптимальные свойства сформулированного г-критерия будут рассмотрены в других главах.
Пока мы приведем некоторые дополнительные соображения в пользу этого критерия. Заметим 112 прежде всего, что знаменатель статистики г, с точностью до пос- тоянного множителя, равен Цпр„, ->„л т'Ц« = Цт — пр„» УЦ«= ЦУ вЂ” т)Ц« (13) и, следовательно, Цу — Ч«Ц'= Цпрг«с»г» у+ прл бг«ТЦ'= =Цпр;~,'уЦ'+Цпр;~, уЦ*- (!4) Отношение (14) к (13) равно 1+ Ц пр„«~ «у Ц~/Ц пр,ГЧВ„,» т' Ц~ =- 1+ — г.
(15) Если гипотеза Н верна, то (16) Цирк~~с» т'Ц'=-о' Ц пр,«ь„»е Ц', т. е. увеличение (14) по сравнению с (!3) вызвано только слу- чайными причинами. Если же гипотеза Н нарушена, то Цпр а ьг»'т'Ц'=Цпр„«с»„»(»1+аз)Ц«= =Ц пРг«сьг»»1+ о пР„«~„»е Ц». (! 7) Величина (!7) стохастнчески больше (16) (см. и. 4 $12), и, следовательно, большие значения статистики (15) могут рассматриваться как свидетельство против гипотезы Й. С точки зрения задачи проверки гипотезы статистика (15) равнозначна статистике г.
Подводя итог, отметим, что распределение статистики г свободно от мешающего параметра и, критическая область с доверительным уровнем а имеет вид Г>Хь (Е»-«,с -а). (! 8) ~-критерий (18) называют также дисперсионным кригерцелц так как статистика г представляет собой отношение двух независимых оценок дисперсий: в знаменателе — несмещенная оценка а«, в числителе — независящая от знаменателя статистика, являю. щаяся несмещенной оценкой и' в предположении гипотезы Н. 113 н представляет собой меру отклонения вектора наблюдений т' от оценки его вектора среднего т1. Если гипотеза Н верна, то за оценку вектора среднего следует принять вектор проекции т' на подпространство У«:»1»= пр„»Т, и тогда мера отклонения т' от т)» равна Цт' — т)»Ц«.
Но т = прг» у + пр„«(=„,» у -,' при,~»г у 4. Прямер! сравнение средних в нескольких нормальных выборках. Пусть имеешься г независимых выборок: У!.— (1'и, .... !г!,ч), ! =- 1, .... г, и /-... +и =и. прн !ем наблюдения внутри выборки независимые и Ф(11„о')-распределенные. Положив т'=(т!, ..., т',) и обозначив через 1!, О! вектора размерности /, целиком состоящие из 1 и 0 соответственно, образуем линейную модель 1„',О.', ... О.', р, тк, Ол~ 1п, ° ° ° Оч~ рэ (19) Ол Оа ... 1а р~ где е= (еь ..., е,) — стандартный нормальный вектор.
Матрица Х линейной модели (19) — ортогональная, поэтому легко находятся оценки 1 кч р!= — ЕУ/ 1=1."., г иг / ! Оценка дисперсии имеет вид 1 из= — !! т' — (р,1„,, рэли,, ..., р,! )П' —— и — г ! о е л = — ат)„~ (у!/ — р!)' =- — „, ~~,~, у!/ — — „, ~.и!р! ! !/ ! ! !/ ! ! ! Рассмотрим гипотезу И:р!=От=... р,. Подпространство У', где в соответствии с гипотезой Н лежит вектор среднего з), в данном случае одномерно: А= ! и порождается вектором 1„.