Андерсон Т. - Введение в многомерный статистический анализ (1185341), страница 44
Текст из файла (страница 44)
У нас имеется совокупность р-мерных независииых, нормально распределенных случайных векторов Уг (г = 1,..., г; /=1, ..., с) с средними значениями (1), где р, АР ч/— Гипотеза состоит в том, что коэффициенты при гоа,, равны оа, ~/ нулю. Так как матрица фиксированных величин 9.91 ОВОГЩГННЫН ЛНСПСРСНОННЫН АНАЛНЗ 297 векторы. и ковариационной чатрнцей Х. В этом случае лля свеления этоИ задачи к задаче о регрессии можно использовать те же самые алгебраические результаты.
Опрелелим У, Уь, У,, по формуле (7) и положим А= ~~ (У~/ — Уь — У., + У..)(у/ — Уь — У/+ 1'„)'= и/ = ~ У;;У;/ — с ~~'„', Уь 1",. — г,'У У./У'./ -1- гс У„У"., (11) В = г Х (У./ У") (У./ У") / = гХ У, У./ — гсУ„У... / СтатистикоИ, аналогичной (10), будет следующая статистика [А[ ! А+/г! ' Если верна нулевая гипотеза, то эта величина имеет (/-распределение для р, л=(г — 1)(с — 1) и д, =с — 1, данных в й 8.5. Для того чтобы матрица А была невырожденноИ (с вероятностью 1), нужно потребовать, чтобы выполнялось р ((г — 1)(с — 1), В качестче примера рассмотрим данные, впервые опубликованные Иммером, Хейесом и Пауэрсом [1[ и использованные впослелствии Фишером [9[, Ейтсом и Кохреном [1[ и Тюке ем [1[.
Первая компонента наблюдаемого вектора есть урожаИ ячменя в данном году; вторая компонента есть урожай того же ячменя в следующем году. В различных(а.столбцах фигурируют рззличные сорта ячменя, а в различных строках — различные места его выращивания. Данные приведены в таблице 11. / 81'~ Например, [ ) в верхнем левом углу указывзет на урожай 81 ячменя сорта М в кажлом году в районе (/Р. Числа, расположенные на олноИ вертикали и одной горизонтали, суммируются, и суммы записаны по краям таблицы. Мы считаем, что квадрат (147,!00) есть < 21 609 14 700 ч, 14 700 !0000) 298 ПРОВВРКА ОВШИХ ЛИНЕИНЫХ ГИПОТЕЗ !ГЛ.
3 Тогда (13) (19) Этот результат должен быть сопоставлен с точкой значимости дла Ут „яе. ИспользУЯ РезУльтат 9 8.5, мы видим, что 1 — 1 0,4075 19 2 69 ф~ 0,4075 4 должно быть сопоставлено с точкой значимости для гтв з. Эта значимость соответствует 5»е-му уровню. Наши данные )'~ У~ / 380 944 315 381 ~ ~,3!5381 277625) ь/ 6 / 2 157 924 1 844 346 ч, ~, 1 844 346 1 579583,/ / 5)г .
5 1', ' = ~ /1874386 1560145А! ~, ! 560 145 ! 353 727) г Г !0705984 9 !45240ч, (30) .,)(30), )'= д !45240 78!2025 . (!6) «Сумма квадратов ошибок» будет 802 3977 «сумма квадратов строк» будет / 18 011 7 188 'т 5~~~~()'ь — у..)( Π— у.,)'=~ 7 !8 10384)' (18) а «сумма квадратов столбцов» будет 7' 2788 2550 т! 1, 2550 2922 ) Величина (10) в этом случае будет /3279 302 (А ! ~ 802 3977! ! А + В ! Гу067 3352 — — 0,4075. (20) ~ 3352 6899 ~ зоо пповггвка овгпнх лннгнгпях гипотез ~гл а распределена как чтут с и степенями свободы. Существует другая совокупность линейных комбинаций, скажем ~~~ ~р У, где ~р „ известны, такая, что величина =Х1Х .1'=Х .;У,У распределена как азуа с иг степенями свободы в случае, когда нулевая гипотеза верна, и как произведение аз на не- центральную величину ут в случае, когда пулевая гипотеза неверна.
В любом случае величина Ь не зависит от а. Таким образом, если нулевая гипотеза верна, то Ь и ~с„тУ„У и (24) а ги ~ а',зУ,Уа га (23) В=~~п„(~~,ср У,) (~~' ~р „У„) = ~~~ с,аУ„Уз (26) распределена по закону Ф'(Х, гл) и не зависит от А. Тогда ~А~ ~~д„зУ„У.',~ ~ А+ В ~ ~ ~ гГ,а3", Гр+ ~~5 е„р У,3'з ~ (27) имеет (гр „-распределение. Рассуждения, провсленные при выводе распределения величин а и Ь, показывают, что если некоторые нз чисел р имеет В-распределение соответственно с гл и н степенямк свободы.
Нулевая гипотеза состоит в том, что некоторые из величии р равны нутю. В многомерном лисперсионноы анализе Ун ..., У, являются р-мерными векторными величинами. Математическое ожидание вектора У„дается Формулой (2!), где ф~— вектор, координаты которого суть )т параметров. Мы предполагаем, что ( У„) независимы и распределены нормально с общей ковариационной матрицей Х. Из этих векторов можно образовать линейные комбинации ~~.', Т„Угг Тогда А =ХД ТыУ„)(Х ТыУ.)' =Х У.)У.Уз (2б) распределена по закону Ф'(Х, и).
Если нулевая гипотеза верна, то ОБОВЩЕННЫИ ДИСПЕРСИОННЫИ АНАЛИЗ 301 99! ".зф.тМт~! = ~ ~« а,,'~, т, з а ! л««! б= ч; с.аф.„ф„г„л,= .э; г„'. .Сита а ~™ а л«! (28) Вследствие ортогональности преобразования величины (У„! будут независимы и распределены нормально с общей дисперсией 99. Так как л„, я=1, ..., л, должны быть линейными комбинациями ",~~Т,.„У„и д„, я =и+1, ..., и+в!, должны быть линейными комбинациями ~~.',ф „Г„, то они а должны иметь нулевые математические ожидания (при нулевой гипотезе).
Такич образом, а(99 н д/99 имеют фиксированные независимые (т-распределения. В многомерном случае используется преобразование Уа — —.«~ф,„Я„, где Уз и Я,— векторы. Тогда а л л а «а В= Д с„,ф„„ф„.г,г.'= ~ г.г„', так как из (28) следует, что, с одной стороны. ~с(. ф„ф 9 — 1 а,а при Т =в~(л и нулю в остальных случаях, а с другой стороны, ~~~,с. ф„„ф.;=1 при л+1 <Т =64п+ вг и нулю а,а в остальных случаях. Поскольку катрина Ч" ортогональная, то векторы (Я,) псзависииы и распределены нориально (29) равны нулю, как этого требует нулевая гипотеза, то М Х Тг,р„ = О и М,~~ фл,)а, = 0 (тождественно относи- а тельно р, оставшихся неопределенными). Ясно, что эти рассуждения проходят в многомерном случае с такич же успехом, как и в одномерном случае.
Далее утверждается, что в одномерном случае существует ортогональная матрица Ч" =(фаа) такая, что преобразование г'З вЂ”вЂ” - ~! фЗ„Е„приводит а а и Ь к виду 303 пРОВеРкА ОБ(пих линеиных ГипОтез [Гл. 8 с ковариационной матрицсй Х. Тс >кс самые доводы показывают, что если справедлива нулевая гипотеза, то МЯ.=О, и = 1, ..., и+ т. Таким образом, А и В независимы н распределены по законам )1'(Х, л) н Ж" (Х, т) соответственно. 8.10. Другие критерии для проверки линейной гипотезы Пока мы рассмотрели лишь один критерий для проверки линейной гипотезы — критерий отношения правдоподобия. В этом параграфе мы рассмотрим некоторые другие методы проверки этой гипотезы.
Пусть Ха, Вш и В2 — оценки параметров распределения )>[(Вв, Х), вычисленные по выборке из 1)г наблюдений. Они образуют множество достаточных статистик, и мы можем на их основе построить критерий. Как было показано в $8.3, если гипотеза заключается в том, что В)= В), то она может быть переформулирована в виде В, =-О (посредством замены х. на ха — В!Е„).
Более того, (1) Вяа = В!Еа + Втяи = В! (Еа А)2А22 ва ) + (В2 + В)АшА22 ) в» = В!»'. + В2Е(~), Х (1) (2)' к (1> а(1)' где Л в. в. = О и ,й г. г„ = А)1.2. Поэтому В, = В)я а а и Ж=В Чтобы уменьшить множество критериев, которые мы будем рассматривать, используем принцип инвариантности. Во-первых, если мы сделаем преобразование Х2= Х,+Т!Е(~>, то нулевая гипотеза при этом не изменится, поскольку МХ,' = В)я„+ (В2+ а) »,, В2+ аа — неопределенная мат- 41> ° (2> рица. Единственными инвариаптами достаточных статистик являются Х и Й! (так как для каждой матрицы В2 существует матрица Т', которая преобразует ее в О, а именно — В2).
Во-вторых, нулевая гипотеза инвариантна относительно -(!) »(1> преобразованиа в. = Сла (матрица С Бевыро>кденная); это зл01 дРУгие кРитеРии пРовеРки линеинои ГипОтезы 303 3 преобразование переводит В, в В,С . Х и В1АИ.ЗВ1 инвариантны относительно этого преобразования; мы рассматриваем Аи.з как информацию, относящуюся к выводу. Но эти матрицы являются единственными иивариантами. Рассмотрим функцию матриц В, и Ансп скажем, у(ВН Аи,з) Тогда существует матрица С*, переводящая эту функцию в у'(В|С,/), а следующее ортогональное преобразование переводит ее в у(Т, )), где ты=0, 1< ж Рн) О.
(Если каждую строку матрицы Т рассматривать как вектор в д,-мерном пространстве, то поворотом осей координат можно добиться того, чтобы направление первого вектора совпадало с направлением первой координатной оси, второй вектор находился в плоскости, определенной первыми двумя осями координат, и т. д.). 1 гто Т есть функция матрицы ТТ' = Й1Аи.зФП т. е. элементы Т однозначно определяются этим уравнением и предыдущими ограничениями.