Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 20
Текст из файла (страница 20)
(4.4з) Дисперсия о~ обычно неизвестна и оценивается по выборке„Как было показано в предыдущем разделе, несмещенной оценкой дисперсии является Таким образом, ковариационная матрица векторной оценки р имеет Вид 8 " = оа (Х' Х)" 1. (4 44) На основании данных примера из предыдущего раздела, касающихся производительности труда при установке заклепок, имеем". 8- 8~ РР1 РФВ (4.44а) ~ Здесь нмеетеи небольшое отклонение от наших обозначений. Мы обозначаем злементы на главной диагонали Ф, а не ад, чтобы подчеркнуть наличие только одной дисперсии.
1 0 ... 0 01...0 0 О ... 1 аа О ... 0 О а' ... 0 О 0 ... оа что, принимая во внимание ошибку округления, также согласуется с предыдущими результатами. Обсудив оценивание ковариационной матрицы вектора р и получив математическое ожидание р, обратимся теперь к выборочному распределению р. Из (4.27) Р=(Х'Х)-'Х ~.
Так как (Х'Х)-'Х' предполагается посгоянной, р представляет собой линейную функцию У, Поскольку мы считаем, что У имеет нормальное распределение, то и р будет иметь нормальное распределение. Этот вывод — следствие того, что линейные функции нормально распределенных переменных также распределены нормально (мы отмечали это в разделе 3.2, когда рассматривали линейные комбинации). Однако, так как обычно ковариационная матрица р неизвестна и оценивается, р подчиняется распределению Стьюдента, которым мы в дальнейшем и будем пользоваться для проверки гипотез. Проверка гипотезы о равенстве некоторого коэффициента заданной постоянной, Для проверки гипотезы ~о ° Рй = 0ой где ~~ — некоторый коэффициент регрессии генеральной совокупности, а ~,а — предполагаемое значение этого коэффициента, можно воспользоваться статистикой Ь вЂ” бои (4.45) Дисперсия я представляет собой А-й диагональный элемент 3- РКВ Р и квадратный корень изз- — это стандартнаяо~иибка коэффициента Ь ~а.
Эту нулевую гипотезу можно проверить по отношению к некоторой односторонней или двусторонней альтернативной гипотезе; статистика 1 из (4.45) подчиняется 1-распределению с и — К вЂ” 1 степенями свободы. Значительный интерес представляет проверка гипотезы о том; что коэффициент~~ равен нулю. Как отмечалось ранее, если установлено, что угловой коэффициент не отличается существенно от нуля, то соответствующая этому коэффициенту переменная не вносит статистически значимого вклада в уравнение регрессии. Реже, ио тем не менее в ряде случаев нас интересует проверка гипотезы о том, что ) гловой коэффициент равен некоторой константе, отличной от нуля.
Кроме того, иногда требуется проверить, равен ли статистически свободный член Ра некоторой постоянной, например нулю, или нет,' ~ Предлагая судить о существенности влияния иа функцию множественной регрессии той или иной независимой (предсказывающей) переменной по реаультатам проверки ~на статистически значимое отличие от нуля~ ее выборочного ковффициента регрессии ~ь (с помощью статистики (4.45), в которой принято Ц~ = = О), авторы следуют, к сожалению, весьма распространенным в прикладной Обращаясь вновь к нашему примеру, касающемуся установки заклепок, проверим гипотезу о том, что тест ловкости пальцев не вносит статистически значимого вклада в уравнение регрессии. Этой гипотезе будет противостоять односторонняя альтернативная гипотеза, так как мы априори полагаем, что повышение ловкости пальцев должно привести к увеличению производительности при установке заклепок.
Поэтому мы проверим Но.~,=О, Н,: Р,'~0. Проведем эту проверку на уровне а = 0,05. Из проведенны» ранее подсчетов мы находим, что статистика 1 в 14.45). принимает' значение 1,1822 — 0 1, 1822 1~0,551 0,742 По 1-распределению при сс = 0,05 и ~ =- а — К вЂ” 1 = 24 находим 1в оь., з4 —— 1,711. Так как фактическое значение ~ не превышает критического значения, мы не отвергаем нулевую гипотезу на данном уровне значимости. Если бы была сформулирована двусторонняя альтернативная гипотеза, мы выполняли бы проверку аналогично, за исключением того, что в качестве критического значения 1 было бы выбрано не 1,~;,, а ~,„~з.. При регрессионном анализе в экономических задачах двустороннюю альтернативную гипотезу в одномерных критериях„касающихся углового коэффициента, применяют редко.
Так происходит потому, что экономическая теория обычно указывает заранее знак углового коэффициента. Так, мы априори не ожидаем, что для функции готребления этот коэффициент будет отрицательным. На практике только что описанную проверку можно выполнить очень быстро, обратив внимание на следующее простое правило. Если предполагаемая величина углового коэффициента равна нулю (и на самом деле это так), то статистику 1 в формуле 14.45) можно записать в виде отношения оценки углового коэффициента к оценке его статистической литературе рекомендациям.
Необходимо предупредить читателя, что этот метод проверки заслуживаетдоверия лишь в ситуациях, когда участвующие в регрессионной модели предсказывающие переменные взаимно некоррелированы (или достаточно слабо взаимно коррелированы). действительно„можно показать (см., например, й. С, беагу, С. Е. Ч. 1.ехег, Агпег1с. Яа1Ы., 1968, то1.22„ № 1, р.10 — 21), что в моделях множественной регрессии с взаимокоррелированными предсказывающими1 переменными вполне реальны ситуации, когда проверка, основанная на (4.45), свидетельствует о том, что все ~в статистически незначимо отличаются от нуля„в то время как на самом деле все предсказывающие переменные существенновлияют нафупкцию регрессии.
Поэтому в общем случае, и в первую очередь в ситуациях, характеризующихся мультиколлинеарностью (т, е. высокой взаимозависимостью предсказывающих переменных), более эффективен метод, основанный на последовательном пересчете и сравнении значений множественного коэ4фициента корреляции, рассчитываемого для различных вариантов комбинаций предсказывающих переменных, включаемых в модель (который и взят в основу большинства алгоритмов.так называемой поиаговой регрессии). — Прижч. ред. !22 рых, р в гл,Зэквивалентпо К + 1 в этой главе, эта аналогиястановится очевидной. Проверим теперь совместную гипотезу о том, что оба угловых коэффициента в нашем примере с установкой заклепок равны нулю и что отрезок, отсекаемый на осн ординат, равен — 1ОО,О, Нулевая гипотеза имеет вид: И,: $, ~, ~,1 =. 1 — 100,0 0 И, н мы будем ее проверять при а = — 0,05.
Заметим„что для получения Зр нам не нужно обращать 8„=. В самом деле, такой метод вычисления может иногда приводить к значительным погрешностям из-за округления. Вместо этого достаточно заметить, что Зр - (Х' Х) Х ~ (1,'о~). Таким образом, статистика 7~ в (4.47) принимает значение: 0,0356О 4,20622 2,99182 — 4„020 = ~ — 4.02 1 498 1 1821 4,20622 501,108 355,775 1,498 2,99182 355,775 254,511 1,182 =-- 2660,83, где матрица размера 3 х 3 равна (приближенно) $~ . Из уравнения (4.48) найдем критическое значение Т'.
Т0,05, з,л — — (3) Го,щ, з,~~= (3) (3,01) =9,03. Так как вычисленное значение Т' превышает критическое значение, мы отвергаем нулевую гипотезу. 100 (1 — а)%-ный совместный доверительный эллипсоид (область) можно вычислить с помощью уравнений (4А7) и (4.48). Доверительная область будет ограничена поверхностью Ь вЂ” ф) Зр (ф — ~) — (К+ 1) Гж; к+1, — к — 1. (4 49) Полученный в результате эллипсоид будет находиться в (К + 1)-мерном простРанстве, так что, как и в предыдущей главе, его можно представить визуально только в случае К вЂ”,' 1 ~ 3. Линейные комбинации. Подобно тому как мы использовали линейные комбинации при проверке гипотез и определении доверительных пределов для средних значений, так же можно использовать линейные комбинации и применительно к параметрам регрессии. Пусть С будет матрица (К+ 1) х д ранга д ~ ~К+ 1.
Тогда при ранее принятых нами допущениях линейная комбинация С' ф имеет д-мерное нормальное распределение. По аналогии с соотношением (3.15) в гл. 3 ги- потезу н,: ср --- с'р, можно проверить с помощью критерия т = ~С'Р— С Р„)'(С'С~С)-11С Р вЂ” С Р,) с критическим значением т~ а, "ч* -к — 1 =Ч' к", ь — к — 1. (4.50) Заметим, чта если С есть единичная матрица порядка К+ 1, та (4.50) сводится к (4.49), и заметим также, что вторсе число степеней свободы для Т' и Р оказывается равным а — К вЂ” 1, а не и — д. Это происходит потому, что дисперсию С' 3„- С мы па-прежнему получаем из оценки о'-, имеющей и — К вЂ” 1 степеней свободы.