Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 22
Текст из файла (страница 22)
Следовательно, дисперсия отдельного предсказания будет равна 02 Х. (Х'Х)-1 Х.' + О2 о' ~1+ Х; (Х'Х) 1 ХЯ. Заменяя о~ ее оценкой, мы получим оценку дисперсии о'И+ Х,-(Х'Х)-' Х;1 или (Р+ Х; $- Х,'. 100 (1 — а)',4-ный доверительный интервал (интервал прогноза) для У; будет ограничен 1';:ЬИад; — к — ~) ~ о' + Х;Зр Хг ° (4 64) В частном случае, когда К = 1, как может убедиться читатель, Х/ -Я 1+ 1 + (Х~ — Х) П Хх~ Таким образом, доверительный интервал, задаваемый (4.64), с ростом .
(Х; — Х)' увеличивается. Этот интервал будет шире, чем интервал для р;, что отражает большую неопределенность при предсказании отдельного значения У;, нежели при предсказании среднего значения р;. Проверка совместных гипотез. Предположим, что мы имеем несколько прогнозов. Например, зная несколько значений дохода, мы хотели бы воспользоваться функцией потребления, рассмотренной- в этой главе, для предсказания нескольких размеров потребления.
Если имеется р таких предсказаний, то они определяются в виде 1 Х~~ ... Хур или (4.65а) Совместную гипотезу * Вектор возмущений е не еодержит ~-й компоненты. — Примеч. ред. где ф». — Зто вектор средних, соотвстств'~*ющих У~, а ~!0 — постоян. ный вектор, можно проверить с помощью статистики '.Р Хотеллинга: 7' =- Ь. — р,„)' зр.'(Ф. — р„). (4.66) "У1 Ур = Х~Зр Х.'.
Я гр ур критическое значение 'Р будет Ял . Я у~ар у~ у Если верна нулевая гипотеза, то равно: а 106(1 — я)040-ная совместная доверительная область ограничена поверхностью 0~» Рое) 8У» (~» Рм) Р~ и; р. л — к — 1 ° Если требуется проверить совместную гипотезу и определить совместные доверительные области для конкретных значений 7;, а не для значений р,;, то последние четыре уравнения остаются в силе, за исключением того, что аппо аналогии с (4.63)] матрица Зу заменяется » на о'$+Х.„Вр Х,', где 1 — единичная матрица того же порядка, что и Х~З-Х,'. 4.6.
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ КОЭФФИЦИЕНТОВ РАЗЛИЧНЫХ УРАВНЕНИЙ РЕГРЕССИИ Н раздсле 4.4 нас интересовала проверка коэффициентов водном уравнении регрессии. Иногда возникает необходимость в проверке предположения о равенстве истинных (теоретических) значений коэффициентов в различных уравнениях регрессии (см., в частности, раздел 5.4). В табл. 4.4 приводятся данные о цене У и полезной площади Х нескольких жилых домов, продававшихся в Мемфисе (штат Теннесси) в 1970 г.
Опытный агент по продаже нсдвижимости классифицировал эти дома в зависимости от их состояния на следующие три категории: нсплохой дом, хороший дом и превосходный дом. Предположим, что для каждой категории дома сформулировано уравнение регрессии." е„,~, ~=-1, в~~,!=1, е~;, ~ -'-"= 1, 1'и =- 0 о + 0 Х1 + 1'и =- 0 ° + 0 Хм + Уз; —.= ~„+ ~з,Хз;+ Матрица 5-. представляет собой ковариационную матрицу для р » опеиок Ъ'„т.
с. Таблица 4.4 Продажная цена (в дол.), полеэная площадь (в квадратных Футах) н категория 22 жилых домов' превосходный (3) хороший (2) ПОЛВЭНЙЯ ппои$йдь хэви цепи Уд 16 650 27 500 1 762 777,83 15715,88 1350,13 25024,00 Среднее 8 549,66 1715,00 ° даннае приведены с разрешеннп МИка Харриса. Первый индекс указывает категорию (т. е.
1 — неплохой, 2 — хороший и 3 — превосходный). На рис. 4.6 показаны выборочные значения К в зависимости от выборочных значений Х, Каждая пара наблюдений обозначена в соответствии с классификацией: кружки соответствуют домам с оценкой енеплохойэ, крестики — домам с оценкой ~хорошийа ббО гба аОС ~або наб Иаа~воа Фюи!адь Рис. 4.6. Диаграмма рассеянии данных иа табл.
4.4 н линии рсгрсгсии 14 650 12 850 17 ЖВ 21 977 13 900 13 100 19 750 11 6ОО 1 688 1 738 1 040 1 404 1 558 ! 292 2 350 1 732 2 010 1 749 и точки — домам с оценкой ~превосходный>. На этом рисунке также нанесены сплошными линиями три оцененные линии регрессии, определяемые уравнениями У'„= — 1135,36 + 12,45Х„+ е,~, 1~~; = 981,17+ 10„91Х,~+ е,~, У'з; = — 606,98+ 14,95Хэ + ез;, (4.68) причем сумма квадратов остатков для каждого уравнения равна соот- ветственно: 6 е~ е,= ~Р, е~~ =13976855,58; Е=! 6- е~е,= ~~ е5=22719О35„91; к Э ез е, = "~.
еЬ == 141617937,46. чаи $ Мы хотим проверить, имеют ли эти три линии регрессии одинаковые коэффициенты, т. е. проверить гипотезу~ Оо:Ф =Р. =0зо=5юи0 =0 =Рз1=р ° Н,: не все соответствующие коэффициенты равны. При этом мы рассуждаем следующим образом. Если гипотеза о том, что все коэффициенты регрессии равны„верна, то достаточно одной линни регрессии вместо трех. Эта линия задается уравнением У~ — — ф,+~,Х~+а;, г=-1, 2, ..., и, (4.69) где а = и, + а, + и~. Таким образом, если эта гипотеза верна, то можно объединить все данные вместе, и уравнение (4.69) будет отвечать нашей задаче не хуже, чем уравнения (4.67). Или говоря точнее, сумма квадратов остатков для уравнения (4.69) не должна существенно отличаться от общей суммы квадратов остатков трех отдельных уравнений. Оценкой общей регрессии (показанной пунктирной линией па рис. 4.6) является уравнение У; = — 4О78,13+ 16,ООХ~ + е;, (4.7О) полученное регрессией всех 22 значений Х и У', приведенных в табл.
4.4. Сумма квадратов остатков для этого уравнения равна: е' е = 'Я е,~ = 244351749,56. 1=! Полная сумма квадратов остатков для трех отдельных уравнений будет равна: 8, = е ~ е, + е~ е, + ез е, = 178313828,95 с и — Б1(п1 — 2) + (п~ — 2) + (л~ — 2) = ~г — 61 степенямн сво- боды.
Более того, пусть 5„= е'е (4.72) с п — 2 степенями свободы. Если церна нулевая гипотеза, то расхождение 8, — 81 будет обусловлено ошибкой выборки. Обозначим это расхождение = 8о — ~~ = 6603792О,61 (4.73) с 4 1(п — 2) — (и — 6) = 41 степенями свободы. Можно показать, что нулевую гипотезу мОжно проверить с пОмОщью отношения 9 Яр~4 Я,/Ь вЂ” б) ' которое подчиняется Г-распределению с 4 и а — б степенями свободы. Это отношение Г сравнивает расхождение Я~ с полной суммой 8, квадратов остатков трех уравнений, причем и 8, и Я, отнесены к соотВетствующим числам степеней свободы. В нашем случае 66ОЗУ920,61~4 176313Ж8, 95/16 ..., п наблюдениями в каждом уравнении соответственно и ~д ... ~ц~1. Таким образом, у нас есть р уравнений регреспсременными в каждом уравнении. Мы хотим проверить ги- с и~, й~, Рг ='Ц~~о сии с .К потезу И,:~1 =Р,=-.--=Ь =~; О,; не все ф, равны.
Чтобы выполнить эту проверку, сначала объединим все данные и оценим уравнение общей регрессии 7 =Хр+е, (4,75) построенное по и = а, + п~ + ... + а~ наблюдениям. Затем вычислим сумму квадратов остатков для каждого из уравнений регрессии в отдельности и, суммируя их„образуем 81= ~ ес'е~. (4.76) Уюе 1 и это значение Р ие превышает Ро о,; ~ 1, 3,01. Следовательно, на заданном уровне значимости мы не находим различия между ко- эффициентами, В общем случае предположим, что имеется р уравнений 71 =-Хф, + в~ (4.74) 7„=. Хрф„+ а~ Эта общая сумма имеет и — р (К + 1) степеней свободы. Аналогич- ным образом вычислим сумму квадратов остатков для уравнения 4.75: еи 1 ОО Хз1 10 ОЖ,„ О1 ОЛз, Уи У„, Уз, 01 ОХ,„ ОО 1Л„ ° ° Э Оо 1Х~, У".
У,, Коэффициент р называется средним (или объединенным) угловым коэффициентом. Он еще встретится нам в разделе 5.4. Более компактно мс жно записать: 7 = %Ь + е. (4.81) ( ) ~а=ее (4.77) с и — К вЂ” 1 степенями свободы. Расхождение между ними 8з = ~а — ~~ с (и — К вЂ” 1) — (и — р (К+ 1)) = — (р — 1) (К+ 1) степенями свободы. Отношение Г определяется в виде ~,йр — ц %+1) Ь',|( — ~ (К+ ~М с (Р— 1) (К+ 1) Ц и — Р (К+ 1) степенями свободы. Подмножества коэффициентов.
Как мы уже отмечали, в зкономических исследованиях свободный член в уравнении регрессии, как правило, менее важен,. чем угловой коэффициент. Поэтому предположим, что нас интересует проверка гипотезы о том, что в нескольких уравнениях регрессии равны только угловые козффипиенты. Так, в примере с продажей домов мы хотим проверить гипотезу На: 111 = 1з1 = 1з = 1. (4.79) Н,: не все угловые козффищннты равны. Если гипотеза о том, что все угловые коэффициенты равны, справедлива, то зависимость иены дома от полезной площади будет одинаковсй для всех трех категорий домов, и система уравнений (4.67) приобретает вид У ~ - 1 а + 0~а + еи ~ = 1 2* "-.
и ". Уз; = ф„+ ~3Х„. + ез1, г =- 1, 2, ..., из, (4.8О) Уз~ = рза + 1Хз; + ез-, ~ = 1 ° 2 - из. Объединяя наблюдения, мы имеем в матричной форме: Оценка наименьших квадратов уравнения (4.81) равна: Ь =- (%'%)-» %'Ъ' (4.82) с е в качестве остатка. При нулевой гипотеза 50 = е'е с и — 4 степенями свободы, Лля нашего примера 8,) = 184241946,90.
Расхождение между Б, и общей суммой квадратов остатков всех трех уравнений (равной 178313828,95) следующее: 82 = 56 — 5» = 184241946,90 — 178313828,95 = 5928117,95 с двумя 1т. е. с (и — 4) — (и — 6)1 степенями свободы. Следовательно, отношение (4.83) и имеет 2 и 16 степеней свободы. Очевидно, это значение не превышает Р~,у„~ »6, поэтому нулевая гипотеза не отвергается.
Переходя к общему случаю, предположим, что у нас есть система уравнений У» = Х, а» + Х» ~» + а» (4.84) Ур = Хр~р + Хфр + вр где а~ представляет собой д-мерные векторы, а р; есты-мерные векторы. В любом из уравнений д --', г равно К+ 1, т. е. числу независимых переменных плюс свободный член. В системе уравнений (4.84) все коэффициенты разделены на два множества: множество коэффициентов, представляемое вектором а, проверкой которого мы не интересуемся, и множество коэффициентов, представляемое вектором Р, равенство которых мы и хотим проверить.
Другими словами, мы проверяем 00 Р» = Р2 = ." =-- Ь =- Р* Н»: не все Р равны. Как и ранее, объединим все наблюдения в соответствии с гип~ тезой -Х,ОО ".ОХ,— ° Х, О У 7» У, Ур 8~ т ° й О О О ° . ° Х„Х„ Здесь каждый элемент 7, — ио а;-мерный вектор, каждый Х; — ма- трица л~ х д и каждый Х; — матрица л; х г'. Остальные элементы матрицы справа от знака равенства равны нулю. Уравнение (4.85) 139 также можно записать более компактно: У вЂ” — %6+ е; решением этого уравнения будет (4.82). Процедура проверки остается такой же, как в (4.76) — (4,78), и отличается только числом степеней свободы, а именно 51/( — Р (К+1)) с г(р — 1) н и — р (К+ 1) степенями свободы.