В.П. Носко - Эконометрика для начинающих (1160539), страница 26
Текст из файла (страница 26)
Если же отклонениеyi −1 от(α+ β xi−1 )отрицательно ( yi −1 < α + β xi −1 ) , то второе слагаемое будетположительным, действуя в сторону увеличения приращения∆ yi = yi − yi −1 .Указанная модель коррекции приращений переменной yиспользует «истинные» значения параметров α , β , ρ .Поскольку эти значения нам не известны, мы в состояниипостроитьтолькоаппроксимациютакоймодели,использующую оценки параметров. При этом естественновоспользоваться оценкой r и уточненными оценками α$ , β$ ,полученными на базе преобразованной модели.В рассмотренном примере аппроксимирующая моделькоррекции приращений принимает вид∆ y i = 2.795 ∆ x i − 0.126 ( y i −1 + 244.262 − 2.795 x i −1 ).3.6.
КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИНАЛИЧИИ СЕЗОННОСТИ. ФИКТИВНЫЕ ПЕРЕМЕННЫЕПриведенный ниже график показывает динамикуизменения совокупного располагаемого дохода DPI и объемовпродаж SALES лыжного инвентаря в США (квартальныеданные; DPI — в млрд долларов, SALES — в млн долларов, вценах 1972 г.).5920016012080400646566676869SALES70717273DPIОцениваниелинейноймоделипеременных дает следующие результаты.связиуказанныхDependent Variable: SALESMethod: Least SquaresSample: 1964:1 1973:4Included observations: 40VariableCoefficient Std. Errort-StatisticProb.CDPI29.976130.1084026.4636260.0367994.6376652.9457680.00000.0055R-squaredAdjusted R-squaredS. E. of regressionSum squared residLog likelihoodDurbin-Watson stat0.1859040.1644813.521017471.1074–106.08171.874403Mean dependent varS.
D. dependent varAkaike info criterionSchwarz criterionF-statisticProb (F-statistic)48.945713.8520325.4040845.4885288.6775460.005475Коэффициент при переменной DPI статистически значим.Однако график стандартизованных остатков (приведенный дляудобства в двух формах)60221100-1-1-264-2656667686970RESID_STAND71727364656667686970717273RESID_STANDобнаруживает явную неадекватность построенной моделиимеющимсянаблюдениям.Однакохарактерэтойнеадекватности таков, что он не улавливается критериемДарбина-Уотсона: значение 1874.статистики ДарбинаУотсона близко к 2 . И это не удивительно: заположительными остатками с равным успехом следуют какположительные, так и отрицательные остатки, чтосоответствует практическому отсутствию корреляции междусоседними ошибками и подтверждается диаграммой рассеяния61RES01 vs.
RES01(-1)10RES0150-5-10-10-50510RES01(-1)(Здесь RES01 — переменная, образованная остатками отподобранной модели линейной связи, а RES01( −1) —переменная, образованная запаздывающими на один кварталзначениями переменной RES01.)RES01 vs. RES01(-4)1055RES01RES01RES01 vs. RES01(-2)100-5-10-100-5-50RES01(-2)510-10-10-50510RES01(-4)В то же время, налицо отрицательная коррелированностьостатков для наблюдений, отстоящих на два квартала, и62положительная — для наблюдений, отстоящих на четыреквартала:В отличие от критерия Дарбина-Уотсона, критерийБройша-Годфри «замечает» такую коррелированность:допуская коррелированность ошибок для наблюдений,разделенныхдвумякварталами,получаемP − value = 0.000037 , что ведет к безусловному отклонениюгипотезы о независимости ошибок.Обратим теперь внимание на весьма специфическоеповедение остатков.
Все остатки, соответствуюшие первому ичетвертому кварталам, положительны, а все (за исключениемдвух) остатки, соответствующие второму и третьемукварталам, отрицательны. Такое положение, конечно, простоотражает тот факт, что спрос на зимний спортивный инвентарьвозрастает в осенне-зимний период и снижается в весеннелетний период года, т.
е. имеет сезонный характер.Построенная нами модель не учитывает фактор сезонностиспроса и потому оказывается неадекватной. Вследствие этого,такая модель не может, в частности, использоваться дляпрогнозирования объема спроса в зависимости от величинысовокупного располагаемого дохода.Для коррекции моделей связи в подобных ситуациях частопривлекают искусственно построенные переменные —«фиктивные переменные» («dummy» variables). В нашемслучае в качестве такой дополнительной переменной можновзять, например, переменную DUMMY , значение которойравно 1 для первого и четвертого кварталов и равно 0 длявторого и третьего кварталов. Добавление такой переменной вкачестве объясняющей позволяет учесть сезонные колебанияспроса.
Оценивание расширенной модели дает следующиерезультаты.63Dependent Variable: SALESVariableCoefficient Std. Errort-StatisticProb.CDPIDUMMY26.217870.1126536.0285243.1520420.0178470.5399978.3177426.31222711.163990.00000.00000.0000R-squaredAdjusted R-squaredS. E. of regressionSum squared residLog likelihoodDurbin-Watson stat0.8136440.8035711.707233107.8419-76.593271.452616Mean dependent varS. D. dependent varAkaike info criterionSchwarz criterionF-statisticProb (F-statistic)48.945713.8520323.9796634.10632980.772440.000000Оцененное значение 6.029 коэффициента при переменнойDUMMY фактически означает, что спрос на лыжныйинвентарь в течение первого и четвертого кварталоввозрастает по сравнению со спросом в течение второго ичетвертого кварталов в среднем примерно на 6 млн долларов(в ценах 1972 г.). Следующий график иллюстрирует качествоподобранной расширенной модели.6460555064544020-2-46465666768Residual6970Actual717273FittedНа сей раз значение P − value для статистики критерияБройша-Годфри равно 0157197.против прежнего значения0.000037 , так что этот критерий теперь не отвергает гипотезунезависимости случайных ошибок ε 1 ,K , ε n .По-существу, мы подобрали две различные моделилинейной связи между DPI и SALES :модельSALES = 26.21787 + 0.112653DPIдля весенне-летнего периода;модельSALES = (26.21787 + 6.028524) + 0.112653DPIдля осенне-зимнего периода.При этом, предельная склонность к закупке лыжногоинвентаря в обеих моделях остается одинаковой и оцениваетсявеличиной 0112653..Замечание.
Вместо подбора отдельных моделей дляосенне-зимнего и весенне-летнего периодов можно было бызаняться подбором отдельных моделей для каждого из четырехкварталов года. С этой целью в качестве дополнительныхобъясняющихпеременныхможновзять,например,переменные DUMMY 4, DUMMY1, DUMMY 2 , принимающие65значение 1 , соответственно, в четвертом, первом и второмкварталах, и равные нулю в остальных кварталах. Приоценивании такой расширенной модели для наших данныхоказывается незначимым коэффициент при DUMMY2 , чтоозначает близость в среднем уровней продаж во втором и втретьем кварталах. Более того, оказываются близкими оценкикоэффициентов при переменных DUMMY4 и DUMMY1 .Гипотеза о совпадении двух последних коэффициентов неотвергается, и в итоге мы возвращаемся к модели с однойфиктивной переменной DUMMY , которую мы уже оценилиранее.Использование фиктивных переменных полезно прианализе агрегированных (объединенных) данных, полученныхпри объединении наблюдений, относящихся к различнымполам (мужчины и женщины), к различным возрастным,языковым и социальным группам, к различным периодамвремени.
В таких ситуациях модели, построенные поотдельным группам, могут существенно различаться, и тогдамодель, построенная по объединенным данным, не учитываетэтого различия. Привлечение фиктивных переменныхпозволяет оценить значимость такого различия и порезультатам этой оценки остановиться на модели сагрегированными данными или на модели, в которойучитывается различие параметров связи для различных групп(периодов времени).В качестве примера, попробуем построить модель связимежду переменными Z и X , которые в 15 наблюденияхимели следующие значения:X12366Z1.2571.8123.641X678Z0.8651.9302.944X111213Z1.8041.9563.134454.4015.5619104.3165.32314154.6494.559Этим данным соответствует приведенная ниже диаграммарассеяния;Прямая на диаграмме соответствует подобранной модели связиZ = 2.414 + 0.099 X ;t - статистика для коэффициента при X принимаетзначение 1.087 , что дает P − value = 0.297 и ведет кнеотвержению гипотезы о равенстве этого коэффициентанулю.
Регрессия переменной Z на переменную X признаетсянезначимой.Z vs. X65Z4321005101520XГрафик указывает на наличие трех режимов линейнойсвязи между переменными Z и X , соответствующим5 первым, 5 центральным и 5 последним наблюдениям.Коэффициент при X кажется одинаковым для всех трехрежимов, тогда как постоянные различаются.В то же время, график остатков от подобранной моделисвязи явно указывает на неправильную спецификацию модели:673210-1-2-3123456789 10 11 12 13 14 15RESID01Чтобы учесть обнаруженное по графику остатков наличиетрех режимов, привлечем в качестве дополнительныхобъясняющих переменных две фиктивные переменные:переменную D2 , равную 1 в пяти центральных наблюденияхи равную 0 в остальных наблюдениях, а также переменнуюD3, равную 1 в пяти последних наблюдениях и равную 0 востальных наблюдениях. Оценивание расширенной модели сучастием этих дополнительных объясняющих переменныхдает следующий результат:VariableCoefficient Std.
Errort-StatisticProb.CXD2D30.2643681.023398-5.375960-10.348060.2740730.0707650.4304490.7489100.96459114.46185-12.48920-13.817490.35550.00000.00000.0000R-squaredDurbin-Watson stat0.9502862.205754Mean dependent varProb (F-statistic)3.2102130.000000На этот раз регрессия оказывается не только статистическизначимой, но и имеет очень высокую значимость; то же68относится и к коэффициентам при переменных X , D2 и D3.Высокая значимость двух последних коэффициентовподтверждает значимое отличие констант в моделях линейнойсвязи между переменными Z и X .В заключение обратимся опять к примеру, рассмотренномув параграфе 3.3.
Мы обнаружили там, что модель линейнойсвязиCONS t = θ 1 + θ 2 DPI t + θ 3 ASSETS t −1 + ε t , t = 2,K ,27 ,оказалась неудовлетворительной, поскольку анализостатков от оцененной модели выявил гетероскедастичность иавтокоррелированность ошибок и отличие распределенияошибок от нормального. Приведенные там графикзависимости стандартизованных остатков ci = ei S от номеранаблюдений и его вариант в виде зависимости от годанаблюдения указывают на явную разницу в поведенииостатков в первой части периода наблюдений (до 1972 года) иво второй его части (1973-1985 годы).
Такое различие вповедении остатков свидетельствует о том, что в 1973 годупроизошел структурный сдвиг в экономической ситуации,связанный с мировым топливо-энергетическим кризисом,который изменил характер связи между рассматриваемымимакроэкономическимифакторами.Последнеемогло,например, выразиться в изменении значений параметровϑ 1 ,ϑ 2 , ϑ 3 при переходе ко второй части периоданаблюдений. Возможность такого изменения учитываетрасширенная модельCONS t = γ 1 ( D1) t + γ 2 ( D2) t + γ 3 ( DPI 1) t + γ 4 ( DPI 2) t+ γ 5 ( ASSLAG1) t + γ 6 ( ASSLAG 2) t + ε t , t = 2,K ,27 .Здесь69( D1) t - фиктивная переменная, равная 1 для t = 1,K ,14(что соответствует периоду с 1959 по 1972 год) и равная 0 дляt = 15,K ,27 (что соответствует периоду с 1973 по 1985 год),( D2) t = 1 − ( D1) t - фиктивная переменная, равная 0 дляt = 1,K ,14 и равная 1 для t = 15,K ,27 ,( DPI 1) t = DPI t ⋅ ( D1) t - переменная, равная ( DPI ) t дляt = 1,K ,14 и равная 0 для t = 15,K ,27 ,( DPI 2) t = DPI t ⋅ ( D2) t - переменная, равная 0 дляt = 1,K ,14 и равная ( DPI ) t для t = 15,K ,27 ,( ASSLAG1) t = ASSETS t −1 ⋅ ( D1) t - переменная, равнаяASSETS t −1 для t = 2,K ,14 и равная 0 для t = 15,K ,27 ,( ASSLAG 2) t = ASSETS t −1 ⋅ ( D2) t - переменная, равная 0для t = 2,K ,14 и равная ASSETS t −1 для t = 15,K ,27 .Заметим, что при этом( DPI 1) t + ( DPI 2) t = DPI t , t = 1,K ,27,( ASSLAG1) t + ( ASSLAG 2) t = ASSETS t −1 , t = 2,K ,27.В рамках расширенной модели проверим гипотезуH0 : γ 1 = γ 2 , γ 3 = γ 4 , γ 5 = γ 6 ,используя F -критерий.