В.П. Носко - Эконометрика для начинающих (1160539), страница 24
Текст из файла (страница 24)
Величинаwiинтерпретируется в этом контексте как вес, приписываемыйквадрату отклонения в i - м наблюдении. Этот вес будет темменьше, чем больше значение xi2 , которое в силу нашихпредположений пропорционально дисперсии случайнойошибкиD(ε i ) = σ i2 = σ 2 ⋅ xi2вi -мнаблюдении.Следовательно, чем больше дисперсия случайной ошибки ε i ,тем меньше вес, с которым входит квадрат отклонения в i -мнаблюдении в минимизируемую сумму.Имея в виду, что оценивание преобразованной моделинаблюдений сводится к минимизации суммыn∑w (yii =1− α − β xi ) ,2i41рассмотренный метод оценивания называют взвешеннымметодом наименьших квадратов (хотя точнее его следовалобы называть методом наименьших взвешенных квадратов).Замечание. В некоторых руководствах по эконометрике ив некоторых пакетах статистического анализа данных(например, в пакете EVIEWS) используется несколько иноеравносильноепредставлениеминимизируемойсуммыквадратов в преобразованной модели наблюдений:∑(w (ynii =1− α − β x i )) .2iВ этом случае вес приписывается не квадрату отклонения,а самому отклонению( yi − α − β xi ).
Разумеется, врассмотренном примере при таком определении весапоследний будет равен1wi =.xiНа это обстоятельство следует обратить внимание приспецификации весов в процедурах, реализующих взвешенныйметод наименьших квадратов.Обратим теперь внимание на то, в каком виде выдаетсяинформация о результатах применения взвешенного методанаименьших квадратов на примере пакета EVIEWS. При этомиспользуем данные из рассмотренного выше примера.Согласно сказанному в Замечании, при обращении кпроцедуре оценивания взвешенным методом наименьшихквадратов в условиях нашего примера мы специфицируем весакак w = 1 x .42Протокол оценивания имеет следующий вид:Dependent Variable: YMethod: Least SquaresDate: Time:Sample: 1 27Included observations: 27Weighting series: 1/XVariableCoefficient Std.
Errort-StatisticProb.CX3.8032960.1209904.5697450.0089990.83227713.445400.41310.00000.026960–0.01196113.159024328.998-106.85432.272111Mean dependent varS. D. dependent varAkaike info criterionSchwarz criterionF-statisticProb (F-statistic)74.0494613.081038.0632808.159268180.77890.0000000.7580340.74835522.577462.444541Mean dependent varS. D. dependent varSum squared resid94.4444445.0071212743.54Weighted StatisticsR-squaredAdjusted R-squaredS. E. of regressionSum squared residLog likelihoodDurbin-Watson statUnweighted StatisticsR-squaredAdjusted R-squaredS.
E. of regressionDurbin-Watson statВ этом протоколе приводятся значения двух видовстатистик:• Weighted Statistics (взвешенные статистики) — этостатистики, основанные на остатках, получаемых повзвешенным данным, т. е. на остатках ei∗ = yi∗ − β − α xi∗в преобразованной модели.• Unweighted Statistics (невзвешенные статистики) —этостатистики,основанныена«остатках»WLSWLSui = yi − αxi ,−βт. е. на отклонениях43наблюдаемых значений объясняемой переменной y отзначений, предсказываемых линейной моделью связи, вкачестве параметров которой берутся их оценкиα WLS , β WLS , полученные в преобразованной модели.Отметим весьма низкое (0.2696) значение коэффициентадетерминации в преобразованной модели.
Однако этообстоятельство не должно нас волновать — линейная связь впреобразованной модели значима, о чем говорит весьмавысокое значение F -статистики, равное 180.7789, исоответствующее ему P -значение 0.0000 (см. WeightedStatistics). В конечном счете нас интересует значение R 2 ,находящеесявчастипротокола,соответствующейневзвешенным статистикам, а это значение достаточно велико(0.7580).Отметим еще, что приведенные в начале таблицы значенияоценок параметров, их стандартных ошибок и t -статистик, атакже P -значения соответствуют величинам, полученным настадии оценивания преобразованной модели.Заметим, наконец, что значение R 2 = 0.758 , указанное вчисле невзвешенных статистик, отличается от значенияR 2 = 0.776 , полученного нами при оценивании исходной(непреобразованной) модели наблюдений.
Причина этого,разумеется, в том, что при вычислении значения R 2 = 0.776использовались остаткиei = yi − α$ − β$ xi ,где α$ , β$ — оценки наименьших квадратов параметровисходной модели, полученные без использования взвешиванияотклонений.44Мы уже отмечали выше, что результатом неоднородностидисперсий случайных ошибок в модели наблюдений являетсясмещение оценок дисперсий случайных величин θ$ 1 ,K , θ$ p . Вто же время, наличие такого нарушения стандартныхпредположений оставляет оценки θ$ 1 ,K , θ$ p несмещенными.
Всвязи с этим, один из методов коррекции статистическихвыводов при неоднородности дисперсий ошибок состоит виспользовании обычных оценок наименьших квадратов (OLSоценок, Ordinary Least Squares estimates) θ$ 1 ,K , θ$ pкоэффициентов θ 1 ,K , θ p вместе со скорректированными нагетероскедастичность оценками стандартных ошибок sθ$ .jОдин из вариантов получения скорректированных нагетероскедастичность значений sθ$ был предложен Уайтомj(White) и реализован в ряде пакетов статистического анализаданных, в том числе и в пакете EVIEWS. При этомудовлетворительные свойства оценки Уайта гарантируютсятолько при большом количестве наблюдений.
Мы не будемприводить здесь детали получения оценки Уайта, а простовоспользуемся пакетом EVIEWS для анализа данных из толькочто рассмотренного примера.Пример. Используем данные из предыдущего примера, ноприменим для их анализа последнюю процедуру. Согласноэтой процедуре, мы оцениваем коэффициенты α и β обычнымметодом наименьших квадратов, так что в качестве оценокберутся значения α$ = 14.448 и β$ = 0105.. В качестве же оценокстандартных ошибок sα$ и sβ$ вместо значений sα$ = 9.562 иsβ$ = 0.011 ,полученныхвышеприоцениваниимодели45обычным методом наименьших квадратов, берем значенияоценок Уайта sα$ = 10.633 и sβ$ = 0.018 .Бросающееся в глаза значительное различие оценок дляпараметра α при применении двух рассмотренных методов( 3803.и 14.448 ) в действительности не столь уж удивительно,поскольку оценки стандартной ошибки для α$ , полученныекаждым из двух методов довольно высоки ( sα$ = 4.570 иsα$ = 10.633 , соответственно).Избавиться от неоднородности дисперсий ошибок в рядеслучаев позволяет переход к логарифмам объясняемойпеременной.Пример.
По данным, использованным в двух предыдущихпримерах, оценим модель наблюденийln yi = α + β xi + ε i , i = 1,K ,27.Графикзависимостистандартизованныхостатков,полученных при оценивании этой модели, от предсказанных∧значений ln yi (левый график)221RESID_STANDRESID_STAND10-1-1-2-33.54.04.55.0LnY_F4605.56.0-23.54.04.5LnY_F5.05.5указывает на неправильную спецификацию модели,связаннуюсвозможнымпропускомквадратичной2составляющейxi . Оценивание расширенной моделинаблюдений, включающей дополнительную объясняющуюпеременную x 2 , приводит к остаткам, обнаруживающимсущественно более удовлетворительное поведение (см.
правыйграфик). Результаты оценивания расширенной моделиприведены в следующей таблице.Variable1xx2Coefficient2.8510.003-1.10E-06Std. Error0.1570.0003992.24E-07t-Statistic18.2057.803-4.925P-value0.00000.00000.0001Таким образом, используя преобразования переменных,мы получили две альтернативные оцененные модели связимежду переменными x и y :. ⋅ 10 −6 x 2 .y = 3.803 + 0.121x и ln y = 2.851 + 0.003 x − 11Первую из этих двух моделей можно предпочесть изсоображений простоты интерпретации.3.5. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИАВТОКОРРЕЛИРОВАННОСТИ ОШИБОКПусть мы имеем дело с наблюдениями, производимымипоследовательно через равные промежутки времени(ежедневные, еженедельные, ежеквартальные, ежегодныестатистические данные) и выявляем по графику зависимостистандартизованных остатков ci = ei S от i тенденциюсохранения знака соседних наблюдений.
В таком случае мыможем подозревать нарушение условия независимостислучайных ошибок ε 1 ,K , ε n в принятой нами моделинаблюдений47yi = θ 1 xi 1 +K+θ p xi p + ε i , i = 1,K , n,в форме положительной автокоррелированности рядаошибок.Простейшей моделью автокоррелированности ошибокявляется модель авторегрессии первого порядка:ε i = ρ ε i −1 + δ i , i = 2,K , n,где ρ < 1, а δ i , i = 2,K , n, — независимые всовокупности случайные величины, имеющие одинаковоенормальное распределение N 0, σ 2 . Тогда гипотеза()H0 : ρ = 0соответствует (при нашем предположении о нормальностираспределения случайных ошибок) независимости всовокупности случайных величин ε 1 ,K , ε n . В качествеальтернативной используем гипотезуHA : ρ > 0 ,соответствующуюположительнойавтокоррелированности случайных величин ε 1 ,K , ε n (т.
е.тенденции преимущественного сохранения знака случайнойошибки при переходе от i - го наблюдения к i + 1-му). Еслигипотеза H 0 : ρ = 0 отклоняется критерием Дарбина-Уотсонав пользу альтернативной гипотезы H A : ρ > 0 , то дляполучения правильных статистических выводов относительнокоэффициентовмоделинеобходимасоответствующаякоррекция.ИтерационнаяпроцедураКохрейна-Оркатта(Cochrane-Orcutt).Умножим обе части выражения для (i − 1) -го наблюденияна ρ , так что48ρ yi −1 = θ 1ρ xi −1, 1 +K+θ p ρ xi −1, p + ρε i −1 , i = 1,K , n,и вычтем обе части полученного выражения изсоответствующих частей выражения для i -го наблюдения:yi − ρ yi −1 = θ 1 ( xi ,1 − ρ xi −1, 1 )+K+θ p xi , p − ρ xi −1, p + (ε i − ρε()Тем самым мы приходим к преобразованнойнаблюденийyi′ = θ 1 xi′1 +K+θ p xi′p + ε i ′ , i = 2,K , n,моделигдеyi′ = yi − ρ yi −1 ,xi′,1 = xi ,1 − ρ xi −1, 1 , K , xi′, p = xi , p − ρ xi −1, p ,ε i ′ = ε i − ρε.Поскольку в принятой модели ошибокε i − ρ ε i −1 = δ i , i = 2,K , n,то это означает, что ошибки ε ′2 ,K , ε n′ в преобразованноймодели — независимые в совокупности случайные величины,имеющие одинаковое нормальное распределение N 0, σ 2 .i −1()Иными словами, случайные ошибки в преобразованноймодели удовлетворяют стандартным предположениям.Следовательно, в рамках преобразованной модели никакойдополнительной коррекции обычных статистических выводово коэффициентах модели не требуется.