В.П. Носко - Эконометрика для начинающих (1160539), страница 23
Текст из файла (страница 23)
Если мы, как обычно, задаем уровень значимостиравным α = 0.05 , то соответствующее этому уровнюзначимости критическое значение F -статистики равноF0.95 (7,7) = 3.79 .Наблюдаемое значение этой статистики 6.228 превышаеткритическое; поэтому гипотеза выполнения стандартныхпредположений об ошибках отклоняется в пользу гипотезы30возрастания дисперсийD(ε i )с ростом значенийθ 1 + θ 2 DPI + θ 3 ASSETS( −1) .Заметим,наконец,чтовероятностьпревышенияслучайнойвеличинойсраспределением F ( 7,7) значения 6.228 равнаP - value = 0.0138.Сравним результаты применения критерия ГолдфелдаКвандта с результатами, получаемыми при использованиидвух вариантов критерия Уайта.При использовании первого варианта наблюдаемоезначение статистики критерия равно nR 2 = 8.884 .
Посколькуp = 3 , то число степеней свободы соответствующегораспределения хи-квадрат равно 2 p − 2 = 4 . Вероятность того,что случайная величина, имеющая такое распределение,превысит значение 8.884 , равна 0.0641 , так что значениеnR 2 = 8.884 меньше критического, а значит, гипотезаоднородности дисперсий этим вариантом критерия Уайта неотвергается.При использовании второго варианта наблюдаемоезначение статистики критерия равно nR 2 = 9.699 . Числостепеней свободы соответствующего распределения хиквадрат равноp 2 + p − 2 2 = 5 . Вероятность того, что()случайная величина, имеющая такое распределение, превыситзначение 9.699 , равна 0.0842 , так что значение nR 2 = 9.699меньше критического, а значит, гипотеза однородностидисперсий не отвергается и этим вариантом критерия Уайта.Таким образом, статистические выводы относительнооднородности дисперсий случайных составляющих врассматриваемоймоделинаболюденийоказалисьпротиворечивыми: гипотеза однородности отвергается31критерием Голфелда-Квандта, но не отвергается обоимивариантами критерия Уайта.
Как можно объяснить такоепротиворечие?• Оба варианта критерия Уайта асимптотические, тогдакак критерий Голдфелда-Квандта учитывает реальноимеющееся количество наблюдений.• Оба варианта критерия Уайта являются критериямисогласия, не настроенными на какой-то специфическийкласс альтернатив гипотезе однородности, тогда какиспользованиекритерияГолдфелда-Квандтанепосредственно связано с альтернативой, выраженнойв форме возрастания дисперсий ошибок длясоответствующего упорядочения наблюдений. И здесьпроявляется общее положение: критерии, построенныес расчетом на узкий класс альтернатив, оказываютсяболее мощными по сравнению с критериями,рассчитанными на более широкий класс альтернатив, т.е.
чаще отвергают нулевую гипотезу, когда она неверна.Рассмотримтеперьграфикзависимостистандартизованных остатков ci = ei S от номера наблюденийи его вариант в виде зависимости от года наблюдения:32RESID_STAND & YEAR211RESID_STANDRESID_STANDRESID_STAND & i20-1-20-1-2-3-351015i2025606570758085YEARЗдесь обращает на себя внимание наличие серий остатководинакового знака, что сигнализирует о том, что ошибки вмодели наблюдений скорее всего имеют положительнуюавтокорреляцию.
Для 26 наблюдений и p = 3 объясняющихпеременных границы для критического значения статистикиДарбина-Уотсона при α = 0.05 (односторонний критерий)равны. , d U ,0.05 = 155. .d L ,0.05 = 122В то же время, вычисленное по остаткам от оцененноймодели значение статистики Дарбина-Уотсона равноDW = 101. ,что меньше нижней границы d L,0.05 = 122.
. Следовательно,нулевая гипотеза о выполнении стандартных предположенийотклоняетсяв пользу гипотезы о положительнойавтокоррелированности ошибок.Сравним результаты применения критерия ДарбинаУотсона с результатами, получаемые при использованиикритерия Бройша-Годфри.Если исходить из допущения зависимости очищенныхслучайных ошибок только на один шаг ( K = 1) , как это33делается при использовании критерия Дарбина-Уотсона, то вэтом случае вычисленное значение статистики критерияБройша-Годфри равно nR 2 = 6.068 , что соответствует P значению, равному 0.014 . Гипотеза независимости ошибокотвергается, что согласуется с результатом, полученным прииспользовании критерия Дарбина-Уотсона.В то же время, если взять K = 5 , то тогда nR 2 = 10.331 , чтосоответствуетP -значению, равному 0.066 . Гипотезанезависимости ошибок в этом случае не отвергается приустановленном уровне значимости α = 0.05 , что расходится срезультатом, полученным при использовании критерияДарбина-Уотсона.
Эта гипотеза не отвергается также привыборе K = 6 ( P - value = 0.095) , K = 7 ( P - value = 0.127)и т.д., и это вполне объяснимо: выбор K = 5 , K = 6 , K = 7соответствует выбору все более широких альтернатив посравнению с K = 1 , что приводит к уменьшению вероятностиотвергнуть гипотезу независимости ошибок в случае, когда онане верна.Проверим, наконец, предположение о нормальномраспределении ошибок. Сначала рассмотрим диаграмму«квантиль-квантиль»(Q-Q plot) и диаграмму плотности (DPPplot):3430.520.30DPPNormal Quantile0.41-10.2-20.1-3-3-2-10120.0-3-2-1012C_KC_KПервая диаграмма не выглядит удовлетворительной;вторая обнаруживает определенную асимметрию.
Выборочныйкоэффициент асимметрии равен здесь −1.285, а выборочныйкоэффициент эксцесса равен 5.321. Оба эти значения говорятотнюдь не в пользу нормальности ошибок. Статистикакритерия Jarque-Bera принимает значение 12.997, чтосоответствует P - value = 0.0015.
Следовательно, имеющиесяданные не подтверждают гипотезу о выполнении стандартныхпредположений об ошибках и по этому критерию.В связи со столь неутешительными результатами вотношении проверки гипотезы выполнения стандартныхпредположений в рассмотренном примере, возникаетестественный вопрос о том, как именно влияют нарушенияэтих предположений на статистические выводы.Неоднородностьдисперсийошибок(гетероскедастичность,heteroscedasticity).Этотвиднарушений стандартных предположений характерен длястатистических данных, относящихся к одному моментувремени, но собранных по различным регионам, различнымпредприятиям, различным социальным группам (данные всечениях, cross-section data).
Неоднородность дисперсий35возникает также как результат тех или иных структурныхизменений в экономике, например связанных с мировымиэкономическими кризисами. Последний пример как раз ииллюстрирует подобную ситуацию: резкое возрастаниеабсолютных величин остатков в этом примере относится кпериоду глобального нефтяного кризиса.Последствия неоднородности дисперсий ошибок:• Оценки дисперсий случайных величин θ$ 1 ,K , θ$ p(оценоккоэффициентовлинейноймодели)оказываются смещенными.• Построенные доверительные интервалы для θ$ 1 ,K , θ$ pне соответствуют заявленным уровням значимости.• Вычисленные значения t - и F - отношений уже нельзярассматривать как наблюдаемые значения случайныхвеличин,имеющихtиF -распределения,соответствующиестандартнымпредположениям.Поэтому сравнение вычисленных значений t - и F отношений с квантилями указанных t - и F распределений может приводить к ошибочнымстатистическим выводам в отношении гипотез означениях коэффициентов линейной модели.Автокоррелированность(сериальнаякорреляция)ошибок (autocorrelation, serial correlation).
Этот виднарушений стандартных предположений характерен длястатистических данных, развернутых во времени (продольныеданные, longitudial data). Автокоррелированность ошибокобычно возникает вследствие направильной спецификациимодели, например, при невключении в модель существеннойобъясняющей переменной с выраженной автокорреляцией.Последствия автокоррелированности ошибок:36• Оценка S 2 = RSS (n − p) дисперсии случайных ошибоксмещена вниз в случае положительной и смещена вверхв случае отрицательной автокоррелированности ошибок.• Оценки дисперсий случайных величин θ$ 1 ,K , θ$ p(оценок коэффициентов линейной модели) оказываютсязаниженными в случае положительной и завышеннымив случае отрицательной автокоррелированности ошибок.• Построенные доверительные интервалы для θ$ 1 ,K , θ$ pне соответствуют заявленным уровням значимости: вслучае положительной автокоррелированности ошибокпостроенные интервалы неоправденно узки, а в случаеотрицательнойавтокоррелированностиошибокнеоправданно широки.• Вычисленные значения t - и F - отношений нельзярассматривать как наблюдаемые значения случайныхвеличин,имеющихtиF -распределения,соответствующиестандартнымпредположениям.Поэтому сравнение вычисленных значений t - и F отношений с квантилями указанных t - и F распределений может приводить к ошибочнымстатистическим выводам в отношении гипотез означенияхкоэффициентовлинейноймодели.Вычисленные значения t - и F - отношений завышены вслучае положительной и занижены в случаеотрицательной автокоррелированности ошибок.При обнаружении нарушений стандартных предположенийследует либо улучшить спецификацию модели, привлекаяподходящие дополнительные объясняющие переменные, либоиспользовать для оценивания коэффициентов и оцениваниядисперсий коэффициентов модели специальные методы37оценивания, принимающие во внимание обнаруженныенарушения (далее мы рассмотрим два таких метода:взвешенныйметоднаименьшихквадратовиавторегрессионное преобразование переменных).3.4.
КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИНАЛИЧИИ ГЕТЕРОСКЕДАСТИЧНОСТИ(НЕОДНОРОДНОСТИ ДИСПЕРСИЙ ОШИБОК)Пример. Для исследования вопроса о зависимостиколичества руководящих работников от размера предприятиябыли собраны статистические данные по 27 промышленнымпредприятиям. Далее обозначено:xi — численность персонала на i-м предприятии,yi — количество руководителей на i-м предприятии.Оцениваем линейную модель наблюденийyi = α + β xi + ε i , i = 1,K ,27.Регрессионный анализ дает следующие результаты: R2=0.776 иVariable1XCoefficient14.4480.105Std. Error9.5620.011t-Statistic1.5119.303P-value.0.14330.0000Следующие два графика демонстрируют диаграммурассеяния с подобранной прямой y = 14.448 + 0.105x (левыйграфик) и зависимость стандартизованных остатков ci = ei Sот значений y$i = 14.448 + 0.105xi (правый график).38Y vs.
X22001RES_STAND250Y1501000-1-250-300500100015002000050100150200YFXПохоже, что имеет место тенденция линейноговозрастания абсолютных величин остатков с ростом y$ ,соответствующая наличию приближенной зависимости видаD(ε i ) = σ i2 = σ 2 ⋅ xi2 для дисперсий ошибок. Чтобы погаситьтакую неоднородность дисперсий, разделим обе частисоотношения yi = α + β xi + ε i на xi :yiε1=α+β + i ,xixixiт.
е. перейдем к модели наблюденийyi∗ = β + α xi∗ + ε i∗ ,гдеy1εyi∗ = i , xi∗ =, ε i∗ = i .xixixiЕслидействительновыполняетсясоотношение222D(ε i ) = σ i = σ ⋅ xi , то тогда в преобразованной модели( ) = 0, D(ε ) =Eε∗i∗i( )= σ1Dεxi2i2,39т. е. неоднородность дисперсий ошибок преодолевается.Результаты оценивания преобразованной модели:Variable11/xCoefficient0.1213.803Std.
Error0.0094.570t-Statistic13.4450.832P-value.0.00000.4131В исходных переменных это соответствует моделилинейной связиy = 3.803 + 0.121x .Отметим уменьшение оцененных стандартных ошибокоценок обоих параметров α и β . Именно на эти значенияследует опираться при построении доверительных интерваловдля этих параметров. Средними точками этих интерваловбудут, соответственно, α$ = 3803.и β$ = 0121. .
Следующийграфик показывает характер зависимости стандартизованныхостатков в преобразованной модели от y$ ∗ .На сей раз неоднородности дисперсий остатков (покрайней мере явной) не обнаруживается.2RESID_STAND*10-1-2050100150200250YF*Рассмотрим внимательнее наши действия при оцениваниипреобразованноймодели.Оценкикоэффициентов,приведенные в последней таблице, получены применением40метода наименьших квадратов к модели наблюденийyi∗ = β + α xi∗ + ε i∗ , т. е. путем минимизации суммы квадратов∑(yn∗i)2− β − α xi∗ ,i =1которую, вспоминая, что обозначают переменные созвездочками, можно записать в виде2n yi112∑ x − β − α x = ∑ x 2 ( yi − α − β xi ) .i =1i =1 iiinОбозначая теперь1wi = 2 ,xiполучаем, что задача минимизации суммы квадратовотклонений в преобразованной модели равносильна задачеминимизации взвешенной суммы квадратов отклонений висходной (непреобразованной) модели.