В.П. Носко - Эконометрика для начинающих (1160539), страница 22
Текст из файла (страница 22)
Этот критерийиспользуется в ряде пакетов статистического анализа данных(например, в EVIEWS) для проверки гипотезы H 0нормальности ошибок в модели наблюдений, точнее,H 0 : ε 1 ,K , ε n ∼ i. i. d . N 0, σ 2()(значение σ не конкретизируется). Если эта гипотезаверна,то при большом количестве наблюдений n статистика ( sample skewness) 2 (sample kurtosis - 3) 2 JB = n +624имеет распределение, близкое к распределению хи-квадратс двумя степенями свободы χ 2 ( 2) , функция плотностикоторого имеет видp( x ) = 21 e − x 2 , x > 0 .Здесь «sample skewness» — выборочный коэффициентасимметрии,m3sample skewness =,(m2 ) 3 22«sample kurtosis» — выборочный коэффициент эксцесса,msample kurtosis = 42 ,m2где1 nmk = ∑ eikn i =1и e1 ,K , en — остатки, полученные при оценивании модели.22Если распределение ошибок действительно являетсянормальным, то значения выборочного коэффициентаасимметрии близки к нулю, а значения выборочногокоэффициента эксцесса близки к 3.Существенное отличие выборочного коэффициентаасимметрии от нуля указывает на несимметричность(относительнонуля)графикафункцииплотностираспределения ошибок («скошенность» распределения).Существенное отличие от 3 выборочного коэффициентаэксцесса указывает на не характерные для нормальногораспределения «островершинность» (при значении этогокоэффициента, большем трех) или излишнюю «сглаженность»(при значении этого коэффициента, меньшем трех) графикафункции плотности распределения ошибок.При нарушении условия нормальности распределенияошибок значения статистики JB имеют тенденцию квозрастанию.
Поэтому гипотеза нормальности ошибокотвергается, если значения этой статистики «слишкомвелики», а именно, еслиJB > χ 12−α (2) ,гдеχ 12−α (2) — квантиль распределенияχ 2 ( 2) ,соответствующая уровню 1 − α .Замечание. Критерии Дарбина-Уотсона и ГолдфелдаКвандта являются точными, в том смысле, что онинепосредственно учитывают количество наблюдений n . Впротивоположность этому, критерий Жарка-Бера являетсяасимптотическим критерием: распределение статистикиJB хорошо приближается распределением χ 2 ( 2) только прибольшом количестве наблюдений. Поэтому вполне полагатьсяна результаты применения критерия Жарка-Бера можно только23в таких ситуациях.
Помимо критерия Жарка-Бера вспециализированные пакеты программ статистическогоанализа данных часто встраиваются и другие асимптотическиекритерии, например, критерии Уайта и Бройша-Годфри,которые рассматриваются ниже.Критерий Бройша-Годфри (Breusch-Godfrey). Этоткритерий используется в ряде пакетов статистического анализаданных (например, в EVIEWS) для проверки гипотезынекоррелированности ошибок в модели наблюденийyi = θ 1 xi 1 +K+θ p xi p + ε i , i = 1,K , n.При наших предположениях это соответствует гипотезенезависимостивсовокупностислучайныхвеличин ε i , i = 1,K , n. Напомним, что критерий Дарбина —Уотсона основан на рассмотрении модели наблюдений, вкоторой случайные составляющие ε i связаны соотношениемε i = ρ ε i −1 + δ i , i = 1,K , n,гдеρ < 1, а δ i , i = 1,K , n, — независимые всовокупности случайные величины, имеющие одинаковоенормальное распределение N 0, σ δ2 .
В такой модели()наблюдений случайные составляющие ε i , разделенные двумяили более периодами времени и очищенные от влиянияпромежуточных ε j , оказываются независимыми.КритерийБройша-Годфридопускаетзависимостьслучайных составляющих ε i , разделенных K периодамивремени и также очищенных от влияния промежуточных ε j ;соответствующая модель зависимости имеет видε i = a1ε i −1 +K+ a K ε i − K + δ i .242Статистика этого критерия равна nR , где R 2 коэффициент детерминации, получаемый при оцениваниимоделиei = γ 1 xi 1 +K+γ p xi p + α 1ei −1 +K+α K ei − K + ν i , i = 1,K , n,а e1 ,K , en - остатки, полученные при оцениванииосновной модели наблюдений. (Недостающие значенияe0 ,K , e1− K заменяются нулями.)В рамках последней модели проверяется гипотезаH0 : α 1 =L = α K = 0.Если эта гипотеза верна, то при большом количественаблюдений n статистика критерия имеет распределение,близкое к распределению хи-квадрат с K степенями свободы.Гипотеза H 0 отвергается при заданном уровне значимости α ,если вычисленное значение nR 2 превышает критическоезначение, равное квантили уровня 1 − αуказанногораспределения, т.
е. еслиnR 2 > nR 2 crit = χ 12−α ( K ).( )Конечно, при интерпретации результатов применениякритерия Бройша-Годфри следует помнить, что этот критерийасимптотический, тогда как критерий Дарбина-Уотсонаточный. Однако возможность применения критерия ДарбинаУотсона ограничивается тем, чтоон допускает зависимость «очищенных» случайныхошибок только на один шаг, т. е. K = 1 ;он неприменим в ситуациях, когда в число объясняющихпеременныхвключаютсязапаздывающиезначенияобъясняемой переменной.Критерий же Бройша-Годфри свободен от этихограничений.25Критерий Уайта (White). Этот критерий используется вряде пакетов статистического анализа данных (например, вEVIEWS) для проверки однородности дисперсий ошибок вмодели наблюденийyi = θ 1 xi 1 +K+θ p xi p + ε i , i = 1,K , n.Критерий имеет два варианта.Вариант I.
В рамках моделиppj =2j =2ei2 = α 1 + ∑ α j xi j + ∑ β j xi2j + ν i , i = 1,K , n,где e1 ,K , en - остатки, полученные при оцениванииосновной модели наблюдений, проверяется гипотезаH0 : α j = β j = 0 , j = 2,K , p.Статистика критерия равна nR 2 , где R 2 - коэффициентдетерминации, получаемый при оценивании последнеймодели.Если указанная гипотеза верна, то при большомколичестве наблюдений n статистика критерия имеетраспределение, близкое к распределению хи-квадрат с ( 2 p − 2)степенями свободы.
Гипотеза H 0 отвергается при заданномуровне значимости α , если вычисленное значение nR 2превышает критическое значение, равное квантили уровня1 − α указанного распределения, т. е. еслиnR 2 > nR 2 crit = χ 12−α (2 p − 2).( )Вариант II. В рамках моделиpppei2 = α 1 + ∑ α j xi j + ∑ ∑ βj =226j =2 k =2x x + ν i , i = 1,K , n,jk ij ikгде e1 ,K , en - остатки, полученные при оцениванииосновной модели наблюдений, проверяется гипотезаH0 : α j = 0 , j = 2 ,K , p ,βjk= 0, j = 2,K , p, k = 2,K , p.Статистика критерия равна nR 2 , где R 2 - коэффициентдетерминации, получаемый при оценивании последнеймодели.Если указанная гипотеза верна, то при большомколичестве наблюдений n статистика критерия имеетраспределение, близкое к распределению хи-квадрат сp 2 + p − 2 2 степенями свободы.
Гипотеза H 0 отвергается()при заданном уровне значимости α , если вычисленноезначение nR 2 превышает критическое значение, равноеквантили уровня 1 − α указанного распределения, т. е. если( )nR 2 > nR 2crit(() )= χ 12−α p 2 + p − 2 2 .Как и в случае критерия Бройша-Годфри, приинтерпретации результатов применения обоих вариантовкритерия Уайта следует помнить, что этот критерийасимптотический.Замечание. При описании критериев Уайта мы неявнопредполагали, что xi1 ≡ 1 . Если постоянная не включена висходную модель наблюдений, то в моделях, оцениваемых навтором шаге обоих вариантов критерия Уайта, суммированиеследует производить, начиная с j = 1.273.3.
НЕАДЕКВАТНОСТЬ ПОДОБРАННОЙ МОДЕЛИ:ПРИМЕРЫ И ПОСЛЕДСТВИЯПример. Рассмотрим статистические данные по США запериод с 1959 по 1985 г. г. о следующих макроэкономическихпоказателях:DPI — годовой совокупный располагаемый личный доход;CONS — годовые совокупные потребительские расходы;ASSETS — финансовые активы на конец календарного года(все показатели в млрд. долларов, в ценах 1982 г.).Представление об изменении этих макроэкономическихпоказателей дает следующий график:35003000250020001500100050060 62 64 66 68 70 72 74 76 78 80 82 84CONSDPIASSETSРассмотрим модель наблюденийCONS t = θ 1 + θ 2 DPI t + θ 3 ASSETS t −1 + ε t , t = 1,K ,27 ,где индексу t соответствует (1958+ t) год.
Это модель с 3объясняющими переменными:X 1 ≡ 1, X 2 = DPI , X 3 = ASSETS ( −1);символ ASSETS( −1) обозначает переменную, значениякоторой запаздывают на одну единицу времени относительнозначений переменной ASSETS .Оценивание этой модели дает следующие результаты:2R = 0.9981 ,28θ$ 2 = 0.672 ,θ$ 3 = 0174.,P - value = 0.0000 ;P - value = 0.0069 ;объясняющие переменные X 2 = DPI , X 3 = ASSETS ( −1)имеютвысокуюстатистическуюзначимость.Нижепредставлены диаграмма рассеяния для предсказанных(CONSF) и наблюдаемых (CONS) значений переменнойCONS , а также график зависимости стандартизованныхостатков ci = ei S (RESID_STAND) от предсказанных(CONSF) значений переменной CONS :CONS vs. CONSFRESID_STAND vs. CONSF250021RESID_STANDCONS200015000-11000-250050010001500CONSF20002500-35001000150020002500CONSFЛевый график отражает высокое значение коэффициентадетерминации.
На правом графике заметно возрастаниеразброса точек относительно нулевого уровня при значенияхC$ i >1600 .Поскольку первый из приведенных в этом примереграфиков указывает на возрастание годовых потребительскихрасходов с течением времени, для реализации процедурыGoldfeld-Quandt естественно воспользоваться уже имеющимсяупорядочением наблюдений во времени (это и будет29направлением ожидаемого возрастания дисперсий случайныхошибок). Заметим теперь, что вследствие использованиястатистических данных, начиная с 1959 года, мы не имеем всвоем распоряжении значения ASSETS 0 , соответствующего1958 году. Поэтому реально при оценивании коэффициентовмодели наблюдений мы используем только 26 (а не 27)наборов значений ( xi 1 , xi 2 , xi 3 ) , i = 2,K ,27 .Выделим из этих 26 наблюдений две группы, состоящие изпервых 10 и последних 10 наборов значений ( xi 1 , xi 2 , xi 3 ) ,соответствующие периодам с 1960 по 1969 и с 1976 поr=6центральных1985 годы (так что отброшенынаблюдений).
При раздельном подборе линейной модели поэтим группам наблюдений получаем остаточные суммыквадратов RSS1 = 208.68 и RSS 2 = 1299.66 , соответственно,так что наблюдаемое значение F - статистики критерияGoldfeld-Quandt равноRSS 2 RSS1 = 1299.66 208.68 = 6.228 .Если стандартные предположения о случайных ошибках вмодели наблюдений выполнены, то тогда отношениеуказанных остаточных сумм квадратов как случайных величин26 − 6 26 − 6имеет F -распределение Фишера F − 3,− 3 = 22F ( 7,7) .