В.П. Носко - Эконометрика для начинающих (1160539), страница 21
Текст из файла (страница 21)
По такому графику можно обнаружитьИзменение дисперсии ошибок с течением времени4RESID_STAND20-2-40102030iНевключение в модель переменных, зависящих отвремени и существенно влияющих на объясняемуюпеременную:120.4RESID_STAND0.20.0-0.2-0.405101520IНевыполнение условия независимости в совокупностислучайныхошибокε i , i =1,K,nвформеихавтокоррелированности. Более подробно о такой форместатистической зависимости между случайными ошибками мыпоговорим позднее, а сейчас продемонстрируем, как выглядятграфикиостатковвслучаеположительнойавтокоррелированности (левый график) и в случаеотрицательной автокоррелированности (правый график):231201-10-2-1-3-260657075808551015202530В первом случае проявляется тенденция сохранениязнака остатка при переходе к следующему наблюдению (заположительнымостаткомскорееследуеттакжеположительныйостаток,азаотрицательным—отрицательный). Во втором случае проявляется тенденция13смены знака остатка при переходе к следующему наблюдению(за положительным остатком скорее следует отрицательныйостаток, а за отрицательным — положительный).Отдельную группу составляют графические методыпроверки предположения о нормальности распределенияслучайных составляющих ε i , i =1,K,n.Диаграмма «квантиль-квантиль» (Q-Q plot).
Дляпостроения этой диаграммы значения стандартизованныхостатков c i , i =1,K,n упорядочивают в порядке возрастания;упорядоченные значения образуют рядc(1) < c( 2 ) < L < c( n ) .Если теперь для каждого k =1,K,n нанести впрямоугольной системе координат на плоскости точку сабсциссой c( k ) и ординатой k − 12 Qk = Φ −1 n ( Qk — квантиль уровня уровня ( 2 k − 1) ( 2n) стандартногонормальногораспределения),тополученныеnточек c( k ) , Qk , k =1,K,n,вслучаенормальности()распределения ошибок должны располагаться вдоль прямой,имеющей угловой коэффициент, близкий к единице.
Подобноерасположение имеют точки на диаграмме, построеннойуказанным способом по первому из четырех множествискусственных данных:142Normal Quantile10-1-2-2-1012RESID_STANDЗамечание. Если в последней процедуре не проводитьстандартизацию остатков, а использовать непосредственноостатки e i , i =1,K,n, то полученные точки e( k ) , Qk , k =1,K,n,()также будут располагаться (при нормальном распределенииошибок) вдоль некоторой прямой, но уже имеющей угловойкоэффициент, не обязательно близкий к единице.Указанное свойство диаграммы «квантиль-квантиль»основано на том, что при больших значениях n имеет местоприближенное равенство−1 k − 21 c( k ) ≈ Φ . n Последнему соответствует приближенное равенствоk − 21Φ c( k ) ≈n— соотношение, используемое для проверки нормальностиошибок в пакете EXCEL.Диграмма плотности (DP-plot, DPP) отличается отдиаграммы «квантиль-квантиль» тем, что по оси ординатвместо значений квантилей Qk откладываются значенияфункцииплотностистандартногонормального( )15( )распределения φ c( k ) .
Такая диаграмма дает возможностьпри достаточном количестве наблюдений не только проверитьсогласие с предположением о нормальном распределенииошибок,ноивыявитьхарактеральтернативногораспределения в случае отклонения распределения ошибок отнормального. В качестве примера приведем диаграммуплотности, построенную по остаткам, полученным врезультате подбора модели линейной зависимости совокупныхрасходовналичноепотреблениеотсовокупногорасполагаемого личного дохода (данные по США в млрд.долларов 1982 г., за период с 1959 по 1985 г.):0.5DP(Qk)0.40.30.20.10.0-3-2-1012C(k)На этой диаграмме обнаруживается определеннаяасимметрия, что представляется не вполне согласующимся спредположением о нормальности ошибок. Однако сразу делатьна этом основании вывод о нарушении такого предположенияне следует. Дело в том, что при небольшом количественаблюдений структура подобной диаграммы весьманеустойчива.
Поэтому даже при заведомо нормальномраспределенииошибокмыредкоувидимвполнесимметричную картину расположения точек на диаграмме прималом количестве наблюдений.16Ядерные (kernel) оценки плотности — еще один методполучения суждений о форме функции плотности,позволяющий, в отличие от двух предыдущих, получатьграфик в виде непрерывной кривой.
Существует много разныхвариантов таких оценок, в детали которых мы вдаваться небудем, а отметим только, что в пакете EVIEWS предлагаетсяна выбор 8 вариантов, в рамках которых имеется еще ивозможностьварьированияпараметров.Вариант,применяемый по умолчанию, дает для только чторассмотренных данных следующую оценку плотностираспределения ошибок:0.50.40.30.20.10.0-3-2-1012C_KКак видим, и такой подход дает график, не очень похожийна график функции плотности стандартного нормальногораспределения, но это опять может быть вызвано малымколичеством наблюдений (27).3.2. ПРОВЕРКА АДЕКВАТНОСТИ ПОДОБРАННОЙМОДЕЛИ ИМЕЮЩИМСЯ СТАТИСТИЧЕСКИМ ДАННЫМ:ФОРМАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ПРОЦЕДУРЫПомимо графических, существует довольно многопроцедур, предназначенных для проверки выполнениястандартных предположений о линейной модели наблюдений,использующих статистические критерии проверки гипотез.17Мы остановимся только на нескольких таких процедурах.
Вкаждой из этих процедур в качестве нулевой гипотезы беретсягипотезаH 0 : ε 1 ,K , ε n ∼ i. i. d . N 0, σ 2 .()Однако приспособлены соответствующие критерии длявыявленияспецифическихнарушенийстандартныхпредположений, что делает каждый из критериев особочувствительным именно к тем нарушениям, на которые он«настроен».Критерий Голдфелда-Квандта (Goldfeld-Quandt).
Еслиграфический анализ остатков указывает на возможнуюнеоднородность дисперсий ошибок D(ε i ) , тонаблюдения, насколько это возможно, упорядочивают впорядке предполагаемого возрастания дисперсий случайныхошибок;отбрасывают r центральных наблюдений (для болеенадежного разделения групп с малыми и большимидисперсиями случайных ошибок), так что для дальнейшегоанализа остается n − r наблюдений;производят оценивание выбранной модели отдельно попервым ( n − r ) 2 и по последним ( n − r ) 2 наблюдениям;вычисляют отношение F = RSS 2 RSS1 остаточных суммквадратов,полученныхприподборемоделипопоследним ( n − r ) 2 (остаточная сумма квадратов RSS 2 ) и попервым ( n − r ) 2 (остаточная сумма квадратов RSS1 )наблюдениям.При принятии решения учитывают, что если все жеD(ε i ) = σ 2 , i = 1,K , n , (дисперсии однородны) и выполненыостальные стандартные предположения о модели наблюдений,18включая предположение о нормальности ошибок, то тогдаотношениеF = RSS 2 RSS1n−rn−rимеет F — распределение Фишера F − p,− p с 22n−r n−r− p и − p степенями свободы. 2 2ГипотезаH 0 : D(ε i ) = σ 2 , i = 1,K , n , (дисперсии однородны)отвергается, если вычисленное значение F -отношения«слишком велико», т.
е. превышает критический уровеньn−rn−rF1−α − p,− p , 22соответствующий выбранному уровню значимости α .Критерий Дарбина-Уотсона (Durbin-Watson). Этоткритерий применяется, когда наблюдения производятсяпоследовательно во времени, с равными интервалами, играфик изменения остатков во времени указывает на наличиеавтокоррелированности случайных составляющих ε i моделинаблюдений. Предполагается, что эта автокоррелированностьопределяется соотношениемε i = ρ ε i −1 + δ i , i = 1,K , n,гдеρ < 1, а δ i , i = 1,K , n, — независимые всовокупности случайные величины, имеющие одинаковоенормальное распределение N 0, σ δ2 , причем δ i не зависитстатистически от εСтатистикасоотношением(i−s)для s > 0 .Дарбина-Уотсонаопределяется19nDW =∑ (eii =2− ei −1 )2,n∑e2ii =1где e1 ,K , en — остатки, получаемые при оцениваниилинейной модели наблюдений.В качестве нулевой гипотезы здесь берется гипотезаH 0 : ρ = 0,соответствующая(принашемпредположениионормальностираспределенияслучайныхошибок)независимости в совокупности случайных величинε 1 ,K , ε n .
В качестве альтернативной при анализеэкономических данных чаще всего используют гипотезуHA : ρ > 0 ,соответствующуюположительнойавтокоррелированности случайных величин ε 1 ,K , ε n (т. е.тенденции преимущественного сохранения знака случайнойошибки при переходе от i -го наблюдения к i + 1-му).Статистика DW принимает значения в интервале от 0 до4 . Рассматриваемая как случайная величина она имеет пригипотезе H 0 : ρ = 0 (т.
е. если эта гипотеза верна) функциюплотности p( x ) , симметричную относительно точки x = 2 —середины этого интервала. Если в действительностиρ = ρ ∗ > 0 , то тогда значения статистики DW тяготеют клевой границе интервала. Поэтому, в соответствии с общимподходом к построению односторонних статистическихкритериев, мы должны были бы для выбранного нами уровнязначимости α найти соответствующее ему критическое20значение d α(0 < d α< 2) и отвергать гипотезу H 0 : ρ = 0 впользу H A : ρ > 0 при выполнении неравенства DW < d α .Однако распределение статистики Дарбина-Уотсоназависит не только от n и p , но также и от конкретныхзначенийxi j , j = 1,K , p,i = 1,K , n,объясняющихпеременных, что делает неосуществимым построение таблицкритических значений этого распределения.
Дарбин и Уотсонпреодолели это затруднение следующим образом. Они нашли(при различных значениях n и p ) нижнюю d Lα и верхнююdUα границы интервала, в котором только и могут находитьсякритические значения d α статистики Дарбина-Уотсона,независимо от того, каковы конкретные значенияxi j , j = 1,K , p, i = 1,K , n . Иными словами,0 < d Lα < d α < d Uα < 2,где d Lα и dUα не зависят от конкретных значенийxi j , j = 1,K , p, i = 1,K , n , а определяются только количествомнаблюдений, количеством объясняющих переменных иустановленным уровнем значимости критерия.Гипотеза H 0 : ρ = 0отвергается в пользу гипотезы H A : ρ > 0 , еслиDW < d Lα ;не отвергается, если DW > dUα .Если жеd Lα < DW < dUα ,то никакого вывода относительно справедливости илинесправедливости гипотезы H 0 : ρ = 0 не делается.21При соблюдении этих правил вероятность ошибочногоотвержения гипотезы H 0 : ρ = 0 не превосходит заданногоуровня значимости α .Критерий Жарка-Бера (Jarque-Bera).