Шанченко Н.И. - Лекции по эконометрике (1094691), страница 12
Текст из файла (страница 12)
е. случайными величинами, распределенными по~закону Стьюдента с числом степеней свободы np1. Через bi обозначены точные значения коэффициентов регрессии.Согласно t-критерию Стьюдента, выдвигается «нулевая» гипотеза H0 о статистической незначимости коэффициента уравнения регрессии (т. е. о статистически незначимом отличии величины а или bi от нуля).
Эта гипотеза отвергается при выполнении условия t > tкрит, где tкрит определяется по таблицамt-критерия Стьюдента (П2) по числу степеней свободы k1 = np1 (p числонезависимых переменных в уравнении регрессии) и заданному уровню значимости α.t-критерий Стьюдента применяется в процедуре принятия решения о целесообразности включения фактора в модель. Если коэффициент при факторе вуравнении регрессии оказывается незначимым, то включать данный фактор вмодель не рекомендуется. Отметим, что это правило не является абсолютным ибывают ситуации, когда включение в модель статистически незначимого фактора определяется экономической целесообразностью.50Доверительные интервалы для параметров bi уравнения линейной регрессииопределяются соотношениями:~bi t1α, np1 · sbi bi bi + t1α, np1 · sbi.(3.31)Величина t1α,n-2 представляет собой табличное значение t-критерия Стьюдента на уровне значимости α при степени свободы n–2.Если в границы доверительного интервала попадает ноль, т.
е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается равным нулю, так как он не может одновременно принимать и положительное, и отрицательное значения.Точность полученного уравнения регрессии можно оценить, анализируядоверительный интервал для функции регрессии, т.
е. для среднего значения ỹ0,зависимой переменной y при заданных значениях объясняющих переменныхx1 = x10, x2 = x20, ..., xp = xp0.,Доверительный интервал для функции регрессии определяется соотношениямиŷ0 t1α, np1 · sŷ ỹ0 ŷ0 + t1α, np1 sŷ,(3.32)где ŷ0 – групповая средняя, определяемая по уравнению регрессии (3.4) при заданных значениях объясняющих переменных x1 = x10, x2 = x20, ..., xp = xp0;s yˆ sîñò X 0 ( X X ) X 0 – ее стандартная ошибка;(3.33)ỹ0 – точное значение групповой средней; X 0 – вектор, составленный из заданных значений независимых переменных X 0 = (1, x10, x20, ..., xp0 ).Доверительный интервал для индивидуальных значений зависимой переменной y*0 определяется соотношениямиŷ0 t1α, np1 · sŷ0 y*0 ŷ0 + t1α, np1 sŷ0,(3.34)гдеs yˆ0 sîñò 1 X 0 ( X X ) X 0(3.35)есть стандартная ошибка индивидуальных значений зависимой переменной y*0.3.8.
Частные уравнения регрессии. Частная корреляцияУравнение линейной множественной регрессии yˆ a b1 x1 b2 x2 ... bp xpхарактеризует совместное влияние факторов x1 , x 2 ,..., x p на исследуемую переменную y. Уравнение парной регрессии yˆ x i a i b i xi показывает зависимость между y и xi при игнорировании остальных факторов. Коэффициент bi наряду с влиянием фактора xi частично отражает влияние и остальных факторов.Частные уравнения регрессии, характеризующие изолированное влияниеодного из факторов хi на результативную переменную y при исключении влияния остальных факторов, включенных в уравнение регрессии, получаются изобщего уравнения линейной множественной регрессии (3.6) при закреплениивсех факторов кроме хi на их среднем уровне:yˆ xi p a b1 x1 b2 x 2 ...
bi 1 x i 1 bi x i bi 1 x i 1 ... b p x p ,(i = 1, 2, …, p)51илиyˆ xi p Ai bi x i ,(i = 1, 2, …, p)(3.36)где Ai a b1 x1 b2 x 2 ... bi 1 xi 1 bi 1 xi 1 ... b p x p и Ai a i .На основе частных уравнений регрессии (3.36) определяют частные коэффициенты эластичностиx(3.37)Ý y x bi i , (i = 1, 2, …, p)iyˆ xi pгде bi – коэффициенты регрессии для фактора хi в уравнении множественнойрегрессии; yˆ xi n – значение результативного фактора, полученное из частногоуравнения регрессии при данном значении фактора хi,Средние частные коэффициенты эластичностиÝ yxi bixi.
(i = 1,2, …,p)(3.38)yˆ xi pпоказывают, на сколько процентов в среднем по совокупности изменится результат у от своей величины при изменении фактора х на 1 % от своего значения при неизменных значениях других факторов, и могут использоваться длявыделения факторов, наиболее влияющих на результат.Если факторы xi , x j находятся в корреляционной связи, то это влияет наспособность коэффициента парной корреляции ryxi изолированно выявить степень тесноты связи между переменными у и хi. В такой ситуации следует использовать частные коэффициенты корреляции ryxi p , характеризующие тесноту связи между переменными у и хi при исключении влияния остальных p – 1фактора (при фиксированных значениях остальных факторов), определяемыесоотношениямиryxi p q yiq yy qii,(i = 1, 2, …, p)(3.39)где qyi, qyy и qii алгебраические дополнения соответственно к элементамryxi , ryy и rxi xi матрицы...
ryx p ryy ryx1 ryx2... rx1x p rx1 y rx1x1 rx1x2rrx2 x1 rx2 x2 ... rx2 x p x2 y.(3.40)q......... ... rrx p x1 rx p x2 ... rx p x p xp yЗначимость частных коэффициентов корреляции ryxi p проверяется также,как и значимость парного коэффициента корреляции (2.37), (2.38) с заменойчисла наблюдений n на n′ = n – p + 1, т. е. статистика52t ryxi p n p 12(3.41)1 r yxi pимеет t-распределение Стьюдента с n–p–1 степенями свободы.
Если t>t1–α;n–p–1,то коэффициент считается значимым.В случае только двух факторов х1 и х2 формула (3.39) принимает видryx1 ryx2 rx1x2ryx1x2 .(3.42)(1 ryx2 2 )(1 rx21x2 )Существенность влияния корреляционной связи проанализируем на примере. Рассмотрим переменную у и два фактора х1 и х2, находящиеся в корреляционной связи, и предположим, что парные коэффициенты корреляции имеютследующие значения ryx1 = 0,54, ryx2 = 0,1, rx1x2 = 0,6. Вычисления по формуле(3.42) дают0,54 0,1 0,60,48ryx1 x2 0,60;220,990,64(1 0,1 )(1 0,6 )ryx2 x1 0,1 0,54 0,6(1 0,54 2 )(1 0,6 2 )0,224 0,33.0,78 0,64Значения коэффициентов ryx1 и ryx1x2 близки между собой, а значения коэффициентов ryx2 и ryx2 x1 отличаются по величине более, чем в три раза и имеют разные знаки.Частные коэффициенты корреляции ryxi p позволяют ранжировать факторыпо степени влияния на результативный признак и находят применение в процедуре отбора факторов для включения их в уравнение регрессии (учитываются факторы, которым соответствуют значимые коэффициенты частной корреляции).3.9.
Обобщенный метод наименьших квадратов.Гетероскедастичность3.9.1. Обобщенный метод наименьших квадратовОценки (3.13) коэффициентов линейной множественной регрессии (3.6)являются эффективными (имеющими минимальную дисперсию в классе линейных несмещенных оценок) только при выполнении предпосылок п. 3.5.
Нарушение второй и третьей предпосылок ведет к утере эффективности оценок(3.13), т. е. существуют оценки с меньшей дисперсией (с меньшим разбросомзначений оценок).Следствием предпосылок 2 и 3 является диагональная структура матрицыковариаций ε случайного члена εi с одинаковыми диагональными элементамиσ2 (дисперсия случайного члена εi)ε = σ2En,(3.43)53где En единичная матрица размерности n (n – количество наблюдений). Принарушении предпосылок ε перестает иметь структуру (3.43). Обозначим ее дляудобства через Ω.В общем случае, согласно теореме Айткена, наилучшей в классе линейныхнесмещенных оценок является оценка(3.44)B ( X 1 X ) 1 X 1Y .Вычисление оценок параметров уравнения множественной линейной регрессии по формуле (3.45) (с учетом матрицы ковариаций Ω) называется обобщенным методом наименьших квадратов (ОМНК).Согласно ОМНК, уравнения регрессии предварительно преобразовываются с целью получить модель, содержащую случайный член, удовлетворяющийпредпосылкам регрессионного анализа (п.
3.5).Следует сказать, что ввиду сложности определения матрицы ковариацийε = Ω этот результат имеет в основном теоретический характер. Тем не менее,при определенных предположениях о структуре ε теорема имеет практическоезначение.3.9.2. Обобщенный метод наименьших квадратов в случаегетероскедастичности остатковПредположим, что нарушается только предпосылка 2 о постоянстве дисперсии случайного члена 2i 2j 2 , ( j i ) .
В этом случае говорят о гетероскедастичности остатков, а сами остатки называются гетероскедастичными. При выполнении предпосылки 2 говорят о гомоскедастичности остатков.Матрицы Ω и Ω–1 в этом случае являются диагональными 1 2 0 ... 0 1 12 0 ... 0120...00...02, 1 22(3.45).... ... ... ...... ... ... ... 20 0 ... n 0 0 ... 1 n2 Система нормальных уравнений ОМНК (3.13), (3.10) имеет вид( X 1 X ) B X 1Y(3.46)или в координатной формеyi2i ay i x1i2i1 i2 a b1 x1i2ix1ix1 b2 i2 b1 x 21i2i b2 x 2i i2 ...
b p x 2i x1i2ix pi i2 ... b p ;x pi x1i i2;(3.47).....................................................................................y i x pi i2 ax pi i2 b1 x1i x pi i2 b2 x 2i x pi i2 ... b p x 2 pi i2.54Система уравнений (3.47) соответствует модели, определяемой соотношениямиx piyixx1 a b1 1i b2 2 i ... b p u i , (i = 1, 2, …, n) (3.48)iiiiiкоторые получаются, если исходное уравнение множественной регрессии (3.6),записанное для каждого наблюдения разделить на среднее квадратическое отiклонение i случайного члена εi в i-наблюдении. Случайный член ui вiмодели (3.48) имеет постоянную для всех наблюдений дисперсию ui2 =1. Записьмодели в виде (3.48) соответствует уравнению линейной множественной регрессии (без свободного члена)y ax0 b1 x1 b2 x2 ... b p x p u ,(3.49)записанному в новых переменных y , x0 , x1 , ..., x p , значения которых определяются по формуламyi yi, x0 i 1, x1i x1i, x 2i x2ii, (i = 1, 2, …, n) (3.50)iiпрактически никогда не известны и, ..., x pi iiiiСледует сказать, что величины i2x pi, ui вместо них следует использовать состоятельные оценки ˆ i2 .При практическом использовании ОМНК используется какое-либо предположение относительно зависимости дисперсии i2 случайного члена ε от наблюдения или величины факторов xi.Представим дисперсии i2 случайного члена в виде произведения некоторой функции K i2 от факторов на постоянную величину 2 i2 K i2 2 .(3.51)Тогда соотношения (3.50) принимают видx piyxx1yi i , x0 i , x1i 1i , x2i 2 i , ..., x pi , u i i , ui const 2 .KiKiKiKiKiKi(i = 1, 2,…, n)(3.52)Часто на практике можно с достаточным основанием предположить, чтовеличины σi пропорциональны значениям какого-либо фактора xα, т.
е. i xi ( i2 x2i 2 ). В этом случае модель (3.49) принимает видxpxxxy1a b1 1 ... b 1 1 b b 1 1 ... b p u (3.53)xxxxxxи ui2 2 .Оценки параметров модели (3.53) являются оценками параметров исходного уравнения (3.6).Если, вычислив значения новых переменных, мы запишем модель в стандартном виде55xpx1x2y a b1 b2 ... b p u,xxxx(3.54)то это будет новая модель с переменными, имеющими иной смысл. Оценки еепараметров будут отличаться от оценок параметров исходной модели.Рассмотрим случай парной регрессииy a bx(3.55)и предположим, что величины σi пропорциональны значениям фактора x, т.