Шанченко Н.И. - Лекции по эконометрике (1094691), страница 10
Текст из файла (страница 10)
и т. д. Без учета замещающей переменной коэффициент при logK неправдоподобно велик.При отборе факторов в модель следует, по возможности, стремиться к минимизации количества факторов, так как неоправданное их увеличение приводит к затруднениям в интерпретации модели и снижению достоверности результатов.3.2.2. МультиколлинеарностьПод мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных.
Следствием мультиколлинеарности является линейная зависимость между столбцами наблюдений xij в таблице 3.1 илимежду столбцами матрицы X (3.11). В результате, матрица X′X становится плохо обусловленной, что приводит к неустойчивости оценок коэффициентов регрессии, когда незначительные изменения данных наблюдений приводят к значительным изменениям оценок.Проверка наличия мультиколлинеарности основывается на анализе матрицы парных корреляций между факторамиrx1x2 ...
rx1x p rx1x1 rx1x2 ... rx1x p 1r... rx3 x2 rx2 x2 ... rx3 x2 rx2 x11x2 x1R(3.3)...... ... ... ...... ... ...r... rx p x p rx p x1 rx p x2... 1 r x p x1 x p x2 Коэффициенты парной корреляции rxi x j между объясняющими переменными используются для выявления дублирующих факторов. Линейная зависимость между объясняющими переменными xi и xj считается установленной, если выполняется условие rxi x j 0,8 , а сами факторы называются явно коллинеарными (эмпирическое правило). Один из факторов должен быть исключен измодели. Предпочтение при этом отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другимифакторами.Наряду с парной коллинеарностью может иметь место линейная зависимость между боле, чем двумя переменными.
Для оценки мультиколлинеарностифакторов в этом случае может использоваться величину определителя Det R41матрицы парных коэффициентов корреляции rx x между факторами либо ееi jминимального собственного значения.Чем ближе к нулю определитель (минимальное собственное значение)матрицы межфакторной корреляции, тем сильнее мультиколлинеарность междуфакторами и тем ненадежнее результаты множественной регрессии.Для оценки статистической значимости мультиколлинеарности факторовможет быть использован тот факт, что величина n 1 (2m 5) lg DetR имеет611p ( p 1) степенями свободы.2Выдвигается гипотеза H0 о независимости переменных, т.
е. Det R 1 .Если фактическое значение χ2 превосходит табличное (критическое)22 факт табл, то гипотеза Н0 отклоняется и мультиколлинеарность счита( df , a )приближенное распределение 2 с df ется доказанной.Для выявления мультиколлинеарности факторов можно использовать коэффициенты множественной детерминации Rx2 | x x ... x ; Rx2 | x x ... x … , полученные12 3p21 3pпо уравнениям регрессии, в которых качестве зависимой переменной рассматривается один из факторов. Чем ближе значение коэффициента детерминации кединице, тем сильнее проявляется мультиколлинеарность факторов.
Согласноэмпирическому правилу, при значении коэффициента множественной детерминации R x21| x2 x3 ... x p > 0,6 мультиколлинеарность факторов считается установленной. Оставляя в уравнении регрессии факторы с минимальной величиной коэффициента множественной детерминации, можно исключить мультиколлинеарность факторов.Для преодоления явления линейной зависимости между факторами используются такие способы, как: исключение одного из коррелирующих факторов; переход с помощью линейного преобразования к новым некоррелирующим независимым переменным. Например, переход к главным компонентамвектора исходных объясняющих переменных (что позволяет также уменьшитьколичество рассматриваемых факторов), переход к последовательным разностям во временных рядах xit xit xit 1 и т. п.; переход к смещенным оценкам, имеющим меньшую дисперсию.
В частности, при использовании «ридж-регрессии» применяются смещенные оценкивектора параметров bτ ( X X E p 1 ) 1 X Y (п. 3.4), где τ некоторое положительной число, Ep+1 единичная матрица порядка p+1. Такое преобразованиеувеличивает определитель матрицы системы нормальных уравнений и повышает устойчивость результатов (снижает дисперсию оценок, которые становятсясмещенными).Другие аспекты вопроса отбора факторов рассмотрены в п. 1.5.42Следует также учитывать ограничение, накладываемое на количество факторов, имеющимся числом наблюдений. Количество наблюдений должно превышать количество факторов более чем в 6-7 раз.3.3. Выбор формы уравнения регрессииРазличают следующие виды уравнений множественной регрессии: линейные, нелинейные, сводящиеся к линейным, и нелинейные, не сводящиеся к линейным (внутренне нелинейные).
В первых двух случаях для оценки параметров модели применяются классического линейного регрессионного анализа. Вслучае внутренне нелинейных уравнений для оценки параметров приходитсяприменять методы нелинейной оптимизации.Основное требование, предъявляемое к уравнениям регрессии, заключается в наличии наглядной экономической интерпретации модели и ее параметров.Исходя из этих соображений, наиболее часто используются линейная истепенная зависимости.Линейная множественная регрессия имеет видyˆ a b1 x1 b2 x 2 ... b p x p .(3.4)Параметры bi при факторах хi называются коэффициентами «чистой» регрессии.Они показывают, на сколько единиц в среднем изменится результативный признак y за счет изменения соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.Предположим, например, что зависимость спроса на товар (Qd) от цены (P)и дохода (I) характеризуется следующим уравнением:Qd = 2,5 0,12P + 0,23 I.Коэффициенты данного уравнения говорят о том, что при увеличении цены наединицу, спрос уменьшится в среднем на 0,12 единиц измерения спроса, а приувеличении дохода на единицу, спрос возрастет в среднем 0,23 единицы.Параметр а в (3.14) не всегда может быть содержательно проинтерпретирован.Степенная множественная регрессия имеет видbyˆ a x1b1 x 2b2 ...
x pp(3.5)Параметры bj (степени факторов хi) являются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменится результативный признак y за счет изменения соответствующего фактора хi на 1 % при неизмененном значении остальных факторов.Наиболее широкое применение этот вид уравнения регрессии получил впроизводственных функциях, а также при исследовании спроса и потребления.Например, зависимость выпуска продукции Y от затрат капитала K и труда LY 0 ,89 K 0 .23 L0 .81говорит о том, что увеличение затрат капитала K на 1 % при неизменных затратах труда вызывает увеличение выпуска продукции Y на 0,23 %.
Увеличение затрат труда L на 1 % при неизменных затратах капитала K вызывает увеличениевыпуска продукции Y на 0,81 %.43Экономический смысл имеет также сумма коэффициентов bi каждого фактора (сумма эластичностей) b = bi. Эта величина дает обобщенную характеристику эластичности производства.Если значение b > 1, то говорят, что функция имеет возрастающий эффектот масштаба производства.
Значение b = 1 говорит о постоянном масштабепроизводства. Если значение b < 1, то имеет место убывающий эффект от масштаба производства.Примеры других зависимостей, используемых при построении регрессии,приведены в п. 1.4.Если один и тот же фактор вводится в регрессию в разных степенях, то каждая степень рассматривается как самостоятельный фактор. Например, если внелинейной модели с двумя факторами x1 , x 2y a b1 x1 b2 x 2 b3 x12 b4 x1 x 22 ,величины x12 , x1 x 22 рассматривать как новые дополнительные факторы, то,используя замену переменных z1 x1 , z 2 x 2 , z 3 x12 , z 4 x1 x 22 , ее можнопривести к линейному уравнению регрессии с четырьмя факторами:y a b1 z1 b2 z 2 b3 z 3 b4 z 4 .3.4. Оценка параметров уравнения линейноймножественной регрессииРассмотрим уравнение линейной множественной регрессииy a b1 x1 b2 x 2 ...
b p x p .(3.6)Для оценки параметров уравнения множественной регрессии обычно применяется метод наименьших квадратов (МНК), согласно которому следует выбирать такие значения параметров а и bi, при которых сумма квадратов отклонений фактических значений результативного признака yi от теоретическихзначений ŷ = f (x1i,x2i,...,xpi) (при тех же значениях фактора xij) минимальна, т. е.2S yˆ i y i min .С учетом (3.6) величина S является функцией неизвестных параметров а и binS ( yi a b1 x1 b2 x2 ...
b p x p ) 2 S ( a, b1 ,..., b p ) .(3.7)i 1Оптимальные значения параметров а и bi удовлетворяют условиямSSSS 0, 0, 0, ... 0.(3.8)ab1b2b pВыполняя соответствующие вычисления, получим для определения параметров а и bi следующую систему уравнений44nS 2 ( y i a b1 x1 b2 x 2 ... b p x p ),ai 1nS 2b1 ( y i a b1 x1 b2 x 2 ... b p x p ),b1i 1(3.9)...nS 2b p ( y i a b1 x1 b2 x 2 ...
b p x p ),b pi 1откуда после некоторых преобразований получается система нормальных уравнений метода наименьших квадратов y n a b1 x1 b2 x 2 ... b p x p ; yx1 a x1 b1 x12 b2 x 2 x1 ... b p x p x1 ;.....................................................................................(3.10) yx p a x p b1 x1 x p b2 x 2 x p ... b p x 22 .Решение системы (3.10) удобно записать с помощью матричных обозначений.
Обозначим1 x11 ...x p1 a y1 b y 1x...x112p2,B , Y 2 , X (3.11)... ... ... 1x1n ...x pn yn b p где B матрица-столбец (p+1×1) из коэффициентов а и bi;Y матриц-столбец (n×1) исходных значений зависимой переменной y;X матрица (p+1×n) исходных значений независимых переменных xi, в которой первый столбец из единиц можно рассматривать как значения «фиктивной» переменной, соответствующей коэффициенту а.В этих обозначениях система (3.10) примет вид( X X ) B X Y ,(3.12)где X' транспонированная матрица X. Матрица X X является неособеннойквадратной размерности (p+1×p+1) при условии, что столбцы матрицы X линейно независимы.Решение системы (3.12) определяется соотношением(3.13)B ( X X ) 1 X Y .Независимые переменные xi имеют различный экономический смысл, разные единицы измерения и масштаб. Если нужно определить степень относительного влияния отдельных факторов xi на изменение результативной переменной y, то переменные xi следует привести к сопоставимому виду.
Это можно осуществить, вводя, так называемые, «стандартизованные» переменныеt y , t x1 ,..., t x p с помощью соотношений45ty yyy,t xi xi xi xi,(i = 1, 2, …, p)(3.14)где y, x i средние значения, y , x средние квадратические отклонения пеiременных y и xi.Стандартизованные переменные обладают следующими свойствами: 1)средние значения равны нулю t y t xi 0 ; 2) средние квадратические отклоне-ния равны единице t y t xi 1.Уравнения множественной регрессии в стандартизованных переменныхпринимает видt y 1 t x 2 t x ...