Диссертация (1138015), страница 10
Текст из файла (страница 10)
человек населения)ДоступностьОтношение средних цен на вторичном рынке жильяжилья(рублей за кв. метр) на среднедушевые денежныедоходы населения (рулей в месяц)ЧислозарегистрированныхпреступленийПреступность(количество на 100 тыс. человек населения)ВаловойВРП на душу населения в ценах 2005 года,региональныйскорректированный на стоимость потребительскойпродукткорзины (тыс. руб.)ПлотностьПлотность населения (чел. на кв. км.)ЗаработнаяСреднемесячная начисленная заработная платаплатаработников организаций (руб. в ценах 2005 года),скорректированная на стоимость потребительскойкорзины (руб.)Источник: составлено авторомВначальнуюспецификациюмоделибыливключенывсеперечисленные в таблице 2.5 переменные.
Однако, после этого былапроверена гипотеза о совместной незначимости группы переменных, ивследствие ее неотвержения, для увеличения эффективности оценоккоэффициентов некоторые переменные не были включены в финальнуюспецификацию. В финальную спецификацию модели были включены:!57отраслевая структура, уровень образования, доля городского населения,показатель доступности жилья, миграция, заработная плата (или валовойрегиональный продукт).В текущем разделе используются данные за 2005–2010 гг.
по 75субъектам Российской Федерации. Данные ограничены 2005 г., так какинформация об отраслевой структуре занятости доступна только с 2005 г.Спецификация моделейОсновой для использованной в работе модели послужила модель спространственным лагом следующего вида:yit = ρWyit + X 'it −1 β1 + S 'it β 2 + µ i + φt + ε it ,(2.8)региона, t = 2005,…,2010 —год, ρ —где i = 1,…,75 —пространственныйномеркоэффициенткорреляции,W—взвешивающаяпространственная матрица размерности ( N × N ) , X 'it −1 — матрица значенийобъясняющих переменных предыдущего периода (лаги объясняющихпеременныхбылииспользованы,чтобыизбежатьпроблемыэндогенности), S 'it — матрица переменных, характеризующих отраслевуюструктуру2, β 1 — вектор оцениваемых коэффициентов при факторах, β 2— вектор оцениваемых коэффициентов при показателях отраслевойструктуры, µ i — индивидуальные фиксированные эффекты, φt —временныефиксированныеэффекты.Ошибкиимеютнормальноераспределение ε it ~ N (0, σ 2 I NT ).Вышеуказанная модель содержит пространственный лаг зависимойпеременной Wy it .
Взвешивающая матрица W отражает географическуюструктуру данных, придавая соответствующие веса уровням безработицы вдругих регионах.Напомним, что в качестве взвешивающих матриц часто используютбинарную матрицу (как показано в примере выше), в которой равные веса2Информация о доли занятых в отраслях доступна только с 2005 г., поэтому используются текущиезначения.!58присваиваются только регионам с общей границей, а остальные регионыимеют нулевой вес. Другим часто используемым видом является матрицаобратных расстояний. Влияние других регионов в такой матрице нарассматриваемый регион обратно пропорционально удаленности другихрегионов.
В предыдущей главе с помощью симуляций было показано, чтопри анализе безработицы в России матрица обратных расстояний даетнаименьшее смещение коэффициентов, даже если истинной матрицейявляется бинарная матрица. Поэтому в текущей главе используетсяматрица обратных расстояний.Модификациямоделисостоялаввыборенелинейнойфункциональной формы:yit = ρWyit + f1 ( X 1it −1 ) + f 2 ( X 2 it −1 ) + X it3−1 β 3 + … + X itk−−1e β k −e ++ X itk −e+1 β k −e+1 + … + X itk β k + µi + φt + ε it(2.9)где X 1 , … , X k — перечисленные в таблице 2.5 переменные, e —количество переменных, отражающих отраслевую структуру.Выбор функциональной зависимости, включая выбор конкретноговида функций f1 , f 2 ,был основан на соответствующих диаграммахрассеяния переменных Y и X 1 , … , X k (см. рис. 4). В итоге для всехпеременных, кроме «доли городского населения», «заработной платы» и«валового регионального продукта» была выбрана линейная формазависимости, для переменной «доля городского населения» и «заработнаяплата»—несимметричнаяU–образнаяформазависимостиf1 ( x) = ax + bx ln x , для переменной «валовой региональный продукт» —пороговаяформазависимостиf 2 ( x) = cx + dx ⋅ I (GDP < 1000) .GDP < 1000 функция принимает вид f 2 ( x) = (c + d ) x , приПриGDP ≥ 1000 —f 2 ( x) = cx .
Итоговая модель имеет вид:yit = ρWyit + aX 1it −1 + bX 1it −1 ln X 1it −1 + cX 2 it −1 + dX 2 it −1 I (GDP < 1000) ++ X it3−1 β 3 + … + X itk−−1e β k −e + X itk −e+1 β k −e+1 + … + X itk β k + µ i + φt + ε it.(2.10)!59Оценкамаксимальногомодели(2.10)правдоподобия,осуществляласьчастоспомощьюприменяемогоприметодаанализепространственных моделей панельных данных [Anselin, 1988]. При оценкеучитывалась поправка, предложенная [Lee и др., 2010], учитывающая, чтоT не стремится к бесконечности.Как было показано в разделе 2.1, невключение в модельсущественного фактора приводит к получению смещенных оценоккоэффициентов при оставшихся факторах. Для того, чтобы получитьпредставление о последствиях невключения в модель пространственноголага, была оценена модель (2.11), отличающаяся от модели (2.8) толькоотсутствием пространственных эффектов:yit = X 'it −1 β1 + S 'it β 2 + µ i + φt + ε it ,(2.11)оценивая ее с помощью стандартного метода оценки панельных данных сфиксированными эффектами — оценки «within».!60Рис.
2.1 Диаграммы рассеяния уровня безработица в зависимости от переменных в моделиРасчет предельных эффектовИнтерпретация результатов оценки параметров пространственныхмоделей отличается от классических [см. LeSage, Pace, 2009], ведь эффектот изменения одной из характеристик региона будет оказывать эффект нетолько на сам регион, но и на другие регионы через изменение зависимой!61переменной.Поэтомуприиспользованииспецификации,котораяпредполагает наличие глобальных пространственных эффектов, выводынеобходимо делать исходя не из оценок коэффициентов, а значенийпредельных эффектов.
Термин «глобальные пространственные эффекты»подробно поясняет LeSage [2014]: если изменение в одном регионе влечетза собой изменения во всех других регионах, даже если эти регионы неявляютсяпрямымиобъясняетсясоседями.присутствиемПрисутствиеглобальныхэффектовчлена ( I n − ρW ) −1 = I n + ρW + ρ 2W 2 + … вформуле для вычисления прямых, косвенных и общих эффектов.Напомним,какинтерпретируютсярезультатыоценкипространственных моделей с линейной зависимостью от объясняющихфакторов в модели (2.8).
Влияние X r на Y в таких моделях удобноинтерпретировать, переписав уравнение (2.8) следующим образом [LeSage,Pace, 2009, c.35]:' y1 $r% "' S r (W )11 " S r (W )1n $' X 1 $""%% y2 " k %−1=!#!!+(I−ρW)u,%"∑%"n% ! " r =1% S (W ) " S (W ) "% X r n "%% ""n1rnn #&& r#& yn #(2.12)где вектор ошибок u включает в себя временные и индивидуальныеэффекты, n — количество наблюдений (в нашем случае регионов), r —количество регрессоров.
X 1 ,…, X k —соответствующие регрессоры, атакже переменные, характеризующие отраслевую структуру в модели(2.8). Исходя из формулы (2.12), запишем выражение для i-й строки:kyi = ∑ [ S r (W ) i1 X 1r + S r (W ) i 2 X 2r +, … ,+ S r (W ) in X nr1 ] + (( I n − ρW ) −1 ui ) ,r =1(2.13)где S r (W ) ij — элементы матрицы S r (W ) = ( I n − ρW ) −1 I n β r .LeSage, Pace [2009] предложили вычислять прямые предельныеэффекты как среднее диагональных значений матрицы S r (W ) :!62M ( X r ) direct =1tr ( S r (W )) ,N(2.14)где M ( X r ) direct — обозначение прямого предельного эффекта, N —количествонаблюдений,tr ( S r (W ))—следматрицыS r (W ) .Интерпретация прямых эффектов близка к интерпретации коэффициентовв классической модели регрессии: насколько изменение в объясняющейпеременной для одного региона изменяет значение зависимой переменнойэтого региона.
Однако прямой эффект также учитывает «обратное»влияние, проходящее через другие наблюдения: например, изменение xрегиона i влияет на y региона j, а изменение y региона j в свою очередьвлияет на y региона i.Общий эффект вычисляется какM ( X r ) total =1iN ' S r (W )iNN,(2.15)где M ( X r )total — общий предельный эффект, iN — единичный вектор, N —количество наблюдений. Общий предельный эффект имеет «двойную»интерпретацию: он отражает усредненное влияние одинакового для всехрегионовизмененияобъясняющейпеременнойxназависимуюпеременную y i-го региона, либо усредненное влияние измененияобъясняющей переменной x одного i-го региона на зависимые переменныевсех регионов (включая i-й регион).Косвенные эффекты показывают, как изменение в объясняющейпеременной одного региона может повлиять на изменения в зависимойпеременной в других регионах. Косвенный эффект вычисляется какM ( X r )indirect = M ( X r )total − M ( X r ) direct .(2.16)Формулы (2.14)–(2.16) несложно обобщить на нелинейный случай иполучить формулы для вычисления прямых, косвенных и общих эффектов(2.17)–(2.21).
Прямой предельный эффект для нелинейной функции:∂yi= S r (W ) ii f ' ( xir ) ,∂xir!63(2.17)косвенный предельный эффект для нелинейной функции:∂yi= S r (W ) ij f ' ( x jr ) .∂x jr(2.18)Предельный эффект y по x равен:ˆ −1∂yi $!( I n − ρW ) β r , r = 1,2=#−1 ∂f, r ≥ 3.∂x jr ! ( I n − ρˆW )∂x"(2.19)Для нелинейных функций f 1 ( x) = ax + bx ln x иf 2 ( x) = cx + dx ⋅ I (GDP < 1000) :∂f1= a + b(ln x j1 + 1),∂x j1(2.20)∂f 2= cx j 2 + dx j 2 I (GDP < 1000) .∂x j 2(2.21)В связи с тем, что предельные эффекты определяются достаточносложной структурой матрицы S r (W ) , для вычисления доверительныхинтервалов прямых, косвенных и общих эффектов LeSage, Pace [2009]предлагают использовать симуляции.
Так как оценки параметров модели(оценок коэффициентов, ковариационной матрицы оценок коэффициентовит.д.)полученыметодоммаксимальногоправдоподобия,тоасимптотическое распределение параметров ρ̂ , β̂ является нормальнымраспределением. В соответствии с LeSage, Pace [2009], для вычислениядоверительных интервалов используется метод симуляции Монте Карло,основанный на 1000 симуляций. Параметр ρ и вектор параметров βимеют совместное нормальное распределение. В соответствии с этимраспределением и его параметрами, оценки которых были получены приоценивании модели, было просимулировано 1000 значений параметра ρ ивектора параметров β .