Диссертация (1138213), страница 14
Текст из файла (страница 14)
Методология моделирования миграции на региональном уровне2.1.1. МодельВ базовых работах по миграции, о которых говорилось в предыдущемразделе,оцениваетсямодель,описывающаягравитационныйзаконпространственного взаимодействия, согласно которому «демографическая»сила притяжения между регионами прямо пропорциональна населению врегионе выбытия и регионе прибытия и обратно пропорциональна квадратурасстояния между регионами.Fij kPi Pj(2.1)Dijгде Fij - сила притяжения между регионами i и j , Pi - численностьнаселения региона выбытия i , Pj - численность населения региона прибытияj , Dij - географическое расстояние между центрами регионов i и j , k –коэффициент пропорциональности, константа.
Эту модель принято называтьгравитационной,посколькуонааналогичнасуществующемузаконувсемирного тяготения Ньютона в физике. Для того чтобы оценить модель,обычно логарифмируют обе части модели (2.1). Проделав это, получаем:ln Fij ln k Pi Pj Dij(2.2)В качестве зависимой переменной в этой модели, как правило, берутлогарифм миграционного потока между регионами ln M ij . Параметрыk , , , подлежат оцениванию.Однаковдальнейшихработахисследователиоценивалитакназываемую модифицированную гравитационную модель. Где помимостандартных факторов базовой гравитационной модели, вносятся различныесоциально-демографические характеристики регионов.69ln M ij k ln X ki k ln X kj Dij ijkK(2.3)kKгде X ki - это социально-демографические факторы региона выбытия, X kj это факторы региона прибытия. Однако, существуют работы, в которыхкритикуетсяиспользованиелогнормальногораспределениядля ij .Например, Flowerden и Aitkin (1982) построили гравитационную модельмиграции, в предположении Пуассоновского распределения миграционныхпотоков.
Авторами статьи показано, что закон Пуассона лучше подходит дляописания миграционных потоков, чем логнормальное распределение.Однако мы располагаем панельными данными, поэтому воспользуемсяих преимуществами. В исследованиях по России авторы уже прибегали канализу панельных данных (Андриенко, Гуриев, 2004). Однако, здесьвозникает вопрос, модель какого вида нужно оценивать: модель сфиксированными или со случайными индивидуальными эффектами. Вкачестве единицы наблюдения в нашей модели предполагается парарегионов.
Рассмотрим, как выглядит спецификация каждой из моделей.Спецификация для модели с фиксированными индивидуальнымиэффектами (FE) выглядит следующим образом:ln M i , j ,t i , j t yeart k ln X k ,i ,t k ln X k , j ,t ui , j ,ttTkK(2.4)kKгде yeart - временные эффекты, которые учитываются с помощьюдамми переменных на соответствующие года, ui , j ,t - случайная ошибка.
Всеiid 0; u2 . i , j -ui , j ,t независимые и одинаково распределенные, ui , j ,tфиксированный эффект пары регионов i и j . Предполагается, что все X k ,i ,t ,X k , j ,t не зависят от ui , j ,t . С помощью фиксированного эффекта моделируютсяненаблюдаемые переменные, которые не меняются во времени для парырегионов i и j (культурные, этнические, религиозные, родственные и прочиесвязимеждурегионами,климатические70условияигеографическиепоказатели). К числу ненаблюдаемых, но фиксированных эффектов, можноотнести величину издержек, которую несет индивид при миграции изрегиона i в регион j . Для оценки уравнения регрессии (2.4) сначала делаетсяпреобразование «within», т.е.
для каждой переменной вычитается среднее повременизначение,поэтомумодельFEнепозволяетоцениватьнеинвариантные по времени переменные, а затем применяется методнаименьших квадратов.Здесь делается довольно сильное предположение о независимости ui , j ,t .На самом деле это предположение может не выполняться, посколькумиграционные потоки между регионами могут зависеть между собой.Допустим, что есть зависимость среди потоков, которые направлены изодного региона, т.е. ошибки ui , j ,t зависимы для одного i . Однако будемсчитать, что для разных i зависимости между ошибками нет.
Для того чтобыучесть этот факт, стандартные ошибки коэффициентов рассчитываются сучетом возможной корреляции с помощью т.н. sandwich estimator. При этомзначения коэффициентов не изменится, меняются только стандартныеошибки и доверительные интервалы. Этот способ учета зависимости ошибокносит название кластеризованных стандартных отклонений (cluster-robuststandard errors). Идея его состоит в том, что ковариационная матрицакоэффициентов регрессии корректируется с помощью взвешивающихкоэффициентов для ошибок внутри одного кластера (Stock, Watson, 2006).Из исследователей, которые занимались изучением миграционныхпроцессов в России, отдавали предпочтение модели с фиксированнымииндивидуальными эффектами Гуриев и Андриенко (2004, 2006б), Ощепков(2008).Для модели со случайными индивидуальными эффектами (RE) модельбудет выглядеть следующим образом:ln M i , j ,t t yeart k ln X k ,i ,t k ln X k , j ,t i , j ,ttTkKkK71(2.5)где i , j ,t i , j ui , j ,t .
В этой модели предполагается, что индивидуальныйэффект i , j не фиксированная величина, а случайная. Считается, что у этойслучайной величины нулевое математическое ожидание и ненулеваядисперсия. i , jчастьюui , j ,tиiid 0; 2 случайнойСлучайный индивидуальный эффект являетсяошибки.Какираньшепредполагается,чтоiid 0; u2 . Кроме того, считается, что все X k ,i ,t , X k , j ,t не зависят от ui , j ,ti, j .Длямоделейсослучайнымиэффектамииндивидуальнаянеоднородность учитывается не в самом уравнении, а в ковариационнойматрице ошибок. Модель со случайными индивидуальными эффектамиоценивается обобщенным методом наименьших квадратов (GLS).Предпочтение модели RE отдавал Гербер (2000) в своей работе поанализу миграции в России.Для выбора одной из этих спецификаций используются различныеобоснования как содержательные, так и технические.
С одной стороныпредполагается, что оценки, полученные при оценивании модели FE,состоятельные, но часто неэффективные. Оценки RE эффективные, но невсегда состоятельные. В случае,когда нарушается предпосылка онекоррелированности регрессоров с ненаблюдаемым случайным эффектом,оценки RE будут несостоятельными.
Для тестирования предположения онекоррелированностиненаблюдаемыхиндивидуальныхэффектовсрегрессорами используется тест Хаусмана. Проделав этот тест, мы получили,чтоприлюбыхспецификацияхмоделисдетерминированнымииндивидуальными эффектами предпочтительнее моделей со случайнымиэффектами.Обоснуемсодержательновыбормоделисфиксированнымииндивидуальными эффектами. Модель с фиксированными эффектамиобычно используют тогда, когда выборка, с которой работают, по сути,представляет собой генеральную совокупность. Это как раз наш случай,72поскольку мы работаем почти со всеми регионами Российской Федерации.Также если мы предполагаем, что возможна коррелированность регрессоровс индивидуальными эффектами, лучше выбрать модель с FE эффектами,поскольку в такой модели ненаблюдаемые индивидуальные эффектыисчезают при оценивании, т.к. они предполагаются постоянными во времени.Предположениеокоррелированностиненаблюдаемогоэффектасрегрессорами не безосновательно.
Если предположить, что ненаблюдаемыеиндивидуальные эффекты, например, отражают культурные различия междурегионами, то факторы среднедушевых доходов в регионе, показателикачества жизни, не могут, ни коррелировать с ненаблюдаемым эффектом. Извсего выше сказанного можно сделать вывод, что оценивание модели с FEпредпочтительнее.Учет неоднородности регионовСложно представить, что все регионы России описываются одноймоделью миграции.
Можно предположить, что возможна неоднородностьпар регионов, т.е. модели миграции для разных пар регионов могут бытьразными. Вообще говоря, следовало бы проверить сливание данных в панельпо парам регионов, входящих в выборку. Однако мы не сможем построитьотдельно для каждой пары регионов свою модель, поскольку имеемограничение по количеству временных периодов. Рассмотрим способы,которые можно применить, чтобы хотя бы частично решить проблемунеоднородности.Одним из таких способов может быть построение модели сослучайными коэффициентами вида:ln M i , j ,t t yeart k ,i , j ln X k ,i ,t k ,i , j ln X k , j ,t ui , j ,ttTkK(2.6)kKВ модели (2.6) предполагается, что коэффициенты модели разные дляразных пар регионов.
k ,i , j k k ,i , j и k ,i , j k k ,i , j , где k ,i , j и k ,i , j случайные составляющие. Такие модели подлежат оцениванию обобщеннымметодом наименьших квадратов (GLS). По сути, оценка GLS для такой73модели рассчитывается путем взвешивания каждого наблюдения модели наобратную ковариационную матрицу, рассчитанную специальным образом(Hsiao, 1999). Однако, поскольку в основе такой постановки задачи лежитоценивание отдельно для каждой пары регионов (наблюдения) регрессии насвоем временном ряде, то возникает проблема короткого временного ряда:количество регрессоров больше, чем T – число временных периодов.Следовательно, в нашем случае этот способ оценивания не применим.Другой способ учета неоднородности пар регионов состоит вовведении дамми переменных на те пары регионов, которые сильноотклоняются от общей тенденции.
Однако здесь опять возникает проблемаразмерности, поскольку вводить дамми переменные стоит, возможно, нетолько на константу, но и на линейные коэффициенты регрессии. Но числофакторов в такой модели резко возрастает, а число степеней свободыснижается.Ещеоднимспособомучетанеоднородностиданныхявляетсякластеризация пар регионов на однородные группы. Группы должны бытьоднородны в том плане, что внутри одной группы пары регионов должныописываться одной регрессионной моделью. Этот способ в нашем случаеможет быть применен. Однако здесь возникает проблема выделения такиходнородных групп.















