Диссертация (1138015), страница 18
Текст из файла (страница 18)
Поэтомуиспользовались две следующие возможности.1) Оценивались модели 1–11 (см. раздел 3.1) по данным за 2005–2010гг., подставлялись реальные значения X за 2011 и 2012 гг. (для России) и за2011 г. (для Германии) и сравнивались полученные прогнозы.2) Модели 1–11 (из раздела 3.1) оценивались с заменой X t на X t −1 поданным за 2006–2012 гг. (для России) и за 2006–2011 гг.
(для Германии),используя значения X за 2012 г. (для России) и 2011 г. (для Германии) вформулах для прогноза на 2013 г. (для России) и 2012 г. (для Германии).Пространственные модели панельных данных можно оцениватьнесколькими способами: с помощью обобщенного метода моментов,методамаксимальногомарковскихцепяхправдоподобия,(MCMC).ВсеэтиметодаМонте-Карлометоды(принавыполненииопределенных условий) позволяют получить состоятельные оценки.Однако применение метода моментов затрудняется необходимостьюпоиска валидных инструментов. Метод Монте-Карло является достаточнотрудо- (и время-) затратным. Поэтому, как и во второй главедиссертационного исследования, использовался симуляционный методмаксимального правдоподобия, в настоящее время широко применяемый!106при оценке пространственных моделей панельных данных (Anselin, 1988).В ходе оценки используется коррекция Lee, Yu [2010], учитывающая, что Tнестремитсякбесконечности.Модели,неучитывающиепространственные эффекты, оцениваются стандартными методами оценкипанельных данных.
Модель с фиксированными эффектами — с помощьюоценки «within», модель со случайными эффектами — с помощьювзвешенного МНК, объединенная модель регрессии — с помощью МНК.В целях учета пространственных взаимосвязей между регионамииспользуются поочередно две экзогенных пространственных матрицы W:граничная матрица и матрица обратных расстояний. В граничной матрицеэлемент, соответствующий двум регионам, равен 1, если регионы имеютобщую границу, и 0 в противном случае. Матрица обратных расстоянийсостоит из элементов, равных обратному расстоянию между столицамирегионов (для России — по автодорогам, для Германии — прямоерасстояние).
Диагональные элементы матриц равны нулю. Матрицынормированы по строкам.В настоящей главе в целях экономии места опущены результатыоценки моделей9.3. 3. Прогнозирование уровня безработицы3.3.1 Формулы для прогнозовВ данном разделе рассматриваются формулы для построения всехпредставленных в статье прогнозов, начиная с наиболее простых ипереходя к более сложным.В качестве одного из наивных прогнозов используется уровеньбезработицы в предыдущем периоде:yˆ i ,T +s = yi ,T ,9Результаты доступны по запросу: lena.sem7@mail.ru.!107s ≥ 1.(3.2)Другой наивный прогноз вычисляется как среднее значений уровнябезработицы четырех предыдущих периодов10:4yˆ i ,T + s = ∑ yi ,T + s − j / 4 .(3.3)j =1Здесь, если s > j , то yi ,T + s − j = yˆ i ,T + s − j .Прогноз пространственной модели с фиксированными эффектами, невключающей объясняющие переменные:yˆ i ,T + s = ( I − ρˆW ) −1 µˆ i + ( I − ρˆW ) −1φT + s .(3.4)Прогноз динамической пространственной модели, не включающейобъясняющие переменные:yˆ i ,T + s = ( I − ρˆW ) −1 µˆ i + ( I − ρˆW ) −1 γˆyi ,T + s −1 + ( I − ρˆW ) −1φT + s .
(3.5)Далее рассмотрим прогнозы, построенные с помощью моделейпанельных данных: моделей с фиксированными и случайными эффектамис учетом и без учета пространственного лага. Для их построениянеобходимо располагать матрицей регрессоров для прогнозируемыхпериодов X iT + s . Прогноз уровня безработицы в регионе с помощью моделис фиксированными эффектами вычисляется следующим образом:ŷ i ,T +s = X i ,T +s β̂ + µ̂i + ϕ̂ T +s ,(3.6)где µ̂i и β̂ — within-оценки соответствующих параметров, φˆT + s — оценкавременного эффекта для периода T + s .Из результатов оценки моделей известны оценки временныхэффектов лишь для периода оценивания, поэтому в качестве φˆT + s мыдобавляем либо значение временного эффекта предыдущего периода, либосреднее значение оценок временных эффектов нескольких (в нашем случаечетырех) предыдущих периодов.10Были рассмотрены также средние значения двух, трех, пяти и шести предыдущих периодов.
Однако втаблицу для сравнения моделей вынесен только один показатель, дающий наилучшее качество прогноза.!108Прогноздлямоделисфиксированнымиэффектамиипространственным авторегрессионным лагом (SAR) вычисляется спомощью формулы:yˆ i ,T + s = ( I − ρˆW ) −1 X 'i ,T + s βˆ + ( I − ρˆW ) −1 µˆ i + ( I − ρˆW ) −1φˆT + s ,где ρ̂ , β̂ , µ̂i —оценки,полученныеметодом(3.7)максимальногоправдоподобия для пространственных моделей панельных данных, φˆT + s —оценка временного эффекта для периода T + s .Для построения прогноза в моделях со случайными эффектамииспользована формула для наилучшего предсказания в классе линейныхнесмещенных оценок (BLUP) для ОМНК модели (Goldberger, 1962).
Наоснове этой формулы были выведены предсказания для модели синдивидуальными эффектами (Taub, 1979; Wansbeek, Kapteyn, 1978).Позже Baltagi, Li (2004) адаптировали эту формулу для модели спространственнойкорреляциейвошибках.Внастоящейстатьеиспользуется следующая формула для модели со случайными эффектами ипространственным авторегрессионным лагом:2yˆ i ,T + sTσ= ( I − ρˆW ) X 'i ,T + s βˆ + ( I − ρˆW ) −1φˆT + s + ( I − ρˆW ) −1 2µ ε i ,OMHK , (3.8)−1σ1Tгде σˆ 12 = Tσˆ µ2 + σˆ ε2 , ε i ,OMHK = ∑ εˆit ,OMHK / T .t =13.3.2. Меры для сравнения качества прогнозовПредсказательная сила разных моделей для всех регионов всовокупности сравнивается с помощью нескольких критериев, основнымиз которых является средняя квадратичная ошибка (RMSE):RMSE =где ei—ошибкапрогноза,1NN2i∑ei =1,вычисляемая(3.9)какразностьмеждупредсказанными и наблюдаемыми значениями ŷi и yi .
Наряду с RMSE,!109наиболее часто используемым в литературе, вычислены и другие мерыошибки предсказания:– средняя абсолютная ошибка в процентах (MAPE)MAPE = 1001NN∑ | yˆi =1iT + s− yiT + s | / | yiT + s |,(3.10)– средняя абсолютная ошибка (MAE)MAE =1NN∑ | yˆi =1iT + s− yiT + s | ,(3.11)– симметричная средняя абсолютная ошибка в процентах (sMAPE)sMAPE = 1001NN∑ 2 | yˆi =1iT + s− yiT + s | / | yˆ iT + s + yiT + s | ,(3.12)– максимальная абсолютная ошибка в процентах (maxAPE):max APE = 100 max(| yˆ iT + s − yiT + s | / | yiT + s |)i∈[1; N ].(3.13)Для оценки качества подгонки моделей для каждого региона поотдельности использовался показатель MAEi =| yˆ iT + s − yiT + s | .3.3.3. Результаты прогнозированияКак описано выше, прогнозы построены для двух случаев: когдаобъясняющие переменные в будущем периоде известны, и имеетсявозможность строить прогнозы в соответствующих точках, и когдаобъясняющие переменные в будущем периоде неизвестны, и необходимоиспользовать их лаги.1) В первом случае оцениваются модели 1–11 для случая, когдазначения соответствующих регрессоров известны.
Результаты оценкикачества прогнозов для российских регионов на один год впередпредставлены в таблице Г.1 (см. Приложение главы 3). Для оценки этихмоделей использовались данные за 2005–2010 гг. (по России и Германии).В случае предсказания уровня безработицы в регионах России можнозаметить, что учет пространственных эффектов значительно улучшаеткачество предсказания: c RMSE = 1.48 до RMSE = 0.99 . Включениединамического лага в модель незначительно улучшает качество прогноза.!110Интересно отметить, что наивные предсказания обладают достаточнонеплохой прогнозной силой: качество прогноза, вычисленного как среднеепредыдущих значений, сравнимо с прогнозом, полученным с помощьюмодели с фиксированными эффектами без учета пространственныхэффектов ( RMSE = 1.32 против RMSE = 1.48 ). Разделение данных навосточныеизападныерегионызначительноулучшаеткачествопредсказания для восточных регионов (с RMSE = 0.99 до RMSE = 0.54).В случае предсказания безработицы в Германии (см.
таблицу Г.3Приложенияглавы3)пространственнаядинамическаямодельсфиксированными эффектами дает наилучшие результаты ( RMSE = 0.45).Качество прогнозов этой модели значительно превосходит качествонаивных прогнозов. Добавление пространственных эффектов в модель сфиксированными эффектами улучшает прогноз (с RMSE = 1.54 доRMSE = 1.28 ) в случае использования граничной матрицы. При оценкемоделей на подвыборках для востока и запада наилучший прогноз длязападных регионов получается при использовании пространственнойдинамической модели с фиксированными эффектами без объясняющихпеременных,адлявосточныхрегионов—пространственнойдинамической модели с фиксированными эффектами.Результаты оценки качества предсказания на два шага вперед дляроссийских регионов 11 (см.
таблицу Г.2) подтверждают, что включениепространственных эффектов в модель улучшает прогноз (с RMSE = 2.43 доRMSE = 1.48 ). Наилучшее качество прогноза по-прежнему достигаетсяпространственной моделью с фиксированными эффектами и матрицейобратных расстояний. При этом разделение выборки на восточные изападные регионы улучшает качество предсказания.Такимобразом,еслиизвестнызначениясоответствующихрегрессоров, либо их значения могут быть хорошо спрогнозированы, то11Прогноз на два шага вперед для регионов Германии не был построен в связи с недостатком данных длянекоторых регрессоров.!111для прогнозирования безработицы на региональном уровне имеет смыслиспользовать пространственные модели панельных данных: качество ихпрогноза является наилучшим из представленных моделей, в том числе посравнению с часто используемыми наивными прогнозами.2) К сожалению, не всегда имеется возможность качественноспрогнозировать объясняющие переменные.
В этом случае возможнымвыходом из положения может стать использование лагов регрессоров.Тогда проверяется качество прогнозов, полученных с помощью моделей 1–11, где текущие значения регрессоров заменены на значения изпредыдущего периода.В таблицах Г.4 и Г.5 (в приложении главы 3) представленырезультаты качества предсказаний на 2013 г. (для России) и 2012 г. (дляГермании). Для оценки данных моделей использовались данные за 2006–2012гг.(поРоссии)и2006–2011гг.(поГермании).Учетпространственных взаимосвязей по-прежнему позволяет получить болеекачественныйпрогнозпосравнениюсклассическимимоделямипанельных данных. Однако наилучшим прогнозом в данном случаеявляется наивный прогноз: в среднем по всем регионам его качествонемного превосходит качество прогноза, полученного с помощьюдинамическойпространственноймодели(RMSE = 0.72противRMSE = 0.73 для России и RMSE = 0.34 против RMSE = 0.39 дляГермании).Тем не менее, динамическая пространственная модель все ещеостается более предпочтительной для некоторых отдельных регионов.
Вцелях проверки робастности, качество прогнозов на один шаг вперед,полученных с помощью моделей 1–11, где текущие значения регрессоровзаменены на предыдущие значения, было проверено для других периодов.Были построены прогнозы на 2012, 2011 и 2010 гг. (для России) и 2011,2010 гг.