Диссертация (1138206), страница 16
Текст из файла (страница 16)
По всей видимости,наличие такого явления в двух соседних годах не должно бытьслучайностью. С одной стороны, это может быть вызвано изменениемструктуры выборки, например, в эти годы удалось охватить более широкийдиапазон населения по доходу, однако исследование других характеристик(общая сумма расходов в этих группах) не подтверждает такую гипотезу.
Сдругой стороны, это опережение может быть связано с какими-томакроэкономическими тенденциями, например, подорожанием импортныхпродуктов питания из-за колебаний курса в этот период. Как отмечалось, всоответствующем пункте диссертации, описывающим макроэкономическиетенденции в период 2002-2010 гг., однозначно связать это явление сконкретнымсобытиемтрудно.Однакоможносуверенностьюконстатировать, что 2004-2005 является некоторым переходным периодом,связывающим две модели роста – восстановление после кризиса идостаточнобыстрыйконъюнктуры.Этотроствпереходрезультатеблагоприятнойсопровождалсявнешнеймногочисленнымиструктурными сдвигами, в том числе в потребительском поведениидомашних хозяйств.80На втором этапе исследования нам удалось успешно применить к рядулет (2002-2010 годы) разработанный ранее механизм «восстановления»индексов цен покупок продуктов питания для ОБДХ по данным выборкиRLMS, который был подробно описан для данных 2007 года.Ради большей универсальности механизм «пересадки» индексов былмодифицирован.
В дальнейшим полученные результаты использовались длярасчета межвременных индексов цен покупок по доходным группам, как дляпродовольственных товаров отдельно, так и для всей корзины товаров иуслуг. Соответственно, выделение групп по уровню расходов на питание ужене обеспечивало требуемый уровень представительности групп и непозволяло интерпретировать их в качестве децимальных групп в привычномпонимании.
Таким образом, первым изменением стало ранжированиедомашних хозяйств в обеих выборках и выделение групп на основе этогоранжирования по уровню общего дохода на одного члена д/х, а не уровнюрасходов на питание как раньше.Стоитотметить,чтотаккаквыборочныеобследованияхарактеризуются неполнотой данных, данные о доходах и расходах могут неполностью соотноситься друг с другом – зачастую сумма расходов (даже споправкой на уменьшение сбережений или полученные кредиты) можетсильно превышать уровень доходов д/х в конкретном периоде или даже напротяжении ряда лет. Для корректировки на такую неполноту в данныхRLMS дальнейших расчетах использовался некоторый синтетическийпоказатель дохода, который был равен максимуму из указанного респондентадохода и общей суммы расходов с поправкой на сбережения и кредиты.
Тоесть если уровень расходов превышает доходы, то в качестве меры доходыпринимается соответствующая величина расходов. Фактически аналогичныйподход использует при публикации данных ОБДХ, поэтому для этойвыборки такая корректировка не требуется – данные о доходах в нейизначально получены на основе информации о расходах и сбережениях ирасхождения не возникает.81Вторым важным изменением сталоиспользование встроенногомеханизма взвешивания при работе с данными ОБДХ. Как уже отмечалось,это позволяет приблизить данные выборочного обследования к параметрамгенеральной совокупности.
Однако различие, в том числе по среднемудоходу, все равно сохраняется существенным (Таблица 4). Тем не менее, так,по крайней мере, обеспечивается сопоставимость с официальными расчетамиРосстата, выполнены при использовании взвешивания.Таблица 4. Соотношение среднего дохода в обследованиях имакростатистике, руб. на человека в месяц2002 2003 2004 2005 2006БДДР3 920 5 115 6 343 8 025 10 090ОБДХ2 533 3 179 3 983 5 050 6 209RLMS3 265 4 070 5 497 6 259 7 747ОБДХ/БДДР, % 64.6 62.2 62.8 62.9 61.5RLMS/БДДР, % 83.3 79.6 86.7 78.0 76.8200712 4897 8748 81963.070.6200814 81510 22411 75869.079.4200916 86011 16711 59666.268.8201018 71912 89813 75368.973.5Третьим важным изменением стал выбор факторов, использующих приразложениимежгрупповогоиндексаценRLMSипоследующемвосстановлении.
При использовании для одного года (2007) нами подробнообсуждался вопрос о выборе факторов, которые должны быть использованыв регрессионной модели. Отмечалось, что включение всех пяти факторов водну модель может вызвать некоторые трудности с точки зрения ее качества.Одна из проблем связана с тем, что для основного случая – разбиения на 10доходных групп использование пяти факторов делает модель слишком«длинной», то есть оставляет малое число степеней свободы. Кроме того, этифакторы характеризуются некоторой мультиколлинеарностью, как попостроению (сумма расходов на питание и доля расходов на питание), так истатистически.В данном случае применение этого метода к различным годам и кразличным вариантам разбиения на группы не позволило установитьуниверсальное сочетание двух-трех факторов, которые с одной стороны былибы во всех случаях значимыми, а с другой - объясняли бы значительнуюдолю вариации индекса (что характеризуется большим значением R2 в82модели).
Перебор возможных вариантов приводил к тому, что во всехслучаях для ряда лет некоторые факторы оказывались незначимыми, причемкак для разбиения на малое число групп (10 или 20), так и на большое (50).Никакой системы в этом установить не удалось. В такой ситуации возможныдва варианта модификации механизма – выбор значимых факторовиндивидуально по каждому году, что является несколько более точным сточки зрения статистических свойств моделей (в них не участвуютнезначимыефакторы),нозначительноуменьшаетуниверсальностьмеханизма, так как требует «ручной настройки» для каждого года вотдельности. Однако, в некоторых случаях даже выбор факторов для каждогогода в отдельности оказывался затруднен, если значимыми оказывалисьразные факторы при различном разбиении на группы.
Кроме тогозатрудняется процесс прогнозирования – в такой ситуации выбор факторов вбудущем ничем не мотивирован.Поэтому в данном случае использовались другой более универсальныйподход. В моделях разложения индекса цен по регрессорам для всех лет иразличного разбиения на группы использовался стандартный наборфакторов, хотя и несколько измененный.
Не рассматривалась долягородского населения в силу того, что она стабильна для ОБДХ прииспользовании взвешивания. Решено было также отказаться от общей суммырасходов на питание из-за тесной связи с соответствующей долей, но затодобавить долю расходов на услуги. Таким образом, факторов осталось лишьчетыре – общая сумма расходов на одного члена д/х, размер семьи и долирасходов на питание и услуги. Это, в частности, позволило повысить наединицу число степеней свободы, что достаточно критично для регрессии на10 наблюдениях.Однако для дальнейшего увеличения числа степеней свободы былаопробована еще одна модификация. Данные за разные годы рассматривалиськак панель. Ниже приводятся результаты для логарифмической модели.(9) ln(IPF(s;t))=const(t)+0,32·ln(fam(s;t))-0,12·ln(food_sh(s;t))+0,17·ln(serv_sh(s;t))+0,26·ln(ex(s;t)),R2=0,973(0,07)(0,09)83(0,04)(0,03)s = 1, …, 10 – номер группы, t = 2002, …, 2010 – год; в скобках указаныстандартные отклонения оценок коэффициентов;fam(s;t) – среднее по группе число человек в д/х (взрослых и детей);food_sh(s;t) – средняя по группе доля расходов на питание в д/х;serv_sh(s;t) – средняя по группе доля расходов на услуги в д/х;ex(s;t) – средние по группе расходы на одного члена д/х.То есть при оценке регрессии для разложения межгруппового индексацен по факторам все коэффициенты кроме свободных членов полагалисьравными для разных лет, а отличие заключалось лишь в значении констант(временных эффектов).
Естественно, такая модель является несколькоограничивающей.Хотячисленныезначенияоценоккоэффициентов,полученные в предположении такой панельной структуры и без нее (то есть спостоянным набором факторов для всех лет, но разными значениямикоэффициентов) несколько отличаются, итоговые результаты оказалиськачественно и численно близки. Это позволило остановиться на панельнойспецификации модели (9), дающей сходные результаты, но имеющейзначительно лучшие статистические свойства. (Таблица 5)Таблица 5. Сравнение результатов разложения межгруппового индекса ценпо факторам в панельной спецификации (9) и отдельно по годамгодразмер семьидоля питаниядоля услуграсходыконстантаврем. эффект в панелиЧисло наблюденийR220020.100.02-0.080.18-1.43-2100.9920030.330.130.040.20-1.56-2100.982004-0.03-0.280.100.19-1.321.846100.9920050.02-0.500.220.15-1.071.793100.9920060.340.060.210.18-1.361.610101.0020070.300.100.020.19-1.731.585100.9920080.300.100.110.18-1.491.558100.9820090.500.030.190.22-2.001.536101.002010 Панель0.65 0.320.24 -0.12-0.04 0.170.36 0.26-3.631.528100.94На графиках (Рисунок 17) приводится динамика для исходных ивосстановленных индексов цен с помощью описанной процедуры для всехрассмотренных лет для случая разбиения на 10 доходных групп.Аналогичные графики получены и для более дробного деления – на 20 и 50групп, однако в тексте работы они не приводятся.















