Диссертация (1138206), страница 14
Текст из файла (страница 14)
Таким69образом, между этими тремя показателями возникает нетривиальная связь,когда два из них положительно коррелируют между собой, а третий –положительно с одним из них, но отрицательно с другим. Такая ситуацияможет объяснять двойственной природой доли расходов на питание. С однойстороны, она растет с ростом числителя, то есть суммы расходов на питание,с другой – падает с ростом знаменателя – общей суммы расходов.Межгрупповая динамика выборочных стандартных отклонений взависимости от доходной группы выглядит несколько менее регулярной, нопри этом также на качественном уровне, а часто и численно, очень близка вобеих выборках.
Отметим незначительное сокращение разброса числачеловек в домохозяйстве с ростом номера расходной группы и резкоеувеличение разброса уровня душевых расходов на питание на левом иправом конце распределения. Даже в логарифмическом масштабе видноочень существенное увеличение значение выборочного стандартногоотклонения внутри группы для младших и, особенно, старших групп(Рисунок 13, график стандартного отклонения).Применение механизма совместного использования информацииОБДХ и RLMS на примере 2007 годаВ рамках поставленной задачи необходимо на основе доступнойинформации о параметрах обеих выборок разработать и реализоватьмеханизм, позволяющий с помощью оценок «восстановить» динамику цен напродуктыпитаниядляданныхОБДХ.Такоймеханизмпозволитиспользовать данные RLMS о ценах покупок совместно с данными ОБДХ,проведя соответствующую корректировку на различие в параметрахвыборок.
Структура выборок представляется очень близкой друг к другу, чтодает основания для проведения такого оценивания, в то же времякорректировка на различия параметров может сделать оценку индексов ценпокупок еще более надежной.Такая «пересадка» индексов цен покупок продуктов питания можетосуществляться несколькими принципиально разными путями. Простойзаключается в копировании и использовании этих индексов, рассчитанных на70основе данных RLMS в выборке ОБДХ. Такое заимствование представляетсяоправданным в силу близости характеристик выборок, но лишь накачественном уровне.
То есть можно утверждать, что для ОБДХ также будетхарактерна тенденция увеличения средних цен покупок продуктов питания сростом суммы расходов на питание или общей суммы расходов. Сохранятсяи другие выводы, которые сделаны для данных RLMS. Но такое простоезаимствование индексов цен не учитывает существующие, пусть и незначительные различия в параметрах выборок, проявляющие в несколькоразной межгрупповой динамике рассматриваемых показателей.Рассмотрим более продвинутый способ использования заимствованныхиндексов из RLMS для выборки ОБДХ отдельно для 2007 года. Для этогонеобходиммеханизм корректировки индексов цен на пусть и незначительные, но существующие отличия в характеристиках расходныхгрупп в двух выборок.
Для реализации такого механизма была оцененарегрессионная модель, индекса цен покупок продуктов питания по группамнаселения, выделенным по уровню расходов на питание от всех доступныхпараметроввыборки.Вданномслучае,необходимоучитыватьтехарактеристики, которые доступны для обеих групп.Дляотдельногогодабылииспользованыданныебезучетавзвешивания, хотя не влияет на качественные выводы. Используются те пятьхарактеристик, по которым проводилось сравнение выборок по структуре:средняя по группе сумма расходов на питание на человека; средняя по группесумма общих потребительских расходов на человека; средний размере семьи;средняя доля расходов на питание в общей сумме расходов по группе; долягородского населения в группах.Необходимо разложить динамику индекса цен по 5 рассмотреннымфакторам.Основнойсложностьювэтойзадачеявляетсякрайнеограниченное число наблюдений при работе с достаточно крупнымразделениемвыборки(10-20расходныхгрупп),непозволяющееиспользовать многие стандартные подходы и тесты, применимые лишь дляслучая большого числа групп.
Возможен вариант перехода к более дробным71группам домохозяйств (например, 50), но в данном случае в межгрупповойдинамике показателей, в том числе индексов цен, появляется достаточносильная волатильность.Рассмотрим подробнее парные корреляции отдельных показателеймежду собой и с индексом цен Фишера, демонстрирующий среднююдинамику из рассмотренных четырех индексов, на данных RLMS (Таблица2). Заметим, что все значения коэффициентов корреляций крайне велики помодулю – более 0,65, а многие – более 0,9. Кроме того, знаки корреляцийвесьма регулярны – единственный показатель, который отрицательно связанс другими – размер семьи. Он имеет отрицательные корреляции со всеми 4факторами и с межгрупповой динамикой цен.
Все остальные корреляциимежду факторами и индексом цен – положительны. Такая ситуация можетбыть в том числе связана с наличием довольно устойчивой тенденции вмежгрупповой динамике каждого из факторов и индекса цен – отрицательнойдля размера семьи и положительной для всех остальных. Знаки корреляцийважны, в том числе для построения так называемых «гармоническихрегрессий» [18].Таблица 2.
Значения парных корреляций на данных RLMS для 20 групп.FOOD_EXPFAM_SIZEURBANFOOD_SHTOTAL_EXPIPFFOOD_EXP1.00-0.950.670.920.990.91FAM_SIZE-0.951.00-0.75-0.95-0.95-0.94URBAN0.67-0.751.000.880.710.88FOOD_SH0.92-0.950.881.000.930.98TOTAL_EXP0.99-0.950.710.931.000.93IPF0.91-0.940.880.980.931.00Для каждого из разбиений на группы (мы рассматриваем выделение 20или 50 групп домохозяйств по расходам на питание на душу указанным вышеспособом) возможно оценивание нескольких вариантов моделей.
Так,основным различием является функциональная форма – оценивалисьобычная линейная регрессия и линейная в логарифмах модели. Дляпояснения процесса выбора модели и отбора значимых факторов приведеммодели, включающие полный набор факторов:72(7) IPF=0,86–1,41·10-5Food_exp–0,03·Fam_size+0,21Urban+0,33Food_sh–1,52·10-5Total_exp,R2=0,975 (3,92) (0,59 )(-0,79)(1,98)(0,79)(1,76)(8) ln(IPF)= –0,66+0,04ln(Food_exp)+0,01ln(Fam_size)–0,02ln(Urban)+0,12ln(Food_sh)+0,06ln(Total_exp)R2=0,971 -1,18) (0,57 )(0,09)(-0,23)(0,53)(1,36)Где: Food_exp – средняя по группе сумма расходов на питание на одного члена д/х;Fam_size – среднее по группе число человек в д/х (взрослых и детей);Urban – доля д/х в группе, проживающий в городах;Food_sh – средняя по группе доля расходов на питание в д/х;Total_exp – средние по группе общие расходы д/х.Подкоэффициентамирегрессионныхуравненийуказанызначениясоответствующих t-статистик.Прокомментируем подробнее результаты регрессионного анализа.Видно, что результаты применения моделей (7), (8) очень близки.
ЗначениеR2 в обеих моделях очень велико (более 97%), что подтверждает гипотезу отом, что выбор цен покупок (индекс относительно первой группы) во многомопределяетсямикроэкономическимихарактеристикамигруппыдомохозяйств. Для случая 50 групп результаты качественно не отличаются,значения R2 несколько ниже, но все равно находятся на уровне выше 93%.Результаты расчета индекса цен по данным RLMS с помощью обеихмоделей приводятся на графике (Рисунок 14. Результаты регрессионногомоделирования межгруппового индекса цен Фишера по данным RLMS дляслучая 20 групп.). Однако, говорить о преимуществах одной из них на этомэтапе не вполне корректно.140%Индексы цен135%RLMS-данные130%линейная модель125%лог-линейная модель120%115%110%105%100%номер группы12345678910 11 12 13 14 15 16 17 18 19 20Рисунок 14.
Результаты регрессионного моделирования межгрупповогоиндекса цен Фишера по данным RLMS для случая 20 групп.73Обратим внимание на незначимость коэффициентов в моделях. Пристоль малой длине выборки все параметры в случае линейной в логарифмах ипочти все в случае линейной моделей оказываются незначимыми. Одной изпричин этого может являться сильная мультиколлинеарность факторов. Этоподтверждается при оценивании вспомогательных регрессий одного изфакторов на другие – во всех случаях значение R2 оказывается крайневысоким (до 98-99%). В такой ситуации незначимые факторы должны бытьисключены из модели, так как включение столько тесно коррелированныхфакторов делает модель некорректной и искажает получаемые оценки.Однако простое «механическое» исключение незначимых факторов впорядке наименьшего уровня значимости в данном случае не вполнеприменимо.
Необходимо учитывать содержательные связи между факторамидля получения наиболее точных оценок.При последовательном исключении факторов для случая разбиения на20 групп обе модели включают в себя по два фактора - общие расходы,линейная модель – долю городского населения, а лог-линейная – долюрасходов на питание. При 50 группах в обеих моделях оказались значимымипо 3 фактора – общие расходы, доля расходов на питание, расходы напитание. С одной стороны, в такой ситуации не полностью учитываетсяразличие между выборками. Все пять факторов имеют свою межгрупповуюдинамику для каждой из выборок. Идея пересчета индекса цен предполагаетучет максимально возможной информации при восстановлении индексов дляОБДХ по параметрам выборки.
Но, с другой стороны, имея в виду оченьтесную корреляцию между факторами, есть возможность подобрать такое ихсочетание, которое будет объяснять значительную долю колебаний индексацен и в то же время не будет характеризоваться столь значительноймультиколлинеарностью.Одним из возможных способов решения этой проблемы может статьприменение метода главных компонент (МГК) для линейной модели,учитывающие влияние всех факторов.














