Диссертация (1137982), страница 20
Текст из файла (страница 20)
Допустим, мы хотим предсказать заработную плату дляиностранного работника – дворника с высшим образованием, если бы он былместным жителем. Но в нашей выборке может не оказаться местных жителей стаким набором характеристик, а наше предсказание, основанное на средней отдачена образование, может значительно исказить истинное значение.Одним из способов, который позволяет преодолеть описанные вышепроблемы, является использование непараметрических методов оценки. ХьюгоНопо [Nopo, 2008] предлагает использовать метод точного мэтчинга (exactmatching)дляпостроениявозможнойзаработнойплаты.Предложеннаяметодология позволяет проанализировать разрыв не делая допущение о валидностипредсказанной заработной платы для индивидов с отсутствующим в выборкесочетаниемхарактеристик.Дополнительнымдостоинствомподхода,предложенного Нопо, является возможность получить некоторую меру сегрегациииностранных работников как разницу между сопоставимыми и не сопоставимыми сними местных работников.Коротко опишем методологию непараметрической декомпозиции так, какона была представлена в работе Нопо [Nopo, 2008].
Обозначим Y – случайнуюпеременную, моделирующую доходы индивида, а X – n-мерный векториндивидуальных характеристик (таких как возраст, образование, профессию,географическое положение и т.д.).FМ ()иF N ()- условные функциираспределения индвидуальных характеристик X для мигрантов и местныхNМработников соответственно, а dF () и dF () - соответствующие функцииплотности.Такимобразом,M (S) p(X S | M) dFM(x)иS N (S) p(X S | N) dFN (x) - это вероятностные меры на множестве S дляSмигрантов и местных работников соответственно.Также задаются функции условных ожидаемых доходов для мигрантов иMNместных жителей E[Y | M,X] g () и E[Y | N,X] g () , тогда:100E[Y | M] gM(x)dFM (x)(4.13)(x)dFN (x) ,(4.14)MSE[Y | N] gNSNГде SM и SN – пространство значений характеристик для мигрантов иместных жителей, соответственно. Тогда разрыв в заработках мигрантов и местныхжителей E[Y | N] E[Y | M] можно выразить как:gN(x)dFN (x) NgM(x)dFM (x)(4.15)MSSПоскольку пространство SN отличается от SM, можно выделить три области:Nобласть пересечения SN SM , область вне пересечения для местных работников SMи область вне пересечения для мигрантов S .
После ряда преобразованийвыражение (4.15) может быть преобразовано как:dF N (x) N M [ g (x) N M g (x) N M ] (S ) (S ) (S ) SMSMNg N (x)[SN SMdFN (x)NdFNdFM](x) N (SM ) M (SN )dFM (x)NM[g(x)g(x)]MNM(S)NS S[ g M (x)SN(4.16)dFM (x)dFM (x) M NMg(x)] (S ) M (SN ) SN M (SN )Компоненты разложения, следуя Нопо, будем обозначать как: N X 0 M(4.17)Обсудим интерпретацию каждого из элементов декомпозиции. N - различияв заработках, которые объясняются разницей между двумя группами местныхработников: теми, кто сравним с мигрантами по наблюдаемым характеристикам, итеми, кто не сравним с ними.
Эта часть различий ассоциируется со степеньюсегрегации иностранных работников на рынке труда принимающей страны. Онапоявляется как в результате самоотбора иностранных и местных работников междусегментами рынка труда (отраслевыми, профессиональными, географическими),101так и в результате существования барьеров для иностранных работников на вход вопределенные сегменты. X - это компонент, отражающий различия в заработках засчет различий в распределении наблюдаемых характеристик X между мигрантамии местными работниками в общей области значений.
0 - это «необъясненная»часть разрыва, существующая в общей области значений. Она появляется врезультате различий в ненаблюдаемых характеристиках либо в результатедискриминации. Наконец, M - различия в заработках, которые объясняютсяразницей между мигрантами, сопоставимыми и не сопоставимыми с местнымиработниками по наблюдаемым характеристикам.Чтобы оценить компоненты декомпозиции, Нопо предлагает использоватьметод точного мэтчинга (exact matching). Метод вычисляет разрыв в заработкахтолько для той части выборки, для которой возможно найти идентичныхиндивидов в другой группе. Процедура мэтчинга предполагает поиск для каждогоиностранного работника набора абсолютно идентичных по наблюдаемымхарактеристикам местных работников.
С ними и сопоставляется заработная платаиностранного работника. Процедура состоит из следующих стадий: сначала извыборки выбирается один иностранный работник; затем выбираются все местныеработники с таким же набором характеристик x; затем из выбранных местныхработниковформируется«синтетический»местныйработниксосреднейзарплатой, этот работник помещается в подвыборку сопоставимых местныхработников.
В результате процедуры будут сформированы четыре подвыборки:сопоставимые и не сопоставимые местные работники, сопоставимые и несопоставимые иностранные работники.После процедуры мэтчинга вычисление компонент декомпозиции сводится квычислению условных средних и эмпирических вероятностей в получившихсяподвыборках.4.1.3Источники данных и состав выборкиИсточником данных об иностранных работниках, как и в предшествующихглавах диссертации, служили два раунда Обследования уровня жизни вТаджикистане 2007 и 2009 года и Обследование домохозяйств Таджикистана 2011года.
В данной главе диссертации используется информация о работниках из102Таджикистана по репрезентативной выборке домохозяйств каждого года.Источником информации о российских работниках были 16, 18 и 20 волныРоссийского мониторинга экономического положения и здоровья населения НИУВШЭ)54. В выборку вошли занятые и сообщающие о своих заработках мужчины ввозрасте 17-70 лет. Из выборки местных работников исключались живущие всельской местности, поскольку для них полностью отсутствуют сопоставимыеиностранные работники. Согласно определению местного работника, принятому вданной диссертации, необходимо сравнивать иностранных работников (неграждан) с местными работниками – гражданами России.
Однако прямой вопрос огражданстве отсутствует в опроснике, поэтому нужно признать, что некотороеколичество индивидовиз выборкимогутнесоответствоватьпринятомуопределению. Однако количество таких наблюдений, по всей видимости,незначительно. Обратим внимание, что в базовом варианте расчетов индивиды смиграционным опытом, переехавшие в Россию после 1991 года, не исключались извыборки55. В итоговую выборку иностранных работников попали около 1000, 500 и700 индивидов в 2007, 2009 и 2011 годах соответственно. В итоговую выборкуместных работников попали около 1500, 1400 и 2500 респондентов в 2007, 2009 и2011 годах.4.1.4 Описание используемых переменныхАнализируемойпеременнойвданнойглаведиссертацииявляетсясреднемесячная номинальная заработная плата.
При ее измерении важнасопоставимость определений показателя для иностранных и местных работников.В анкете Опроса домохозяйств Таджикистана задается вопрос:Назовите сколько в среднем составлял ваш (чистый) ежемесячный доход наэтой работе? (Пожалуйста укажите сумму в долларах США.)56 [вопрос задаетсяотносительно основного рода занятий во время последней поездки]«Российский мониторинг экономического положения и здоровья населения НИУ-ВШЭ (RLMS-HSE)»,проводимый Национальным исследовательским университетом "Высшая школа экономики" и ООО«Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле иИнститута социологии Федерального научно-исследовательского социологического центра РАН. (Сайтыобследования RLMS-HSE: http://www.cpc.unc.edu/projects/rlms и http://www.hse.ru/rlms)».55При исключении таких индивидов из выборки размер различий в заработках незначительно снижался56Сумма, указанная в ответе на вопрос, переводилась в рубли по курсу на дату проведения интервью54103В качестве сопоставимого показателя для местных работников брался ответна вопрос:Скажите, пожалуйста, за последние 12 месяцев какова была Вашасреднемесячная заработная плата на этом предприятии после вычета налогов?[вопрос задается о месте работы, которое респондент считает основным]Для получения разложения как параметрическим, так и непараметрическимспособами необходим набор характеристик, который должен быть одинаков дляобеих групп.
Набор объясняющих переменных ограничен имеющимися данными.Так, для иностранных работников отсутствуют показатели как специфического, таки общего стажа, традиционно включаемые в число регрессоров в уравнениезаработной платы.В итоговую спецификацию включаются следующие переменные:-Возраст-Уровень образования57-Принадлежность к профессиональной группе по классификатору профессийISCO-88-Категория населенного пункта (Москва, региональный центр, другой город)-Индикатор федерального округаВ Таблице 4.1 сравниваются перечисленные характеристики для россиян иработников из Таджикистана.
Существенные различия наблюдаются по всемпараметрам: работники из Таджикистана в среднем моложе, имеют более низкийуровень образования, заняты преимущественно как работники сферы услуг,ручным и неквалифицированным трудом, в остальных профессиональных группахих присутствие ниже, чем у местных работников.