Диссертация (1136799), страница 21
Текст из файла (страница 21)
Иммигранты, исповедующие ислам, считаются гомогенной группойдля удобства исследования, хотя на самом деле этот аспект значительно сложнее102[Norris, Inglehart, 2004, p. 133]. Такое упрощение связано со спецификой данных.У меня нет возможности получить информацию о достаточно большом числе мигрантов – представителей разных направлений ислама, так как я работаю с национальными репрезентативными выборками, а не с подвыборками мигрантов.Религиозность в данной части работы измеряется тремя различными способами, это прямой вопрос: «Насколько Вы религиозны?» (шкала состоит из 10 категорий), а также две переменные о религиозных практиках. Переменная «Как часто Вы молитесь?» состоит из 7 вариантов ответа (1 – каждый день, 7 – никогда) ииспользуется в моделях как категориальная, поскольку размер эффекта между категориями различается.
Предиктор «Как часто Вы посещаете храм?» представленв форме непрерывной переменной из 7 категорий. Эффект непрерывен и линеен,уровень гендерного эгалитаризма понижается на одинаковую величину на каждойкатегории, поэтому переменная была перекодирована в непрерывную.Уровень образования перекодирован из 27-уровневой шкалы ISCED в переменную с тремя категориями: школьное образование, техникум/училище и высшее образование. Положение на рынке труда из переменной с 9 категориями перекодировано в 6 (оплачиваемый труда, на пенсии, безработный, студент, домохозяйка, другое).Четвертый параграф эмпирической главы посвящен гендерному равноправию на рынке труда на Арабском Востоке.
Был сформирован агрегированныйкомпозитный индекс из 3 переменных:(1) Замужняя женщина может работать вне дома, если она того хочет.(2) У мужчин и женщин должны быть равные возможности получить работу.(3) Мужчины и женщины должны получать одинаковую заработную платуза эквивалентный труд.Пытаясь подобрать вопросы, максимально близкие к тем, что задавались в«Европейском социальном обследовании», я остановилась на этих трех, поскольку они укладываются в единый фактор и описывают ту же сферу, а именно рав-103ный доступ женщин (в том числе замужних и имеющих детей) и мужчин к рынкутруда. Эти переменные фиксируют отношение к правам женщин на рынке труданесколько иным образом, чем в случае Западной Европы, где, например, сам вопрос о возможности работы замужних женщин вне дома трудно представить.
Индекс консистентен, альфа Кронбаха составляет 0.78 [Кабаков, 2014], был выполнен эксплораторный факторный анализ [Cudeck, 2000]. В основе этих вопросовлежит один латентный фактор, поэтому из них был сконструирован простой композитный индекс со шкалой от 0 до 1 (0 – эгалитарный, 1 – патриархатный) с равными весами для всех переменных. Чем ниже значение индекса, тем либеральнеереспондент в вопросах равноправия полов.Некоторые переменные, входящие в модели, имели пропущенные значения,и число валидных наблюдений составляло 7347.
Если применить построчное удаление, то база данных теряет 775 случаев из 8122, что составляет 9,5%. Я использовала технику множественной импутации, реализованную в пакете Amelia II среды статистического программирования R. Этот метод позволяет с высокой точностью восстановить пропущенные значения, основываясь на регрессионном моделировании каждого пропущенного случая, что позволило довести число валидныхпеременных до изначального количества респондентов (8122) [Honaker et al.,2011].При анализе регрессий на десяти импутированных базах данных использовался пакет Zelig в среде R, для подсчета процента объясненной дисперсии применялся метод максимального правдоподобия, поэтому стандартный показательобъясненной дисперсии R2 здесь неприменим [Kosuke et. al., 2013].
Для лучшегопонимания качества модели была выбрана одна из типовых баз данных, на основекоторой и приводятся регрессионная модель с объясненной дисперсией 15%.В качестве измерения религиозности были использованы все имеющиеся вбазе данных переменные, связанные с этой сферой. Вопрос «Как часто Вы читаете Коран?» был перекодирован из 5 категорий в 3: «ежедневно», «иногда» и «редко/никогда». Прямой вопрос о религиозности был предложен в опросе с тремя ва-104риантами ответа: да, что-то среднее, нет (в модели добавлена также категория«отказ от ответа»).
Вопрос о частоте молитв представлен в виде бинарной переменной (да\нет), как он был сформулирован в опросе.Также была перекодирована переменная «возраст», изначально состоявшаяиз 7 категорий для Марокко и из точного числа лет для остальных стран. Группа75 лет и старше имела слишком мало случаев, поэтому была сконструирована новая с шестью категориями, где шестая стала называться «65+».В пятом параграфе настоящей главы синтезируются данные по Европе имусульманским странам для построения многоуровневых регрессионных моделейс перекрестной классификацией.28Многие ученые считают, что для всестороннего анализа миграции необходимо учитывать не только характеристики мигрантов в принимающем обществе,но также располагать информацией об отправляющих сообществах [Van Tubergenet al., 2004; Beauchemin, 2014].
И хотя последнее время многоуровневое моделирование становится все более принятым в исследованиях миграции [Yang, Guo,1999; Swain, Garasky, 2007], одновременный анализ стран исхода и проживанияеще не распространен [Huijts, Kraaykamp, 2012; Urquia et al., 2011]. Сравнительный дизайн с перекрестной классификацией набирает популярность среди методологов и уже успешно применялся для анализа здоровья мигрантов, их владенияязыком, вовлеченности в рынок труда, религиозности и успешности в учебе, атакже приверженности определенным ценностям [Van Tubergen, 2006; Levels etal., 2008; Rudnev, 2014].
Однако, насколько мне известно, этот подход ранее невстречался в работах по гендерным установкам мигрантов (Спирингс использовалмногоуровневый иерархический дизайн, исследуя влияние родительских гендерных установок на взгляды их детей в Турции и среди турецких мигрантов)[Spierings, 2015].Технические аспекты многоуровневого регрессионного моделирования с перекрестной классификацией на опросных данных изложены в статье Костенко В.В. Гендерные установки мигрантов–мусульман вЗападной Европе: многоуровневый неиерархический анализ [Текст] / В.В. Костенко // Мониторинг общественного мнения: экономические и социальные перемены. - 2017.
- N 1. - С. 97-120.28105В исследовании применяется многоуровневая логистическая регрессия с перекрестной классификацией, уточним каждый из этих терминов.Бинарная логистическая регрессия применяется в тех случаях, когда зависимая переменная категориальная и представлена двумя вариантами ответов(да\нет, 0\1), а не непрерывная, как в линейной регрессии [Agresti, Kateri, 2011].Поиск наилучшей модели и определение ее качества (goodness of fit) для таких регрессий осуществляется с помощью теста хи-квадрат [Lemeshow, Sturdivant, Hosmer, 2013], который в среде R реализован для сравнения моделей в функцииanova.29В многоуровневых регрессиях моделируются не только углы наклона, как вклассической регрессии, но и интерсепты, которые отличаются для каждой группы [Rasbash, 2008]. То есть, если формула классической регрессии выглядит как = α + βx + ϵ,где α – интерсепт (неизменяющаяся точка пересечения регрессионной линии сосью OY), β – тангенс угла наклона регрессионной линии, x – предиктор (независимая переменная), и ϵ – остаток (ошибка или необъясненная дисперсия).Для многоуровневой регрессии эта формула несколько усложняется, поскольку α становится переменной: = + β + ,где i показывает характеристики индивида, j – характеристики группы.
Таким образом, – это интерсепт для каждой группы, а угол наклона β одинаков для всехгрупп, и ϵ – необъясненная дисперсия на индивидуальном уровне.Такое название функции не должно вводить в заблуждение относительно сути теста, он имеет в своейоснове именно тест хи-квадрат, а не дисперсионный анализ.29106Рисунок 1 – Расположение регрессионных линий для классической регрессии, многоуровневой регрессии с фиксированными углами наклона (FSRI) и многоуровневой регрессии с рандомизированными углами наклона (RSRI)Кроме того, исследователь может предположить, что зависимость Y от xразличается в разных группах (странах), тогда возможна рандомизация угловнаклона (см. третий график на Рис.2), которая выражается формулой = αj + βj Xij + ϵij = 00 + + 0 = 01 + 1где обозначает интерсепт, –угол наклона регрессионной линии, - ошибкуна индивидуальном уровне, –необъясненную дисперсию на групповом уровне,00 - общий (средний) интерсепт, 01 – общий (средний) угол наклона.
При этомугол наклона может зависеть от различных предикторов индивидуального уровня( ), а интерсепт – от предикторов группового уровня ( ).В многоуровневой регрессии предполагается нормальное распределениеостатков внутри каждой группы, то есть учитывается кластеризация элементовпервого уровня (в нашем случае, индивидов) внутри элементов второго (например, стран). Одноуровневая регрессия в данном случае приводит к недооценкестандартных ошибок и, следовательно, к переоценке статистической значимости(ошибка I типа). Кроме того, этот метод позволяет моделировать влияние переменных второго уровня на те или иные характеристики индивидов, а также учи-107тывать межуровневые интеракции.
Таким образом, дисперсия состоит из трех частей: объясненная дисперсия на индивидуальном уровне, на групповом уровне, атакже необъясненная дисперсия.Этот способ учитывает иерархическую (гнездную) структуру данных, когда,например, индивиды проживают в определенной стране, и на их ценности накладывают отпечаток как их индивидуальные особенности, так и характеристикиэтой страны.Многоуровневое регрессионное моделирование с перекрестной классификацией позволяет одновременно учитывать несколько источников группировки,не связанных друг с другом (например, влияние школы и района проживания науспехи учеников) [Snijders, Bosker, 1999 [2012]].