Диссертация (1136792), страница 15
Текст из файла (страница 15)
Он основан на методе корреляций и линейной регрессии, что обеспечиваетего простоту в использовании, хотя и усложняет работу с не-интервальнымипеременными, к примеру, основанными на шкале Ликерта (см. Hoyle 2000).Конфирматорный факторный анализ используется для изучения связи наблюдаемых переменных (заданных вопросов) с латентными конструктами. Приэтом данные конструкты должны быть теоретически обоснованы, т.е. проверяемая факторная структура предзадается самим исследователем.Положения, на которых основан метод, не отличаются от основных положений IRT:72 Локальная независимость: связь между наблюдаемыми переменнымиобъясняется только их общей взаимосвязью с латентным конструктом; Одномерность: каждый из вопросов замеряет только одну характеристику,то есть коррелирует только с одним латентным фактором.
При этом, в отличие отдругих методов, конфирматорный факторный анализ позволяет учитывать корреляцию между необъясненной частью вариаций наблюдаемых переменных, такимобразом принимая во внимание возможные общие «третьи переменные».Важной особенностью конфирматорного факторного анализа являетсяпредположение о том, что все латентные конструкты взаимосвязаны, то есть автоматически учитывается корреляция между создаваемыми факторами. Это позволяет получить более реалистичную модель факторной структуры, т.к. вбольшинстве случаев даже на теоретическом уровне создаваемые факторы не независимы друг от друга.Главной слабостью метода является некоторая вероятность вывода ненастоящих факторов: кластеризация данных на разных уровнях может «обмануть» этот метод, так что он выделит несколько факторов для разных уровнейвместо одного общего (Cuc, Griffin 2007).
Кроме того, как и КТТ, факторныйанализ не позволяет выделить «тестовый балл» и объединить в одно измерениеспособности индивида и качество вопросов, на что способна современная теория тестов (Griffin 2005). При этом для рутинных задач одноуровневого анализас целью создания индексов для дальнейшего включения их в модели, слабостиконфирматорного анализа не создают серьезной проблемы.Конфирматорный факторный анализ традиционно используется для конструирования социально-психологических шкал ценностей (Schwartz, Boehnke2004), уверенности учащихся в свои силах (Marsh, Hocevar 1985), академической мотивации (Cokley et.al. 2001) и пр.Как показывают эмпирические исследования, при стандартных условияхфакторный анализ работает так же хорошо, как и IRT (см.
Geramipour et.al. 2012).Создаваемые с помощью данных двух методов показатели при включении в дальнейший анализ ведут себя практически одинаково. В задачи данной работы не73входит психометрический анализ социально-психологических шкал, включенныхв модели.
Поэтому для создания этих шкал кажется достаточным применениеконфирматорного факторного анализа – метода более простого, чем IRT, но неменее эффективного для задач исследования.§4Статистические методы, применяемые для оценки влияния со-циального окружения на успехи и планы школьниковАнализ проводится с помощью трех статистических методов: линейной(OLS) и логистической регрессий, многоуровневого моделирования (HLM) и моделирования структурными уравнениями (SEM).
Одноуровневая регрессия применяется для демонстрации базовых эффектов социально-экономического статуса семьии происхождения учащегося на его успеваемость и образовательные планы.Многоуровневое моделирование необходимо для выявления влияния среды(друзей, одноклассников, школы), т.к. она представляет собой более высокийуровень, чем сам ученик, взятый за единицу анализа. Важнейшей аналитическойвозможностью, которую предоставляет многоуровневое моделирование, является проверка межуровневых интерактивных эффектов.В работе используется два типа моделей: двухуровневые «вложенные» модели (2 level nested model) и двухуровневые не вложенные модели (2 level crossclassified models).Модели первого вида используют для того, чтобы учесть единицы анализадвух уровней, в данном случае – индивид (1 уровень) и класс либо школа (2 уровень).
Так как индивиды учатся внутри классов и школ, их иерархия считаетсявложенной (nested). В среднем в каждом классе обучается больше 20 учеников,но в одной параллели редко бывает больше двух классов. Поэтому возможноприменять двухуровневое, но не трехуровневое моделирование: соотношениеединиц второго и третьего уровня (класс и школа) не соответствует даже самымминимальным требованиям в 5 к 1.74Невложенное моделирование применяется для того, чтобы учесть не только вертикальную иерархию, но и горизонтальные отношения между единицамианализа.
В данном случае данный метод используется для измерения влиянияуспеваемости друзей и средней успеваемости в школе/классе на уверенность индивида в своих силах. С одной стороны, данные имеют иерархическую структуру и упорядочены от индивидуального уровня – учащийся – до уровня классалибо школы. С другой стороны, нужно учитывать влияние друзей, которые находятся с индивидом на одном уровне иерархии (индивидуальном), то есть немогут быть включены в иерархическую модель. Модель специфицируется такжекак невложенная, то есть учитывающая связи между единицами анализа одногоуровня. Подобный метод также используется для анализа геоданных, где важноучитывать взаимное расположение зданий / городов и т.п. Такой анализ позволяет проводить программа MLwiN.В рамках данного исследования были выделены следующие уровни анализа (в порядке убывания):Школа (45 кейсов);Класс (187 кейсов);Друзья (2082 эго-сетей);Индивид (2082 индивидов).При этом друзья специфицируются как кросс-классификация, а не как иерархия.Моделирование структурными уравнениями (structural equation modeling,здесь и далее сокращенно SEM) применяется для определения факторовмедиаторов, опосредующих эффекты экзогенных факторов социального происхождения на достижения учащихся.
Этот метод позволяет определять путивлияния включенных в анализ факторов на зависимую переменную. SEM позволяет изучать эффекты медиации, а также устанавливать условную каузальностьсвязей. В данном исследовании метод был выбран для проверки медиирующейроли социально-психологических установок для достижений и планов учеников.75Следует помнить, что SEM – исключительно конфирматорная методика, ееприменяют для того, чтобы проверить, подходит ли для описания данных теоретическая модель, выведенная на основе опыта предыдущих исследований / теоретическихпредположений.Этотметоднепредназначендляпоисканаправления связей между переменными, он дает возможность только проверитьзаранее предполагаемые связи и их заранее установленное направление.
Следовательно, направление влияния в первую очередь устанавливается самим исследователем в соответствии с его теоретическими предположениями. Поэтомукаузальность связи остается не опровергнутой, но и не подтвержденной: для этого необходим лонгитюдный дизайн исследования либо включение инструментальных переменных.SEM основан на частной корреляции (partial correlation) – мере линейнойсвязи двух переменных при фиксированном значении других. Так как во многихсовременных исследованиях, включая данное, в анализе задействовано множество переменных разного типа, не только интервальные, применение Пирсоновских корреляций для построения моделей SEM некорректно. Для таких случаеврекомендуется обращаться к семейству полихорических корреляций.В основе этой группы корреляций лежит предположение, что данные, которые отражает неинтервальная переменная, на самом деле непрерывны и нормально распределены15.
Именно эти корреляции лежат в основе анализа SEM вданном исследовании. В эту группу входит набор корреляций для каждого извозможных сочетаний типов переменных: Тетрахорическая корреляция – для двух дихотомических переменных; Полихорическая корреляция – обобщение тетрахорической корреляции,применимое к двум категориальным переменным, имеющим не менее двухуровней каждая; Бисериальная корреляция – для интервальной и дихотомической переменной;15Полихорические корреляции изобрел U.Olsson, см. Olsson U. Maximum likelihood of the polychoric correlation coefficient // Psychometrika.
– 1979. – 44. – Р. 443–460.76 Полисериальная корреляция – для сочетания интервальной и категориальной переменной, имеющей более трех уровней.Метод SEM относится к баейсовской статистике, для его успешного применения необходимо соблюсти целый ряд требований. В данной работе они небудут рассматриваться подробно, так как она носит не методологический характер. Далее будут кратко описаны только основные условия, при которых обращение к SEM и выводы на основе результатов этого анализа могут считатьсякорректными.Достаточная выборка: в случаях, когда методом оценки выбран метод наибольшего правдоподобия (Maximum likelihood), Джексон (Jackson 2003) рекомендует вычислять необходимое количество кейсов по правилу N (количествокейсов)/q (количество параметров в модели).
Идеальное соотношение равно 20/1.200 случаев в большинстве случаев оказываются уже достаточным количествомдля применения SEM, если не строятся слишком сложные модели.Оценка модели: помимо интерпретации полученных коэффициентов необходимо определить, соответствует ли полученная модель целому ряду байесовских критериев, позволяющих выяснить, насколько хорошо выбранная модельописывает данные.
Здесь перечислены критерии, на данный момент считающиеся ключевыми для оценки fit модели, а также пороговые значения для них: Хи-квадрат – показывает, насколько близка проверяемая гипотеза (модель) к нулевой, подразумевающей, что все коэффициенты, факторные нагрузкимодели, вариация факторов и остатков изучаемой модели валидны. Он долженбыть значим (P=<0.05). В случае больших выборок (более 5000 случаев) должензаменяться на скорректированные критерии (Kline 2011, p.201) из-за своей чувствительность к количеству кейсов; BIC (Bayesian Information Criterion) – скорректированный на затраченные степени свободы и объем выборки хи-квадрат.