Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 13
Текст из файла (страница 13)
Критерий наименьших квадратов В однофакторной модели каждая переменная считается взвешенной суммой общих и характерных факторов: Х,=Ь,Р+а',и,. Предположим, что вместо Р взята его оценка Р. Поскольку критерий наименьших квадратов определяется оценкой Р, минимизирующей сумму квадратов: ХХ(Х„-Ь,Р)з (48) 1 Э то получаем следующую оценку: л Р=х(вв')-'в. (49) Отличие (49) и (47) состоит в том, что в (49) входят воспроизведенные в модели корреляции ВВ' вместо )г.
Таким образом, регрессионный анализ и критерий наименьших квадратов приводят к одним и тем же оценкам, когда выборочные корреляции совпадают с корреляциями для генеральной совокупности. В противном случае эти оценки дают отличающиеся друг от друга результаты. Критерий Бартлетга Для данного подхода включается в рассмотрение выборочная изменчивость. Если характерную долю дисперсии отнести на счет условных ошибок наблюдений, то лучше уменьшать вес тех переменных, которые имеют большие дисперсии ошибок. Введем следующий критерий: (50) В результате параметры с меньшими общностями получают и меньший вес.
Поэтому для неодинаковых коэффициентов факториых нагрузок оценка шкалы, полученная с помощью критерия Бартлетта, отличается от двух предыдущих: о Р=ХУ-аВ(В У-~В)-~ (51) где у-' — диагональная матрица характерностей. Наличие у-з может рассматриваться как результат взвешивания. НЕСКОЛЬКО ОБШИХ ФАКТОРОВ И ЛОПОЛННТЕЛЬНЫЕ СЛОЖНОСТИ Усложним ситуацию, предположив, что имеются два и более общих фактора. Три рассмотренных критерия можно обобщить для многофакторного случая как для ортогонального, так и для косоугольного решений. Все результаты, полученные для одного фактора, справедливы и для нескольких факторов.
Тем не менее тот факт, что корреляция значения фактора с его оценкой не равна 1, порождает в многомерном случае следующие вопросы: 1) будут ли факторные шкалы ортогональны друг другу, если сами скрытые факторы являются ортогональными; 2) будет ли каждая шкала коррелировать только с соответствующим ей фактором (факторная шкала называется монохроматической, если ее частные коэффициенты корреляции с другими факторами нулевые)г В общем случае всем этим требованиям не удовлетворяет ни одна из оценок. Факторные шкалы будут коррелировать друг с другом, даже если скрытые факторы предполагаются ортогональными; кроме того, корреляции между факторными шкалами не совпадают точно с корреляциями между косоугольными факторами.
Поэтому шкала некоторого фактора будет коррелировать с другими факторами. Однако в частном случае перечисленные требования выполняются, во-первых, когда факторная модель точно соответствует экспериментальным данным и отсутствуют выборочная изменчивость и ошибки измерений и, во-вторых, каждая переменная имеет нагрузку только на один фактор.
Если выполняются эти два условия, каждый фактор или размерность можно рассматривать отдельно, причем задача сводится к однофакторной модели для данных без ошибок. Кроме того, как уже было отмечено, в этих условиях нет неопределенности при выборе критерия для оценки шкал — все они будут эквивалентны. К сожалению, такая идеализированная ситуация практически не осуществима. Тем не менее есть еще и другие условия, когда для некоторых факторных шкал выполняются требования ортогональности и монохроматичности. Если первоначальные факторы (до вращения) были выделены с использованием критерия максимального правдоподобия, регрессионная оценка и оценка Бартлетта для факторных шкал будут ортогональны и монохроматичны.
Правда, ортогональность в скрытой факторной модели проявляется далеко не всегда. К тому же после проведения ортогонального вращения для регрессионной оценки факторных шкал уже не выполняется ни одно из этих свойств, а для оценки Бартлетта остается справедливым только условие монохроматичности, т. е. ни тот, ни другой набор шкал после вращения не будет ортогональным. Эти обстоятельства послужили мотивом появления четвертого критерия для шкалирования, введенного Андерсеном и Рубином (Апбегзоп, КпЬ1п, 1956). Критерий Андерсена — Рубина является модификацией подхода Бартлетта. Мнннмнзируется взвешенная сумма квадратов, используемая в критерии Бартлетта, при условии, что получаемые шкалы ортогональны друг другу. Соответственно, независимо от того, вращаются факторы или нет, критерий дает некоррелированные шкалы.
Тем не менее последние при вращении факторов не являются монохроматнческнми, даже если для выделения первоначальных факторов применяется метод максимального правдоподобия. Выбор метода шкалировамия При выборе метода необходимо проанализировать свойства получаемых шкал. Если рассматривать корреляции между скрытыми факторами и их шкалами, то регрессионный метод предпочтительнее метода Бартлетта, а метод Бартлетта в свою очередь предпочтительнее метода наименьших квадратов. С точки зрения требования монохроматичности оценка шкал по критерию Бартлетта является наилучшей, а если брать свойство ортогональности, то предпочтительнее критерий Андерсона— Рубина.
Однако, так как чаще всего заранее неизвестно, ортогональны ли скрытые факторы, выбирать следует либо регрессионный анализ, либо метод Бартлетта. Надо еще упомянуть некоторые обстоятельства, на которые нужно обратить внимание при выборе критерия. Во-первых, как правило, все введенные шкалы сильно коррелированы, поэтому на практике обоснование предпочтительности того или иного метода имеет лишь академический интерес. Для оценивання шкал хорош любой способ (Ногп, 1965; А!ып, 1973). Во-вторых, выбор метода шкалирования зависит еще и от специфики решаемой задачи. Такер (Тпскег, !971) отмечает, что, если факторные шка- 59 лы используются совместно с какими-то новыми, внешними' переменными, некоторые методы являются более предпочтительными.
Так, он показывает, что шкалирование с помощью регрессионного анализа ие позволяет правильно оценивать корреляции между скрытыми факторами и внешними переменными, в то время как остальные методы это допускают. С другой стороны, если задача состоит только в применении факторных шкал как предикторов для значений внешних переменных, регрессионный критерий является наилучшим. И наконец, надо иметь в виду, что все приведенные выводы относились к случаю, когда модель точно соответствует генеральной совокупности, и расхождения между моделью и экспериментальными данными вызвано лишь случайностью выборки.
Что же произойдет, если такое соответствие нарушится или если факторный анализ будет использоваться лишь в качестве эвристического метода выделения кластеров в экспериментальных данных? Тогда все сказанное выше о сравнении методов может иметь второстепенное значение, а основную роль будут играть какие-то другие, не относящиеся к факторному анализу, соображения. НЕПОЛНЫЕ ФАКТОРНЫЕ ШКАЛЫ Есть причины, по которым имеет смысл рассмотреть шкалы, использующие только часть информации, получаемой из фактор- ного анализа.
Можно предположить, что факторная модель точно соответствует данным для генеральной совокупности, а заданные конкретные значения, получаемые в факторном решении, можно считать обусловленными случайностью выборки. В этом случае, пренебрегая оценками значений факторных нагрузок, разумно учитывать лишь следующее: имеет ли переменная нагрузку на данный фактор или иет. Соответственно оценка значения фактора получается суммированием только тех переменных, которые имеют значительные коэффициенты нагрузки, Остальные переменные с небольшими коэффициентами нагрузки отбрасываются. Такую шкалу будем называть неполной факторной шкалой.
Прн использовании таких шкал следует иметь в виду два обстоятельства: 1) даже если в генеральной совокупности для некоторых переменных факторные нагрузки нулевые в факторном решении, основанном на выборке, они будут отличны от нуля; 2) даже если факторные нагрузки принимают одинаковые значения в генеральной совокупности, их оценки по выборке могут не быть таковыми. На практике часто следуют эмпирическому правилу, по которому факторные нагрузки меньше О,З считаются несущественными. Правомерность применения неполных факторных шкал определяется тем, насколько хорошо выполняются отмеченные пред- * Внешние переменные — переменные, которые не использовались при проведении факторного анализа.
— Примеч. ред. положения. В идеале следует проверять их с помощью конфирматорного факторного анализа. Более того, если после проверки такая простая с1руктура матрицы нагрузок подтверждается, то использование иглюлной факторной шкалы становится совершенно законным. Если все же обнаружены статистически значимые отклонения, необходимо выяснить степень этих отклонений, и в любом случае малые отклонечия от простой структуры можно не учитывать. Существует еще один подход для определения правомерности применения неполных факторных шкал (эти шкалы являются самыми простыми для вычислений, ио основная причина их использования ие в этом).
Часто факторная модель неточно описывает экспериментальные данные: 1) неслучайные ошибки измерений переменных и 2) второстепенные факторы, не представляющие интерес для целей исследования и потому, не учитываемые в модели, могут внести вклад в наблюдаемые корреляции. А это в свою очередь влияет на получаемые значения. Следовательно, есть смысл не считать окончательными конкретные величины, получаемые в результате факторного решения.
Консервативная точка зрения состоит в том, чтобы рассматривать найденные с помощью факторного анализа структуры лишь как гипотезы, отражающие в экспериментальных данных некоторые тенденции к скоплению переменных в кластеры (не более того). На наш взгляд, следует считать, что полученные значения содержат определенную ошибку, и разумно игнорировать некоторый уровень отклонений. Возможны возражения против применения неполных факторных шкал.