Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 7
Текст из файла (страница 7)
Соотношение (19) может быть представлено в следующем виде: 2 ~;(ь„) — (ч ь„) з=! 20 ( ) Число факторов г и общности каждой переменной считаются известными в результате решения задачи выделения первоначальных факторов. Поэтому слагаемое, входящее в (20) с отрицательным знаком, является константой, ибо 2 2 ~"', Ь„=Ь, з=1 в случае ортогонального решения. Общей мерой сложности может служить сумма д, всех переменных (21) Использование критерия квиргимакс основано на вращении осей таким образом, чтобы результирующие факторные нагрузки максимизировали д. При этом максимизация д эквивалентна максимизации следующего выражения: и Я= Е ЕЬо (22) так как слагаемое со знаком минус в (21) является константой.
Отсюда и название — квартимакс. На практике, применяя этот критерий, можно достичь простоту интерпретации переменных за счет простоты интерпретации 30 л 2' ь„— ( 2' ь„)' (23) лт Заметим при этом, что выражение где суммирование происходит по номеру параметра 4, не является константой. Общая мера простоты задается критерием в т е З;лЧ Ь„вЂ” Ч (Ч Ь„)т т=! 1 т=! (24) л' известным под названием критерия варимакс. Обычно нормированные факторные нагрузки применяют, чтобы избавиться от не.
желательного влияния на результат вращения переменных с большой общностью, т. е. в выражении (24) квадраты нагрузок Ь„' заменяются на ЬЯЙ,2, а четвертые степени Ь, 4 — иа Ььт4(ига. В табл. 6 представлены результаты применения методов квартимакс и варимакс (с нормированием) к одним и тем же данным. Отметим, что, хотя, алгоритмически метод квартимакс проще, чем варимакс, последний дает лучшее разделение факторов. Эксперименты, проведенные Кайзером (Ка(зег, 1968), пока- Таблица 6 Результаты вращений по методам виримвкс и квиртимлкс, применяемых к фкяториой матрице в табл. 4' Метод враменна варн- макс Метод вра- щение квар- тимакс Перемен- иаа и! иа 1 О, 787 0 7 30 0,595 0,154 0,083 0,306 О,1 33 0,143 0,1 65 0,5 ЗЗ 0,7 80 0,4 92 0,793 0,736 0,602 0,173 0,111 О,З 24 0,167 0,170 0,187 0,539 0,7 83 0,503 Х, х Х! Ха Ха Ха ' В етом примере тенденции выделе.
нив генерального фактора методом ивар. тимакс выражена слабо. 31 факторов. В частности, описание переменной упрощается при уменьшении числа общих факторов, связанных с ней. В то же время описание фактора становится проще, если относительно небольшое число переменных имеют существенные нагрузки на этот фактор, а остальные переменные — нулевые нагрузки. В общем, метод квартимакс имеет тенденцию к выделению генерального фактора. Метод варимакс использует несколько другой критерий, в котором добиваются упрощения описания столбцов факторной матрицы. Вместо дисперсии квадратов нагрузок переменной рассматривается дисперсия квадратов нагрузок фактора.
Индекс сложности и! фактора 1' равен: зывают, что факторная матрица, получаемая с помощью метода вращения варимакс, в большей степени инвариантна по отношению к выбору различных множеств переменных. Учитывая, что критерий квартимакс основан на упрощении описания строк, а критерий варимакс — на упрощении описания столбцов, можно предложить некоторый совместный критерий, введя соответствующие веса. Обобщенный критерий имеет вид аЯ+ рг'=Мах1тпт, (25) где Π— задается соотношением (22), а У вЂ” соотношением (24), умноженным на и для удобства представления и с учетом того, что умножение на константу не влияет на процесс нахождения максимума; а и р — веса. Полученный критерий запишем в форме: 1' П т и ~', ~ Ьо — у 2", ( ~„бц)э/п=Мах1тит, (26) 3=1 1 1 з=1 ~=1 где у=5/(а+~).
Если у=О, то образуется критерий квартимакс, а если у=1, то — варимакс. При уэ г/2 и у=0,5 получаем особые критерии, названные экэимакс и бикваргимакс соответственно. МЕТОДЫ КОСОУГОЛЬНОГО ВРАЩЕНИЯ Косоугольное вращение является более общим, чем ортогональное, так как здесь нет ограничений, связанных с некоррелированностью факторов. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им свойственна, а не привнесена методом вращения. Поскольку косоугольные вращения производятся с учетом корреляций между факторами, существуют многочисленные методы интерпретации результатов факторного анализа.
Так, для объяснения корреляции между факторами в ряде слу. чаев вводят факторы второго и более высокого порядков. Кроме того, существуют два подхода к косоугольному вращению — использование вторичных осей и первичной матрицы факторного отображения. Основные принципы получения простой структуры уже обсуждались, поэтому описание методов будет кратким.
Методы, основанные на введении вторичных осей Обсуждаемые здесь методы основаны на том, что если существуют разделимые скопления точек, определяемые первичными факторами, то они будут иметь почти нулевые проекции на все вторичные оси, за исключением одной, Таким образом, можно определить критерий, называемый квартимин, который аналогичен квартимаксу: 32 (27) гУ= ~.', 2., 'амагм !=! г(г=! где ам и агх — проекции г-го параметра на /-ю и й-ю вторичные оси. Величина гУ будет нулевой, если все параметры имеют нагрузку только на один фактор.
Цель вращения — нахождение та. ких фякторных нагрузок, которые минимизируют /У. Для орта. тональных вращений этот критерий эквивалентен квартимвксу. По аналогии с ортогональным критерием варимакс вводится критерий коварииии. В этом случае минимизируется ковариация квадратов проекций на вторичные оси г г - г г С= ~ (п ~ аг,агг — 2; а„~', агх).
(28) г<г=! 1=1 4=! Модификация эгого критерия основана на нормировании — замене а!!э на аггг//ггг. Применительно к одним и тем же данным критерий ковзримии, как правило, дает меньше косоугольных факторов, чем квартимин. Объединение этих двух критериев при. водит ь обобщенному критерию В = а/у+ 8С/и = в(пппшп, (2с) где а и р — веса, назначаемые для /У и для С сгстветственно. После умножения соотношения (29) на и и групггировки членов, получаем общий критерий облимин г !! г 2 В= ~ (и 2 а';ам- у 2", а;, 2, 'а,г), (30) !<э=! з=! г=! 1 ! где у=й/(а+~).
Этот общий критерий при у=0 переходя! н квартпмин (наибольшая косоугольность), при у=0,5 — в бчквартимин, а при у=1 — в коваримин (наименьшая косоугольность). Вще раз отметим, что, как правило, применяется критерий облимин в нормированной форме, т. е. когда аг„г заменяется на аггг//ггг. Другой критерий, тесно связанный с принципами облимина, но используемый в совершенно другом вычислительном алгоритме, называется критерием бинормамин. В нем заложена идея объективного выбора значения у в соотношении (30).
По сравнению с критерием биквартимин, в котором у=1/2, бниормамин дает лучшие результаты для особо простых или особо сложных данных. Прямой метод облимин Дженрих и Сэмпсон ()епг)сЬ, Ьагпрзоп, 1966) предложили критерий, основанный на упрощении матрицы нагрузок первичных факторов (без использования вторичных осей).
Этот критерий допускает эффективную программную реализацию. Минимизируемая функция имеет вид, аналогичный (30), Отличие только 33 в том, что используются нагрузки первичных факторов, а не на- грузки вторичной структуры. Критерий имеет вид Г г г п 2 и г (7= Х ЕЬ,Ь -г(( Е ЬО Е Ьгь)l г«»=г г-г г (31) Другие методы косоугольного вращения Существует много других методов косоугольного вращения. Мы упомянем некоторые наиболее известные. Критерий облимакс (Заппдегз, 1953) основан на упрощении факториой структуры по принципу увеличения числа значительных и пренебрежимо малых нагрузок за счет остальных коэффициентов структуры, Этот критерий эквивалентен критерию квартнмакс в случае ортогонального вращения, но приводит к решению, отличному от метода квартимнн при использовании его без ограничения, связанного с ортогональностью. Следует отметить еще два метода вращения, Это — метод оргоблик (ог(ЬоЫ(ппе), предложенный Гаррисом и Кайзером (Нзтг(з, Ка(зег, 1964), и метод максплейн (шахр!апе), рассмот.
ренный Каттеллем и Мерлем и позднее Эбеном (СаНе11, Миег1е, 1960; ЕЬеп, 1966). Последний подход принципиально отличается ото всех упомянутых ранее. ВРАЩЕНИЕ С ИСПОЛЬЗОВАНИЕМ ЦЕЛЕВОЙ МАТРИЦЫ Еще один подход к вращению основывается на априорной информации о факторной структуре. Во-первых, можно задать значения нагрузок для каждой переменной, а затем проводить вращения с целью обеспечения минимального отличия полученной матрицы факторной структуры от заданной матрицы (в смысле критерия наименьших квадратов).
При этом можно налагать дополнительные ограничения типа ортогональиости. Этот вид вращения обычно применяется для анализа соответствия двух факторных структур. Во-первых, в качестве целевой матрицы можно использовать где Ьц — элементы матрицы нагрузок первичных факторов. Заметим, что в соотношении (31) по сравнению с (30), член с отрицательным знаком дан с сомножителем 1(п. Как и в традиционном критерии облимин, выбор параметра а регулирует «степень» косоугольности получаемого решения. Вбльшие значения а соответствуют «наиболее» косоугольным решениям, а меньшие отрицательные значения — «наиболее» ортогональным решениям.
В наиболее простом случае однофакторной модели следует положить а=О. Необходимо сделать предостережение о том, что выбор а в прямом критерии облимин отличается от выбора у в (30). Подробно этот аспект рассматривался Харманом (Нагшап, 1975). Таблица 7. некоторые функции от ортогонального решения. Этот подход, известный под названием лромакс-метода косоугольных вращений (Непдг1скзоп, ЦГЫ1е, 1964), основан на том, что ортогональные вращения, как правило, близки к косоугольным.