Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu), страница 6
Описание файла
DJVU-файл из архива "Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 6 - страница
Вращение заключается в прове- денни новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в пространстве факторов есть явные скопления (кластеры) точек (переменных), легко отделяемые друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления. Но если такое разделение не очевидно или число факторов велико, графический метод неприменим. Второй подход связан с аналитическими методами. В этом случае выбирается некоторый объективный критерий, которым надо руководствоваться при выполнении вращения. В рамках этого подхода различают два вида вращения в ортогональное и косоугольное. А они в свою очередь имеют многочисленные вариации.
В этом разделе мы остановимся на наиболее известных из них. Третий подход заключается в задании априорной целевой матрицы. Цель вращения — нахождение факторного отображения, наиболее близкого к некоторой заданной матрице. Так как при задании целевой матрицы делаются определенные предположения о факторной структуре, третий подход схож с конфирматорным факторным анализом, в котором проверяются гипотезы о матрице факторного отображения. ГЕОМЕТРИЧЕСКИИ МЕТОД ВРАЩЕНИЯ, ПРОСТАЯ СТРУКТУРА И ВТОРИЧНЫЕ ОСИ Геометрический метод вращения практически неприменим, когда скопления точек трудно разделимы или когда число факторов больше двух, Мы рассматриваем этот подход только потому, что он дает возможность лучше понять аналитический способ вращения, Хорошим введением в геометрический метод служит работа Мьюлейка (Мц!а(к, 1972).
Целью всех вращений является получение наиболее простой факторной структуры. К сожалению, концепция простоты неоднозначна, и поэтому не существует единых формальных критериев. Наиболее полное определение простой структуры дано ' В этом случае исходные переменные рассматриваются как точки в факторном пространстве координаты которых равны нагрузкам на факторы, а размерность определяется числом факторов. — Примеч.
ред. Тэрстоуном (Тпцгз1опе, 1947), но в последнее время уже выяснилось, что не все его критерии формализуются в аналитическом виде. Поскольку Тэрстоун использует понятие гиперплоскости или подпространства, мы остановимся на более простом подходе Мьюлейка (Мц1а1)с, 1972), предполагающем знание лишь элементов теории векторных пространств.
(В определении Мьюлейка через г обозначено число общих факторов, а Р— матрица вторичной структуры, образованная координатами (нагрузками) вторичных факторов, получаемых в результате вращения.) 1) В каждой строке матрицы вторичной структуры У должен быть хотя бы один нулевой элемент. Это предположение является основным в определении простой структуры. 2) Для каждого столбца й матрицы вторичной структуры $' должно существовать подмножество из г линейно-независимых наблюдаемых переменных, корреляции которых с й-м вторичным фактором — нулевые. Данный критерий сводится к тому, что каждый столбец матрицы должен содержать не менее г нулей. 3) У одного из столбцов каждой пары столбцов матрицы У должно быть несколько нулевых коэффициентов (нагрузок) в тех позициях, где для другого столбца онн ненулевые.
Это предположение гарантирует различимость вторичных осей и соответствующих им подпространств размерности г — 1 в пространстве общих факторов, 4) При числе общих факторов больше четырех в каждой паре столбцов должно быть некоторое количество нулевых нагрузок в одних и тех же строках. Данное предположение дает возможность разделить наблюдаемые переменные на отдельные скопления.
5) Для каждой пары столбцов матрицы Р должно быть как можно меньше значительных по величине нагрузок, соответствующих одним и тем же строкам. Это требование обеспечивает минимизацию сложности переменных. Сформулированные критерии основаны на двух соображениях: а) необходимо определить признаки простой структуры и б) необходимо выяснить условия, при которых простая структура выделяется однозначно и объективно. В специальных работах по факторному анализу при обсуждении этого понятия преобладает второе соображение.
Мы же оставим этот вопрос специалистам, и сосредоточим наше внимание на первом. Хотя трудно определить минимальные требования к простой структуре, ио если взять число факторов г и число переменных п, то всегда можно сказать, какая структура наиболее простая. Факторная структура является наипростейшей, когда все переменные имеют факторную сложность, равную 1, т.
е. когда каждая переменная имеет ненулевую нагрузку только на один общий фактор. Если число факторов два и больше, то это означает, что в наиболее простой матрице факторной структуры, во-первых, каждая строка будет содержать только один ненулевой элемент, вовторых, каждый столбец будет иметь несколько нулей и, в-третьих, для каждой пары столбцов нулевые элементы не совпадают. 27 Для реальных данных такая простая структура недостижима. Следовательно, задача состоит в том, чтобы «определить» факторную структуру, которая является самой «близкой» к простой структуре. Здесь специалисты расходятся в определении «простоты» для таких «несовершенных» структур, а также в вычислительных методах решения задачи.
Как уже отмечалось, критерий Тэрстоуна дает эмпирические условия, при которых простая структура определяется однозначно. Одно из них состоит в следующем: для каждого фактора должны существовать по крайней мере три переменные, имеющие на этот фактор значительную нагрузку. Но определение простой структуры никак не зависит от этого эмпирического ограничения, принимаемого при анализе реальных данных. В разведочном факторном анализе исследователь вынужден довольствоваться теми переменными, которыми он располагает, и прежде чем начать интерпретировать факторы, заранее определить, что он понимает под «простой» структурой. Первоначально простую факторную структуру определяли в терминах вторичных осей.
Хотя это понятие не является абсолютно необходимым (так как есть методы косоугольных вращений, где вторичные оси не вводятся), мы остановимся на нем, поскольку в некоторых компьютерных программах для косоугольных вращений введение этих осей предполагается. Заметим, что первичные факторные нагрузки †э не что иное, как проекции переменных на две оси (в случае двухфакторной модели), т. е. нагрузки определяются при опускании перпендикуляров из данной точки на первичные ортогональные оси.
Простая структура получается в том случае, когда все значения переменных лежат на этих осях. В ортогональном случае простая структура задается множеством точек, имеющим ненулевые нагрузки (нулевые проекции) только на один фактор (на одну ось). Проекция будет ненулевой, если угол между скоплениями точек отличен от прямого угла.
При этом следует провести вторичные оси перпендикулярно гиперплоскостям, проходящим через эти скопления, которые сами могут рассматриваться как первичные факторы (для двухфакторной модели гиперплоскость есть прямая; рис. 4). Таким образом, можно предположить, что скопления точек находятся на первичных осях, или же что проекции точек на вторичных осях в нулевые. В нашем примере переменные Хь Хз, Х» имеют нулевые проекции на вторичной оси Рь а переменные Хь' Хм Ха — нулевые проекции на оси Жь Однако не ясно, зачем проводить вторичные оси, вместо того чтобы провести первичные оси прямо через скопления точек. Следует отметить, что метод, основанный на идентификации вторичных осей, при котором они рассматриваются как ортогональные, позволяет более точно определить первичные оси, если число факторов больше двух, а скопления точек не столь явные, как в модельных данных.
Из всего сказанного можно сделать вывод, что основная а~ Рис. 4. Р, н г,— первичные косоугольные факторы; Рб н г",' — соответствующие вторичные оси. Проекции Хь Хт и Ха будут нулевыми на оси га', а проекции Ха, Ха и Ха — на оси Рб цель вращения заключается в нахождении матрицы факторного отображения, наиболее близкой к простейшей идеальной структуре, описанной выше. МЕТОДЫ ОРТОГОНАЛЬНОГО ВРАЩЕНИЯ: КВАРТИМАКС, ВАРИМАКС И ЭКВИМАКС Мы остановимся только на основных принципах каждого метода, так как предполагается„ что читатель будет использовать какую-то готовую компьютерную программу.
В предыдущем разделе описана простейшая структура при заданном числе общих факторов й и числе переменных п. Полезно еще раз повторить некоторые свойства такой матрицы, Поскольку каждая переменная имеет нагрузку только на один фактор, интерпретация переменных не представляет труда.
Но для численного использования зта характеристика степени сложности неудобна. Одной из возможных мер сложности модели является вариация квадрата факторной нагрузки для каждой стро- ки (для каждой переменной). Мы рассматриваем квадрат нагрузок только для того, чтобы избежать осложнений, связанных с учетом знака. Известно, что дисперсия определяется как математическое ожидание квадрата отклонений от среднего, поэтому при фиксированном числе факторов и заданных общностях дисперсия максимальна, если одно из значений квадратов нагрузок равно общности, а все остальные элементы в строке нулевые. Иначе говоря, дисперсия квадратов факторных нагрузок переменной есть мера факторной сложности этой переменной: факторная сложность= — ~, '(Ьо — Ь„)', переменной Г (19) где г — число столбцов факторной матрицы; ܄— факторная нагрузка 1ьго фактора на 1-ю переменную; ܄— среднее значение квадратов факторных нагрузок в 1-й строке.