Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 15
Текст из файла (страница 15)
ной зависимостью. В последнем случае не нужно применять факторный анализ. Поэтому данный подход нерационален (Кпп, Ь(!е, 'ч'егЬа, 1977). з) Существук.г ли какие-либо более прямые методы реп«ения этих задач2 В литературе предложены два подхода. В каждом нз ннх предполагается, что переменные, принимающие два либо несколько значений, являются индикаторными переменными для скрытых непрерывных переменных, к которым, безусловно, применима факторная модель. Соответственно для нахождения факторной структуры необходимо определить корреляции между скрытыми переменными, Первый путь связан с использованием тетрахорическнх корреляций вместо ф. Этот подход является эвристичес.
кям, поскольку вычисление таких корреляций не всегда возмож. но, н корреляционная матрица может не быть матрнцей Грама (Вос(с, ЫеЬегшап, 1970). Другой подход непосредственно применяет скрытое многомерное распределение вместо вычисления тетрахорическнх корреляций исходя из двумерных таблиц. Данный метод является многообещающим, однако требует чрезмерно боль. шого объема вычислений даже для современных компьютеров (СЬг!8(о(!егззоп, 1975) *. ИСПОЛЬЗОВАНИЕ КОРРЕЛЯЦИОННЫХ ЛИБО КОВАРИАЦИОННЫХ МАТРИЦ а) Имеет ли значение, какую матрицу использовать — ковариационную или корреляционную2 » Пол»од на основе множественного анализа соответствий описан и кн. М. Жаибю «Иерархический кластер-анализ». — М ° Финансы н статистика, !988. — Примеч ред. Это зависит: 1) от того, имеются ли сравнимые метрики;в пространстве переменных; 2) от применяемого метода выделении и 3) от того, есть ли необходимость в сравнении одной факторной структуры с другой.
Если рассматривается только одна выборка (группа) и используется независимый от масштаба метод выделения, например, такой, как метод максимального правдоподобия, альфа.факторный анализ или анализ образов, то не имеет значения, какой матрицей воспользоваться, при условии, что необходимо идентифицировать соответствующие скрытые размерности (факторы).
Если применяется коварнацнонная матрица и единицы измерения в значительной степени неоднородны, факторные шкалы будет сложно интерпретировать. Поэтому в случаях, когда дисперсии переменных существенно отличаются одна от другой и имеются разнородные единицы измерения, разумно использовать корреляционную матрицу. (Например, один параметр может измеряться в долларах, другой — в количестве лет, а третий — по шкале Ликерта.) Применение корреляционных матриц рекомендуется с практической точки зрения — некоторые компьютерные программы не допускают задания ковариацнонных матриц, и, кроме того, большинство примеров, приведенных в литературе, основано на матрицах корреляций.
б) Когда использование ковариационных матриц предпочти. тельнее? Ковариационные матрицы предпочтительнее, когда производится сравнение факторных структур для различных выборок. Дело в том, что корреляционная матрица получается при масштабировании переменных с применением выборочных средних и дисперсий. По этой причине даже, теоретически инвариантные параметры могут меняться от выборки к выборке. Обсуждение всевозможных осложнений, связанных с введением переменных в стандартной форме, приводится в работах (К1гп, Мпе11ег, 1979), а также (БогЬот апб,)огезйод, 1976). в) Что делать, если задача состоит в сравнении факторных структур для различных выборок, и переменные измеряются в неодинаковых единицах? Один из методов заключается в нормировке переменных, т. е.
в приведении нх к стандартной форме, используя средние и дисперсии, вычисленные по совокупности выборок. Затем может быть вычислена ковариационная матрица для каждой выборки в отдельности. Этот подход отличен от получения корреляционной матрицы по одной выборке, когда переменные в каждой группе преобразуются с использованием частных выборочных средних и дисперсий. КРИТЕРИИ ЗНАЧИМОСТИ И УСТОИЧИВОСТЬ ФАКТОРНЫХ РЕШЕНИИ а) В каких случаях используется метод максимального правдоподобия и связанные с ним критерии значимости, и каков минимальный объем выборки? Чем больше объем выборки, тем точнее уэ-аппроксимация. Лоули и Максвелл (1.ачч!еу апд Махюе11, 1971) считают, что этот критерий применим, когда выборка содержит по крайней мере на 51 наблюдение больше, чем рассматриваемое число переменных.
Другими словами, это условие имеет внд Ф вЂ” п — 1)50, где Ф вЂ” объем выборки, а п — число переменных. Разумеется, это — всего лишь эмпирическое правило, б) Сколько переменных должно приходиться на один гипотетический фактор? Тэрстоун считает, что на один фактор должно приходиться по крайней мере трн переменные. Для конфнрматорного фактор- ного анализа эта пропорция, очевидно, меньше. Исследователи в целом сходятся на том, что переменных должно быть по меньшей мере вдвое больше, чем факторов. Минимальное число переменных для использования критерия значимости приводится в табл.
11 в равд. Ч1. в) Всегда ли необходимо предположение о многомерной нормальности закона распределения параметров? Сама по себе факторная модель не требует такого предположения. Например, возможно построить факторную модель, в которой факторы принимают значения О и 1. Однако в методе максимального правдоподобия и связанном с ннм критерии значимости предположение о нормальности существенно. В общем случае, последствия нарушения этого допущения не вполне ясны. ДРУГИЕ СТАТИСТИЧЕСКИЕ ВОПРОСЫ а) Что означает знак факторных нагрузок2 Сам по себе знак не имеет внутреннего содержания и не несет информации о зависимости между переменной и фактором.
Однако следует сопоставлять между собой знаки для различных переменных прн данном факторе. Разумно перед применением факторного анализа так задать переменные, чтобы знаки коэффициентов нагрузок на данный фактор были одинаковы. б) Что означают собственные значения, связанные с факторами, полученными после враи1ения? Какова роль доли дисперсии, воспроизводимой каким-либо из этих факторов? Собственные значения, связанные с факторами до вращения, не совпадают с соответствующими величинами для вращаемых факторов; неизменна только сумма собственных значений.
В первоначальном факторном решении величина собственного значения несет информацию об относительной важности каждого фактора. Для факторного решения после вращения это свойство не сохраняется. Поскольку в результате вращепия определяются совсем другие факторы, не важно, какую долю дисперсии воспроизводит каждый из них. в) Возможно ли в факторном анализе, используя зависимости между факторными шкалами, получить факторное решение более чвысокого» порядка? Нет. Корреляции между факторными шкалами не совпадают с корреляциями между скрытыми факторами. Для получения факторных решений более высокого порядка следует применять корреляционную матрицу, полученную в результате косоугольного вращения. г) Можно ли утверждать, что скрытая факторная структура является ортогональной, если экспериментальные данные не противоречат такому решению? Нет.
Ортогональность вносится исследователем. Однако если ортогональность проявляется после косоугольных вращений илн если графическое представление показывает, что скопления пе. ременных составляют прямые углы, то свойство ортогональности, по-видимому, присуще скрытой структуре. д) Можно ли включать в анализ переменные, некоторые из которых являются причиннгями для других2 Иначе говоря, необходимо ли, чтобы все переменные были на одном уровне причинности2 В общем случае, переменные не должны быть причинными для других. В факторной модели предполагается, что все наблюдаемые переменные являются функциями скрытых факторов. Однако при достаточном опыте можно применять факторный анализ к причинным системам с более сложной структурой (8!(псЬсотЬе, 1971).
специдльнАя литеРАтуРА и кОмпьютеРные НРОГРАммы а) Есть ли книги или статьи по факторному анализу, доступные начинающим? По-видимому, нет. Большинство публикаций требует опреде- ленной технической подготовки. Вот наиболее простые работы: (Кпппле1, 1967; БсЬпевв!ег, 1971; Са(!е11, 1952; Сотгеу, 1973; РгпсЬ(ег, 1954). б) Какие книги предназначены для последующего, более глубокого изучения2 (Нагтап, 1976; Мп!ай, 1972; Еаъ1еу апб Махше!1, 1971). в) В каких журналах регулярно публикуются работы по фак- торному анализу? РвусЬогпе1гйа; Вг!1!вЬ бопгпа! о( Ма(Ьета(!са! апд 8(а!!в(1са! РвусЬо1оау; Ебпса1!опа! апй РвусЬо1од!са! Меавпгегпеп1. г) Какие существуют пакеты прикладных программ, содер- жащие программы по факторному анализу? 8Р85; 051)х15; ЯА8; ВМО. д) Есть ли какие-либо спеииализированньче программен для задач факторного анализа? Е!1!1е ЛВу, Маги 17 (Ка!вег, 1974); Со!аппп (ЯогЬот, Догевйод, 19?6), е) Где можно прочесть об основньчх результатах по модели- рованию2 Тпсйег, Кооршап; 1.!пп (1969); Вгожпе (1968); 1.!пп (1968); Накса!1ап (1971); На(гв!1ап апб АЬе!1 (1974).