И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 15
Текст из файла (страница 15)
б) Возможно ли использование тау-статистики Кендалла или гамма-статистики Гудмана и Крускала вместо обычных карреляиийу Нет, невозможно. Как уже отмечалось, операции сложения для порядковых переменных не определены, поэтому не существует факторных моделей с порядковыми статистиками. Допускается лишь эвристическое использование таких моделей без статистической интерпретации результатов.
(Существуют некоторые не- метрические методы шкалнрования, специально разработанные для оперирования с нечисловыми переменными.) в) Должен ли исследователь, учитывая данные выше ответьи всегда избегать использования факторного анализа в случаях, когда метризуемость пространства переменных не вполне ясная Не обязательно. Многие переменные, такие, как меры отношений и мнений в социологии, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы.
Тем не менее часто предполагается, что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств. Окончательный ответ на этот вопрос основан на двух моментах: 1) насколько хорошо вспомогательные числовые значения отражают скрытые истинные расстояния и 2) велико ли искажение, вносимое в корреляции между параметрами (являющимися входными данными в факторном анализе) при введении шкалирования. К счастью, коэффициенты корреляции обладают свойством робастности по отношению к порядковым искажениям в измеряемых данных (1аЬоч((з, 1967, 1970; Кпп, 1975).
Поэтому, если искажения корреляций, вносимые при шкалировании порядковых переменных, не слишком велики, вполне законно использовать эти переменные в качестве числовых. Тем не менее следует быть готовыми к появлению пусть даже незначительных, систематических ошибок в факторном решении. г) Расскажите о дихотомических переменньж, Существует мнение, что факторный анализ вполне применим для таких переменных, во-первььх, поскольку при использовании дихотоми- ческих переменных не требуется предположение об измерениях и, во-вторых, поскольку гр Гфи), равное коэффициенту корреляции Пирсона, является адекватной мерой зависимости для факторного анализа. Поэтому, возможно ли применение факторного анализа к матрице значений ез? Нет.
Дихотомические переменные нельзя представить в рамках факторной модели. Действительно, вспомним о предположении, что каждая переменная является взвешенной суммой по крайней мере двух скрытых факторов (одного общего и одного характерного). Даже если эти факторы принимают лишь 2 значения (что вряд ли встретится на практике), наблюдаемая переменная будет принимать уже 4 возможных значения. Следовательно, никакие соображения, кроме чисто эвристических, не могут обосновать применение факторного анализа к днхотомическнм переменным. д) Ответ на предыдущий вопрос озадачивает. Поскольку мы обычно предполагаем факторную модель непрерывной„следует ожидать и непрерывности измеряемых переменных. Однако переменные, с которыми мы имеем дело на практике, часто принимают лишь весьма ограниченный набор значений — да или нет; согласие или несогласие; в лучшем случае — целиком согласен, согласен, безразличен, полностью не согласен и т.
д. Означает ли зто, что мы применяем факторный анализ к данным, которые с ним не согласуются? В некотором смысле — да. Переменные, принимающие ограниченный набор значений, строго говоря, несовместимы с факторной моделью. Если предположить, что наблюдаемые переменные представляют собой результаты неточных измерений или результаты, полученные при объединении в одну группу близких значений, вопрос будет состоять не в том, применима ли факторная модель к данным, а в том, насколько неслучайные ошибки измерений искажают результаты факторного анализа. Группирование близких значений, безусловно, сказывается на корреляциях, но степень этого влияния зависит от законов распределений, шага дескрнтизацин и т.
д. Тем не менее имеются некоторые обнадеживающие соображения по поводу использования факторного анализа как эвристического метода прн наличии больших ошибок измерений (см. следующий вопрос). е) В каких случаях возможно применение факторного анализа к данным, содержащим дихотомические переменные или переменные с конечным множеством значений? В общем случае, чем шире множество значений, тем точнее результаты. В случае дихотомических переменных использование коэффициента гр может быть оправдано, если решается задача нахождения кластеров переменных я если корреляции между исходными переменными невелики*, скажем, не превосходят 0„6 ' Здесь предполагается, что существуют некоторые скрытые переменные, порождаюшие наблюдаемые дяхотомические переменные.
Последние получаются делением интервалов значений зтих скрытых переменных на 2 части.— Лримеч. дед. 64 иии 0,7. При переходе от непрерывных переменных к дихотомн. ческим переменным корреляции уменьшаются. При этом на величину уменьшения влияет выбор точек делении. Если корреляции не очень велики, эффект, связанный с выбором точек деления, не столь значителен. Таким образом, группированне (дихотомнзация) переменных в целом уменьшает корреляции между ними, но не влияет на кластерную структуру данных, поскольку факторный анализ основан на относительной величине корреляций.
Если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа оправдано (Кпп, Х!е, ЧегЬа, 1977). ж) Если отклонения, возникающие в решении из-за введения точек деления более значительны, чем отклонения связанные с уменьшением корреляций при группировании, то почему бы не использовать относительные величины ф/фюах или Й/)х' „вместо фиЮ Такой подход целесообразен только в том случае, когда распределение имеет какую-то особую (негауссову) форму (Сагго(, 1961) или когда непрерывные переменные связаны функцнональ.
ной зависимостью. В последнем случае не нужно применять факторный анализ. Поэтому данный подход нерационален (Кпп, Ь(!е, 'ч'егЬа, 1977). з) Существук.г ли какие-либо более прямые методы реп«ения этих задач2 В литературе предложены два подхода. В каждом нз ннх предполагается, что переменные, принимающие два либо несколько значений, являются индикаторными переменными для скрытых непрерывных переменных, к которым, безусловно, применима факторная модель. Соответственно для нахождения факторной структуры необходимо определить корреляции между скрытыми переменными, Первый путь связан с использованием тетрахорическнх корреляций вместо ф.
Этот подход является эвристичес. кям, поскольку вычисление таких корреляций не всегда возмож. но, н корреляционная матрица может не быть матрнцей Грама (Вос(с, ЫеЬегшап, 1970). Другой подход непосредственно применяет скрытое многомерное распределение вместо вычисления тетрахорическнх корреляций исходя из двумерных таблиц. Данный метод является многообещающим, однако требует чрезмерно боль.
шого объема вычислений даже для современных компьютеров (СЬг!8(о(!егззоп, 1975) *. ИСПОЛЬЗОВАНИЕ КОРРЕЛЯЦИОННЫХ ЛИБО КОВАРИАЦИОННЫХ МАТРИЦ а) Имеет ли значение, какую матрицу использовать — ковариационную или корреляционную2 » Пол»од на основе множественного анализа соответствий описан и кн. М. Жаибю «Иерархический кластер-анализ». — М ° Финансы н статистика, !988. — Примеч ред.
Это зависит: 1) от того, имеются ли сравнимые метрики;в пространстве переменных; 2) от применяемого метода выделении и 3) от того, есть ли необходимость в сравнении одной факторной структуры с другой. Если рассматривается только одна выборка (группа) и используется независимый от масштаба метод выделения, например, такой, как метод максимального правдоподобия, альфа.факторный анализ или анализ образов, то не имеет значения, какой матрицей воспользоваться, при условии, что необходимо идентифицировать соответствующие скрытые размерности (факторы). Если применяется коварнацнонная матрица и единицы измерения в значительной степени неоднородны, факторные шкалы будет сложно интерпретировать. Поэтому в случаях, когда дисперсии переменных существенно отличаются одна от другой и имеются разнородные единицы измерения, разумно использовать корреляционную матрицу.
(Например, один параметр может измеряться в долларах, другой — в количестве лет, а третий — по шкале Ликерта.) Применение корреляционных матриц рекомендуется с практической точки зрения — некоторые компьютерные программы не допускают задания ковариацнонных матриц, и, кроме того, большинство примеров, приведенных в литературе, основано на матрицах корреляций. б) Когда использование ковариационных матриц предпочти. тельнее? Ковариационные матрицы предпочтительнее, когда производится сравнение факторных структур для различных выборок. Дело в том, что корреляционная матрица получается при масштабировании переменных с применением выборочных средних и дисперсий.
По этой причине даже, теоретически инвариантные параметры могут меняться от выборки к выборке. Обсуждение всевозможных осложнений, связанных с введением переменных в стандартной форме, приводится в работах (К1гп, Мпе11ег, 1979), а также (БогЬот апб,)огезйод, 1976). в) Что делать, если задача состоит в сравнении факторных структур для различных выборок, и переменные измеряются в неодинаковых единицах? Один из методов заключается в нормировке переменных, т. е. в приведении нх к стандартной форме, используя средние и дисперсии, вычисленные по совокупности выборок. Затем может быть вычислена ковариационная матрица для каждой выборки в отдельности.
Этот подход отличен от получения корреляционной матрицы по одной выборке, когда переменные в каждой группе преобразуются с использованием частных выборочных средних и дисперсий. КРИТЕРИИ ЗНАЧИМОСТИ И УСТОИЧИВОСТЬ ФАКТОРНЫХ РЕШЕНИИ а) В каких случаях используется метод максимального правдоподобия и связанные с ним критерии значимости, и каков минимальный объем выборки? Чем больше объем выборки, тем точнее уэ-аппроксимация. Лоули и Максвелл (1.ачч!еу апд Махюе11, 1971) считают, что этот критерий применим, когда выборка содержит по крайней мере на 51 наблюдение больше, чем рассматриваемое число переменных.
Другими словами, это условие имеет внд Ф вЂ” п — 1)50, где Ф вЂ” объем выборки, а п — число переменных. Разумеется, это — всего лишь эмпирическое правило, б) Сколько переменных должно приходиться на один гипотетический фактор? Тэрстоун считает, что на один фактор должно приходиться по крайней мере трн переменные. Для конфнрматорного фактор- ного анализа эта пропорция, очевидно, меньше. Исследователи в целом сходятся на том, что переменных должно быть по меньшей мере вдвое больше, чем факторов. Минимальное число переменных для использования критерия значимости приводится в табл. 11 в равд.
Ч1. в) Всегда ли необходимо предположение о многомерной нормальности закона распределения параметров? Сама по себе факторная модель не требует такого предположения. Например, возможно построить факторную модель, в которой факторы принимают значения О и 1. Однако в методе максимального правдоподобия и связанном с ннм критерии значимости предположение о нормальности существенно. В общем случае, последствия нарушения этого допущения не вполне ясны. ДРУГИЕ СТАТИСТИЧЕСКИЕ ВОПРОСЫ а) Что означает знак факторных нагрузок2 Сам по себе знак не имеет внутреннего содержания и не несет информации о зависимости между переменной и фактором. Однако следует сопоставлять между собой знаки для различных переменных прн данном факторе.