Главная » Просмотр файлов » И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 15

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 15 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 152019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 15)

б) Возможно ли использование тау-статистики Кендалла или гамма-статистики Гудмана и Крускала вместо обычных карреляиийу Нет, невозможно. Как уже отмечалось, операции сложения для порядковых переменных не определены, поэтому не существует факторных моделей с порядковыми статистиками. Допускается лишь эвристическое использование таких моделей без статистической интерпретации результатов.

(Существуют некоторые не- метрические методы шкалнрования, специально разработанные для оперирования с нечисловыми переменными.) в) Должен ли исследователь, учитывая данные выше ответьи всегда избегать использования факторного анализа в случаях, когда метризуемость пространства переменных не вполне ясная Не обязательно. Многие переменные, такие, как меры отношений и мнений в социологии, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы.

Тем не менее часто предполагается, что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств. Окончательный ответ на этот вопрос основан на двух моментах: 1) насколько хорошо вспомогательные числовые значения отражают скрытые истинные расстояния и 2) велико ли искажение, вносимое в корреляции между параметрами (являющимися входными данными в факторном анализе) при введении шкалирования. К счастью, коэффициенты корреляции обладают свойством робастности по отношению к порядковым искажениям в измеряемых данных (1аЬоч((з, 1967, 1970; Кпп, 1975).

Поэтому, если искажения корреляций, вносимые при шкалировании порядковых переменных, не слишком велики, вполне законно использовать эти переменные в качестве числовых. Тем не менее следует быть готовыми к появлению пусть даже незначительных, систематических ошибок в факторном решении. г) Расскажите о дихотомических переменньж, Существует мнение, что факторный анализ вполне применим для таких переменных, во-первььх, поскольку при использовании дихотоми- ческих переменных не требуется предположение об измерениях и, во-вторых, поскольку гр Гфи), равное коэффициенту корреляции Пирсона, является адекватной мерой зависимости для факторного анализа. Поэтому, возможно ли применение факторного анализа к матрице значений ез? Нет.

Дихотомические переменные нельзя представить в рамках факторной модели. Действительно, вспомним о предположении, что каждая переменная является взвешенной суммой по крайней мере двух скрытых факторов (одного общего и одного характерного). Даже если эти факторы принимают лишь 2 значения (что вряд ли встретится на практике), наблюдаемая переменная будет принимать уже 4 возможных значения. Следовательно, никакие соображения, кроме чисто эвристических, не могут обосновать применение факторного анализа к днхотомическнм переменным. д) Ответ на предыдущий вопрос озадачивает. Поскольку мы обычно предполагаем факторную модель непрерывной„следует ожидать и непрерывности измеряемых переменных. Однако переменные, с которыми мы имеем дело на практике, часто принимают лишь весьма ограниченный набор значений — да или нет; согласие или несогласие; в лучшем случае — целиком согласен, согласен, безразличен, полностью не согласен и т.

д. Означает ли зто, что мы применяем факторный анализ к данным, которые с ним не согласуются? В некотором смысле — да. Переменные, принимающие ограниченный набор значений, строго говоря, несовместимы с факторной моделью. Если предположить, что наблюдаемые переменные представляют собой результаты неточных измерений или результаты, полученные при объединении в одну группу близких значений, вопрос будет состоять не в том, применима ли факторная модель к данным, а в том, насколько неслучайные ошибки измерений искажают результаты факторного анализа. Группирование близких значений, безусловно, сказывается на корреляциях, но степень этого влияния зависит от законов распределений, шага дескрнтизацин и т.

д. Тем не менее имеются некоторые обнадеживающие соображения по поводу использования факторного анализа как эвристического метода прн наличии больших ошибок измерений (см. следующий вопрос). е) В каких случаях возможно применение факторного анализа к данным, содержащим дихотомические переменные или переменные с конечным множеством значений? В общем случае, чем шире множество значений, тем точнее результаты. В случае дихотомических переменных использование коэффициента гр может быть оправдано, если решается задача нахождения кластеров переменных я если корреляции между исходными переменными невелики*, скажем, не превосходят 0„6 ' Здесь предполагается, что существуют некоторые скрытые переменные, порождаюшие наблюдаемые дяхотомические переменные.

Последние получаются делением интервалов значений зтих скрытых переменных на 2 части.— Лримеч. дед. 64 иии 0,7. При переходе от непрерывных переменных к дихотомн. ческим переменным корреляции уменьшаются. При этом на величину уменьшения влияет выбор точек делении. Если корреляции не очень велики, эффект, связанный с выбором точек деления, не столь значителен. Таким образом, группированне (дихотомнзация) переменных в целом уменьшает корреляции между ними, но не влияет на кластерную структуру данных, поскольку факторный анализ основан на относительной величине корреляций.

Если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа оправдано (Кпп, Х!е, ЧегЬа, 1977). ж) Если отклонения, возникающие в решении из-за введения точек деления более значительны, чем отклонения связанные с уменьшением корреляций при группировании, то почему бы не использовать относительные величины ф/фюах или Й/)х' „вместо фиЮ Такой подход целесообразен только в том случае, когда распределение имеет какую-то особую (негауссову) форму (Сагго(, 1961) или когда непрерывные переменные связаны функцнональ.

ной зависимостью. В последнем случае не нужно применять факторный анализ. Поэтому данный подход нерационален (Кпп, Ь(!е, 'ч'егЬа, 1977). з) Существук.г ли какие-либо более прямые методы реп«ения этих задач2 В литературе предложены два подхода. В каждом нз ннх предполагается, что переменные, принимающие два либо несколько значений, являются индикаторными переменными для скрытых непрерывных переменных, к которым, безусловно, применима факторная модель. Соответственно для нахождения факторной структуры необходимо определить корреляции между скрытыми переменными, Первый путь связан с использованием тетрахорическнх корреляций вместо ф.

Этот подход является эвристичес. кям, поскольку вычисление таких корреляций не всегда возмож. но, н корреляционная матрица может не быть матрнцей Грама (Вос(с, ЫеЬегшап, 1970). Другой подход непосредственно применяет скрытое многомерное распределение вместо вычисления тетрахорическнх корреляций исходя из двумерных таблиц. Данный метод является многообещающим, однако требует чрезмерно боль.

шого объема вычислений даже для современных компьютеров (СЬг!8(о(!егззоп, 1975) *. ИСПОЛЬЗОВАНИЕ КОРРЕЛЯЦИОННЫХ ЛИБО КОВАРИАЦИОННЫХ МАТРИЦ а) Имеет ли значение, какую матрицу использовать — ковариационную или корреляционную2 » Пол»од на основе множественного анализа соответствий описан и кн. М. Жаибю «Иерархический кластер-анализ». — М ° Финансы н статистика, !988. — Примеч ред.

Это зависит: 1) от того, имеются ли сравнимые метрики;в пространстве переменных; 2) от применяемого метода выделении и 3) от того, есть ли необходимость в сравнении одной факторной структуры с другой. Если рассматривается только одна выборка (группа) и используется независимый от масштаба метод выделения, например, такой, как метод максимального правдоподобия, альфа.факторный анализ или анализ образов, то не имеет значения, какой матрицей воспользоваться, при условии, что необходимо идентифицировать соответствующие скрытые размерности (факторы). Если применяется коварнацнонная матрица и единицы измерения в значительной степени неоднородны, факторные шкалы будет сложно интерпретировать. Поэтому в случаях, когда дисперсии переменных существенно отличаются одна от другой и имеются разнородные единицы измерения, разумно использовать корреляционную матрицу.

(Например, один параметр может измеряться в долларах, другой — в количестве лет, а третий — по шкале Ликерта.) Применение корреляционных матриц рекомендуется с практической точки зрения — некоторые компьютерные программы не допускают задания ковариацнонных матриц, и, кроме того, большинство примеров, приведенных в литературе, основано на матрицах корреляций. б) Когда использование ковариационных матриц предпочти. тельнее? Ковариационные матрицы предпочтительнее, когда производится сравнение факторных структур для различных выборок. Дело в том, что корреляционная матрица получается при масштабировании переменных с применением выборочных средних и дисперсий.

По этой причине даже, теоретически инвариантные параметры могут меняться от выборки к выборке. Обсуждение всевозможных осложнений, связанных с введением переменных в стандартной форме, приводится в работах (К1гп, Мпе11ег, 1979), а также (БогЬот апб,)огезйод, 1976). в) Что делать, если задача состоит в сравнении факторных структур для различных выборок, и переменные измеряются в неодинаковых единицах? Один из методов заключается в нормировке переменных, т. е. в приведении нх к стандартной форме, используя средние и дисперсии, вычисленные по совокупности выборок. Затем может быть вычислена ковариационная матрица для каждой выборки в отдельности.

Этот подход отличен от получения корреляционной матрицы по одной выборке, когда переменные в каждой группе преобразуются с использованием частных выборочных средних и дисперсий. КРИТЕРИИ ЗНАЧИМОСТИ И УСТОИЧИВОСТЬ ФАКТОРНЫХ РЕШЕНИИ а) В каких случаях используется метод максимального правдоподобия и связанные с ним критерии значимости, и каков минимальный объем выборки? Чем больше объем выборки, тем точнее уэ-аппроксимация. Лоули и Максвелл (1.ачч!еу апд Махюе11, 1971) считают, что этот критерий применим, когда выборка содержит по крайней мере на 51 наблюдение больше, чем рассматриваемое число переменных.

Другими словами, это условие имеет внд Ф вЂ” п — 1)50, где Ф вЂ” объем выборки, а п — число переменных. Разумеется, это — всего лишь эмпирическое правило, б) Сколько переменных должно приходиться на один гипотетический фактор? Тэрстоун считает, что на один фактор должно приходиться по крайней мере трн переменные. Для конфнрматорного фактор- ного анализа эта пропорция, очевидно, меньше. Исследователи в целом сходятся на том, что переменных должно быть по меньшей мере вдвое больше, чем факторов. Минимальное число переменных для использования критерия значимости приводится в табл. 11 в равд.

Ч1. в) Всегда ли необходимо предположение о многомерной нормальности закона распределения параметров? Сама по себе факторная модель не требует такого предположения. Например, возможно построить факторную модель, в которой факторы принимают значения О и 1. Однако в методе максимального правдоподобия и связанном с ннм критерии значимости предположение о нормальности существенно. В общем случае, последствия нарушения этого допущения не вполне ясны. ДРУГИЕ СТАТИСТИЧЕСКИЕ ВОПРОСЫ а) Что означает знак факторных нагрузок2 Сам по себе знак не имеет внутреннего содержания и не несет информации о зависимости между переменной и фактором. Однако следует сопоставлять между собой знаки для различных переменных прн данном факторе.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6417
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее