Главная » Просмотр файлов » И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 14

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 14 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 142019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 14)

е. ни тот, ни другой набор шкал после вращения не будет ортогональным. Эти обстоятельства послужили мотивом появления четвертого критерия для шкалирования, введенного Андерсеном и Рубином (Апбегзоп, КпЬ1п, 1956). Критерий Андерсена — Рубина является модификацией подхода Бартлетта. Мнннмнзируется взвешенная сумма квадратов, используемая в критерии Бартлетта, при условии, что получаемые шкалы ортогональны друг другу. Соответственно, независимо от того, вращаются факторы или нет, критерий дает некоррелированные шкалы.

Тем не менее последние при вращении факторов не являются монохроматнческнми, даже если для выделения первоначальных факторов применяется метод максимального правдоподобия. Выбор метода шкалировамия При выборе метода необходимо проанализировать свойства получаемых шкал. Если рассматривать корреляции между скрытыми факторами и их шкалами, то регрессионный метод предпочтительнее метода Бартлетта, а метод Бартлетта в свою очередь предпочтительнее метода наименьших квадратов. С точки зрения требования монохроматичности оценка шкал по критерию Бартлетта является наилучшей, а если брать свойство ортогональности, то предпочтительнее критерий Андерсона— Рубина. Однако, так как чаще всего заранее неизвестно, ортогональны ли скрытые факторы, выбирать следует либо регрессионный анализ, либо метод Бартлетта. Надо еще упомянуть некоторые обстоятельства, на которые нужно обратить внимание при выборе критерия.

Во-первых, как правило, все введенные шкалы сильно коррелированы, поэтому на практике обоснование предпочтительности того или иного метода имеет лишь академический интерес. Для оценивання шкал хорош любой способ (Ногп, 1965; А!ып, 1973). Во-вторых, выбор метода шкалирования зависит еще и от специфики решаемой задачи. Такер (Тпскег, !971) отмечает, что, если факторные шка- 59 лы используются совместно с какими-то новыми, внешними' переменными, некоторые методы являются более предпочтительными. Так, он показывает, что шкалирование с помощью регрессионного анализа ие позволяет правильно оценивать корреляции между скрытыми факторами и внешними переменными, в то время как остальные методы это допускают.

С другой стороны, если задача состоит только в применении факторных шкал как предикторов для значений внешних переменных, регрессионный критерий является наилучшим. И наконец, надо иметь в виду, что все приведенные выводы относились к случаю, когда модель точно соответствует генеральной совокупности, и расхождения между моделью и экспериментальными данными вызвано лишь случайностью выборки. Что же произойдет, если такое соответствие нарушится или если факторный анализ будет использоваться лишь в качестве эвристического метода выделения кластеров в экспериментальных данных? Тогда все сказанное выше о сравнении методов может иметь второстепенное значение, а основную роль будут играть какие-то другие, не относящиеся к факторному анализу, соображения.

НЕПОЛНЫЕ ФАКТОРНЫЕ ШКАЛЫ Есть причины, по которым имеет смысл рассмотреть шкалы, использующие только часть информации, получаемой из фактор- ного анализа. Можно предположить, что факторная модель точно соответствует данным для генеральной совокупности, а заданные конкретные значения, получаемые в факторном решении, можно считать обусловленными случайностью выборки. В этом случае, пренебрегая оценками значений факторных нагрузок, разумно учитывать лишь следующее: имеет ли переменная нагрузку на данный фактор или иет. Соответственно оценка значения фактора получается суммированием только тех переменных, которые имеют значительные коэффициенты нагрузки, Остальные переменные с небольшими коэффициентами нагрузки отбрасываются. Такую шкалу будем называть неполной факторной шкалой.

Прн использовании таких шкал следует иметь в виду два обстоятельства: 1) даже если в генеральной совокупности для некоторых переменных факторные нагрузки нулевые в факторном решении, основанном на выборке, они будут отличны от нуля; 2) даже если факторные нагрузки принимают одинаковые значения в генеральной совокупности, их оценки по выборке могут не быть таковыми. На практике часто следуют эмпирическому правилу, по которому факторные нагрузки меньше О,З считаются несущественными.

Правомерность применения неполных факторных шкал определяется тем, насколько хорошо выполняются отмеченные пред- * Внешние переменные — переменные, которые не использовались при проведении факторного анализа. — Примеч. ред. положения. В идеале следует проверять их с помощью конфирматорного факторного анализа. Более того, если после проверки такая простая с1руктура матрицы нагрузок подтверждается, то использование иглюлной факторной шкалы становится совершенно законным. Если все же обнаружены статистически значимые отклонения, необходимо выяснить степень этих отклонений, и в любом случае малые отклонечия от простой структуры можно не учитывать.

Существует еще один подход для определения правомерности применения неполных факторных шкал (эти шкалы являются самыми простыми для вычислений, ио основная причина их использования ие в этом). Часто факторная модель неточно описывает экспериментальные данные: 1) неслучайные ошибки измерений переменных и 2) второстепенные факторы, не представляющие интерес для целей исследования и потому, не учитываемые в модели, могут внести вклад в наблюдаемые корреляции.

А это в свою очередь влияет на получаемые значения. Следовательно, есть смысл не считать окончательными конкретные величины, получаемые в результате факторного решения. Консервативная точка зрения состоит в том, чтобы рассматривать найденные с помощью факторного анализа структуры лишь как гипотезы, отражающие в экспериментальных данных некоторые тенденции к скоплению переменных в кластеры (не более того). На наш взгляд, следует считать, что полученные значения содержат определенную ошибку, и разумно игнорировать некоторый уровень отклонений.

Возможны возражения против применения неполных факторных шкал. Так, можно заметить, что такая комбинация наблюдаемых переменных не является оптимальной, т. е. другое взвешивание переменных может увеличить корреляцию между шкалами и наблюдаемыми переменными. Однако здесь можно воспользоваться тем же доводом, который приводился в пользу простого суммирования: множественный коэффициент корреляции между шкалой (линейной комбинацией наблюдаемых переменных) и всем набором наблюдаемых переменных мало изменяется при небольших отклонениях в весах (Юапд, З(ап!еу, 1970; Юа(пег, 1976).

Здесь следует сделать одно предостережение, о котором уже говорилось в равд. П1. Если известно, что факторная модель точно соответствует данным, нельзя отбрасывать высокие факторные нагрузки (например, порядка 0,9) и приписывать им такое же значение, как и небольшим нагрузкам. Итак, по-видимому, как обычные, так и неполные факторные шкалы имеют право на существование и могут использоваться на практике. ЗНАЧЕНИЯ ГЛАВНЫХ КОМПОНЕНТ Сделаем несколько замечаний по поводу шкал, соответствующих главным компонентам.

Как уже отмечалось, принцип глав- 61 получаются при суммировании зн пропорциональными компонентным Значение компоненты=В ~ (йц/Лг) Х!1 !52) где Ьп — нагрузка на !сю переменную от г-й компоненты; Лг — соответствующее собственное значение. Деление на собственное значение приводит к тому, что значение компоненты будет иметь единичную дисперсию. ПРИМЕЧАНИЕ !. Если скрытая структура является сложной, как, например, для бокспроблены Терстоуна (сн. Иберла, !980), трудно точно восстановить скрытуго структуру из ковариационной матрицы только на основании кзкого-то аналитического критерия. Для этого могут потребоваться аппроксимация гиперплоскостяии н приненение визуальных вращений.

Таблица 12 Результат применыиги конфврматорного еракторного анализа к коррелвционной матрице. представленной иаддиагональными элементами табл. 1 при использовании модели в табл. 7г ' Этя результаты еезучееы е пеыощьщ прееремиы ЫБКЕЬ Пг, е ее СОрдмм. ных компонент отличается от принципа введения факторной модели. Поэтому ни один нз этих подходов не может подменять другой.

На практике применяются оба подхода. В некоторых задачах значения главных компонент могут быть предпочтительнее, чем факторные шкалы, в особенности сели необходимо только сжать информацию, содержащуюся в данных, и факторная структура для этого не нужна. Именно поэтому стоит уделить этому вопросу немного внимания. Как мы уже знаем, главные компоненты являются математическими функциями измеряемых переменных. Таким образом, компоненты можно непосредственно представлять в виде линейной комбинации переменных и говорить о значении компонент, а не об их оценках.

Значения компонент аченнй переменных с весами, нагрузкам: И!. КРАТКИЕ ОТВЕТЫ НА ЧАСТО ВОЗНИКАЮЩИЕ ВОПРОСЫ ПРИРОДА ПЕРЕМЕННЫХ И ИХ ИЗМЕРЕНИЕ а) Какой способ измерений необходим в факторном анализеу В факторном анализе требуется, чтобы переменные измерялись по крайней мере на уровне шкалы интервалов (З(ечепз, 1946). Это требование обусловлено тем, что входной ннформаци. ей для факторного анализа являются элементы ковариацнонной матрицы. Кроме того, представление переменных в виде линейной комбинации скрытых факторов и использование оценок факторов через линейные комбинации наблюдаемых переменных для порядковых переменных невозможны.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6417
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее