Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 6

Файл №1185345 Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu) 6 страницаКим_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345) страница 62020-08-252020-08-25СтудИзба

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 6)

Вращение заключается в прове- денни новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в пространстве факторов есть явные скопления (кластеры) точек (переменных), легко отделяемые друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления. Но если такое разделение не очевидно или число факторов велико, графический метод неприменим. Второй подход связан с аналитическими методами. В этом случае выбирается некоторый объективный критерий, которым надо руководствоваться при выполнении вращения. В рамках этого подхода различают два вида вращения в ортогональное и косоугольное. А они в свою очередь имеют многочисленные вариации.

В этом разделе мы остановимся на наиболее известных из них. Третий подход заключается в задании априорной целевой матрицы. Цель вращения вЂ” нахождение факторного отображения, наиболее близкого к некоторой заданной матрице. Так как при задании целевой матрицы делаются определенные предположения о факторной структуре, третий подход схож с конфирматорным факторным анализом, в котором проверяются гипотезы о матрице факторного отображения. ГЕОМЕТРИЧЕСКИИ МЕТОД ВРАЩЕНИЯ, ПРОСТАЯ СТРУКТУРА И ВТОРИЧНЫЕ ОСИ Геометрический метод вращения практически неприменим, когда скопления точек трудно разделимы или когда число факторов больше двух, Мы рассматриваем этот подход только потому, что он дает возможность лучше понять аналитический способ вращения, Хорошим введением в геометрический метод служит работа Мьюлейка (Мц!а(к, 1972).

Целью всех вращений является получение наиболее простой факторной структуры. К сожалению, концепция простоты неоднозначна, и поэтому не существует единых формальных критериев. Наиболее полное определение простой структуры дано ' В этом случае исходные переменные рассматриваются как точки в факторном пространстве координаты которых равны нагрузкам на факторы, а размерность определяется числом факторов. вЂ” Примеч.

ред. Тэрстоуном (Тпцгз1опе, 1947), но в последнее время уже выяснилось, что не все его критерии формализуются в аналитическом виде. Поскольку Тэрстоун использует понятие гиперплоскости или подпространства, мы остановимся на более простом подходе Мьюлейка (Мц1а1)с, 1972), предполагающем знание лишь элементов теории векторных пространств.

(В определении Мьюлейка через г обозначено число общих факторов, а Р вЂ” матрица вторичной структуры, образованная координатами (нагрузками) вторичных факторов, получаемых в результате вращения.) 1) В каждой строке матрицы вторичной структуры У должен быть хотя бы один нулевой элемент. Это предположение является основным в определении простой структуры. 2) Для каждого столбца й матрицы вторичной структуры $' должно существовать подмножество из г линейно-независимых наблюдаемых переменных, корреляции которых с й-м вторичным фактором вЂ” нулевые. Данный критерий сводится к тому, что каждый столбец матрицы должен содержать не менее г нулей. 3) У одного из столбцов каждой пары столбцов матрицы У должно быть несколько нулевых коэффициентов (нагрузок) в тех позициях, где для другого столбца онн ненулевые.

Это предположение гарантирует различимость вторичных осей и соответствующих им подпространств размерности г вЂ” 1 в пространстве общих факторов, 4) При числе общих факторов больше четырех в каждой паре столбцов должно быть некоторое количество нулевых нагрузок в одних и тех же строках. Данное предположение дает возможность разделить наблюдаемые переменные на отдельные скопления.

5) Для каждой пары столбцов матрицы Р должно быть как можно меньше значительных по величине нагрузок, соответствующих одним и тем же строкам. Это требование обеспечивает минимизацию сложности переменных. Сформулированные критерии основаны на двух соображениях: а) необходимо определить признаки простой структуры и б) необходимо выяснить условия, при которых простая структура выделяется однозначно и объективно. В специальных работах по факторному анализу при обсуждении этого понятия преобладает второе соображение.

Мы же оставим этот вопрос специалистам, и сосредоточим наше внимание на первом. Хотя трудно определить минимальные требования к простой структуре, ио если взять число факторов г и число переменных п, то всегда можно сказать, какая структура наиболее простая. Факторная структура является наипростейшей, когда все переменные имеют факторную сложность, равную 1, т.

е. когда каждая переменная имеет ненулевую нагрузку только на один общий фактор. Если число факторов два и больше, то это означает, что в наиболее простой матрице факторной структуры, во-первых, каждая строка будет содержать только один ненулевой элемент, вовторых, каждый столбец будет иметь несколько нулей и, в-третьих, для каждой пары столбцов нулевые элементы не совпадают. 27 Для реальных данных такая простая структура недостижима. Следовательно, задача состоит в том, чтобы «определить» факторную структуру, которая является самой «близкой» к простой структуре. Здесь специалисты расходятся в определении «простоты» для таких «несовершенных» структур, а также в вычислительных методах решения задачи.

Как уже отмечалось, критерий Тэрстоуна дает эмпирические условия, при которых простая структура определяется однозначно. Одно из них состоит в следующем: для каждого фактора должны существовать по крайней мере три переменные, имеющие на этот фактор значительную нагрузку. Но определение простой структуры никак не зависит от этого эмпирического ограничения, принимаемого при анализе реальных данных. В разведочном факторном анализе исследователь вынужден довольствоваться теми переменными, которыми он располагает, и прежде чем начать интерпретировать факторы, заранее определить, что он понимает под «простой» структурой. Первоначально простую факторную структуру определяли в терминах вторичных осей.

Хотя это понятие не является абсолютно необходимым (так как есть методы косоугольных вращений, где вторичные оси не вводятся), мы остановимся на нем, поскольку в некоторых компьютерных программах для косоугольных вращений введение этих осей предполагается. Заметим, что первичные факторные нагрузки вЂ э не что иное, как проекции переменных на две оси (в случае двухфакторной модели), т. е. нагрузки определяются при опускании перпендикуляров из данной точки на первичные ортогональные оси.

Простая структура получается в том случае, когда все значения переменных лежат на этих осях. В ортогональном случае простая структура задается множеством точек, имеющим ненулевые нагрузки (нулевые проекции) только на один фактор (на одну ось). Проекция будет ненулевой, если угол между скоплениями точек отличен от прямого угла.

При этом следует провести вторичные оси перпендикулярно гиперплоскостям, проходящим через эти скопления, которые сами могут рассматриваться как первичные факторы (для двухфакторной модели гиперплоскость есть прямая; рис. 4). Таким образом, можно предположить, что скопления точек находятся на первичных осях, или же что проекции точек на вторичных осях в нулевые. В нашем примере переменные Хь Хз, Х» имеют нулевые проекции на вторичной оси Рь а переменные Хь' Хм Ха вЂ” нулевые проекции на оси Жь Однако не ясно, зачем проводить вторичные оси, вместо того чтобы провести первичные оси прямо через скопления точек. Следует отметить, что метод, основанный на идентификации вторичных осей, при котором они рассматриваются как ортогональные, позволяет более точно определить первичные оси, если число факторов больше двух, а скопления точек не столь явные, как в модельных данных.

Из всего сказанного можно сделать вывод, что основная а~ Рис. 4. Р, н г,вЂ” первичные косоугольные факторы; Рб н г",' вЂ” соответствующие вторичные оси. Проекции Хь Хт и Ха будут нулевыми на оси га', а проекции Ха, Ха и Ха вЂ” на оси Рб цель вращения заключается в нахождении матрицы факторного отображения, наиболее близкой к простейшей идеальной структуре, описанной выше. МЕТОДЫ ОРТОГОНАЛЬНОГО ВРАЩЕНИЯ: КВАРТИМАКС, ВАРИМАКС И ЭКВИМАКС Мы остановимся только на основных принципах каждого метода, так как предполагается„ что читатель будет использовать какую-то готовую компьютерную программу.

В предыдущем разделе описана простейшая структура при заданном числе общих факторов й и числе переменных п. Полезно еще раз повторить некоторые свойства такой матрицы, Поскольку каждая переменная имеет нагрузку только на один фактор, интерпретация переменных не представляет труда.

Но для численного использования зта характеристика степени сложности неудобна. Одной из возможных мер сложности модели является вариация квадрата факторной нагрузки для каждой стро- ки (для каждой переменной). Мы рассматриваем квадрат нагрузок только для того, чтобы избежать осложнений, связанных с учетом знака. Известно, что дисперсия определяется как математическое ожидание квадрата отклонений от среднего, поэтому при фиксированном числе факторов и заданных общностях дисперсия максимальна, если одно из значений квадратов нагрузок равно общности, а все остальные элементы в строке нулевые. Иначе говоря, дисперсия квадратов факторных нагрузок переменной есть мера факторной сложности этой переменной: факторная сложность= вЂ” ~, '(Ьо вЂ” Ь„)', переменной Г (19) где г вЂ” число столбцов факторной матрицы; Ь„вЂ” факторная нагрузка 1ьго фактора на 1-ю переменную; Ь„вЂ” среднее значение квадратов факторных нагрузок в 1-й строке.

Характеристики

Тип файла

DJVU-файл

Размер

2,35 Mb

Материал

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Тип материала

Книга

Предмет

(ПМСА) Прикладной многомерный статистический анализ

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов книги

kim_-mjuller-i-dr-faktornyj_-diskriminantnyj-i-klasternyj-analizy.djvu.rar

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.