Главная » Все файлы » Просмотр файлов из архивов » Файлы формата DJVU » И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ, страница 6

DJVU-файл И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ, страница 6 Теория вероятностей и математическая статистика (2675): Книга - 4 семестрИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ: Теория вероятностей и математическая статистика - DJVU, страница 6 (2675)2019-05-09СтудИзба

Описание файла

DJVU-файл из архива "И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр DJVU-файла онлайн

Распознанный текст из DJVU-файла, 6 - страница

Но в анализе образов эти переменные считаются выбранными из бесконечного множества переменных, удовлетворяющих двухфакторной модели. Если бы у нас была возможность наблюдать все переменные этого пространства, средний квадрат образа был бы равен оба(- ности переменной, определяемой в факторном анализе, а средний квадрат антиобраза — характерности. (Подразумевается, что мы имеем дело с нормированными переменными.) Другими словами, квадрат множественного коэффициента корреляции между одной переменной и остальными переменными совокупности равен общности данной переменной.

Образы и антиобразы, определяемые для некоторого набора наблюдаемых переменных, называются соответственно частными образами и частными антиобразами. Хотя частные образы являются только приближением к полным образам, они (частные образы) полностью задаются наблюдаемыми переменными В этом смысле анализ образов в корне отличается от классического факторного анализа, в котором общая часть переменной является линейной комбинацией гипотетических факторов и не может быть явной функцией наблюдаемых переменных. Методика анализа образов предполагает введение матрицы ковариаций частных образов: гг (1г чг) р- г(11 чг ) (17) где )с — корреляционная матрица, а Яг †диагональн матрица, элементами которой являются доли дисперсии каждой переменной, не объясняемые другими параметрами (т.

е. доли дисперсии антиобразов). Получение матрицы (17) сводится, во-первых, к замене диагональных элементов матрицы Я на квадраты мио- жественных коэффициентов корреляции каждой переменной с совокупностью всех остальных переменных, и, во-вторых, к пре. образованию недиагональных элементов для получения матрицы Грама.

Характеристическое уравнение для этой матрицы имеет вид 4)е1 (144 — Л1) =О. 118) Число выделяемых факторов определяется количеством собственных чисел, больших 1, но не для матрицы 1тз, а для матрицы 5-'Ю-4. Обычно число выделяемых таким методом факторов велико — приблизительно половина числа исходных параметров. Кайзер предлагает после соответствующих вращений отбрасывать незначимые и неинтерпретируемые факторы. В табл. 5 даны сравнительные результаты применения анализа образов и альфафакторного анализа. Таблица б Факториые нагрузки, вычисленные с помощью альфа-факториого анализа н анализа образов, для модельной корреляционной матрицы, приведенной в табл.

М ' Общности, полученные с помощью альфа-фактарното анализа, весьма блвзки к нстмннмм общностям; анализ образов дает менее точнме оценки. 1!!. МЕТОДЫ ВРАЩЕНИЯ Как уже отмечалось, на первом этапе анализа определяется минимальное число факторов, адекватно воспроизводящих наблюдаемые корреляции, а также значения общностей каждой переменной. Следующий шаг состоит в нахождении легко интерпретируемых факторов с помощью процедуры вращения, При этом число факторов и значения общностей переменных фиксируются.

Применение методов, рассмотренных в предыдущем разделе, приводит к набору ортогональных факторов, упорядоченных в порядке убывания их значимости. Эти два ограничения являются в некотором смысле, искусственными. Они принимаются, чтобы обеспечить единственность решения.

В результате этих огра- ничений, во-первых, факторная сложность переменных, скорее всего, будет больше единицы, независимо от вида истинной факторной структуры, т. е. переменные будут иметь нагрузки более чем на один фактор; во-вторых, все факторы, за исключением первого, являются биполярными, другими словами, некоторые переменные должны иметь положительную нагрузку на этот фактор, а некоторые— отрицательную.

существуют три различных подхода к проблеме вращения. Первый подход в графическийе. Вращение заключается в прове- денни новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в пространстве факторов есть явные скопления (кластеры) точек (переменных), легко отделяемые друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления.

Но если такое разделение не очевидно или число факторов велико, графический метод неприменим. Второй подход связан с аналитическими методами. В этом случае выбирается некоторый объективный критерий, которым надо руководствоваться при выполнении вращения. В рамках этого подхода различают два вида вращения в ортогональное и косоугольное. А они в свою очередь имеют многочисленные вариации.

В этом разделе мы остановимся на наиболее известных из них. Третий подход заключается в задании априорной целевой матрицы. Цель вращения — нахождение факторного отображения, наиболее близкого к некоторой заданной матрице. Так как при задании целевой матрицы делаются определенные предположения о факторной структуре, третий подход схож с конфирматорным факторным анализом, в котором проверяются гипотезы о матрице факторного отображения. ГЕОМЕТРИЧЕСКИИ МЕТОД ВРАЩЕНИЯ, ПРОСТАЯ СТРУКТУРА И ВТОРИЧНЫЕ ОСИ Геометрический метод вращения практически неприменим, когда скопления точек трудно разделимы или когда число факторов больше двух, Мы рассматриваем этот подход только потому, что он дает возможность лучше понять аналитический способ вращения, Хорошим введением в геометрический метод служит работа Мьюлейка (Мц!а(к, 1972).

Целью всех вращений является получение наиболее простой факторной структуры. К сожалению, концепция простоты неоднозначна, и поэтому не существует единых формальных критериев. Наиболее полное определение простой структуры дано ' В этом случае исходные переменные рассматриваются как точки в факторном пространстве координаты которых равны нагрузкам на факторы, а размерность определяется числом факторов. — Примеч. ред. Тэрстоуном (Тпцгз1опе, 1947), но в последнее время уже выяснилось, что не все его критерии формализуются в аналитическом виде. Поскольку Тэрстоун использует понятие гиперплоскости или подпространства, мы остановимся на более простом подходе Мьюлейка (Мц1а1)с, 1972), предполагающем знание лишь элементов теории векторных пространств.

(В определении Мьюлейка через г обозначено число общих факторов, а Р— матрица вторичной структуры, образованная координатами (нагрузками) вторичных факторов, получаемых в результате вращения.) 1) В каждой строке матрицы вторичной структуры У должен быть хотя бы один нулевой элемент. Это предположение является основным в определении простой структуры. 2) Для каждого столбца й матрицы вторичной структуры $' должно существовать подмножество из г линейно-независимых наблюдаемых переменных, корреляции которых с й-м вторичным фактором — нулевые. Данный критерий сводится к тому, что каждый столбец матрицы должен содержать не менее г нулей.

3) У одного из столбцов каждой пары столбцов матрицы У должно быть несколько нулевых коэффициентов (нагрузок) в тех позициях, где для другого столбца онн ненулевые. Это предположение гарантирует различимость вторичных осей и соответствующих им подпространств размерности г — 1 в пространстве общих факторов, 4) При числе общих факторов больше четырех в каждой паре столбцов должно быть некоторое количество нулевых нагрузок в одних и тех же строках.

Данное предположение дает возможность разделить наблюдаемые переменные на отдельные скопления. 5) Для каждой пары столбцов матрицы Р должно быть как можно меньше значительных по величине нагрузок, соответствующих одним и тем же строкам. Это требование обеспечивает минимизацию сложности переменных.

Сформулированные критерии основаны на двух соображениях: а) необходимо определить признаки простой структуры и б) необходимо выяснить условия, при которых простая структура выделяется однозначно и объективно. В специальных работах по факторному анализу при обсуждении этого понятия преобладает второе соображение. Мы же оставим этот вопрос специалистам, и сосредоточим наше внимание на первом. Хотя трудно определить минимальные требования к простой структуре, ио если взять число факторов г и число переменных п, то всегда можно сказать, какая структура наиболее простая.

Факторная структура является наипростейшей, когда все переменные имеют факторную сложность, равную 1, т. е. когда каждая переменная имеет ненулевую нагрузку только на один общий фактор. Если число факторов два и больше, то это означает, что в наиболее простой матрице факторной структуры, во-первых, каждая строка будет содержать только один ненулевой элемент, вовторых, каждый столбец будет иметь несколько нулей и, в-третьих, для каждой пары столбцов нулевые элементы не совпадают.

27 Для реальных данных такая простая структура недостижима. Следовательно, задача состоит в том, чтобы «определить» факторную структуру, которая является самой «близкой» к простой структуре. Здесь специалисты расходятся в определении «простоты» для таких «несовершенных» структур, а также в вычислительных методах решения задачи. Как уже отмечалось, критерий Тэрстоуна дает эмпирические условия, при которых простая структура определяется однозначно. Одно из них состоит в следующем: для каждого фактора должны существовать по крайней мере три переменные, имеющие на этот фактор значительную нагрузку. Но определение простой структуры никак не зависит от этого эмпирического ограничения, принимаемого при анализе реальных данных.

В разведочном факторном анализе исследователь вынужден довольствоваться теми переменными, которыми он располагает, и прежде чем начать интерпретировать факторы, заранее определить, что он понимает под «простой» структурой. Первоначально простую факторную структуру определяли в терминах вторичных осей. Хотя это понятие не является абсолютно необходимым (так как есть методы косоугольных вращений, где вторичные оси не вводятся), мы остановимся на нем, поскольку в некоторых компьютерных программах для косоугольных вращений введение этих осей предполагается.

Заметим, что первичные факторные нагрузки †э не что иное, как проекции переменных на две оси (в случае двухфакторной модели), т. е. нагрузки определяются при опускании перпендикуляров из данной точки на первичные ортогональные оси. Простая структура получается в том случае, когда все значения переменных лежат на этих осях. В ортогональном случае простая структура задается множеством точек, имеющим ненулевые нагрузки (нулевые проекции) только на один фактор (на одну ось). Проекция будет ненулевой, если угол между скоплениями точек отличен от прямого угла. При этом следует провести вторичные оси перпендикулярно гиперплоскостям, проходящим через эти скопления, которые сами могут рассматриваться как первичные факторы (для двухфакторной модели гиперплоскость есть прямая; рис.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5259
Авторов
на СтудИзбе
421
Средний доход
с одного платного файла
Обучение Подробнее