Главная » Просмотр файлов » И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 25

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 25 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 252019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 25)

103 где 5'тч — внутригрупповые структурные коэффициенты для переменной 1 и функции 7; г'еа — внутригрупповые структурные коэффициенты корреляции между переменными 1 и А; са; — стандартизованные коэффициенты канонической функции для переменной й и функции 1. В табл. 8 представлены внутригрупповые структурные коэффициенты, относящиеся к данным Бардес.

Заметим, что эти коэффициенты меньше, чем описанные выше структурные коэффициенты, однако их расположения от больших к меньшим схожи (хотя н не идентичны). Такое положение является типичным, но не обязательным. Некоторые из внутригрупповых структурных коэффициентов могут быть больше нли меньше, нли иметь противоположный знак по сравнению со структурными коэффициентами. Кроме того, они могут иметь различный порядок расположения.

Эти две последовательности коэффициентов относятся к разным сторонам структуры данных. Поэтому н не следует их интерпретировать одинаково, за исключением тех случаев, когда групповые цеитроиды совпадают: С другой стороны, структурные коэффициенты являются просто двуместными корреляциями, поэтому на них не влияют взаимные зависимости прочих переменных. Заметим, что СБТА)Р имеет небольшой стандартизованный коэффициент по функции 1, но относительно большой полный структурный коэффициент. Возможно, это объясняется сильной корреляцией между переменными С13ТА1Х) и С1)ТА81А)Ч (0,787). Поэтому переменная СБТАЫА)Ч дает большой отрицательный вклад в дискриминантные значения, а переменная СБТА10 — небольшой положительный вклад.

Структурные коэффициенты также помогают распознать вклад переменных А)ЧТ1УБПО и АХТ1ХЕ()Т в функцию 1. Эти две переменные имеют довольно малые структурные коэффициенты, т. е. они мало коррелируют с этой функцией. Функция 1 отличается от той, что мы получаем из стандартизованных коэффициентов, которые довольно велики и имеют противоположные знаки. Переменные АХТ1У(360 и АХТ1ХЕПТ сильно коррелированы (0,767), поэтому они дают большие вклады в противоположные направления и погашают друг друга. Анализ подобных ситуаций приводит нас к выводу, что структурные коэффициенты позволяют лучше интерпретировать канонические и дискримииантные функции, чем стандартизованные коэффициенты.

В работе (Очега1! апб К!е(1, 1972; 292 — 295) описывается, как структурные коэффициенты могут использоваться для графического представления различия между групповыми центроидами в случае двух канонических дискриминантных функций. На графике с осями, которые относятся к этим двум функциям, представлены групповые центроиды и главный центроид, изображены векторы, исходящие из главного центроида и направленные в каждую дискримннантную переменную.

Направляющие углы этих векторов вычисляются, исходя из структурных коэффициентов. Длина вектора определяется межгрупповыми и внутрнгрупповыми вариациями соответствующей переменной. Полученная диаграмма дает наглядное представление о различиях групп с помощью дискриминантных переменных, а также о потенциальных возможностях этих переменных. СКОЛЬКО ФУНКЦИЙ НАДО УЧИТЫВАТЬ В равд. П было показано, что решению уравнения (4) соответствует собственное значение (лямбда) и множество коэффициентов для каждой канонической дискриминантной функции. Число возможных решений общей задачи в действительности равно числу дискриминантных переменных р.

Однако некоторые из них будут математически тривиальными решениями, а другие— статистически малозначимыми. Все собственные значения лямбды будут положительными или равными нулю, причем чем больше значение лямбды, тем больше групп будет разделять соответствующая функция. Таким образом, функция с самым боль- 104 шим собственным значением является и самым мощным дискриминатором, а функция с наименьшим собственным значением— самым слабым дискриминатором. Число функций Предположив, что значение лямбда равно нулю, получим решение уравнения (4), которое не представляет интереса. Такое решение оказывается бесполезным, потому что оно допускает отсутствие различий между группами по этой функции. Однако, когда р меньше (д — 1), мы получаем (р — д+1) решений, которые имеют нулевые собственные значения.

По этой причине максимальное число канонических дискриминантных функций «7 меньше любого из чисел р и (д' 1). Возвращаясь к примеру о голосовании в сенате, имеем р= б, (д — 1) =3, так что «7=3. Среди этих д возможных решений мы все еще можем найти собственные значения, равные нулю. Это бывает в тех вырожденных случаях, когда один или несколько центроидов совпадают в пространстве, определенном другими центроидами.

Более типичен случай не полного совпадения из-за ошибок выборки или ошибок измерения. Скорее всего, такое собственное значение функции будет малой величиной. Вопрос в следующем: как мала должна быть величина собственного значения лямбда, чтобы мы рассматриваля ее как результат ошибки выборки или измерения, а не результат измерения величины, действительно отличной от нуля? Это вопрос о статистической значимости. Но даже если функция статистически значима, мы можем решить, что она не имеет самостоятельного значения, поскольку с ее помощью недостаточно хорошо различаются группы. Прежде чем научиться проверять значимость, рассмотрим собственные значения функции, воспользовавшись примером о голосовании в сенате.

Эти результаты приведены в табл. 9. Как н ожидалось, имеются три собственных значения, не равных нулю. Они даются в порядке убывания их величин. Так обычно делают потому, что величина собственного значения связана с днскриминирующими возможностями этой функции: чем больше собственное значение, тем лучше различение, Располагая нх в порядке убывания, мы знаем, что первая функция обладает наи- Табанца 9 большимн возможностями: Собственные значения, вторая функция обеспечивает соотаетствуюацне фуннцнн, максимальное различение пос- в меры значнмостн отиоситеаеиое ироцеитное соаержа- вне Каиоии- ческаа «орр'иа.

цна Кеиечиаи анскрииниантаи Отикции Соестаениае ана- чеиие О, 952 0,782 0,225 85,54 13,93 0,47 9,65976 1,57922 0,05357 105 ле первой функции; третья дает наилучшее дополнительное различение после первой и второй н т. д. Все функции не обязательно дают идеальное различение, но мы, по крайней мере, знаем их порядок значимости. Относительное процентное содержание Фактические числа, представляющие собственные значения, ни о чем нам не говорят. Их нельзя интерпретировать непосредственно. Если имеется более одной функции, желательно уметь сравнивать их дискримннантные возможности. Так, например, число 9,65976 для собственного значения, соответствующего первой функции, больше собственного значения, соответствующего второй, более чем в шесть раз.

В случае когда первое собственное значение в 180 раз превосходит третье, то это доказывает, что третья функция обладает очень незначительными возможностями. Чтобы облегчить такое сравнение, мы припишем собственным значениям относительное процентное содержание. Для этого сначала суммируем все собственные значения, чтобы установить размер общих возможностей различения.

Затем разделим каждое собственное значение иа общую сумму. Так, в приведенной системе уравнений первая функция содержит 85,549о общих дискриминантных возможностей. Третья функция в этом примере иллюстрирует тот случай, когда она оказывается настолько мало значимой, что, по-видимому, ею можно пренебречь. К сожалению, нет правила, которое помогло бы определить, как велико должно быть относительное процентное содержание, чтобы функция представляла для исследователя интерес. Поэтому при дальнейшем рассмотрении может оказаться, что и функция 2 не удовлетворяет нас.

Даже функция 1 иногда ие имеет реальной значимости (согласно критерию, который рассматривается ниже), хотя она наиболее мощная". Относительное процентное содержание только показывает что функция настолько слабее по сравнению с другими, что вряд ли она добавит что-либо к определению различий между группами. Каноническая корреляция Другой способ оценки реальной полезности дискриминантной функции можно получить, рассматривая коэффициент канонической корреляции, который является мерой связи (степени зависимости между группами н дискриминантной функцией).

Нулевое значение говорит об отсутствии связи, а большие числа (всегда положительные) означают большую степень зависимости (максимальное значение равно 1,О). Каноническая корреляция (обозначаем ее гч) связана с собственным значением следующей форм лой: где 1 — номер соответствующей дискриминантной функции. Понятие канонической корреляции взято из так называемого канонического корреляционного анализа (см. 1 ечте, 1977). Ка- ионическая корреляция используется при изучении связей между двумя различными множествами переменных, измеренных по интервальной шкале.

Анализ заключается в формировании д пар линейных комбинаций, где д — число переменных в меньшем множестве. Линейные комбинации в каждой паре (по одной из каждого множества) подбираются так, чтобы получить максимальную корреляцию между ними. Первая пара имеет самую высокую степень зависимости; вторая пара — следующую по величине степень зависимости при условии, что ее составляющие не коррелируют с первой парой и т. д. Канонический коэффициент корреляции, конечно, является мерой зависимости и идентичен смешанному моменту корреляции Пирсона между двумя линейными комбинациями в паре.

С помощью простого математического «фокуса» мы можем превратить дискримннаитный анализ (по крайней мере, обсуж. даемую часть его) в канонический корреляционный анализ. Очевидно, дискриминантные переменные образуют одно нз «множеств». Тогда, если мы представим классы с помощью (л — 1) дихотомических переменных (известных так же, как «бинарные переменные» или «фиктивные переменные»), то получим другое «множество».

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее