Главная » Просмотр файлов » Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 26

Файл №1185345 Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu) 26 страницаКим_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345) страница 262020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 26)

Мы пришли к такому же выводу, когда рассматри- Табанпа 1О Остаточпап дпскрпмкваптпап способность и проаерка апачамостп вали относительное процентное содержание и канонические корреляции. Итак, остающиеся дискриминантные функции (в нашем случае только одна) либо не являются значимыми, либо онн статистически недостоверны. Проверка значимости с помощью Л-статнстикн Уилкса Мы рассматривалн Л-статистику Уилкса как еще одну меру зависимости, но то, что она принимает значения, обратные привычным, и оценивает остаточную днскриминантную способность, делает ее менее полезной, чем относительное процентное содержание н каноническая корреляция.

Однако Л-статистика может быть превращена в тест значимости. Таким образом, мы будем использовать ее скорее как вспомогательную статистику, а не как искомый конечный продукт. На основе Л-статистики Уилкса можно получить тест значимости, аппроксимируя распределение некоторой функции от нее либо распределением хи-квадрат (дт), либо Р-распределеннемте. В дальнейшем можно пользоваться стандартными таблицами для этих распределений, чтобы определить уровень значимости, анекоторые компьютерные программы позволяют распечатать его точные значения. Если воспользоваться формулой и+а'1 Х =- ~'-( —,) -1~ 1.Л,, (Н) то полученное распределение н будет хи-квадрат распределением с (р — А)(д — л — 1) степенямн свободы. В табл.

1О приведены значения статистики хи-квадрат для данных примера о голосовании". Как мы и предвидели, между позициями групп есть значимые различия еще до вычисления какой- либо нз дискриминантных функций (й=0). Уровень значимости 0,001 показывает, что если в действительности между центроидами нет различий, то такое нлн большее значение статистики хиквадрат мы получим только в одной из тысячи выборок (имеются в виду независимые, простые случайные выборки).

Отбрасывая это невероятное событие, мы можем уверенно считать, что результаты получены нз генеральной совокупности с различиями между 11О группами. Кроме того, это доказывает, что наша первая функция статистически значима. После определения первой функции, снова проверим значимость оставшихся различий. Как и следовало ожидать, значение статистики хи-квадрат стало меньше, а уровень значимости стал равным 0,224 (й 1). Большинство исследователей будут считать этот результат незначимым, поэтому определять вторую и третью функции не следует, полагая таким образом, что вся значимая информация о различиях групп уже извлечена, Другими словами, одного-единственного измерения достаточно для представления всех замеченных различий между группами.

Второе измерение (которое вместе с первым обрадует плоскость) не добавит никаких существенных различий. Но если бы вместо этого была установлена значимость остаточной дискриминантной способности, то мы приступили бы к определению второй функции. Затем проверка значимости для новой остаточной дискриминаитной способности была бы повторена (й=2). В нашем примере уровень значимости так велик (0,954), что никто не посчитал бы оставшиеся различия значимыми. Следовательно, нет абсолютно никакой необходимости нычислять третью функцию, так как она вряд ли что-либо добавит к объяснению различий между группами. Найденный результат помогает понять, почему у нас было так много трудностей при интерпретации структурных коэффициентов функции 3 и почему не было обнаружено больших различий между центроидами групп по этой функции. В рассматриваемом примере число статистически значимых функций меньше того, которое допускается математикой Одечако так бывает не всегда.

Во многих ситуациях остаточная дискриминантная способность для й=д — 1* оказывается значимой. В таком случае нужно вычислить все возможные функции (вплоть до й=й — 1), если, конечно, нет других причин не делать этого (таких, ~например, как низкая каноническая корреляция). Примем разумное решение — продолжить определение функций до тех пор, пока остаточная дискриминантная способность перестанет быть значимой. Таким образом, мы можем быть уверены в том, что полученные функции являются статистически значимыми в целом каксистема.

Это не доказывает значимость какой-либо одной функции (если, конечно, она ие была получена специально), а скорее дает значимость всех полученных функций. А поскольку мы используем функции как систему и наша цель — привести информацию, необходимую для разделения, к наименьшему числу размерностей, то этого вполне достаточно, Единственная реальная проблема, которая может быстро уничтожить любой исследовательский проект, возникает, если общее количество информации является незначимым, т. е. при я=б (если только не нужно показать, что между классами нет различий). ' Более точно е=оч1о (я — 1, р).

— Примеч. ред, Здесь мы рассмотрели все то, что обычно делает исследователь, но для лучшего усвоения — в обратном порядке. Логически исследователь должен начать с вопроса: «Какая из моих функций является статистически и реально значимой?» Нет необходимости продолжать анализ любой функции, исключенной из рассмотрения. Для выбранных функций исследователь должен сочетать рассмотрение структурных коэффициентов с определением положений центроидов классов, чтобы выявить значение каждой функции. Структурные коэффициенты дают, кроме того, информацию о том, как каждая из переменных участвует в различении классов в этой системе координат.

В некоторых исследованиях работа аналитика заканчивается вместе с окончанием интерпретации канонических дискриминантных функций. Более вероятно, исследователь продолжит классификацию объектов — либо для практических, либо для аналитических целей, что и является темой следующего раздела. !7. ПРОЦЕДУРЫ КЛАССИФИКАЦИИ Как уже было сказано, целью дискриминантного анализа является решение двух задач: интерпретации н классификации. До снх пор внимание фокусировалось в основном на задаче интерпретации, которая связана с определением числа н значимости канонических дискрнмннантных функций и с выяснением их значении для объяснения различий между классами.

Классификация — это особый внд деятельности исследователя, в котором либо дискриминантные переменные, либо канонические дискримннантные функции используются для предсказания класса, к которому более вероятно принадлежит некоторый объект. Существует несколько процедур классификация„но все онн сравнивают положение объекта с каждым нз центроидов классов, чтобы найти «ближайший». Например, целью исследования Бардес было сформировать подпространство, определяемое канонической дискриминавтной функцией, используя данные о 19 сенаторах и выделенных фракциях. Затем она, воспользовавшись результатами их голосования, вычислила значения дискриминантной функции для позиций остальных сенаторов и смогла отнести позицию каждого сенатора к одной из четырех групп.

Таким образом, она определила размеры н состав фракций и выяснила, как они изменяются со временем. КЛАССИФИЦИРУЮЩИЕ ФУИКЦИИ Классификация — это процесс, который помогает исследователю принять решение: указанный объект «прннадлежит к» нли «очень похож на» данную группу (класс). Такое решение принимается на основе информации, содержащейся в днскримннантных переменных. Существует несколько способов проведения классификация. Обычно они требуют определения понятия «расстояния» !!2 между объектом и каждым центроидом группы, чтобы можно было п иписать объект к «ближайшей» группе.

Р роцедуры классификации могут использовать или самими днскриминантные переменные, илн канонические дискриминантные функции. В первом случае днскриминантный анализ вовсе не проводится". Здесь просто применяется подход максимизации различий между классами для получения функции классификации. Различение классов или размерность дискрнминантного пространства ~на значимость не проверяется. Если же сначала определяются канонические днскриминантные функции н классификация проводится с их помощью, можно провести более глубокий анализ.

К этому мы вернемся позднее, а сейчас продолжим рассмотрение классификации, когда дискриминантные переменные используются непосредственно. Простые классифицированные функции Фишер (1936) был первым, кто предположил, что классификация должна проводиться с помощью линейной комбинации дискрнминантных переменных. Он предложил применять линейную комбинацию, которая макснмизирует различия между классами, но минимизирует дисперсию внутри классов.

Разработка его предложения приводит нас к определению особой линейной комбинации для каждого класса, которая называется «классифицирующая функция»'. Она имеет следующий вид: йд=йдо+Ьд1Х1+ЬдзХа+ "'+ЬдрХр (12) где Ьд — значение функции для класса й, а Ьд,— коэффициенты, которые необходимо определить. Объект относится к классу с наибольшим значением (наибольшим Ь). Коэффициенты для классифицирующих функций определяются с помощью таких вычислений: Ьд,= (п -д) 2, а„Х,д (1З) где Ьд, — коэффициент для переменной 1 в выражении, соответствующему классу )г, а а„— элемент матрицы, обратной к внутри- групповой матрице сумм попарных произведений (ртз.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6439
Авторов
на СтудИзбе
306
Средний доход
с одного платного файла
Обучение Подробнее