Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 22

Файл №1185345 Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu) 22 страницаКим_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345) страница 222020-08-252020-08-25СтудИзба

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 22)

Если же центроиды у классов разные, элементы цу будут меньше соответствующих элементов матрицы Т. Эта разница обозначается как матрица В (В=7 вЂ” К, т. е. 80=1О вЂ” Юы). Матрица В называется межгрупповой суммой квадратов отклонений и попарных произведений. Величины элементов В по отношению к величинам элементов %' дают меру различия между группами, как это будет выяснено позже. ла йрп= ~'., ~ (Хм вЂ” Хпо) (Хмм вЂ” Хяо). (3) «=1 т=1 Если элементы матрицы ир разделить на (л.вЂ” д), получится внутригрупповая ковариационная матрица, она является взвешенным средним ковариационных матриц отдельных классов.

Матрицу Ж' или внутригрупповую ковариационную матрицу легко преобразовать во внутрнгрупповую корреляционную матрицу, как это уже сказано по отношению общей корреляционной матрице. Каждый коэффициент корреляции является оценкой степени зависимости между соответствующей парой переменных внутри групп.

Он обычно ие совпадает с общей корреляцией, на величину которой сказываются межгрупповые различия. Если предположить, что наблюдения относятся к одной генеральной совокупности или к разным генеральным совокупностям, имеющим одинаковые статистические свойства, то в качестве оценок зависимостей между переменными предпочтительнее внутригрупповые корреляции, а не общие корреляции. В табл. 3 представлена матрица внутригрупповых корреляций для экспериментальных данных Бардес. Видно, что многие коэффициенты отличаются от значений, приведенных в табл.

2. Это обусловлено разбросом центроидов разных классов. Матрицы ))т и В содержат всю основную информацию о зависимости внутри групп н между группами. С помощью некоторых вычислений можно получить функцию, удовлетворяюшую требуемым свойствам. Во-первых, необходимо решить систему уравнений: льмо;=Лу ХЬмп;=ЛЕшмп; (4) ХЬр~О~=ЛХи>рм си где Л вЂ” собственное число, а о; вЂ” последовательность р коэффициентов.

Как уже говорилось, Ь,; и юя вЂ” элементы матриц В и ))т соответственно, которые получаются при обработке экспериментальных данных. Построение дискриминантной функции сводится к решению уравнений (4) относительно Л н пь Для получения единственно правильного решения дополнительно наложим условие, что сумма квадратов и, должна быть равна 1. Максимально существует д нетривиальных решений этих уравнений.

Каждое решение, которое имеет свое собственное значение Л и свою последовательность оь соответствует одной канонической дискрцминантной функции. Коэффициенты еч могут использоваться как коэффициенты требуемой дискриминантной функции: и;=и;уп. вЂ” л, ио= вЂ” ~ шХ; .. (Я Эти коэффициенты и, и требовалось определить в соотношении (1). Применение и, из (5) приводит величины )х (значения дискриминантной функции) к стандартной форме. Это означает, что соответствующие дискриминантные значения по совокупности наблюдений (объектов) будут иметь нулевое среднее и единичное внутригрупповое стандартное отклонениев. Значение днскриминантной функции для данного объекта представляет положение этого наблюдения на оси, определяемой данной функцией.

КОЭФФИЦИЕНТЫ Р, Решение системы уравнений (4) дает последовательность коэффициентов о, для каждой функции. Эти коэффициенты могли бы быть непосредственно использованы при классификации. Однако их трудно интерпретировать, соответствующие им значения дискриминантной функции не имеют определенного смысла. Причина заключается в том, что данное решение не имеет ограничения по метрике дискриминантного пространства.

Хотя это пространство вводится для обеспечения максимального разделения классов, последние могут располагаться в любой его области. Приведенная ситуация аналогична ситуации, когда игроки в бей- сбол могут находиться в любой точке поля, лишь бы их взаимное расположение не противоречило правилам игры. В некоторых компьютерных программах коэффициенты и, распечатываются и могут использоваться при классификации (см. равд. 1Ъ). Однако более целесообразна их нормировка, задаваемая соотношением (5).

ИЕСТАИЛАРТИЗОВАИИЪ|Е КОЭФФИЦИЕИТЫ Нормировка коэффициентов не меняет ни результат классификации, ни относительное расположение классов. Однако существенно то, что оси занимают более естественное положение, так как начало координат (точка, где проекции всех дискриминантных функций нулевые) совпадает с главным центроидом. Главный центроид, как мы уже говорили, является точкой пространства, в которой все дискриминантные переменные принимают средние (по всем наблюдениям) значения. Другими словами, это вЂ” центральное положение всех точек, представляющих наблюдения. Расположение начала координат в главном центроиде полезно, так как в данном случае рассматриваемые классы и объекты соотносятся с центром системы.

Нормировка коэффициентов влечет за собой и другие изменения. Они касаются единиц измерения расстояний. Нормированные коэффициенты приводят к дискриминаитным значениям, измеряемым в единицах стандартного квадратичного отклонения, т. е. каждая ось растягивается или сжимается таким образом, что соответствующее дискримииантное значение для данного объекта представляет число стандартных отклонений точки от главного центроидат.

Анализируя это значение, можно сразу отличить относительное расстояние от абсолютного н определить, насколько относительное расстояние велико по сравнению с размерами системы. Так, значение в 2,5 означает, что наблюдение располагается на расстоянии двух с половиной стандартных отклонений в отрицательном направлении от центра осей, Поскольку очень небольшое число точек может находиться вне окрестности радиуса, равного двум стандартным отклонениям, становится ясно, что данное наблюдение достаточно далеко отстоит от центра. Способ приведения переменных к стандартной форме зависит от того, нормируются лн исходные значения наблюдений. Если исходные данные иеприведены к стандартной форме, соответствующие им коээффициенты будем называть «нестандартизованиыми». Обозначение и как раз и относится к этим коэффициентам, а соотношение (5) показывает как значение и переходит в значение и.

(Стандартизованные коэффициенты будут рассмотрены в следующем разделе.) Обычно нестаидартизованные коэффициенты используются для вычисления дискриминантных значений. В настоящем разделе мы рассмотрели получение канонических дискриминантпых функций, постарались дать точное определение некоторых понятий, используемых в работе, и предложили сведущим в математике читателям некоторые основные моменты статистического аппарата.

Специалистам по приложениям, и общем-то, и необязательно досконально разбираться в этих вопросах. Им в первую очередь необходимо научиться применять н интерпретировать канонические дискриминантные функции. Это и является задачей следующего раздела. НЕ ИНТЕРПРЕТАЦИЯ КАНОНИЧЕСКИХ ДИСКРИМИНАНТНЪ|Х ФУНКЦИИ Канонические дискриминантные функции определены, и теперь можно приступить к их интерпретации. Задача сводится, вопервых, к изучению относительных расстояний между объектами и центроидами классов и, во-вторых, к рассмотрению соотношений между отдельными переменными и функциями. Если существует более одной функции, мы также задаемся вопросом, все лн из них необходимы.

Для большей конкретности начнем с изучения экспериментальных данных Бардес. ВЫЧИСЛЕНИЕ ДИСКРИМИНАНТНЫХ ЗНАЧЕНИЙ В табл. 4 представлены нестандартизованные дискриминантные коэффициенты для трех функций, полученных по данным Бардес. Эти функции определяют трехмерное пространство, в котором располагаются наблюдения, соответствующие отдельным сенаторам. Функция 1 определяет одну из осей.

Если представить себе обычное трехмерное пространство, функцию 1 естественно считать горизонтальной осью. Способ получения функции 2 приводит к требованию ее перпендикулярности к функции 1, так что она должна представлять совершенно отличную информацию (две функции должны быть некоррелированы). Это будет вертикальная ось. Третья функция должна быть перпендикулярна первым двумя.

Коэффициенты представляют положение наблюдений в дискриминаитном пространстве, Формула для первой функции следующая: ~дщ = 5,4243+0,8087 Х~дщ+ 0,7940 Хддр, вЂ” 4,6004 ХддтавЂ” вЂ” 0,6957 Хддт 1,1114 Хада+ 1,4387 Хцод~ где 1д обозначает дискриминантные значения для наблюдения по функции 1; Х;д вЂ” значение /-го дискриминантного параметра для т-го наблюдения нз й-го класса. Формулы для двух других функций аналогичны. Эти формулы сводятся к тому, что значение дискриминантной функции для каждого объекта получается путем умножения значений дискриминантных переменных иа соответствующие коэффициенты, а затем сложения полученных произведений с некоторой постоянной.

(Эта постоянная выбирается так, чтобы среднее зна- 95 Твбцвца 4 Нестацдцртизоцвцкые дцскрцыцкацтцые ковффццнецты Нестеввевтнвсвацные ксвффвцненты Пеуеыеяная Фувкцнв 1 Функция Е Фувкцвя В 5,4243 0,0878 0,7910 вЂ” 4,6004 вЂ” 0,6957 вЂ” 1, 1111 1,4387 3,5685 вЂ” 0,5225 -1,1177 -1,1228 вЂ” 1,3160 1,1!32 1,0422 вЂ” 4,3773 1,6209 -0,3339 вЂ” 1,1431 1,1418 0,3781 0,2300 Константа (и,) С17ТА1Р Гт ЕЯТЙ 1СТ СиТД51ДМ М!ХЕР ЛМТ1тиСО А1ЧТ11ЧЕ13Т 96 чение дискриминантной функции по всем наблюдениям было нулевым.) Теперь вычислим значения дискриминаитных функций непосредственно для одного из сенаторов в рассматриваемом примере.

Характеристики

Тип файла

DJVU-файл

Размер

2,35 Mb

Материал

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Тип материала

Книга

Предмет

(ПМСА) Прикладной многомерный статистический анализ

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов книги

kim_-mjuller-i-dr-faktornyj_-diskriminantnyj-i-klasternyj-analizy.djvu.rar

Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы.djvu

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.