Ким_ Мьюллер и др - Факторный_ дискриминантный и кластерный анализы (1185345), страница 22
Текст из файла (страница 22)
Если же центроиды у классов разные, элементы цу будут меньше соответствующих элементов матрицы Т. Эта разница обозначается как матрица В (В=7 — К, т. е. 80=1Π— Юы). Матрица В называется межгрупповой суммой квадратов отклонений и попарных произведений. Величины элементов В по отношению к величинам элементов %' дают меру различия между группами, как это будет выяснено позже. ла йрп= ~'., ~ (Хм — Хпо) (Хмм — Хяо). (3) «=1 т=1 Если элементы матрицы ир разделить на (л.— д), получится внутригрупповая ковариационная матрица, она является взвешенным средним ковариационных матриц отдельных классов.
Матрицу Ж' или внутригрупповую ковариационную матрицу легко преобразовать во внутрнгрупповую корреляционную матрицу, как это уже сказано по отношению общей корреляционной матрице. Каждый коэффициент корреляции является оценкой степени зависимости между соответствующей парой переменных внутри групп.
Он обычно ие совпадает с общей корреляцией, на величину которой сказываются межгрупповые различия. Если предположить, что наблюдения относятся к одной генеральной совокупности или к разным генеральным совокупностям, имеющим одинаковые статистические свойства, то в качестве оценок зависимостей между переменными предпочтительнее внутригрупповые корреляции, а не общие корреляции. В табл. 3 представлена матрица внутригрупповых корреляций для экспериментальных данных Бардес. Видно, что многие коэффициенты отличаются от значений, приведенных в табл.
2. Это обусловлено разбросом центроидов разных классов. Матрицы ))т и В содержат всю основную информацию о зависимости внутри групп н между группами. С помощью некоторых вычислений можно получить функцию, удовлетворяюшую требуемым свойствам. Во-первых, необходимо решить систему уравнений: льмо;=Лу ХЬмп;=ЛЕшмп; (4) ХЬр~О~=ЛХи>рм си где Л вЂ” собственное число, а о; — последовательность р коэффициентов.
Как уже говорилось, Ь,; и юя — элементы матриц В и ))т соответственно, которые получаются при обработке экспериментальных данных. Построение дискриминантной функции сводится к решению уравнений (4) относительно Л н пь Для получения единственно правильного решения дополнительно наложим условие, что сумма квадратов и, должна быть равна 1. Максимально существует д нетривиальных решений этих уравнений.
Каждое решение, которое имеет свое собственное значение Л и свою последовательность оь соответствует одной канонической дискрцминантной функции. Коэффициенты еч могут использоваться как коэффициенты требуемой дискриминантной функции: и;=и;уп. — л, ио= — ~ шХ; .. (Я Эти коэффициенты и, и требовалось определить в соотношении (1). Применение и, из (5) приводит величины )х (значения дискриминантной функции) к стандартной форме. Это означает, что соответствующие дискриминантные значения по совокупности наблюдений (объектов) будут иметь нулевое среднее и единичное внутригрупповое стандартное отклонениев. Значение днскриминантной функции для данного объекта представляет положение этого наблюдения на оси, определяемой данной функцией.
КОЭФФИЦИЕНТЫ Р, Решение системы уравнений (4) дает последовательность коэффициентов о, для каждой функции. Эти коэффициенты могли бы быть непосредственно использованы при классификации. Однако их трудно интерпретировать, соответствующие им значения дискриминантной функции не имеют определенного смысла. Причина заключается в том, что данное решение не имеет ограничения по метрике дискриминантного пространства.
Хотя это пространство вводится для обеспечения максимального разделения классов, последние могут располагаться в любой его области. Приведенная ситуация аналогична ситуации, когда игроки в бей- сбол могут находиться в любой точке поля, лишь бы их взаимное расположение не противоречило правилам игры. В некоторых компьютерных программах коэффициенты и, распечатываются и могут использоваться при классификации (см. равд. 1Ъ). Однако более целесообразна их нормировка, задаваемая соотношением (5).
ИЕСТАИЛАРТИЗОВАИИЪ|Е КОЭФФИЦИЕИТЫ Нормировка коэффициентов не меняет ни результат классификации, ни относительное расположение классов. Однако существенно то, что оси занимают более естественное положение, так как начало координат (точка, где проекции всех дискриминантных функций нулевые) совпадает с главным центроидом. Главный центроид, как мы уже говорили, является точкой пространства, в которой все дискриминантные переменные принимают средние (по всем наблюдениям) значения. Другими словами, это — центральное положение всех точек, представляющих наблюдения. Расположение начала координат в главном центроиде полезно, так как в данном случае рассматриваемые классы и объекты соотносятся с центром системы.
Нормировка коэффициентов влечет за собой и другие изменения. Они касаются единиц измерения расстояний. Нормированные коэффициенты приводят к дискриминаитным значениям, измеряемым в единицах стандартного квадратичного отклонения, т. е. каждая ось растягивается или сжимается таким образом, что соответствующее дискримииантное значение для данного объекта представляет число стандартных отклонений точки от главного центроидат.
Анализируя это значение, можно сразу отличить относительное расстояние от абсолютного н определить, насколько относительное расстояние велико по сравнению с размерами системы. Так, значение в 2,5 означает, что наблюдение располагается на расстоянии двух с половиной стандартных отклонений в отрицательном направлении от центра осей, Поскольку очень небольшое число точек может находиться вне окрестности радиуса, равного двум стандартным отклонениям, становится ясно, что данное наблюдение достаточно далеко отстоит от центра. Способ приведения переменных к стандартной форме зависит от того, нормируются лн исходные значения наблюдений. Если исходные данные иеприведены к стандартной форме, соответствующие им коээффициенты будем называть «нестандартизованиыми». Обозначение и как раз и относится к этим коэффициентам, а соотношение (5) показывает как значение и переходит в значение и.
(Стандартизованные коэффициенты будут рассмотрены в следующем разделе.) Обычно нестаидартизованные коэффициенты используются для вычисления дискриминантных значений. В настоящем разделе мы рассмотрели получение канонических дискриминантпых функций, постарались дать точное определение некоторых понятий, используемых в работе, и предложили сведущим в математике читателям некоторые основные моменты статистического аппарата.
Специалистам по приложениям, и общем-то, и необязательно досконально разбираться в этих вопросах. Им в первую очередь необходимо научиться применять н интерпретировать канонические дискриминантные функции. Это и является задачей следующего раздела. НЕ ИНТЕРПРЕТАЦИЯ КАНОНИЧЕСКИХ ДИСКРИМИНАНТНЪ|Х ФУНКЦИИ Канонические дискриминантные функции определены, и теперь можно приступить к их интерпретации. Задача сводится, вопервых, к изучению относительных расстояний между объектами и центроидами классов и, во-вторых, к рассмотрению соотношений между отдельными переменными и функциями. Если существует более одной функции, мы также задаемся вопросом, все лн из них необходимы.
Для большей конкретности начнем с изучения экспериментальных данных Бардес. ВЫЧИСЛЕНИЕ ДИСКРИМИНАНТНЫХ ЗНАЧЕНИЙ В табл. 4 представлены нестандартизованные дискриминантные коэффициенты для трех функций, полученных по данным Бардес. Эти функции определяют трехмерное пространство, в котором располагаются наблюдения, соответствующие отдельным сенаторам. Функция 1 определяет одну из осей.
Если представить себе обычное трехмерное пространство, функцию 1 естественно считать горизонтальной осью. Способ получения функции 2 приводит к требованию ее перпендикулярности к функции 1, так что она должна представлять совершенно отличную информацию (две функции должны быть некоррелированы). Это будет вертикальная ось. Третья функция должна быть перпендикулярна первым двумя.
Коэффициенты представляют положение наблюдений в дискриминаитном пространстве, Формула для первой функции следующая: ~дщ = 5,4243+0,8087 Х~дщ+ 0,7940 Хддр, — 4,6004 Хддта— — 0,6957 Хддт 1,1114 Хада+ 1,4387 Хцод~ где 1д обозначает дискриминантные значения для наблюдения по функции 1; Х;д — значение /-го дискриминантного параметра для т-го наблюдения нз й-го класса. Формулы для двух других функций аналогичны. Эти формулы сводятся к тому, что значение дискриминантной функции для каждого объекта получается путем умножения значений дискриминантных переменных иа соответствующие коэффициенты, а затем сложения полученных произведений с некоторой постоянной.
(Эта постоянная выбирается так, чтобы среднее зна- 95 Твбцвца 4 Нестацдцртизоцвцкые дцскрцыцкацтцые ковффццнецты Нестеввевтнвсвацные ксвффвцненты Пеуеыеяная Фувкцнв 1 Функция Е Фувкцвя В 5,4243 0,0878 0,7910 — 4,6004 — 0,6957 — 1, 1111 1,4387 3,5685 — 0,5225 -1,1177 -1,1228 — 1,3160 1,1!32 1,0422 — 4,3773 1,6209 -0,3339 — 1,1431 1,1418 0,3781 0,2300 Константа (и,) С17ТА1Р Гт ЕЯТЙ 1СТ СиТД51ДМ М!ХЕР ЛМТ1тиСО А1ЧТ11ЧЕ13Т 96 чение дискриминантной функции по всем наблюдениям было нулевым.) Теперь вычислим значения дискриминаитных функций непосредственно для одного из сенаторов в рассматриваемом примере.