И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 24
Текст из файла (страница 24)
Альтернатива состоит в построении гистограммы для каждой группы. Во-первых, определяются интервалы, соответствующие -6.0 -4.0 -2.0 0.0 з2.0 «4.0 +6.0 Рис. 3. Групповая гистограмма для данных Бнрдес. Знаки «Х» обозначают позиции сенаторов. Ось абсцисс является первой канонической дискриминантной функцией, измеренной в единицах стандартного отклонения стандартному отклонению, равному, например, О,! Во-вторых, над интервалом помещается символ «Х» (или какой-либо другой), если некоторое наблюдение попадает в данный интервал. Для последующих наблюдений, лежащих в рассматриваемом интервале, соответствующие символы «Х> помещаются один над другим, поэтому высота получающихся в результате столбцов определяет число наблюдений в этом интервале. Гистограмма наглядна для представления плотности и распределения группы. Расположив групповые гистограммы одну над другой, можно сравнивать относительное положение групп.
Данные Бардес, рассматриваемые относительно первой дискриминантной функции, представлены на рис. 3. В этом случае мы получим небольшое количество информации о гистограмме, так как в каждом интервале — недостаточное количество наблю. дений.
Однако видно, что по этой выделенной функции отличие между группами 1 и 4 фактически отсутствуют. Действительно, их центроиды занимают одно и то же положение. Гораздо лучший пример однокоординатных графиков дан в работе (Неус)г, К!еска, 1973). Этот же пример приведен в «Руководстве по пакету программ ЬРЬЬ» (А)!е, 1975). СТАНДАРТИЗОВАННЫЕ КОЭФФИИИЕНТЫ Переходя от изучения отдельных наблюдений и групповых центроидов к рассмотрению дискриминантных переменных становится важным вопрос о представлении дискриминантной функции коэффициентов в стандартной или нестандартной форме. Поскольку коэффициент в нестандартной форме дает информацию об абсолютном вкладе данной переменной в значение дискриминантной функции, то при различных единицах измерений переменных (т.
а. нагла стандартные отклонения переменных различны) можно получить верную классификацию Если нас интересует относительный вклад переменной, то коэффициенты следует представлять в стандартной форме. Стандартизованные коэффициенты получаются из соотношения (5), если наблюдения имеют единичные стандартные отклонения, что достигается их нормированием". Вместо того чтобы приводить к стандартной форме наблюдения, а затем псрссчитывать коэффициенты, можно их вычислить исходя из значений коэффициентов в нестандартной форме. с,=и~ (7) л, л где ш„— сумма квадратов (-й переменной, опредсляемая соотношением (3); п — общее число наблюдений; д — число групп. Стандартизованные коэффициенты полезно применять при выявлении тех переменных, которые вносят наибольший вклад в значение дисмримииантной функции.
Абсолютная величина коэф- Таблнца 6 Стандартиаоааниые диеаримннантные иоэффниненты сеаваарееаававцма «авффвццецем Перамецаме Фувацав а Фуавцвв а Фуц ц а О, 6094 0,7068 — 2,1859 — 0,4760 — 0,8077 1, 0168 — 0,3942 — 0,9950 — 0 5335 — 0,9004 0,8090 О, 7365 СЦТА1О мЕЬТм1СТ С11ТА5 1А1Ч 541ХЕТУ А1ЧТга'1700 А1ЧТНЧЕ11Т 1,2227 — О, 2973 — 0,5432 0,7812 0,2748 0,1414 СТРУКТУРНЫЕ КОЭФФИЦИЕНТЫ Для определения взаимной зависимости отдельной переменной и дискриминантной функции мы рассмотрим их корреляцию.
Эти коэффициенты корреляции называются «полнымн структурными коэффициентами». Как корреляции оии являются косинусами углов между переменными и функцией. Поэтому, зная эти коэффициенты, мы имеем информацию о геометрической структуре пространства наблюдений'э. Структурный коэффициент показывает, насколько тесно связаны переменные и дискриминантные функции.
Когда абсолютная величина такого коэффициента велика, вся информация о дискриминантной функции заключена в этой переменной. Если же коэффициент близок к нулю — их зависимость мала. Можно дать «имя» дискриминантной функции, исходя из тех коэффи- 101 фициента анализируется в стандартной форме: чем она больше, тем больше вклад этой переменной. В табл. 6 представлены стандартизованные коэффициенты для данных Бардес, относяшихся к голосованию в сенате.
Для функции 1 вклад переменной С11ТАЯ1Аг4 максимален. Все остальные переменные по сравнению с С11ТАБ1А11 второстепенны. Переменные А1чТ1с1Е11Т и А51Т1 у'1100 после СПТАБ1АХ занимают следуюшее по значимости место. Можно отметить, что они приблизительно вдвое более значимы, чем переменная М1ХЕР. Для функции 2 четыре из шести переменных (цЕБТИСТ, М1ХЕР, А51Тгу'1100 н АХТ1г1ЕБТ) имеют относительно большие стандартизованные коэффициенты, поэтому они вносят приблизительно одинаковый вклад в значение дискриминантной функции. Переменная С11ТА1Р, а вслед за ней М!ХЕР являются доминантными переменными для функции 3". При желании дискриминантное значение можно получить исходя из стандартизованных коэффициентов, однако тогда мы должны умножать эти коэффициенты на значение наблюдений в стандартной форме'э, Таблица 7 Структурные кееффнцненты серукууриме кевФФиииеием Перемевнвв Функции а Функции а Функции 1 0,326 — 0,429 — 0,160 0,254 0,076 -0,269 — 0,565 0,345 — 0,858 0,269 — О, 293 — О, 140 О, 355 0,260 О, 241 — 0,671 О, 785 0,751 С!!ТАБУ ЙЕБТЙ1СТ С11ТА$1АК М1ХЕ1У А1ЧТ!717СО АМТ! ЫЕ11Т Структурные коэффициенты, рассматриваемые здесь, основаны иа понятии корреляции.
Их полезно использовать при классификации групп. Однако иногда интересно узнать, как дискриминантные функции связаны с переменными в пределах отдельной группы. Таким образом, мы приходим к так называемым «внутригрупповым структурным коэффициентам», которые вычисляются следующим образом: р и ы,все, зуу ~', г,лев, ~",— (8) в=в а=у Ты„ыев 102 цнентов, которые максимальны по абсолютной величине, Если соответствующие переменные измеряют похожие характеристики, то функции можно называть по этим характеристикам. Например, рассмотрим полные структурные коэффициенты, относящиеся к данным Бардес (табл.
7). Для функции 1 переменные С1)ТАЮ и Сс)ТАБ1АМ являются доминантными. Их отрицательные знаки говорят о том, что мы должны дать функции 1 название «за помощь». Для функции 2 полные структурные коэффициенты последних трех переменных имеют наибольшие абсолютные значения. Они относятся к ограничению помощи тем странам, которые ие связаны альянсом с США, поэтому мы назовем эту функцию «протнв помощи государствам, не связанным альянсом».
У функции 3 нет преобладающих больших коэффициентов, н она наиболее трудна для интерпретации. Переменные КЕЬТК1СТ и С1)ТАЮ имеют большие коэффициенты, но с противоположными знаками. Рассматривая расположения групповых центроидов по этой функции, можно получить некоторую дополнительную информацию. Группы 2 и 4 («против помощи» и «антикоммунисты») расположены в положительном направлении; группа 3 («против помощи государствам, испытывающим финансовые затруднения») — в отрицательном направлении; группа 1 («за помощь иностранным государствам») — между ними. Поэтому функция 3 служит для различия всевозможных типов оппозиции к функции 1 («за помощь иностранным государствам»).
Таблица 8 Внутригрупповые етруктурные коэффициенты Знутрктруппаяые етруктурнме каеффнцненты Переменнек Функция 3 Функцня 2 Фунтике 1 О, 392 — 0,461 — 0,299 0,315 0,087 — 0,340 — 0,218 0,115 — 0,483 О, 102 — О, 121 — О, 054 О, 279 0,176 0,276 — 0,5!6 0,662 0,588 С!!ТА!0 йЕЯТй1СТ С!7ТА81А1Ч М!ХЕР А1ЧТ1У1100 А1ЧТ11ЧЕ11Т Структурные коэффициенты дают информацию, несколько отличную от той, которая относится к стандартизованным коэффициентам. Стандартизованные коэффициенты показывают вклад переменных в значение днскриминантной функции. Это является одним нз подходов к определению значимости переменной.
Однако этот подход имеет серьезное ограничение. Если две переменных сильно коррелированы, то их вклад в дискриминантное значение должен разделяться, даже при значительном совместном вкладе. Соответственно их стандартизованные коэффициенты могут быть меньше по сравнению с теми случаями, когда используется одна из этих переменных. Или, другими словами, вклад одного коэффициента частично погашается отрицательным вкладом другого'е. Это происходит из-за того, что в стандартизованных коэффициентах одновременно принимается во внимание влияние всех переменных.