Лекция 10. Программирование на языке SAS. Элементы стат. анализа (1185382), страница 2
Текст из файла (страница 2)
компонента кластера либо лучшийпредставитель кластераСуть алгоритма группировки переменных• Нисходящая иерархическая кластеризация, сначала всепеременные в одном кластере• Затем повторяется процесс:1.2.3.Выбор кластера (группы коррелирующих переменных) для разбиенияДеление кластера надва с помощью метода гл. комп. с вращениемПерераспределение переменных по кластерам32Шаг разбиенияFirst Eigenvalue=1.94Second Eigenvalue=1.02Поворот главных компонетПерераспределение переменныхX1FirstRCSecondRCX2X3Разбивать ли дальше?IgnoredFirst Eigenvalue=1.95Second Eigenvalue=0.05Варианты остановки (помимо порога на с.зн.):• Задать максимальное число кластеров• Задать минимум описанной вариации (дисперсии)...Выбор представителей кластеровX2FirstClusterPC1-R 2own cluster1 – 0.90== 0.10121-R next closest1 – 0.01R2 = 0.90Также можно выбирать не автоматически:• Эксперт «вручную»• По корреляции с откликомSecondClusterPCR2 = 0.01Применение PROC VARCLUS37Домашнее заданиеHTTPS://DOCS.GOOGLE.COM/SPREADSHEETS/D/1AYX5JKHG25LWQAKZ_TFSSGSDZMZTHHEWGODF1DRCC-A/EDIT?USP=SHARING.