Боровиков В.П. - Нейронные сети (778916), страница 60
Текст из файла (страница 60)
Термин факторный анализ теперь будет включать как анализ главных компонент, так и анализ главных факторов. Предположим, вы хотите оценить значимость факторов и интерпретировать их разумным образом. Как это сделать? Чтобы проиллюстрировать, каким образом это может быть сделано, производятся действия «в обратном порядке» вЂ” начинают с некоторой осмысленной структуры, а затем смотрят, как она проявляется в результатах. Вернемся к примсру с удовлетворенностью. На рис. 10.48 приведена корреляционная матрица для переменных, относящихся к удовлетворению на работе и дома. Переменные, относящиеся к удовлетворенности на работе, более коррслированы между собой, переменные, относящиеся к удовлетворенности домом, также более коррелированы между собой.
Корреляции между этими двумя типами переменных (переменные, связанные с удовлстворенностыо на работе, и переменные, связанные с удовлетворенностью домом) сравнительно малы. Поэтому кажется правдоподобным, что имеются два относительно независимых фактора (два типа факторов), от- Рис. 10.48 333 Неаронные село.
ЗТАТ!ЗТЮА Меога! Ме!вола раженных в корреляционной матрице: один относится к удовлетворенности на работе, а другой — к удовлетворенности домашней жизнью. факпюрные нагрузки (еперь проведем анализ главных компонент и рассмотрим решение с двумя факторами (рис. 10.49). Для этого рассмотрим корреляции между персменными и двумя факторами (или «новыми» переменными), как они были выделены по умолчанию. Эти корреляции называются факгорными пагрузкамм.
Рве. 10.49 По-видимому, первый фактор более коррелирован с переменными, чем второй. Этого слсдовало ожидать, потому что, как было сказано выше, факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии. Вращение факпюрной спэрукп~уры Факторные нагрузки можно изобразить в виде диаграммы рассеяния, где каждая переменная представлена точкой (рис. 10.
50). Оси поворачиваем в любом направлении без изменения олшосительпого положения точек. Однако действительныс координаты точек, т.е. факторные нагрузки, должны меняться. Из диаграммы видно, если повсрнуть оси относительно начала координат па 45", то можно достичь ясного представления о нагрузках, определяющих переменныс: удовлстворснность на работе и дома. Методы вращения. Предложены различные методы вращсния факторов. Цслыо этих методов является получснис понятной (интерпретируемой) матрицы нагрузок, т.е.
факторов, которые ясно отмсчены высокими нагрузками для некоторых переменных и низкими — для других. Эту общую модель иногда называют простой структурой (более формальное опрсдсчснис можно найти в учебниках). 334 Глава 10. Кпассснесоое мел!оды, апьупернапуоеные нейронным сел!им Фыу р р руру!«,ф ! р ! ф у!рог о,о 0,6 о,г 1 г о,о е о,г .0.4 о,в го,в .0,0 -о.в -о.г о,о о,г о,в о,в о,в Ф44У р 1 Рис. 10.50. Вращеиие факторов Рис. 10.51.
Таблица вагрузок для иоверцугьп факторов Типичными методами вращения являются стратегии оаримакс, кааргиимакс и экои.вакс. Как и ранее, нужно найти вращение, максимизирующее дисперсию по новым осям; другими словами, получить матрицу нагрузок на каждый фактор таким образом, чтобы они отличались максимально возможным образом н имелась возможность их простой интерпретации.
На рис. 10. 51 приведена таблица нагрузок на поворачивасмые факторы. Интерпретация факторпой структуры. Как и ожидалось, первый фактор отмечен высокими нагрузками на переменные, связанные с удовлетворенностью на работе, а второй фактор — с удовлетворенностью домом. Из этого следует заключить, что удовлетворенность, измеренная вашим вопросником, составлена из двух частеи: удовлетворенность домом и работой, следовательно, вы произвели классификацию персмсннььх.
Косоуаопьные факторы Нскоторые авторы обсуждали довольно подробно концепцию косоугольных (нс ортогональных) факторов для того, чгобы достичь более простой интерпретации решений. В частности, были развиты вычислитсльпыс стратегии 335 Нейронные сети. ЗТАТШТ!СА Неига! НеГ»гогае как для вращения факторов, так и для лучшего представления «кластеров» переменных без отказа от ортогональности (т.е.
независимости) факторов. Однако косоугольные факторы, получаемые с помощью этих процедур, не могут быть легко проинтсрпрстированы. Возвратимся к примеру, расмотренному выше, и предположим, что вы включили в вопросник четыре пункта, измеряющих другие «различные» типы удовлетворенности. Предположим, что ответы людей на этн пункты были одинаково связаны как с удовлетворенностью домом (фактор 1), так и работой (фактор 2). Косоугольное вращение должно дать, очевидно, два коррелирующих фактора с меньшей, чем ранее, выразительностью, т.е.с большими перекрестными нагрузками.
Иерархический факпюрный анапиз Вместо вычисления нагрузок косоугольных факторов, для которых часто трудно дать хорошую интерпретацию, модуль йракторный анализ в программе БТзТ1БТ1г.А использует алгоритм, впервые предложенный Томсоном (Тпошрзоп, 1951) и Шмидтом и Лейманом (Бс)гнпп(, Ьс(шап, 1957). В соответствии с этим алгоритмом, программа ЯТАТ1ЯТЛ:А вначале определяет кластеры и вращает оси в пределах кластеров, а затем вычисляет корреляции между найденными (косоугольными) факторами. Полученная корреляционная матрица для косоугольных факторов затем подвергается дальнейшему анализу для того, чтобы выделить множество ортогональных факторов, разделяющих изменчивость в переменных на ту, что относится к распределенной или общей дисперсии (вторичные факторы), и на частные дисперсии, относящиеся к кластерам или схожим переменным (пунктам вопросника) в анализе (первичные факторы).
Ряс. 10.52 Применительно к рассматриваемому примеру такой иерархический анализ можст дать факторные нагрузки, показанные на рис. 10.52. Внимательное изучснис их позволяет сделать следующие заключсния: 33б Гпава 10. Кпасссческсе метсяы, апыпернапэсвные неарснным сетям ° имеется общий (вторичный) фактор удовлетворенности, которому, по-видимому, подвержены все типы удовлетворенности, измеренньэс для 10 пунктов; ° имеются, всроятно, две первичные уникальные области удовлетворения, которые могут быть описаны как удовлетворенностью работой, так и удовлетворенностью домашней жизнью.
Верри (%Ьепу, 1984) обсудил подробно примеры такого иерархического анализа и объяснил, каким образом могут быть получены значимые и интерпретирусмые вторичные факторы. Воспроцэведенные ц осгпагпочные коррепвццц Дополнительным способом проверки числа вьщеленных факторов является вычисление корреляционной матрицы, которая близка исходной, если факторы выделены правильно. Эта матрица называется воспроизиеденной корреляционной матрэщей. Для того чтобы увидеть, как эта матрица отклоняется от исходной корреляционной матрицы (с которой начинался анализ), вычисляют разность между ними.
Полученная матрица называется матрицей остаточных корреляций. Остаточная матрица может указать на «несогласие», т.е. на то, что рассматриваемые коэффициенты корреляции не могут быть получены с достаточной точностью на основе имеющихся факторов. Ппохо обусповпенные маГпрццы В факторном анализе система 3ТАТ18Т1СА обращает корреляционную матрицу. Если имеются избьггочные переменные, то обратная матрица не может быть вычислена. Например, если переменная является суммой двух других переменных, отобранных для этого анализа, то корреляционная матрица для такого набора переменных не может быть обращена, и факторный анализ принципиально не может быть выполнен. На практике это происходит, когда вы пытаетесь применить факторный анализ к множеству сильно коррелированных (зависимых) перемснных, чтоиногдаслучается, например,висследованияхвопросников.
Модуль Факпэорный анализ обнаруживает плохо обусловленные матрицы и выдает соответствующее предупреждение. 3ТАТ18Т1СА искусственно понижает все корреляции в матрице путем добавления малой константы к ее диагональным элементам, а затем стандартизирует ее. Эта процедура обычно приводит к матрице, которая может быть обращена и поэтому к ней применим факторный анализ.
Более того, эта процедура нс влияет на набор факторов, но оценки оказываются менее точными. Вывод: сали клиссиееских методов — в ясности и иэияернретируемости моделей, сили нейронных сетей — в гибкости и одиктииии к иэмеиякэщимся диэиэым. 337 Г пава 11 ДОБЫЧА БАННЫХ В ЗТАТ!ВТ!СА В данной главе мы описываем технологии добычи данных 3ТАП3Т1СА и их применение к реальным задачам. Концепция добычи данных — Ра~а Мгшщ — приобретает все большее распространение как инструмент управления деловой информацией в тех случаях, когда предполагается, что из имеющихся данных можно извлечь знания для принятия решений в условиях неопределенности.
Добыча данных синтезирует классические методы анализа данных с нейронными сетями, дополняя их качественно новыми методами, включая деревья классификации и регрессии, многомерные сплайны, процедуры бурения и расслоения данных и другие. Системы добычи данных больше ориентированы на практическое приложение полученных результатов, чем на выяснение природы явлений. Иными словами, при добыче данных нас не интересует конкретный вид зависимостей между переменными.
Выяснение природы участвующих здесь функций или конкретной формы многомерных зависимостей между переменными не является главной целью этого подхода. Основное внимание уделяется поиску решений, на основе которых можно строить достоверные прогнозы и находить реальные связи между переменными. Нейронные вепш и добыча дазтых о~нкрывают качественно новый этап развитин анализа даинык. Этапы добычи данных Добыча данных включает трп основных этапа: 1.
Начальное исследование, чистка, верификация данных, выбор оптимальных предикторов. 2. Построение рабочих моделей, кросс-проверка результатов и подтверждение. 3. Развертывание — применение построенных моделей к новым данным. Рассмотрим болсс подробно эти этапы. 338 Гпава 11. добыча Ванных в ВТАТ18Т!СА Этап 1. Исспеоование Этап исследования обычно начинается с подготовки данных, которая можст включать чистку, преобразования, выбор подмножеств, а также, в случае наборов данных с большим числом переменных («полей»), анализа их свойств. В зависимости от характера аналитической задачи, первый этап процесса «добычи данных» может включать как простой выбор прсдикгоров, так и проведение всестороннего разведочного анализа с использованием ряда графических и статистических методов для нахождения наиболее сильных предикторов и определения общего характера моделей, которые потенциально можно использовать для построения прогнозов. Этап 2. Построение объяснитепьных мояепей и проверка резупьтатов Данный этап включает рассмотрение различных моделей и выбор наилучшей на основании их характеристик (например, обьясненис изменчивости и получение надежных результатов по выборкам).















