Главная » Просмотр файлов » Боровиков В.П. - Нейронные сети

Боровиков В.П. - Нейронные сети (778916), страница 60

Файл №778916 Боровиков В.П. - Нейронные сети (Боровиков В.П. - Нейронные сети) 60 страницаБоровиков В.П. - Нейронные сети (778916) страница 602017-12-21СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 60)

Термин факторный анализ теперь будет включать как анализ главных компонент, так и анализ главных факторов. Предположим, вы хотите оценить значимость факторов и интерпретировать их разумным образом. Как это сделать? Чтобы проиллюстрировать, каким образом это может быть сделано, производятся действия «в обратном порядке» вЂ” начинают с некоторой осмысленной структуры, а затем смотрят, как она проявляется в результатах. Вернемся к примсру с удовлетворенностью. На рис. 10.48 приведена корреляционная матрица для переменных, относящихся к удовлетворению на работе и дома. Переменные, относящиеся к удовлетворенности на работе, более коррслированы между собой, переменные, относящиеся к удовлетворенности домом, также более коррелированы между собой.

Корреляции между этими двумя типами переменных (переменные, связанные с удовлстворенностыо на работе, и переменные, связанные с удовлетворенностью домом) сравнительно малы. Поэтому кажется правдоподобным, что имеются два относительно независимых фактора (два типа факторов), от- Рис. 10.48 333 Неаронные село.

ЗТАТ!ЗТЮА Меога! Ме!вола раженных в корреляционной матрице: один относится к удовлетворенности на работе, а другой — к удовлетворенности домашней жизнью. факпюрные нагрузки (еперь проведем анализ главных компонент и рассмотрим решение с двумя факторами (рис. 10.49). Для этого рассмотрим корреляции между персменными и двумя факторами (или «новыми» переменными), как они были выделены по умолчанию. Эти корреляции называются факгорными пагрузкамм.

Рве. 10.49 По-видимому, первый фактор более коррелирован с переменными, чем второй. Этого слсдовало ожидать, потому что, как было сказано выше, факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии. Вращение факпюрной спэрукп~уры Факторные нагрузки можно изобразить в виде диаграммы рассеяния, где каждая переменная представлена точкой (рис. 10.

50). Оси поворачиваем в любом направлении без изменения олшосительпого положения точек. Однако действительныс координаты точек, т.е. факторные нагрузки, должны меняться. Из диаграммы видно, если повсрнуть оси относительно начала координат па 45", то можно достичь ясного представления о нагрузках, определяющих переменныс: удовлстворснность на работе и дома. Методы вращения. Предложены различные методы вращсния факторов. Цслыо этих методов является получснис понятной (интерпретируемой) матрицы нагрузок, т.е.

факторов, которые ясно отмсчены высокими нагрузками для некоторых переменных и низкими — для других. Эту общую модель иногда называют простой структурой (более формальное опрсдсчснис можно найти в учебниках). 334 Глава 10. Кпассснесоое мел!оды, апьупернапуоеные нейронным сел!им Фыу р р руру!«,ф ! р ! ф у!рог о,о 0,6 о,г 1 г о,о е о,г .0.4 о,в го,в .0,0 -о.в -о.г о,о о,г о,в о,в о,в Ф44У р 1 Рис. 10.50. Вращеиие факторов Рис. 10.51.

Таблица вагрузок для иоверцугьп факторов Типичными методами вращения являются стратегии оаримакс, кааргиимакс и экои.вакс. Как и ранее, нужно найти вращение, максимизирующее дисперсию по новым осям; другими словами, получить матрицу нагрузок на каждый фактор таким образом, чтобы они отличались максимально возможным образом н имелась возможность их простой интерпретации.

На рис. 10. 51 приведена таблица нагрузок на поворачивасмые факторы. Интерпретация факторпой структуры. Как и ожидалось, первый фактор отмечен высокими нагрузками на переменные, связанные с удовлетворенностью на работе, а второй фактор — с удовлетворенностью домом. Из этого следует заключить, что удовлетворенность, измеренная вашим вопросником, составлена из двух частеи: удовлетворенность домом и работой, следовательно, вы произвели классификацию персмсннььх.

Косоуаопьные факторы Нскоторые авторы обсуждали довольно подробно концепцию косоугольных (нс ортогональных) факторов для того, чгобы достичь более простой интерпретации решений. В частности, были развиты вычислитсльпыс стратегии 335 Нейронные сети. ЗТАТШТ!СА Неига! НеГ»гогае как для вращения факторов, так и для лучшего представления «кластеров» переменных без отказа от ортогональности (т.е.

независимости) факторов. Однако косоугольные факторы, получаемые с помощью этих процедур, не могут быть легко проинтсрпрстированы. Возвратимся к примеру, расмотренному выше, и предположим, что вы включили в вопросник четыре пункта, измеряющих другие «различные» типы удовлетворенности. Предположим, что ответы людей на этн пункты были одинаково связаны как с удовлетворенностью домом (фактор 1), так и работой (фактор 2). Косоугольное вращение должно дать, очевидно, два коррелирующих фактора с меньшей, чем ранее, выразительностью, т.е.с большими перекрестными нагрузками.

Иерархический факпюрный анапиз Вместо вычисления нагрузок косоугольных факторов, для которых часто трудно дать хорошую интерпретацию, модуль йракторный анализ в программе БТзТ1БТ1г.А использует алгоритм, впервые предложенный Томсоном (Тпошрзоп, 1951) и Шмидтом и Лейманом (Бс)гнпп(, Ьс(шап, 1957). В соответствии с этим алгоритмом, программа ЯТАТ1ЯТЛ:А вначале определяет кластеры и вращает оси в пределах кластеров, а затем вычисляет корреляции между найденными (косоугольными) факторами. Полученная корреляционная матрица для косоугольных факторов затем подвергается дальнейшему анализу для того, чтобы выделить множество ортогональных факторов, разделяющих изменчивость в переменных на ту, что относится к распределенной или общей дисперсии (вторичные факторы), и на частные дисперсии, относящиеся к кластерам или схожим переменным (пунктам вопросника) в анализе (первичные факторы).

Ряс. 10.52 Применительно к рассматриваемому примеру такой иерархический анализ можст дать факторные нагрузки, показанные на рис. 10.52. Внимательное изучснис их позволяет сделать следующие заключсния: 33б Гпава 10. Кпасссческсе метсяы, апыпернапэсвные неарснным сетям ° имеется общий (вторичный) фактор удовлетворенности, которому, по-видимому, подвержены все типы удовлетворенности, измеренньэс для 10 пунктов; ° имеются, всроятно, две первичные уникальные области удовлетворения, которые могут быть описаны как удовлетворенностью работой, так и удовлетворенностью домашней жизнью.

Верри (%Ьепу, 1984) обсудил подробно примеры такого иерархического анализа и объяснил, каким образом могут быть получены значимые и интерпретирусмые вторичные факторы. Воспроцэведенные ц осгпагпочные коррепвццц Дополнительным способом проверки числа вьщеленных факторов является вычисление корреляционной матрицы, которая близка исходной, если факторы выделены правильно. Эта матрица называется воспроизиеденной корреляционной матрэщей. Для того чтобы увидеть, как эта матрица отклоняется от исходной корреляционной матрицы (с которой начинался анализ), вычисляют разность между ними.

Полученная матрица называется матрицей остаточных корреляций. Остаточная матрица может указать на «несогласие», т.е. на то, что рассматриваемые коэффициенты корреляции не могут быть получены с достаточной точностью на основе имеющихся факторов. Ппохо обусповпенные маГпрццы В факторном анализе система 3ТАТ18Т1СА обращает корреляционную матрицу. Если имеются избьггочные переменные, то обратная матрица не может быть вычислена. Например, если переменная является суммой двух других переменных, отобранных для этого анализа, то корреляционная матрица для такого набора переменных не может быть обращена, и факторный анализ принципиально не может быть выполнен. На практике это происходит, когда вы пытаетесь применить факторный анализ к множеству сильно коррелированных (зависимых) перемснных, чтоиногдаслучается, например,висследованияхвопросников.

Модуль Факпэорный анализ обнаруживает плохо обусловленные матрицы и выдает соответствующее предупреждение. 3ТАТ18Т1СА искусственно понижает все корреляции в матрице путем добавления малой константы к ее диагональным элементам, а затем стандартизирует ее. Эта процедура обычно приводит к матрице, которая может быть обращена и поэтому к ней применим факторный анализ.

Более того, эта процедура нс влияет на набор факторов, но оценки оказываются менее точными. Вывод: сали клиссиееских методов — в ясности и иэияернретируемости моделей, сили нейронных сетей — в гибкости и одиктииии к иэмеиякэщимся диэиэым. 337 Г пава 11 ДОБЫЧА БАННЫХ В ЗТАТ!ВТ!СА В данной главе мы описываем технологии добычи данных 3ТАП3Т1СА и их применение к реальным задачам. Концепция добычи данных — Ра~а Мгшщ — приобретает все большее распространение как инструмент управления деловой информацией в тех случаях, когда предполагается, что из имеющихся данных можно извлечь знания для принятия решений в условиях неопределенности.

Добыча данных синтезирует классические методы анализа данных с нейронными сетями, дополняя их качественно новыми методами, включая деревья классификации и регрессии, многомерные сплайны, процедуры бурения и расслоения данных и другие. Системы добычи данных больше ориентированы на практическое приложение полученных результатов, чем на выяснение природы явлений. Иными словами, при добыче данных нас не интересует конкретный вид зависимостей между переменными.

Выяснение природы участвующих здесь функций или конкретной формы многомерных зависимостей между переменными не является главной целью этого подхода. Основное внимание уделяется поиску решений, на основе которых можно строить достоверные прогнозы и находить реальные связи между переменными. Нейронные вепш и добыча дазтых о~нкрывают качественно новый этап развитин анализа даинык. Этапы добычи данных Добыча данных включает трп основных этапа: 1.

Начальное исследование, чистка, верификация данных, выбор оптимальных предикторов. 2. Построение рабочих моделей, кросс-проверка результатов и подтверждение. 3. Развертывание — применение построенных моделей к новым данным. Рассмотрим болсс подробно эти этапы. 338 Гпава 11. добыча Ванных в ВТАТ18Т!СА Этап 1. Исспеоование Этап исследования обычно начинается с подготовки данных, которая можст включать чистку, преобразования, выбор подмножеств, а также, в случае наборов данных с большим числом переменных («полей»), анализа их свойств. В зависимости от характера аналитической задачи, первый этап процесса «добычи данных» может включать как простой выбор прсдикгоров, так и проведение всестороннего разведочного анализа с использованием ряда графических и статистических методов для нахождения наиболее сильных предикторов и определения общего характера моделей, которые потенциально можно использовать для построения прогнозов. Этап 2. Построение объяснитепьных мояепей и проверка резупьтатов Данный этап включает рассмотрение различных моделей и выбор наилучшей на основании их характеристик (например, обьясненис изменчивости и получение надежных результатов по выборкам).

Характеристики

Тип файла
DJVU-файл
Размер
5,26 Mb
Тип материала
Высшее учебное заведение

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7041
Авторов
на СтудИзбе
259
Средний доход
с одного платного файла
Обучение Подробнее