Главная » Просмотр файлов » И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 35

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 35 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 352019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 35)

Второй причиной повышенного интереса к кластеризации является то, что наука строится на классификациях, которые привносят порядок в исследования. Она содержит основные понятия, используемые наукой, Например, классификация химических элементов лежит в основе неорганической химии и атомной теории материи; классификация болезней является структурной основой медицины. Поскольку кластерные методы рассматриваются как объективные, легко воспроизводимые способы создания классификаций, то они пользуются широкой популярностью. Ученые давно применяют кластерный анализ.

Среди самых ранних из этих исследований были работы а~нтропологов, которые определяли однородные культурные области, используя матричные методы (см, Сгекаповзк), 1911; Ог!чег, 1965;,)оЬпз!оп, 1972). В психологии кластерный анализ рассматривался как «факторный анализ бедняка» (Тгуоп, 1939). Специалисты других дисциплин, особенно государственного права, также участвовали в ранних разработках методов кластеризации для общественных наук. Хотя многие теории и приложения, служившие основой кластеризации в прошлом, были отвергнуты последующими поколениями,все социальные науки и сейчас сохраняют некоторые традиции использования кластерных методов.

Несмотря на их популярность, кластерные методы все еще понимаются хуже, чем такие многомерные статистические процедуры, как факторный анализ, днскримимантный анализ и многомерное шкалирование. Литература по социальным наукам содержит ошеломляющее количество часто несовместимых терминов, методов и предпочитаемых подходов. Недостаток опубликованных руководств для начинающих в сочетании с разнобоем в терминологии и методологии затрудняют изучение кластер~ного анализа.

Цель ~нашей работы — провести новичка через этот «лабиринт» кластерного анализа. Ввиду большого разнообразия методов, предложенных за последние двадцать лет„мы не сможем исчерпывающе рас- смотреть все или даже часть методов. Поэтому мы остановимся на тех, которые сравнительно хорошо известны в области социаль- ных наук, и, как мы полагаем, имеют достоинства, позволяющие использовать их в прикладных исследованиях. ИСПОЛЬЗОВАНИЕ МЕТОДОВ КЛАСТЕРИЗАЦИИ Как мы уже отмечали, методы кластеризации конструируются для создания од~породных групп объектов или единиц, которые называются кластерами.

Различные приложения кластерного анализа можно свести к четырем основным задачам: 1) разработка типологии или классификации; 2) исследование полезных концептуальных схем группнрования объектов; 3) порождение гипотез на основе исследования данмых; 4) проверка гипотез илн исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных. Как правило, кластерный анализ используется для создания классификаций, яо в большинстве случаев прикладного а~налива данных в основе исследования лежит комбинация этих задач.

Чтобы лучше нх понять, рассмотрим следую1ций пример применения кластерного анализа. Алкоголизм — главная проблема в области психиатрии США, однако классификация больных алкоголизмом до недавнего времени не получала широкого распространения среди профессиональных психиатров. Голдстейн н Линден (1969), психологи-клиницисты, построили такую классификацию на основе кластерного анализа. Они с помощью психологического теста ММР1 (миннесотское многофазовое обследование личности — М1ппезо1а Мп)1)р)1аз1с Регзопа)1(у 1пчеп1огу) собрали данные о 5!3 больных алкоголизмом, проходивших лечение в госпитале в Индианаполисе, штат Индиана.

Тест содержал 566 вопросов (типа да/нет), которые суммировались по 13 диагностическим шкалам (например, шкала шизофрении, шкала истерии). Голдстейн и Линден разделили полученные данные на две части; основная подвыборка (239 больных) и контрольная подвыборка (251 больной). Используя основную подвыборку, они сформнровалв корреляционную матрицу размерностью 239Х239, которая представляла сходства для ММР1-профилей этих больных, и применили кластерный метод, изобретенный Лорром (1966).

Из больных основной подгруппы 114 были распределены по четырем кластерам, а оставшиеся 125 не были приписаны ни к какому кластеру. Когда такой же обработке подверглась контрольная подвыборка, снова были выделены четыре кластера, которые содержали 106 (нз 251) больных алкоголизмом. Главные профили кластеров для обоих подвыборок были в основном одинаковые. Голдстейн и Линден назвали эти четыре кластера следующим образом: 1) эмоционально-неустойчивые личности; 2) пснхоневротикн с бес- 143 покойством7депрессией; 3) психопатические личности и 4) больные алкоголизмом, употребляющие наркотики и обладающие параноидальными чертами.

Исследование Голдстейна и Линдена сыграло важную роль, поскольку послужило моделью для более 15 последующих работ, в которых применялся кластерный анализ для классификации больных алкоголизмом. Большинство из этих работ в основном подтвердили обоснованность выделения первых двух кластеров (типы 1 и 11) . Другая работа была выполнена двумя антропологами Бертоном и Ромин (1975). Они решили исследовать, как в а~нглийском языке можно классифицировать термины, соответствующие статусу и роли индивидов в системе человеческих отношений.

Данные, использованные в работе, были получены в результате классификацн 58 наиболее общих терминов, среди которых типичными были: «художник», «босс», «друг», «человек», «владелец», «поэт» и «шпнон». Участвовавшим в исследовании были розданы карточки с этими словами и затем было предложено произвольным образом разложить их по группам. На число и размеры групп никаких ограничений не накладывалось. Сходство между группами терминов определялось с помощью Я-оценки (Мц!1ег, 1989). Исследуя данные о сходстве с помощью кеметрического многомерного шкалироваиия, авторы пытались выявить наличие некой латентной структуры для описания сходства (различия) данных терминов, Были выделены три шкалы: оценочная шкала, в соответствии с которой такие термины, как «игрок», «бандит» и «шпион», противопоставляются терминам «друг» и «компаньон»; шкала иерархии, по которой выявляется различие между терминами «босс» нли «бригадир» и понятиями родственных н дружеских отношений, например «друг»; шкала профессиональной принадлежности, позволяющая выделить роли и соответствующие термины, связанные с работой.

Затем они провели иерархический кластерный анализ, применив два различных метода к одним и тем же данным о близости. Для каждого из этих методов авторы выбралн решение, состоящее нз восьми кластеров. При этом они отметили, что результаты применения методов, хотя и различаются во многих отношениях, все же имеют четыре общих кластера: 1) кластер, включающий семь терминов родства; 2) кластер дружеских отношений; 3) кластер тсрмииов принадлсжностн к социальным группам и 4) кластер управленческих ролей. Бертон и Ромин пришли к выводу, что результаты, полученные с помощью обоих методов, дополняют друг друга. Они полагают, что лица, классифицировавшие термины, принимали решения на основе двух критериев отбора.

Первый, упрощенный критерий подобен полученному с помощью многомерного шкалнровання (оценочная шкала, шкалы иерархии и профессиональной принадлежности). Второй, более тонкий критерий подсказан результатами кластеризации н подобен четкой структуре английских терминов родственных отношений, основанной на степени родства между индивидами, не за- висящей от половых различий. Результаты, полученные с помощью кластерного анализа, подтверждают неоднозначность поло- ролевых критериев в западном обществе, отмеченных социологами, н, кроме того, проясняют, как в английском языке классифицируются термины родства. Последний пример — социологическое исследование Филсингера, Фолкнера и Уорленда (1969) — предназначался для создания классификации верующих. Данные были собраны с помощью шкалы религиозности (Ре)опй е! а!., !970) в форме вопросника, который был предложен 547 старшекуроникам университета штата Пенсильвания, Было выбрано 37 вопросов, а план измерений был разработан на оанове предыдущего факторного анализа этих данных (Ре)опд е!.

а1., !9?0). Поскольку выборка из 547 студентов слишком велика н требует для обработки больших затрат, для исследования была использована выборка из 220 студентов. Матрица сходства между парами индивидов размерностью 220Х220 подверглась кластеризации. Для а~излива было выбрано решение, состоявшее из семи кластеров, соответствующих семи типам верующих: тип 1 — неверующие; тнп П вЂ” консерваторы; тип П1 — нигилисты; тип 1У вЂ” умеренно религиозные; тип У вЂ” крайне религиозные; тип т'1 — ортодоксы; тнп И1 — поклонники культа и обрядности.

Фнлсингер и другие сделали также попытку проверить обоснованность классификации верующих. Сначала они провели дискриминантный анализ кластеров и, как было сказано, результаты имели высокую значимость~. Затем сравнили объекты из разных кластеров по семи демографическим признакам, По четырем признакам (размер общины; политические взгляды; процент студентов, ие связанных с церковью; принадлежность к той или иной религии) кластеры имели значимые различия. Авторы пришли к заключению, что перекрывающиеся результаты подтверждают их эмпирическую типологию верующих.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6381
Авторов
на СтудИзбе
308
Средний доход
с одного платного файла
Обучение Подробнее