И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 36

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 36 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 362019-05-092019-05-09СтудИзба

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 36)

В приведенных примерах можно найти любую из основных задач кластерного анализа. Целью Голдстейна, Лнндена, Филсиигера и других было построение классификации, но заметную роль играет н исследование классификационных схем (ММР1 и шкалы религиозности). Работа Бертона н Ромин в первую очередь была посвящена анализу данных и проверке гипотез, а построение формальной классификации было второстепенной задачей.

В этом случае еще до проведения проверки гипотез авторы заметили, что их результаты подтверждаются данными, полученными с помощью более традиционных антропологических методов. Эти примеры показывают, что, несмотря на различия в целях, типах данных н примененных методах, все исследования, исполь- зующие кластерный анализ, характеризуют следующие пять основных шагов: 1) отбор выборки для кластеризации; 2) определение множества признаков, по которым будут оцениваться объекты в выборке; 3) вычисление значений той или иной меры сходства между объектами; 4) применение метода кластерного анализа для создания групп сходных объектов; 5) проверка достоверности результатов кластерного решения. Каждый из перечисленных шагов играет существенную роль при использовании кластерного анализа в прикладном анализе данных.

множествА дАнных, используемых В пРимеРАх Мы воспользуемся только одним набором данных, чтобы показать, как применяют кластерные методы, Еще один набор приводится в приложении для того, чтобы заинтересованный читатель мог поэкспериментировать с процедурами, которые мы описываем; наши результаты могут служить ориентирами для сравнения. Первое множество данных, используемое в качестве примера, представляет собой гипотетические данные об археологических раскопках древних захоронений.

Эти данные могут содержать важную для археологов информацию о социальном статусе или положении, занимаемом в обществе индивидами, найденными в могилах. Тщательно анализируя содержимое захоронений, археологи могут сделать выводы о различиях в общественном положении индивидов, что в свою очередь может помочь определить природу социального ~расслоения и уровень развития общества, к которому они принадлежали.

Данные изменяются в зависимости от трех измерений: возраста, пола и статуса. На участке наших археологических раскопок были «захоронены» 25 человек, которые были разделены на три возрастные группы: дети, подростки и взрослые. Представлены два статуса: элитарный и неэлитарный. Во всех захоронениях содержится до восьми различных видов объектов, найденных в них: местная керамика, наконечники стрел, обломки браслетов, обработанные камни, костяные иглы, костяные шилья, привозная керамика и металлические изделия. Каждый из этих видов объектов соответствует определенному статусу и полу; возрастные различия объектов не были включены в данные, чтобы структура набора данных оставалась относительно простой.

Данные были закодированы а двоичной форме с помощью регистрации наличия или отсутствия объекта. Второй набор данных, также искусственного происхождения, был специально создан в качестве модели классификационной задачи, с которой часто сталкиваются в психопатологии. Основное множество даннгях содержит информацию о 90 гипотетических больных с тремя типами психических расстройств: психозы (П) неврозы (Н) и расстройства личности (РЛ), В каждую общую группу входило по тридцать больных. Более подробно о процессе генерации данных можно прочесть у Блзшфилда и Мори (1980).

Характер заболевания больных определялся по 13 стандартным шкалам, взятым из психологического теста ММР1, описанного ранее в работе Голдстейна и Линдена (1969), Эти шкалы имеют следующие названия и аббревиатуры: ° Шкалы достоверности данных; Ь вЂ” шкала лжи; Р вЂ” шкала фальсификаций; К вЂ” шкала поправок. ° Клинические шкалы: Нз вЂ” ипохондрия; Р вЂ” депрессия; Но вЂ” истерия; Рб вЂ” психопатические отклонения; М1 вЂ” шкала пола (мужской/женский); Ра вЂ” паранойя; Р1 вЂ” психастения; Зс вЂ” шизофрения; Ма вЂ” гипомания; 8! вЂ” социальная интроверсия. т Ь Р К На О НЧРды1 Ра Рт Зс Ма 5~ Ряс.

Ь Пример профиля дапаых ММР!.теста Ит Тест ММР1 состоит из 566 вопросов типа да/нет, ответы на которые даются от первого лица (например, «Я люблю читать технические журналы»). Эмпирическим путем эти 566 вопросов были сгруппированы в шкалы ММР1-теста. В ходе разработки данный тест предлагался как здоровым пациентам, так и больным с психическими заболеваниями. Вопрос относился к той или иной шкале, если он позволял отделить группу больных от здоровых. Все десять «клинических» шкал были сформированы именно таким образом, а имена шкал представляют собой клинические названия групп больных, для диагностирования которых этн шкалы предназначались.

Три другие стандартные шкалы являются шкалами достоверности ответов, т. е. определяют, в какой степени пациент может фальсифицировать свои симптомы. Результаты ММР1-теста интерпретировались с помощью профилей данных о больных. На рис. ! приведены результаты ММР1-теста для одного из 90 больных, представленных множеством данных. Значения признака изображены на профиле для каждой шкалы, при этом число 50 вЂ” нормальное значение признака, а число 70 указывает на значимое отличие от нормы.

Прифили различаются в первую очередь по «пикам» или шкалам, которые имеют наивысшие значения. Для рассматриваемого пациента наивысшие значения расположены в следующем порядке Ра, Зс, Р, Р1, 51 и Ма. Этот профиль довольно типичен для больного с диагнозом параноидальная шизофрения, НЕСКОЛЬКО ПРЕДОСТЕРЕЖЕНИЙ ОТНОСИТЕЛЬНО КЛАСТЕРНОГО АНАЛИЗА Прежде чем перейти к обсуждению основных методологических этапов проведения кластерного анализа, необходимо сделать несколько предостережений общего характера, 1) Многие методы кластерного анализа вЂ” довольно простые процедуры, которые, как правило, не имеют достаточного статистического обоснования*. Другими словами, большинство методов кластерного анализа являются эвристическими (подкрепленными лишь опытом разработчиков).

Онн вЂ” не более чем правдоподобные алгоонтмы, используемые для создания кластеров объектов. Вэтом резкое отличие, например, от методов факторного анализа, который хорошо обоснован статистически. Хотя многие кластерные методы обладают важными, подробно исследованными математическими свойствами (см. )агб(п апд 5(Ьзоп, 1971), все же важно сов~казать их простоту. В этом случае маловероятно, что пользователь допустит ошибку прн трактовке результата кластерного анализа.

* Достяточно строгая теория, охватывающая большую часть постзновок задач кластер-анализа, была разработана французскими исследователями. Ев изложение можно изйти в книге ч. дндэ и др «Методы зизлизя дзниых» (Мс Финансы и статистика, 1988), вЂ” Примеч. дед. 148 2) Методы кластерного анализа разрабатывались для многих научных дисциплин, а потому несут на себе отпечатки специфики этих дисциплин. Это важно отметить, потому что каждая дисциплина предъявляет свои требования к отбору данных, к форме их представления, к предполагаемой структуре классификации.

Что может быть полезным в психологии, может оказатьси ненужным для биологов, а так как кластерные методы порой пе более чем правила для создания групп, то пользователь должен знать те особенности, которые часто сопровождают обсуждение и описание методов кластеризации. 3) Разные кластерные методы могут порождать и порождают различные решения для одних и тех же данных. Это обычное явление в большинстве прикладных исследований. Одной из причин неодинаковых решений является то, что кластерные методы получены нз разных источников, которые предопределяли использова~ние различных правил формирования групп.

Данная ситуация вносит в работу с кластерным анализом путаницу не только для начинающих, ио и для опытных пользователей. Кроме того, желательно иметь специальную методику, позволяющую проверить, насколько «естественны» группы, выделенные методом кластеризации в наборе данных. Было разработано несколько процедур, способных помочь в решении этой задачи. 4) Йель кластерного анализа заключается в поиске суи4ествуюи)их структур. В то же время его действие состоит в привнесении структуры в анализируемые данные, т.

е. методы кластеризации необходимы для обнаружения структуры в данных, которую нелегко найти при визуальном обследовании или с помощью экспертов. Эта ситуация отличается от ситуации дискриминантного анализа, который более точно определяется как процедура идентификации.

Характеристики

Тип файла

DJVU-файл

Размер

2,35 Mb

Материал

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

Тип материала

Книга

Предмет

Теория вероятностей и математическая статистика (ТВиМС)

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов книги

i.s.-enjukov-s.b.-koroleva-faktornyj-diskriminantnyj-i-klasternyj-analiz.rar

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ.djvu

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.