И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914), страница 27

Файл №1119914 И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ) 27 страницаИ.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ (1119914) страница 272019-05-092019-05-09СтудИзба

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 27)

Кроме того, это доказывает, что наша первая функция статистически значима. После определения первой функции, снова проверим значимость оставшихся различий. Как и следовало ожидать, значение статистики хи-квадрат стало меньше, а уровень значимости стал равным 0,224 (й 1). Большинство исследователей будут считать этот результат незначимым, поэтому определять вторую и третью функции не следует, полагая таким образом, что вся значимая информация о различиях групп уже извлечена, Другими словами, одного-единственного измерения достаточно для представления всех замеченных различий между группами.

Второе измерение (которое вместе с первым обрадует плоскость) не добавит никаких существенных различий. Но если бы вместо этого была установлена значимость остаточной дискриминантной способности, то мы приступили бы к определению второй функции. Затем проверка значимости для новой остаточной дискриминаитной способности была бы повторена (й=2).

В нашем примере уровень значимости так велик (0,954), что никто не посчитал бы оставшиеся различия значимыми. Следовательно, нет абсолютно никакой необходимости нычислять третью функцию, так как она вряд ли что-либо добавит к объяснению различий между группами. Найденный результат помогает понять, почему у нас было так много трудностей при интерпретации структурных коэффициентов функции 3 и почему не было обнаружено больших различий между центроидами групп по этой функции.

В рассматриваемом примере число статистически значимых функций меньше того, которое допускается математикой Одечако так бывает не всегда. Во многих ситуациях остаточная дискриминантная способность для й=д вЂ” 1* оказывается значимой. В таком случае нужно вычислить все возможные функции (вплоть до й=й вЂ” 1), если, конечно, нет других причин не делать этого (таких, ~например, как низкая каноническая корреляция). Примем разумное решение вЂ” продолжить определение функций до тех пор, пока остаточная дискриминантная способность перестанет быть значимой. Таким образом, мы можем быть уверены в том, что полученные функции являются статистически значимыми в целом каксистема. Это не доказывает значимость какой-либо одной функции (если, конечно, она ие была получена специально), а скорее дает значимость всех полученных функций.

А поскольку мы используем функции как систему и наша цель вЂ” привести информацию, необходимую для разделения, к наименьшему числу размерностей, то этого вполне достаточно, Единственная реальная проблема, которая может быстро уничтожить любой исследовательский проект, возникает, если общее количество информации является незначимым, т. е. при я=б (если только не нужно показать, что между классами нет различий). ' Более точно е=оч1о (я вЂ” 1, р).

вЂ” Примеч. ред, Здесь мы рассмотрели все то, что обычно делает исследователь, но для лучшего усвоения вЂ” в обратном порядке. Логически исследователь должен начать с вопроса: «Какая из моих функций является статистически и реально значимой?» Нет необходимости продолжать анализ любой функции, исключенной из рассмотрения. Для выбранных функций исследователь должен сочетать рассмотрение структурных коэффициентов с определением положений центроидов классов, чтобы выявить значение каждой функции.

Структурные коэффициенты дают, кроме того, информацию о том, как каждая из переменных участвует в различении классов в этой системе координат. В некоторых исследованиях работа аналитика заканчивается вместе с окончанием интерпретации канонических дискриминантных функций. Более вероятно, исследователь продолжит классификацию объектов вЂ” либо для практических, либо для аналитических целей, что и является темой следующего раздела. !7. ПРОЦЕДУРЫ КЛАССИФИКАЦИИ Как уже было сказано, целью дискриминантного анализа является решение двух задач: интерпретации н классификации.

До снх пор внимание фокусировалось в основном на задаче интерпретации, которая связана с определением числа н значимости канонических дискрнмннантных функций и с выяснением их значении для объяснения различий между классами. Классификация вЂ” это особый внд деятельности исследователя, в котором либо дискриминантные переменные, либо канонические дискримннантные функции используются для предсказания класса, к которому более вероятно принадлежит некоторый объект. Существует несколько процедур классификация„но все онн сравнивают положение объекта с каждым нз центроидов классов, чтобы найти «ближайший». Например, целью исследования Бардес было сформировать подпространство, определяемое канонической дискриминавтной функцией, используя данные о 19 сенаторах и выделенных фракциях. Затем она, воспользовавшись результатами их голосования, вычислила значения дискриминантной функции для позиций остальных сенаторов и смогла отнести позицию каждого сенатора к одной из четырех групп.

Таким образом, она определила размеры н состав фракций и выяснила, как они изменяются со временем. КЛАССИФИЦИРУЮЩИЕ ФУИКЦИИ Классификация вЂ” это процесс, который помогает исследователю принять решение: указанный объект «прннадлежит к» нли «очень похож на» данную группу (класс). Такое решение принимается на основе информации, содержащейся в днскримннантных переменных. Существует несколько способов проведения классификация.

Обычно они требуют определения понятия «расстояния» !!2 между объектом и каждым центроидом группы, чтобы можно было п иписать объект к «ближайшей» группе. Р роцедуры классификации могут использовать или самими днскриминантные переменные, илн канонические дискриминантные функции. В первом случае днскриминантный анализ вовсе не проводится". Здесь просто применяется подход максимизации различий между классами для получения функции классификации.

Различение классов или размерность дискрнминантного пространства ~на значимость не проверяется. Если же сначала определяются канонические днскриминантные функции н классификация проводится с их помощью, можно провести более глубокий анализ. К этому мы вернемся позднее, а сейчас продолжим рассмотрение классификации, когда дискриминантные переменные используются непосредственно. Простые классифицированные функции Фишер (1936) был первым, кто предположил, что классификация должна проводиться с помощью линейной комбинации дискрнминантных переменных. Он предложил применять линейную комбинацию, которая макснмизирует различия между классами, но минимизирует дисперсию внутри классов. Разработка его предложения приводит нас к определению особой линейной комбинации для каждого класса, которая называется «классифицирующая функция»'. Она имеет следующий вид: йд=йдо+Ьд1Х1+ЬдзХа+ "'+ЬдрХр (12) где Ьд вЂ” значение функции для класса й, а Ьд,вЂ” коэффициенты, которые необходимо определить.

Объект относится к классу с наибольшим значением (наибольшим Ь). Коэффициенты для классифицирующих функций определяются с помощью таких вычислений: Ьд,= (п -д) 2, а„Х,д (1З) где Ьд, вЂ” коэффициент для переменной 1 в выражении, соответствующему классу )г, а а„вЂ” элемент матрицы, обратной к внутри- групповой матрице сумм попарных произведений (ртз. Постоянный член определяется так: (14) Ьде= вЂ” 0.5 ~., 'ЬдрХ,д Мы обычно не интерпретируем этн коэффициенты классифици.

рующей функции, потому что они не стандартизованы и каждому классу соответствует своя функция. Точные значения функции ро- * Во многих работая именно этн функции называкпси дискрнминантными функциями, а функции, определяемые из соотношения (4), вЂ” каноническими переменными нли каноническими дискриминаитиыми функциями (каноническими направлениями).

вЂ” Примеч ред ыз Таблица 11 Коэффициенты простой каассифицирукпцей функции ли не играют: нам нужно знать лишь, для какого класса это значение наибольшее. Именно к нему объект ближе всего. Функции, описываемые соотношением (12), называются «простымн классифицирующими функциями» потому, что они предполагают лишь равенство групповых ковариационных матриц и не требуют никаких дополнительных свойств, обсуждаемых далее.

Рассмотрим табл. 11, в которой приведены коэффициенты классифицирующих функций для данных о голосовании в сенате, чтобы проиллюстрировать использование этих функций. Применив такую функцию к первичным данным по позиции сенатора Айкена, мы получим следующие значения для четырех групп: 89,?42; 46,578; 78,101 и 78,221. Поскольку первое значение вЂ” наибольшее, мы отнесем позицию Айкена к первой группе (что является верным предсказанием). Обобщенные функции расстояния Более понятным способом классификации является измерение расстояний между объектом и каждым из центрондов классов, чтобы затем отнести объект в ближайший класс.

Однако в тех случаях, когда переменные коррелированы, измерены в разных единицах и имеют различные стандартные отклонения, бывает трудно определить понятие «расстояния», Индийский статистик Махаланобис (1963) предложил обобщенную меру растояния, которая устраняет эти трудности. Мы можем использовать ее в следующей форме: р р Ю(Х(ба)=(п вЂ” и) 2', 2„ан(Х; вЂ” Х,а ) (Х,вЂ” Хто ), (15) а=1 7=~ где 11'(Х~ ба) вЂ” квадрат расстояния от точки Х (данный объект) до центроида класса й. После вычисления Рт для каждого класса классифицируем объект в группу с наименьшим Ю. Это класс, чей типичный профиль по дискриминантным переменным больше похож на профиль для этого объекта, Если расстояние до ближай- 1Ы щего класса велико, то согласие между профилями будет плохим, но по сравнению с любым другим классом вЂ” хорошим.

Соотношение (15) предполагает, что классы имеют равные ковариационные матрицы. Если это предположение не выполняется, то выражение можно модифицировать, как предлагает Татсуока (1971; 222). Вероятность принадлежности к классу Оказывается В» обладает теми же свойствами, что и статистика хи-квадрат с р степенями свободы. Таким образом, мы измеряем расстояние в «хн-квадрат единицах». Если предположить,что каждый класс является частью генеральной совокупности с многомерным нормальным распределением, то большинство объектов будет группироваться вблизи центроида, и нх плотность будет убывать по мере удаления от центроида. Зная расстояние от центроида, можно сказать, какая часть класса находится ближе к центроиду, а какая вЂ” дальше от него. Следовательно, можно оценить вероятность того, что объект, настолько-то удцленный от центроида, принадлежит классу.

Характеристики

Тип файла

DJVU-файл

Размер

2,35 Mb

Материал

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ

Тип материала

Книга

Предмет

Теория вероятностей и математическая статистика (ТВиМС)

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов книги

i.s.-enjukov-s.b.-koroleva-faktornyj-diskriminantnyj-i-klasternyj-analiz.rar

И.С. Енюков, С.Б. Королёва - Факторный дискриминантный и кластерный анализ.djvu

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.