И.Д. Мандель - Кластерный анализ (И.Д. Мандель - Кластерный анализ.djvu), страница 9

DJVU-файл И.Д. Мандель - Кластерный анализ (И.Д. Мандель - Кластерный анализ.djvu), страница 9 (ПМСА) Прикладной многомерный статистический анализ (3367): Книга - 10 семестр (2 семестр магистратуры)И.Д. Мандель - Кластерный анализ (И.Д. Мандель - Кластерный анализ.djvu) - DJVU, страница 9 (3367) - СтудИзба2020-08-252020-08-25KoalaСтудИзба

И.Д. Мандель - Кластерный анализ.djvu1242

Описание файла

DJVU-файл из архива "И.Д. Мандель - Кластерный анализ.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр DJVU-файла онлайн

Распознанный текст из DJVU-файла, 9 - страница

зт Это второе оптимизационное направление в решении задачи кластер-анализа сформировалось позже первого (вторая половина 60-х годов) и представляет богатую и разветвленную дисциплину. Остановимся на некоторых методологических аспектах, касающихся связи двух подходов. Оптимизационное направление пытается задачу кластер-анализа ввести в традиционное математическое русло, четко сформулировать критерий и добиваться его экстремизации. При этом, естественно, возникают чисто математические проблемы: определения свойств функционала, путей достижения оптимума, трудоемкости алгоритма. Обсуждение этих вопросов часто оставляет в стороне узловую проблему: каким должен быть функционалй Его выбор превращается по сути в самостоятельную проблему (см. 2.3.2).

Если функционал качества выбран, то следует решить другую задачу: обосновать процедуру поиска глобального или локального экстремумов. Редко исследователю действительно нужен глобальный экстремум некоторой функции для решения своей весьма расплывчатой задачи выделения однородных групп. Если в какой-нибудь жестко детерминированной зкономической системе экстремум целевой функции еще может означать печно явно полезное (в том смысле, что ухудшение функции на рубль означает ухудшение материального положения заказчика на рубль), то в кластер-анализе такой четкой связи между целевым функционалом и действительной целью исследователя нет. И прежде всего потому, что цель не может быть точно сформулирована в условиях исходной неопределенности в характере данных. Действительно, при разных функционалах качества должны быть разные результаты.

Так как истинная структура данных неизвестна, желательно работать с несколькими функционалами. Если функционалы дают сильно отличающиеся классификации, надо полагать, структура данных не вполне отчетлива. Но если классификации похожи, то скорее всего выявлена реальная структура. В последнем случае разные разбиения примерно отражают наиболее характерную (даже в разных смыслах) структуру. Поэтому нет оснований, на наш взгляд, считать оптимизационные алгоритмы качественно более высоким уровнем по сравнению с процедурами первого типа; скорее это иной способ формализации представлений о хорошей классификации.

Видимо, совсем не случайно установлено, что считавшиеся прежде эвристическими процедуры оптимизируют некоторые функционалы. Резкой границы между подходами нет, наоборот, есть предположение, что каждая прямая процедура на самом деле доставляет экстремум какой-то функции, которую, правда, надо отыскать (см., напр., (18]). И напротив, каждому функционалу скорее всего соответствует свое определение кластера. Большая работа по выяснению такого рода связей между подходами еще далека от завершения, но ее результаты представляются многообещающими (см. 2.3.4). зв Наконец, можно выделить третье направление решения задачи кластеризации, наиболее позднее по срокам развития (середина 70-х годов).

Его можно называть апнроксимационным. Основная идея подхода заключается в следующем: отношения, заложенные в исходных данных, требуется наилучшим образом аппроксимировать отношением, отвечающим нашему представлению о классификации. Классификация обычно задает отношение эквивалентности, а исходные данные могут быть отражены по-разному. Например, матрицу «объект-объект» расстояний можно рассматривать как метризованную толерантность. Тогда задача стоит так: найти эквивалентность, ближайшую (в некотором смысле) в исходной толерантности. Возможны и другие постановки такого вида (2.3). Конечно, алгоритмы аппроксимации носят оптимизационный характер.

Но целесообразно выделить эти процедуры как в силу их своеобразной направленности, так и потому, что сами они порождают определенные функционалы качества. Возможно, наиболее серьезные теоретические результаты будут получены именно на пути анализа процедур аппроксимации при разных предположениях. Рассмотренные три направления в задаче кластеризации, как и некоторые ранее делавшиеся классификации алгоритмов [5, 30, 62 и др.], не бесспорны и даже не вполне строги. Как отмечалось, типы могут пересекаться, и, видимо, зона пересечения будет с углублением теоретических разработок возрастать.

Вообще надо отметить, что вопрос о классификации алгоритмов классификации, поставленный лет пятнадцать назад, не нашел до сих пор приемлемого решения. глл. клдссиеикдция Алгоритмов Варианты классификации обсуждались А. А. Дорофеюком [30), С. А. Айвазяном и др. [5), Н. Г. Загоруйко [38], Б. Г. Миркиным [63), А. Р. Лейбкиндом и др. [47), Дж.

Гудом [28), Р. Кормаком ]!20], Дж. Хартиганом [)3)) и многими другими авторами. При этом различными были ие только схемы классификации, но и первичные установки исследователей вЂ” чрезвычайно обильные и весьма частные свойства классификаций, перечисляемые в ]28] (отчастм и в [47] ), почти никак не связаны с четким, но довольно схематичным делением методов в [30) и т. д. Предлагаемая ниже группировка в значнтельной мере опирается на схемы перечисленных авторов. Классификацию алгоритмов приходится вести по нескольким качественным признакам, поэтому, например, ожидать стройной упорядоченности не приходится вЂ” сочетания признаков носят фасетный характер.

Рассмотрим важнейшие основания для деления. !. Характер отношения, которое отыскивается как результат классификации 1.!. Разбиение с непересекающимися классами (отношение эквивалентности). Все объекты внутри найденного класса считаются тождественными, а объекты разных классов вЂ” нет. Почти все процедуры, описанные в 2.2 и 2.3, отыскивают такие разбиения.

39 1.2. Разбиение с пересекающимися классами. Задается по-разному: введением степени принадлежности объекта к классу в духе теории размытых множеств [34, 331, определением вероятности принадлежности объекта к классу [76) или просто перечнем объектов в зоне пересечения. Некоторые из рассмотренных ниже алгоритмов допускают пересекающиеся классы, но специально рассматривать такие процедуры нам кажется нецелесообразным, поскольку в конечном счете все равно исследователь вынужден отнести куда-либо каждый объект (см.

другую точку зрения в [131, !10] н др.). 1.3. Иерархическое дерево. Процедуры классификации отыскивают целую систему вложенных разбиений. Такая сложная структура далеко не всегда соответствует представлениям о строении совокуп- . ности. Но иерархическими алгоритмами можно отыскивать и «обычные» разбиения, стоит лишь задать число классов, порог и т.

д, В таком аспекте мы и будем их рассматривать. Исторически такие востановки существуют с начала 50-х годов и идут от биологической систематики. Нередка нх называют задачами таксономии (в отличие от других задач кластеризации). В обзоре [зо! они вообще не были зачислены в разряд методов автоматической классификации. 1.4. Отношение произвольной структуры. Наиболее общий способ анализа структуры множества вЂ” аппроксимация его некоторым отношением с произвольной (заранее заданной) структурой. Такая задача, вообще говоря, выходит за рамки кластер-анализа. Но ее можно рассматривать расширительно, связав произвольную структуру со способом операционализации некоторой «суперцели» классификации [37, с. 88) (см.

3.2). 2. Степень участия человека в процедуре выделения кластеров 2.1. Человек не принимает участия в работе алгоритма, классификация производится машинным способом. Таковы многие процедуры в 2.2 и все вЂ” в 2.3. Конечно, отсутствие человека понимается в узком смысле: исследователь формирует исходные данные, выбирает расстояние, задает параметры классификации, но сам в процесс работы алгоритма не вмешивается, разбиение получает как готовый результат.

2.2. Человек участвует в процессе получения разбиения. ЭВМ (алгоритм) выдает не собственно классификацию, а информацию, на основании которой человек принимает решения о разбиении. Такими процедурами фактически являются все методы визуализации данных (см. 3.1), упорядочения матриц связи и др. Они обычно дают максимально полезные содержательные результаты, несмотря на свою «нестрогость» и «человеческий произвол». 40 3, Характер априорных сведений (задаваемых параметров) для работы алгоритма 3 !. Априорные сведения отсутствуют (свободная классификация) Считается, что отсутствие задаваемых параметров необходимо для выделения естественной, а не навязанной структуры исходных данных.

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.