Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 85
Текст из файла (страница 85)
Прием, который используется в линейном метрическом ЧШ для преодоления этого, заключается в переходе к модели с так называемой адаптивной константой Очевидно, существует такое значение а ) О, что для величин Н„будет выполняться неравенство треугольника, т.е. они будут расстояниями. В частности, это будет, если а =( — 1)гпах(Ь„,— бй,— 6„).
й,пу Значение а есть минимальное значение константы а, при котором выполняется неравенство треугольника [20Ц для всех троек объектов из преобразованнои матрицы О. Однако из выполнения неравенства треугольника еще не следует, что величины и'„ можно рассматривать как евклидовы расстояния и, следовательно, нельзя гарантировать неотрицательной неопределенности матрицы В, получаемой в результате процедуры двойного центрирования. Поэтому необходимо выбрать аддитивную константу таким образом, чтобы, с одной стороны, обеспечить положительную определенность матрицы В (или хотя бы небольшие значения модулеи отрицательных собственных чисел), а с другой стороны, не увеличить существенно число значимых по величине положительных собственных чисел матрицы В, т.
е размерность пространства отображения (с ростом а она будет расти). Подробнее о подходах к решению этой проблемы см 12991 Недостатком, ограничивающим практическое применение метода метрического МШ, является трудность работы с пропущенными данными, т. е. в случае, когда часть значений мер различия отсутствует. Тогда неясно, как корректно осуществить переход от матрицы д к В В то же время для нелинейного подхода к МШ и для неметрического МШ отсутствие части данных практически не сказывается на результатах. 16.1.5.
Нелинейные методы метрического МШ. Эти методы основываются на получении матрицы путем прямой минимизации критерием вида а~а= с (Д)2;ои, А,— дм)й (16 8) или Яй (7) сй (Д) Ъ ом (Ьо Нч)~ (16.8') Семейство критериев вида (16 8) с различным выбором весов о„рассматривается в(300, 9, 152, 811(см также 3 13 6). Критерий вида (16 8') предложен в 19, 3291. Вычислительные аспекты, связанные с минимизацией (16 8), описаны в 442 $13 6, некоторыс другие подходы, например использование метода сопряженных градиентов, описаны в (152). Веса со в критерии (16.8) обычно выбирают в одной из следующих форм.
п„=1/б»п о„=б,„(см также $13.6). Вид критериев типа (16 8) аналогичен виду клас сического критерия неметрического шкалирования типа «стресс» (з(гезз) '. Нормирующие константы подбираются так, чтобы, во первых, критерий стал однородным по б»п и во-вторых, отражал некоторую относительную величину качества аппроксимации. Например, в критерии Сэммона (см $13.5) вес ш/=1/б„п с(Л) =1/Хб„Нали» / чие нормирующей константы не влияет, однако на полуа чение минимизирующего решения, поскольку величины б„считаются неизменными в процессе минимизации (в отличие от процедур неметрнческого МШ) В качестве расстояний г(„не обязательно брать евклидовы, можно использовать например, метрику Минковского !152! Решение задачи шкалирования, полученное классическим методом, часто используется как начальная конфигурация для минимизации указанных критериев При метрическом МШ, основанном на критериях типа (16 8), (16 8'), уже можно обрабатывать матрицы А с пропущенными элементами Для это~ о суммирование в (16.8) и (16 8') достаточно проводить только дчя тех пар объектов, для которых удаленности измерены Зкспериментально показано, что качество восстановления конфигурации будет почти таким же, как для полной матрицы, даже при достаточно большом числе пропусков (порядка 1/3 расстояний для каждого объекта) !00!.
16.2. Неметрическое многомерное шквлввоваиме !307, 261, 260, 1521 16.2.1. Структурная модель. В неметрическом МШ предполагается, что различия (близости) б„ измерены в ординальной шкале, так что важен только рашовый порядок различий, а сами их численные значения не так важны. Проце дуры неметрнческого МШ стремятся построить так)ю гео метрическую конфи/) рацию точек в //-мерном пространстве, чтобы ранговый порядок попарных расстояний, между ними » Основное отличие критериев типа (!6 8) (16 8') от критериев типа «стресс» (см (16 1О), (16 1О')) иормир) югпне множители с, (Л) зависят от искомых коорлиизт точек и меняются в процессе работы алгоритма онтимиззции 448 5,(Х, |) = !/ ~(а„— дм)» | ~/~~4,.
ь' ~,» ( Р' (16.9) Это известный «стресс»- критерий (форма 1), предложенный Краскалом (261). Используются и его модификации !329, 89): В»(У, 1) = (16.10') 1 где «( = —, Х «(ы — среднее значение расстояния. о» Функция | ( ) может задаваться как в параметрическом виде, так и непараметрически Для последнего случая Крас- калом предложен метод получения геометрической конфигурации по критерию (16 9) или (16 10), который носит название шкалирования на основе монотонной регрессии (260!. При параметрическом задании функцию | ( ) выбирают из некоторого параметрического семейства монотонных функций 1 (6, О) и, кроме д-мерных наборов координат, определяются и значения параметров Лддитивная константа, рассмотренная в п.
16 1.4, может служить простейшим примером задания функции | (б, «»). Эта константа является единственным оцениваемым параметром при таком задании функции. Большие возможности дает использование линейной функции «(«1 = абм+ Ьь совпадал по возможности с ранговым порядком различий, т. е отобразить неметрическую (ранговую) информацию в метрической шкале. Поскольку ранговый порядок не меняется при любом монотонно возрастающем преобразовании, задаваемом функцией |( ), то приходим к следующеи структурной модели.
|(6„) ж йо. Это означает, что процедура построения подходящеи геометрической конфигурации включает в себя не только подгонку координат точек-образов, но и самой функции 1 0). Дальше через 2„будем обозначать значение | (6„), т. е. И„= | (6„). Для измерения того, насколько в среднем близки зги значения к аппроксимирующим их расстояниям д„, используются различные критерии, например Шкалированне индивидуальных различий (ШИР) 16.3.
В этом случае имеется й (А ) 1) таблиц удаленностей или расстояний (если используетсяметрическое шкалирование). Будем обозначать различия между 1-м и 1-м объектами для Здесь уже имеется двумерный вектор параметров 6, = а, 9, == Ь 16.2.2. Некоторые замечания о вычислитааьной процедуре. Когда функция( (б, В) задана, критерий (16 9) (равно как и критерии (16 10), (16 10')) можно переписать в виде 5, (Е, В).
Будем считать, что имеется единственное значение В,= = В,(Е), которое минимизирует (16.9) при фиксированном Е (для функции вида (16.11) это, очевидно, имеет место). Теперь, подставляя в 5, (Е, В) минимизирующее значе- ние В,, видим, что для получения Е нужно минимизировать критерий 5(Е) =5,(Е, В(Е)). (16.12) Вычислим теперь градиент (16.12) по Е. Имеем Р5(Е) дЗ~ (Е хх)+ д$~ ~ дно дх ' дб ~ дХ ~я.
е, Но, поскольку значение В, получено само из условия мини- мума 5, (Е, 6) по В, необходимо должно выполняться ус- ловие и, следовательно, выражение для градиента упрощается: ~З (Е) = — ' (Е* В ). (16. 13) Таким образом, каждая итерация в задаче минимизации критерия (16.10) может быть разбита на две фазы 1) минимизация по В при заданном Е.
В случае функции (16 11) эта задача сводится к оценке а и Ь по методу наи- меньших квадратов и решается просто и однозначно, 2) минимизация 5 (Е) при фиксированном В. Здесь, как правило„ используется градиентная процедура. Затем происходит возврат к фазе 1. Весьма важным моментом на фазе 2 является выбор шага. По этому поводу н относитель- но других деталей вычислительной процедуры см.
работу 1891. 1-й таблицы (1 =- 1, й) через 6<,'. В случае матриц расстоя- ний структурная модель (ШИР) предполагает, что расстоя- ния б,'," между точками для 1-й матрицы могут быть пред- ставлены в виде взвешенного евклидова расстояния 6<<! <(<и — ъ / с и (з<х! з< !)! г= ! (16.14) В неметрическом случае структурная модель будет Г ч 1(6<1!) <()<! = и ~~ о (я< ! — <.
!), г=! (16.15) 3(., У) =Х 1Ьм<- Х.< х<х!.„) !.о<<, к=! (16.16) Вычислительные процедуры для ШИР приведены, например, в работах (317, 329, 152). ВЫВОДЫ 1 Чногоз<ерное и<калирование — совокупность методов, позволяющих по заданной информации о мерах различия (близости) между объектами рассматриваемой совокупности приписывать каждому из этих объектов вектор характеризующих его количественных показателей; при этом размерность искомого координатного пространства задается заранее, а «погружение» в него анализируемых объектов производится таким образом, чтобы структура взаимных различий (близостей) между ними, измеренных с помо<цью приписываемых им вспомогательных координат, в среднем наименее отличалась бы от заданной в смысле того или иного функционала качества.
Процеду- 446 В метрическом случае и в предположении об отсутствии ошибок можно обобщить подход, рассмотренный в ~ 16.1. Именно процедура двойного центрирования применяется для каждой из й матриц, что дает в результате набор уравнений Ь<т! ж ~г~" я<о иь, где векторы Х! центрированы. ! Значения Х и У (У вЂ” матрица значений весов размером йх<)) получаются из минимизации, например, следующей функции потерь ры многомерного шкалирования применяются, когда данные заданы в виде матрицы попарных расстояний между объектами или удаленностей или их порядковых отношений.
В первом случае используются методы так называемого метрического шкалирования, а во втором— неметрического шкалирования. 2. Важной целью методов шкалирования — дать наглядное визуальное отображение данных в виде некоторой геометрической конфигурации точек. 3. Решения как в метрическом, так и в неметрнческом случае неоднозначны — они определяются с точностью до поворота и переноса начала координат. 4.
При наличии нескольких матриц расстояний (удаленностей), порядковых отношений этих удаленностей, задача шкалирования носит название задачи шкалированил индивидуальных различий, При этом, кроме образов объектов как точек в пространстве низкой размерности, можно получить и точки-образы для условий, породивших различные матрицы. 5. Вычислительные процедуры как в метрическом, так и в неметрическом случае весьма трудоемки (порядок числа умножений растет как и').
Гл а в а 17. СРЕДСТВА АНАЛ ИЗА И ВИЗУАЛ ИЗАЦИ И НЕКОЛИЧЕСТВЕННЫХ ДАННЫХ В данной главе рассматривается подход к анализу неколичественных данных, основанный на использовании методов анализа соответствий и оцифровки. Анализ соответствий (АС) был введен и довольно широко используется в практическом анализе данных начиная с начала 60-х годов группой французских статистиков 1191, 263), Многие результаты, теоретически эквивалентные результатам АС, в особенности относящиеся к анализу двумерных таблиц сопряженности, неоднократно пере- открывались начиная с 30-х годов различными исследователями под названиями «дуальное шкалирование», «оптимальная оцифровка», «одновременная линейная регрессия» и т.д.
(см. библиографию в 12, гл. 3). Несомненной заслугой французских статистиков является, помимо распространения АС на случай более чем двух переменных, широкое использование возможностей визуализации данных, предоставляемых АС. В этой главе рассматривается применение АС для анализа двумерных частотных таблиц сопряженностей, т. е. собственно «классический» АС, введенный в !19И; распространение АС на анализ некоторых типов матриц данных с неотрицательными элементами; множественный анализ соответствий (МАС), т. е.