Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 84
Текст из файла (страница 84)
) О;, с необходимостью следует выпачнение неравенств р(хг,» р(Х„»...>ц (Хг ) и, наоборот (здесь знак «)» означает «не хуже», а Х~, как обычно, вектор (х> ', ..., х,'»' )'). 3. Если рассмотреть линейную модель целевой функции, то задача ее определения (или, что то же, задача постро. ения интегрального показателя у) сводится к определению весовых коэффициентов 8,, О, О„в формуле гс (Х)-- = О„хы> + ... -~- О„х>»> Статистическая практика свидетельствует, что от экспертов гораздо проще получить информацию, относящуюся к сравнению объектов по анализируемому интегральному свойству, чем к сравнению удельных весов О, влияния на него отдельных частных критериальных показателей.
4. Базовая идея экспертно-статистического метода построения единого сводного показателя эффективности функционирования (качества) объекта заключается в «настройке» искомых коэффициентов О, целевой функции >г (Х) на заданную (в различнои форме) экспертную информацию, относящуюся к сравнению статистически обследованных объектов по анализируемому интегральному свойству. Название метода объясняется тем, что его реализация йснована как на статистической информации сб объектах (это данные Х,, Х,, ..., Х» о значениях их частных критериальных показателей), так и на экспертной (это представленные в той или иной форме экспертные оценки анализируемого интегрального свойства у). 5.
Вычислительная реализация экспертно-статистического метода (т. е. алгоритм определения искомых «весов» 8,) сводится к известному мепюду наименьших квадратов лишь в тех сравнительно редких случаях, когда от экспертов удается получить балльные оценки у„,, у», анализируемого интегрального свойства по каждому из исследуемых объекпюв Если же в распоряжении исследователя лин>ьсравнительные оценки объектов по анализируемому свойству (упорядочения, парные сравнения, классификации), то вычислительная процедура по определению коэффициентов О» существенно усложняется (ее описание и обоснование требуют специальной разработки).
6. Экспертно-статистический метод имеет широкий диапазон возможных применений, однако необходимым условием его достоверности и эффективности является четкое определение анализируемого интегрального свойства и компетентность используемых экспертных мнений. Гл а в а 16. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ Рассматриваются методы обработки таблиц экспериментальных данных, заданных в виде одной или нескольких матриц мер различия (или близости) между п объектами Аы~ =(6)п); (, 1=1, ..., п, 1= 1, ..., й. Таким образом, в общем случае имеем дело с трехвходовой матрицей, называемой еще <ящиком» экспериментальных данных. Индекс 1 указывает, что 1-я порция (матрица) близостей получена при проведении измерений на том же множестве объектов (единиц обследования, измерения), что и все другие матрицы Аьо (г Ф 1), но с помощью некоторого 1-го способа измерения, 1-го эксперта, в 1-й момент времени и т, д., т.
е. 1 определяет условия, в которых проводилось формирование матрицы Аа>. Основное внимание будем уделять случаю, когда удаленности (близости) б;; измерены либо в количественной шкале (интервальной или шкале отношений), либо в ординальной. В последнем случае для анализа играет роль только порядок расположения величины 6;н Цель методов, составляющих многомерное шкалирование (МШ), состоит в том, чтобы отобразить информацию о конфигурации точек, заданную матрицами близостей А, в виде геометрической конфигурации из и точек в многомерном пространстве. Если имеется несколько матриц АН~, 1= 1, ..., (г, то одновременно строится и геометрическая конфигурация из й точек в пространстве той же размерности, каждая из которых является «образом» совокупности условии измерения (эксперта, измерительного прибора и т.
д.). Такие методы носят название «многомерное шкалнрование индивидуальных различий» (МШИР). Это отображение достигается путем приписывания каждому из объектов наблюдения (и, если гг ) 1, каждому из условий измерения) о-мерного вектора характеризующих его количественных показателей. Компоненты этих векторов определяются таким образом, 4зз чтобы расстояния или близости (например„скалярные произведения) между точками (образами объектов) в пространстве отображения в среднем мало отличались от матриц Ап! в смысле некоторого критерия. Размерность пространства !! либо задается заранее, либо определяется в процессе решения задачи МШ или МШИР.
16.1. Метрическое многомерное шкалироваиие 16.!.1. Статистическая модель метрического МШ. В случае метрического МШ предполагается, что элементы единственной матрицы удаленностей А есть расстояния, измеренные с некоторой ошибкой, между объектами исследуемой совокупности, которые рассматриваются как точки в некотором д-мерном пространстве Йл: бы =.
!(!т+ вм, (16.1) где !(!! — расстояние между точками Х! и Хэ, вм — ошибка измерения. Обычно, хотя это и не обязательно, пространство Яг предполагается евклидовым, тогда !(» = ( ~ (х!'! — х)'!)» )~!'. г=! Дальшев данном параграфе будем иметь дело только с евклидовой метрикой. 16.1.2. Классическая модель и решение задачи метрического МШ. Описанные далее модель и способ определения координат точек Х„..., Х„подробно рассмотрены в работах 1318, 61, 1521. В данной модели предполагается, что ошибки измерения е!т = О (!, 1 = 1, л), так что бм — это в точности евклидовы расстояния. Метод определения координат точек Х„..., Х„(с точностью до ортогонального вращения) н заодно размерности пространства, в которое они отображаются, основан, однако, не на непосредственном использовании матрицы А, а на преобразовании ее в матрицу В скалярных произведений центрированных векторов Ьм == (Х! — Х) (Х! — Х), (16.2) Переход от матрицы исходной информации л к матрице В производится следующим образом.
Оказывается а П Ьм= — — Ау+ — д, !(м+ — ч А/ —,7,4/). ! ! ! мэ ! ! -!, ! м| ! 2 ~ л л л' ! ! /= ! 1./ (16.3) Процедура перехода от А к В называется двойным ивнтрированигм А. Матрица В размера (пхл) обладает следующими свойствами: 1) В неотрицательно определена; 2) ранг матрицы В равен размерности искомого пространства отображения; 3) ненулевые собственные числа матрицы В, упорядоченные в порядке убывания, совпадают с соответствующими собственными числами матрицы Я= ХХ', где Х вЂ” центрированная матрица данных (неизвестная нам), т.
е. матрица, элементы Ьго столбца которой и являются координатами вектора Х;. Матрица 3/н есть матрица ковариаций для Х; 4) пусть У„есть г-й собственный вектор матрицы $, соответствующий г-му собственному числу Л„, тогда вектор значений г-й главнои компоненты будет х„== Х'(/„. В то же время пусть у„— г-й собственный вектор матрицы В, соответствующий тому же самому собственному значению Л„, т. е. (16.4) (16.4') 440 ВУ~=Л»У ° тогда х„=- УЛ,у,. Из свойства 4) следует, что, решая проблему собственных чисел и собственных векторов для матрицы В и ограничиваясь ненулевыми собственными числами Л„..., Л», получим координатное представление точек в пространстве главных компонент, основываясь на формуле (16.4); величину размерности такого пространства, равную числу положительных собственных чисел матрицы д.
Элементы матрицы В могут быть представлены в виде Ь. — 'Ч ги>гоч ьв ли ~ г г=! Очевидно, решение в, является линейной функцией Х и определяется лишь с точностью до ортогонального нргабраэаванил, поскольку, применяя к матрице У преобразование вращения, получим, что преобразованная матрица Уь столь же точно восстанавливает матрицу В, как н матрица Х.
Такое шкалирование можно назвать линейным. 16.1.3. Погрешность аппроксимации. Оптимальность линейного метрическою МШ. Если возьмем число собственных векторов матрицы аь ( а, то получим некоторое приближение для элементов Ь». Как следует из экстремальных свойств главных компонент (см. гл. 13), (16лй) и это минимальное значение погрешности, которое может быть достигнуто при аппроксимации матрицы В матрицей М ранга д*, т. е. матрицей, представимой в виде М = = ~ сга1,1,' (где 1! — и-мерные ортонормированные векторы), 1=1 если измерять погрешность аппроксимации величиной т' (В, М) = ~~~~ (Ь» — тм)а. (16.6) (16.7) б!1+ а г(гм а Еглагь С., Уполз 6. ТЬе арргоаппа!!оп о1 опе юпагг!х Ьу апо1Ьег о1 !очаг гаях Д Раусьоте!ггха.
— 1936. — Чо1. 1.— Р 21! †3. 441 Заметим, что решение ты = — Ьаы, где Ьам определены равенством (16.4), доставляет глобальный минимум критерию (16.6), хотя координатные векторы Яп ..., 2 о. являются линейными функциями от Х, Этот результат йосит название теоремы Эккарта — 1Онга '. На практике размерность пространства отображения д* выбирают из тех же соображений, как и в анализе главных компонент, т. е. руководствуясь величиной объясненной доли следа.
16.1.4. Воэможности расширения применимости линейного метрического МШ. Проблема аддитивной константы. Применение алгоритма линейного метрического шкалирования, строго говоря, будет корректным при выполнении следующих условий: все й„— евклидовы расстояния, и эти расстояния измерены без ошибки. Об устойчивости алгоритма к ошибкам свидетельствует значительное количество удачных его применений 190, 61, 69). В случае, если различия Ь,> не являются евклидовыми расстояниями, матрица В может не быть положительно определенной.