Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 73
Текст из файла (страница 73)
в «асимптотике А. Н. Колмогорова», анализируемые выборочные характеристики могут вести себя некоторым специальным образом). 8 Геометрически определение первой главной компоненты равносильно построению новой координатной оси Ог<'! таким образом, чтобы она шла в направлении наибольшего разброса исходных данных, т. е. — в направлении вытянутости анализируемого «облака» многомерных наблюдений. Затем среди направлений, перпендикулярных к Ог<<<, отыскивается направление «наибольшей вытянутости» Ог<»! и т. д. Очевидно, если характер вытянутости анализируемого «об- Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА Сущность модели факториого анализа, его основные задачи 14.! .
Описываемые в данной главе методы основаны на общей базовой идее, в соответствии с которой структура связей между р анализируемыми признаками х1'1, х<з>, ..., хгл > может быть объяснена тем, что все эти переменные зависят (линейно или как-то иначе) от меньшего числа других, непосредственно не измеряемых («скрытых», «латентных») факторов ~<'>, 11п, ..., ~<а'1 (р' ( р), которые принято называть общими' и которые в большинстве моделей конструируются так, чтобы они оказались взаимно некоррелированными. При этом в общем случае, естественно, не постулируется возможность однозначного (детерминированного) восстановления значений каждого из наблюдаемых признаков хгл по соот- з Встречающийся еще в литературе перевод «сопппеп 1ас1ог» как «яросгой фактор» ие несет в себе главной смысловой нагрузки этого термина ведь смысл каждой из переменных рм, ..., 11а 1 как раз и состоит в том, что она является общей для всех исходных признаков х(Ч, хмй 13 Заказ № 291 лака» данных в исходном признаковом пространстве существенно отличен от линейного, то линейнал модель главных компонент может оказаться неэффективной.
В подобных ситуациях исследователь должен обратиться к нелинейным версиям мепюда главных компонент (см., например, З13.6). 9. Главные компоненты используются при решении следующих основных типов задач анализа данных: 1) упрощение, сокращение размерностей анализируемых моделей статистического исследования зависимостей или классификации с целью облегчения счета и интерпретации получаемых статистических выводов; 2) наглядное представление (визуализация) исходных многомерных данных, получаемое с помощью их проецирования в пространство, натянутое на первую, первые две или первые три главные компоненты, 3) предварительная ортогонализация объясняющих переменных в задачах построения регрессионных зависимостей как средство «борьбы» с мультиколлинеарностью112, гл.
8]; 4) сжатие объемов хранимой сгпатистической информации. ветствующим значениям общих факторов ~!»,..., ~!а'> (в предположении, что мы их умеем вычислять): допускается, что каждый из исходных признаков ач!> зависит также и от некоторой «специфической» (для него) остаточной случайной , компоненты ип>, которая и обусловливает статистический характер связи между х!!>, с одной стороны, и ~<», ..., у!а'>— с другой. Конечная цель статистического исследования„проводимого с привлечением аппарата факторного анализа, как правило, состоит в выявлении и интерпретации латентных общих факторов с одновременным противоречивым стремлбнием минимизировать как их число, так и степень зависимости х>!> от своих специфических остаточных случайных компонент и<!>.
Как и в любой модельной схеме, эта цель может быть достигнута лишь приближенно. В некотором смысле искомые общие факторы ~<и, ..., у<а'> можно считать причинами, а наблюдаемые признаки х!'>,..., х!а> — следствиями. Принято считать статистический анализ такого рода успешным, если большое число следствий удалось объяснить малым числом причин. Таким образом, методы и модели факторного анализа нацелены на сжатие информации или, что то же, на снижение азмерности исходного признакового пространства В» (Х). ри этом из трех упомянутых в 9 13.1 предпосылок возможности снижения размерности (взаимная коррелированность исходных признаков, малая «вариабельность» некоторых из них, агрегирование) методы факторного анализа базируются, в основном, на первой.
Возникновение схемы и моделей факторного анализа обязано задачам психологии, относится к началу двадцатого века и связано с именами Ч. Спирмэна, Л. Тэрстоуна, Г. Томсона '. Однако в силу ряда исторических причин и, в частности, из-за субъективных пристрастий и специфических научных интересов первых исследователей, работавших в данной области, вероятностно-статистические аспекты этого раздела многомерного статистического анализа долгое время оставались практически неразработанными, а интерпретации и анализу различных моделей факторного анализа была присуща некоторая неопределенность. Лишь с середины 50-х годов начинают появляться интересные результаты именно вероятностно-статистических исследова- > В качестве первой опубннкованной па этой теме работы называют обычно статью Зреагп>ап С.
Сгепега1 !п>еП!йепсе оь)ес11те!у бе1еггп!пеб апб гоеаашеб/А>пег. 2. Рзусьо>. — 1904. — 'то!. 15.— Р. 201 †2. ний этого аппарата [!80, 294, 1851, среди которых работу Т. Андерсона и Г. Рубина следует выделить как основополагающую. При разработке моделей факторного анализа приходится последовательно анализировать и решать следующие вопросы. Су>цествование модели. Далеко не для всякой заданной структуры связей между исходными признаками Х = (х>'>, ., хш>)' можно (при заданном р'( р) построить модель факторного анализа, т. е. указать такие общие факторы >'»>, ..., )ое> (или доказать их существование), которые полностью объяснили бы имеющуюся корреляцию между различными парами хи> и хо>. Пои каком характере связей между исходными признаками х> >, ..., х«'>, т. е. при каких корреляционных (ковариационных) матрицах 11 =- (гы) (Х:-= = (оы)), а также при каком соотношении между числом наблюдаемых признаков р и числом скрытых общих факторов р' (р' ( р) сделанное допущение о наличии определенных связей между х' (>' -= 1, 2, ..., р), с одной стороны, и ?н> (1 = =- 1, 2, ..., р') — с другой, является обоснованным и содержательным — в этом и заключается вопрос существования модели.
Единственность (идентификация) модели. Оказывается, что если р, л> и р' таковы, что допускают построение модели фактор ного анализа, то определение соответствующих факторов Е = (1">, ..., (ш>) и коэффициентов линейного преобразования (г =- (ды), связывающего Х и Е, не единственно. Спрашивается, при каких дополнительных ограничениях на матрицу преобразования Я и на ковариационную матрицу (> — (оы) остаточных специфических факторов ин>, ..., иш> определение параметров искомой модели факторного анализа будет единственным? Алгоритмическое определение структурных параметров модели.
При заданной ковариационной матрице Х исходных признаков и известном числе общих факторов р' (и в предположении, что решение задачи определения структурных параметров >г и К существует) как конкретно вычислить неизвестные параметры модели? Статистическое оценивание (по наблюдениям Х,, Х, ..., Х„и при заданном р') неизвестных структурных параметров модели. Статистическая проверка ряда гипотез, связанных с природой модели и значениями ее структурных параметров, таких, как гипотеза об истинном числе р' общих факторов, гипотеза адекватности принятой модели по отношению к имеющимся результатам наблюдения, гипотеза о значимом от- 387 14.2. Каноническая модель факториого анализа 14.2,1. Общий вид модели, ее связь с главными компонентами. Как и прежде, будем для удобства полагать исследуемые наблюдения Х,, Х„..., Х„центрированными. Переход от исходных наблюдений Х,, Х, ..., Х„и центрированным осуществляется с помощью простого переноса начала координат в ецентр тяжести» исходного множества наблюдений, т.
е. х<'! = хч<! — хч'!, !' = 1, 2, ..., н. Тогда линейная версия модели факторного анализа представляется в виде соотношений Х=--ЯР+У, или в компонентной записи ««! ~ <<<,1<<! ).и<<! (; 1 р) (14,! ) Здесь Я = (<)<;) — прямоугольная матрица размера р х р' коэффициентов линейного преобразования (нагрузок общих факторов на исследуемые признаки), связывающего исследуемые признаки х<'! с ненаблюдаемыми (скрытыми) общими факторами )<<<, ..., )<»'>, а вектор-столбец У вЂ” (и<'>, ..., и<»'!)' определяет ту часть каждого из исследуемых признаков, которая не может быть объяснена общими факторами, в том числе и<'! включает в себя, как правило, ошибки измерения признака х<'!.
Применительно к каждому конкретному наблюдению Х„(я = 1, 2, ..., л) соотношение (14.1) дает Х,=ЯР,+У, или в компонентной записи ~„"= '„~ <)ц5<+и~„" (! = 1, р я= 1, и) <= ! (!4,1') Будем предполагать, что вектор остаточных специфических факторов У подчиняется р-мерному нормальному распределению Л< (О, р), не зависит от г" и состоит из взаимно независимых компонент, т. е. его ковариационная матрица Ч = Е (УУ') имеетдиагональный вид, гдеподиагоналистоят элементы он =- Ои«!. личин от нуля интересующих иас коэффициентов <т<! линейного преобразования и т.п. Построение статистических о<(елок для ненабл<одаез<а<« значений оби!их факторов )т<!, ..., 1<»'>.
Вектор общих факторов г" = Д!т>, ..., (>а'>)', в зависимости от содержания конкретной задачи, может интерпретироваться либо как р'-мерная нормальная случаиная ве >и- чина со средним Ег' = О (в силу центрированности исходных наблюдений) и с ковариационной матрицей специального вида Е (гг"') = 1', либо как вектор неизвестных неслучайных параметров, вспомогательных переменных, значения которых меняются от наблюдения к наблюдению. При последней интерпретации вектора общих факторов более правильной является запись модели в виде (!4.