Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 80
Текст из файла (страница 80)
ВЫВОДЫ Е Различные версии моделей и методов факторного анализа (центроидный, максимального правдоподобия, экстремальной группировки параметров, корреляционных плеяд и др.) основаны на общей базовой идее, в соответствии с которой значения всех признаков х1'>, ..., х1ю анализируемого набора формируются под воздействием сравнительно небольшого числа одних и тех же (общих) факторов ~1'>, ..., ~1е'1, не поддающихся, правда, непосредственному измерению (и потому называкяцихся латентными). В определенном смысле эти общие факторы выступают в роли причин, а наблюдаемые (анализируемые) признаки — в роли следствий.
2. Поскольку число общих (латентных) факторов существенно меньше числа анализируемых признаков, то методы факторного анализа в конечном счете нацелены (так же как и метод главных компонент) на снижение размерности анализируемого признакового пространства. 3. Статистическая реализация модели факторного анализа предусматривает последовательное решение вопросов существования такой модели, ее идентификации (т. е. возможности ее однозначного восстановления по исход- 14* 4!9 ным статистическим данным), алгоритмического определения ее структурны< параметров (т. е.
определения способа вычисления неизвестных параметров модели при точно известной козариационной матрице анализируемого многомерного признака) и их статистической оценки ло ииеющимсл наблюдениям, включаястатистические оценки для самих общих (латентных) факторов. 4. Наиболее распространенной в практике статистических исследований и наиболее теоретически разработанной является каноническая модель факторного анализа, в которой признаки линенно зависят от факторов, факторы взаимно некоррелированы между собой и со случайными остатками модели, а случайные остатки и свою очередь взаимно некоррелированы и нормально распределены.
5. Между методом главных компонент и линенной моделью факторного анализа имеется идейная общность: и тот и другой метод можно рассматривать как метод аппроксимации набора анализируемых переменных с помощью линейных функций от сравнительно небольшого числа одних и тех же вспомогательных переменных (главных компонент — в одном методе и общих факторов — в другом). Их небольшое различие — лишь в конкретизации критерия точности аппроксимации.
6. Наиболее <узкие места» в практической дееспособности модели факторного анализа связаны с решением задачи оценки числа р' общих факторов модели и с содержательной интерпретацией найденных общих факторов. Для успешного решения последней задачи широко пользуются неоднозначностью (с точностью до ортогонального преобразования) определения общих факторов и соответственно возможностью их разнообразных <вращений» в факторноч пространстве.
7. Наряду с математико-статистичесьими методами сниже- ния размерности, т. е. с методами, допускающими описание и интерпретацию в терминах строгой вероятностной модели, существуют и широко используются в статистической практике так называемые эвристические менюды. Свое название они оправдывают тем, что порождаются обычно некоторыми частными целевыми установками, выраженными в виде установленных на содержательно- субъективном уровне оптимизируемых критериев качества решения задачи.
К таким методам, в частности, с носятся методы экстремальной группировки параметров, метод корреляционных плеяд, некоторые «кластерные» приемы и т. п. Глава 15. ЗКСПЕРТНО-СТАТИСТИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ ЕДИНОГО СВОДНОГО ПОКАЗАТЕЛЯ ЗФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ (КАЧЕСТВА) ОБЪЕКТА (СКАЛЯРНАЯ РЕДУКЦИЯ МНОГОКРИТЕРИАЛЬНОЙ СХЕМЫ) Латентный единый (сводный) показатель «качества». Понятия «выходного качества» целевой функции и «входных переменных» (частных критериев) 15.1. Пусть обобщенная сводная характеристика 1 анализируемого свойства объекта определяется набором частных критериев, задаваемых поддающимися учету и измерению переменными хЧЦ, х~<>, ..., х'Ю (в дальнейшем будем называть их <входными»), однако сама эта характеристика явтяется лат«нотой, т.
е. не поддается непосредственному ко.шчественному измерению (для нее не существует объективно обусловленной шкалы). Естественно предположить, что интуитивное экспертное (профессиональное) восприятие этой характеристики (обозначим его у) можно представить как несколько искаженное значение 1 (хч'>, ..., х~ю), причем это искажение 6 носит случайный характер и обусловлено как разрешающей способностью такого <измерительного прибора», каковым в данной схеме является эксперт, так и су- 421 И в профессиональной деятельности, и в своей повседневной жизни человек постоянно сталкивается с ситуациями, когда ему приходится сравнивать межд) собой и упорядочивать по некоторому не поддаюи(емуся непосредственному измерению свойству ряд объектов. Речь может идти, в частности, о сравнении стран по прогрессивности их макроструктуры потребления, предприятий отрасли по эффективности их деятельности, сложных изделий (например, определенного программного средства) по обобщенной характеристике качества.
специалистов по эффективности их участия в выполнении поставленнон задачи, участников игровых видов спорта по уровню проявленного ими (в определенном состязании) мастерства и т. д, Формализации подобных ситуаций и вытекающим иэ нее рекомендациям по построению некоторого условного измерителя упомянутого свойства объекта и посвящена данная глава. шествованием ряда слабо влияющих на у, но не входящих в состав Х = (ха>, ., хио) «входных переменных», То~да модель, связывающая между собой интуитивное представление о сводном показателе качества (у), сам сводный показатель как функцию от Х (~ (Х)) и случайную погрешность 6 (Х), может быть определена в виде у=~(Х)+6(Х). (15.
1) Практически, не ограничивая общности данной схемы, можно принять естественные допущения относительно первых двух моментов остаточной случайной компоненты 6 (Х): Е6 (Х) — = О, Рб (Х) = о«(Х) ( оо. (!5.1') Тогда, очевидно, обобщенная (сводная) характеристика ~ (Х) может интерпретироваться как регрессия у по Х, и если бы в качестве исходной статистической информации располагали бы наряду со значениями Х, =- (х«», х~"') и результатами регистрации соответствующих значений зависимой переменной у, (1 †ном наблюдения), то данная схема непосредственно сводилась бы к обычной модели регрессии (см.
112, гл. 5]). Специфика модели (15.1), (15.1') состоит в том, что вместо прямых измерений у можно получить (с помо»ць«о вкспертов) лишь некоторые специального вида сведения о его значениях, чаще всего — сравнительно~о плана (типа ранжировок или парных сравнений обследованных объектов по свойству у). Это обусловливает и более скромные претензии в отношении целей статистического анализа модели (15.1), (15.1'): вместо требуемого в регрессионном анализе восстановления (оценивания) функции 1'(Х) ставится задача оценивания ) (Х) с точностью до произвольного монотонного преобразования.
О и р ед ел е н и е. Целевой функцией исследуемо|о обобщенного свойства («выходного качества») называется любое преобразование вида гр (хч'>, ... х<ю) = «р (Х), сохраняющее заданное соотношение порядка между анализируемыми объектами О,, О„..., О„по усредненным значениям выходного качества, т. е. обладающее тем свойством, что из ) (Х,„) > ~ (Х„) > ...)) (Х,„) с необходимостью следует выполнение неравенств «р (Х„) ) ~р (Хц) ) ... ) ) «р (Х; ), и, наоборот, из последней серии неравенств вытекает выполнение соответствующих неравенств для ( (Х,„), А = 1,2, ..., ..., и.
Очевидно, данное здесь определение целевой функции неоднозначно. Действительно, если «р (Х) есть целевая функция и 0 («р) — любая взаимно-однозначная монотонно возрастающая функция, то всякая функция вида 422 »Р (Х) =- 0 1«Г (Х)) также будет целевой функцией. Это означает, что допущение о наличии определенной шкалы в измерении единого сводного показателя играет во многих случаях чисто вспомогательную роль и нацеливает на поиск, связанный с выявлением этой шкалы лишь с точностью до произвольного допустимого преобразования шкал. Ведь в соответствии с данным определением само значение целевой функции не отражает никакой реальной, физически содержательной количественной закономерности.
Реальные закономерности отражаются только соотношениями «больше» илн «меньше» между значениями этой функции для различных наборов величин входных параметров Х = — (хи>, ..., хца), Тем самым эти соотношения отражают предпочтение с точки зрения анализируемого выходного качества одних значений Х перед другими. Поэтому в задачах, в которых возможно регулирование значений Х (в некоторой допустимой области), наиболее рациональным управлением естественно признать то, которое максимизирует, при заданных ограничениях на Х, значения целевой функции. Данное определение целевои функции допускает ее содержательную (экономнческую, социально-зкономическую, квалиметрическую, психологическую н т.д.) интерпретацию. Помимо приведенных ниже примеров оно может быть использовано при построении н анализе различных глобальных и частных целевых функций благосостояния и потребления (о которых речь идет, например, в[52, 99, 188, 247), в других задачах аналогичного профиля.