Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 36
Текст из файла (страница 36)
+ айаг(а'„). Относительную аважностьэ ~-й главной компоненты в описании системы можно измерить отношением ° ~~ чаг (УД Х; Х; Р.23) 'Яраг(7~) ( ) ~ Ц 1=1 /ли 1 Более того, так как Определитель ковариационной матрицы иногда называется обоби~ениой диспереией. Следовательно, (7.24) свидетельствует о равенстве обобщенной дисперсии исходных переменных и обобщенной дисперсии главных компонент. 3.
Обычно характеристические корни не равны между собой. В частном случае, когда два или более корней равны, из (7.23) видно, что все равные корни имеют одинаковую относительную важность. В случае двух переменных с А1 = Х, эллипс превращается в окружность и различие между большой и малой осями исчезает. Лействительно, любую прямую„проходящую через центр окружности, можно рассматривать как большую или малую ось и поэтому любые две взаимно перпендикулярные прямые можно считать главными компонентами. Замечание по проведению вычислений.
Как уже было показано, коэффициенты главных компонент представляют собой характеристические векторы ма~рицы Я. Однако и сама матрица 3, и характеристические корни, и векторы этой матрицы не инвариантны относительно изменения масштаба. Следовательно, если мы изменим единицы измерения Х, и/или Х~, то это повлечет за собой изменение формы и/или положения эллипса рассеяния, показанного на рис.
7.2. Следующая трудность анализа главных компонент заключается в том, что если не все переменные Х измеряются в одних и тех же единицах, то бывает нелегко понять смысл линейной комбинации переменных Х. Линейная комбинация фунтов яблок и ярдов ткани в лучшем случае просто непонятна. Поэтому перед вычислением коэффициентов Р переменные Х обычно стандартизируют. Так.как стандартизированные измерения выражаются отвлеченными (безразмерными) числами, это решает проблему образования линейных комбинаций переменных с различными единицами измерения. Более того, поскольку коэффициент корреляции не зависит от масштаба измерения, исчезает и первая труд- кость.
Поэтому перед вычислением мы обычно преобразуем измерение Х в измерение г, где .Цальнейший анализ и интерпретация проводятся в терминах стандар- тизованных переменных. Матрице Я для исходных переменных соответствует корреляционная матрица К для стандартизованных переменных г. При использовании Некоторые примеры. Проиллюстрируем этот метод примером исторического характера. В табл. 7.1 приводятся три индекса прожиточного минимума, относящиеся к 1900 — 1910 гг. в Соединенных Штатах Америки.
Предположим, что мы не уверены в том, какой нз этих индексов принять в большом экономическом исследовании. В этих Таблица 7.1 Три индекса прожиточного минимума Индекс Федерального резервного бюро х1 Индекс Берджессв Хэ Индекс Хвксенв Х3 год Источник. 13пИег! Яа1ез ВерагЬпеп$ о1 Сопппегсе, Н!з1ог1са! Яа!1з11сз о1 111е Бп11еб Яа$ез (ФазЫп!.- !оп, 1Х С.: Б.
Б. Оочегпгпеп1 Рг1п11п~ Ой!се, 1949), р. 235. условиях один из подходов может состоять в образовании некоторой линейной комбинации этих индексов и использовании полученного результата для представления всех трех -индексов. Одним из видов линейной комбинации является обычное среднее, другим — главная компонента Так как все переменные здссь — это численные значения индексов, то они выражены в одних и тех же единицах измерения (процентах) ~ Этот пример вряд лн можно признать удачным. Дело в там, что, данные, представленные в табл.
7.1, — типичный пример временных рядов, т. е. распределения всех трех исследуемых переменных Х1, Хв и Хв существенна меняются от наблюдения к наблюдению !от гада к году),что отчетливо прослеживается при движении по столбцам !обнаруживается естественная тенденция роста). В этой ситуации непосредственное использование аппарата главных компонент не является правомерным; и оценки средних значений переменных, и оценка их ковариационной матрицы оказываются несостоятельными. В подобных случаях следует, по меньшей мере, попытаться предварительно исключить временной тренд из анализируемых данных, что в рамках линейной модели может быть достигнута, например, переходом от исходных данных к их первым разностям. Однако и здесь возникают определенные трудности, связанные с возможным проявлением возникающей при этом взаимозависи.ности наблюдений.
— При,кеч. ред. 1900 1901 1902 !903 1904 1905 1906 1907 1908 ! 909 1910 80 82 84 88 87 90 95 91 9! 96 76 75 78 81 81 8! 85 90 87 91 94 6?,7 70,6 74,8 74,8 76,! 76,0 78,2 82,0 84,4 88;6 93,1 Поэтому мы вычислим главные компоненты по ковариационнай мат- рице 3: 25,218 30,336 34,144 8 = 30,336 40,073 46,187 34,144 46,187 58,005 Характеристические корни и векторы этой матрицы равны: 118,44 4,00 О,'85 0 „0Е8 0,'6Ь57 1,3091 0,5762 — 0,2365 — 0,7823 0,4398 — О,'Л70 0,5408 Сумма характеристических корней (так же как и след матрицы 8) равна 123,29.
Следовательно, первая главная компонента объясняет 96о,„обобщенной дисперсии переменных (118„44/123,29). Первая главная компонента записывается в виде У„- = 0,4398 Хт,- -'г 0,5762.;+ + 0,6889 Хз;, ~ = 1, 2,, 11. Если мы хотим вычислить эту компойенту, то ее первое значение равно: У1, =.
0,4398 (80) + 0,5762 (76) + 0,6889 (67,7) = 125,61. и' Мы хотим поблагодарить Джона Пилгрим~ за помоШь и этой работе. Другие значения вычислены программой и приведены в приложении к этой главе. С помощью первой главной компоненты теперь можно описать вариации прожиточного минимума в течение данного периода времени. В рассмотренном только чта примере значение первой главной компоненты понятна. Три индекса цен настолько сильна коррелированы, что имеет смысл объединить их в один индекс. Первая главная компонента объясняет практически всю обобщенную дисперсию трех рядов, н каждый из этих рядов входит в эту компоненту с положительным весом. Если пе считать того„чта численные значения весов для этих трех индексов не равны 1/3, то мы могли бы получить почти такой же результат, взяв обычное среднее значение трех индексов.
Большие трудности в анализе главных компонент возникают тогда, когда мы пытаемся придать главным компонентам нестатистическнй смысл. Поясним это следующим примером. Этот пример был придуман одним из авторов исключительно ради развлечения, и его не следует считать вкладом в дискуссию по затронутому вопросу*'. В последнее время в области экономики денежных отношений появился интересный раздел, связанный с проблемой валютногаиндикатора. Па мнению двух авторитетных специалистов, валютный индикатор представляет собой ~некоторую шкалу, инвариантную с точностью да монотонного преобразования, которая является основой для заключений, касающихся характера валютной политикиэ ~191.
Бы- Соответетвующн Й Вектор Корень — 0,6391 0,2139 0,7388 0,4737 0,8662 0',1590 0,6059 — 0,4516 0,6549 1,76 0,79 0,45 Итак, иас интересует денежная главная компонента. Первая компонента объясняет большую часть вариации (1,76/3 = 58,7о~) и, кроме гого, имеет интересное сочетание знаков коэффициентов. Например, сли наблюдаются увеличение свободных резервов, увеличение денежкой массы и умеиьгиение процентных ставок, то мы будем полагать, что конъюнктура на денежном рынке понизилась. Таким образом, знак аннус у переменной, соответствующей процентным ставкам, при нали- 1г Ежемесячные данные эа 1918--1939 гг. ражаясь общедоступным языком, задача заключается в нахождении некоторого критерия, который показывал бы нам, является ли текущая валютная политика более ажесткой» или более асвободной», чем, скажем, шесть месяцев назад.
Некоторые экономисты полагают, что размер денежной массы — хороший индикатор конъюнктуры денежного рынка. Так„если скорость изменения денежной массы возрастает, это должно означать наличие снижающей тенденции на рынке. Однако трудность применения этого показателя в качестве валютного индикатора с точки зрения экономистов другой группы заключается в том, что скорость изменения денежной массы представляет собой эндогенный параметр экономической системы.
Иначе говоря, этот параметр зависит не только от валютной политики. Например, в период увеличения зкономической активности спрос на деньги возрастает и резервная банковская система в США способна увеличить поступлениеденег без какого бы то пи было изменения валютной политики. Таким образом, азкономический цикл порождает проциклические изменения денежной массы. Отсюда следует, что те, кто используетденежную массу в качестве индикатора курса фидеральной резервной политики, оказываются предрасположены к неблагоприятной оценке этой политики»150, с. 921. Предположим, что мы исходим из посылки, что все ряды денежных параметров (свободные резервы, процентные ставки, размер денежной массы и т.
п,) имеют независимые денежную компоненту и реальную компоненту. В этом случае индикатором валютной политики, свободным от влияния явлений, происходящих вне денежной системы, была бы главная компонента, связанная с поведением денежной системы. Выберем три ряда: процентное изменение свободных резервов во всех банках федеральной резервной системы (Ж,), процентное изменение коммерческих процентных ставок (Х,) и процентное изменение денежнои массы в узком смысле (Хз) . Для иллюстрации мы Вычислим эти компоненты, пользуясь корреляционной матрицей, хотя трудностей, связанных с измерениями„здесь и не возникает. Характеристические корни и векторы будут равны: чии знаков плюс у других двух переменных приводит нас к тому, чтобы именно эту компоненту считать денежной.