Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 38
Текст из файла (страница 38)
Тогда ~-й канонический коэффициент корреляции равен Х~, а ~-е множество канонических переменных определяется Х~ =- Ха; и У~ — — Щ. Второй вопрос, который может вызвать недоумение читателя„заключается в том, что не имеет значения, вычисляется лп У из (7.34) или из (7.35), а таиже вычисляется ли сс из (7.34) или из(7.36). Может озадачить и та„что пз (7.34) можно получить р корней и множеств векторов а, тогда как пз (7.35) можно получить только д:= р корней.
Разрешение этого кажущегося противоречия состоит и том, чта в уравнении (7.34) имеется р ~ д корней, равных нулю, так чта ненулевые корни уравнений (7.34) и (7.35) равны. Именно в этом смысле мы говорим, что не имеет значения, какое из уравнений, (7.34) или (7.35), берется для вычисления".
Поскольку канонические коррсляцпи равны квадратному корню из 3Р, их можно взять как с положительным, так и с отрицательным знаком. Иногда знак выбирается исходя из содержания задачи, но эта практика может привести к затруднениям. Можно выбрать положительный знак для канонической корреляции между несколькими индексами цен и несколькими индексами производства в предположении, чта более высокие цены порождают увеличение производства. И наоборот, можно выбрать отрицательный знак в предположении, чта более высокис пены снижают спрос. В действительности знак коэффициента канонической корреляции произвольный.
Наконец, коэффициенты канонической корреляции сохраняют многие свойства простых коэффициентов корреляции, а именно абсолютное значение коэффициента канонической корреляции находится в интервале между О и 1 н коэффициенты канонической корреляции инвариантны по отношению к изменениям единиц измерения, Вычисление. Вниду того чта коэффициенты канонической корреляпин не зависят от единиц измерения, их можно оценить„заменив Х либо выборочной коварпационной матрицей 3: либо выборочной корреляционной матрицей й; '4 Донаэительство этого утверждении элнимает много места. 3аиитересоеан ный читатель мотает обратитьея к (6, гл. !2].
для всех переменных. Здесь й„— матрица порядка р корреляции между р переменными совокупности Х, К., — матрица порядка ~ корреляции между д геременными У, Є— матрица размером р Х и корреляции между Х и 7 и К., = 912. Обычно вычисления проводятся с помощью корреляционной матрицы.
Однако, если канонические коэффициенты корреляции оказываются одними и теми же, вне зависимости от того, вычислены ли они по $ или по К, то для коэффициентов а; и р; это не так. Как и в анализе главных компонент, если а~ и Р; вычисляются по 8, то оии относятся к исходным переменным; если же а; и ф~ вычисляются по К, то они относятся к сл~андпртиэаванным исходным переменным. Вычислительная программа в приложении к этой главе допускает применение как 3, так н К, но те же самые преимущества„о которых мы упоминали, говоря об анализе главных компонент, касаются здесь использовапия К. В отличие от анализа главных компонент можно непосредственно перейти от коэффициентов, вычисленных по Й, к коэффициентам, вычисленным по Я.
Например, заметим, чго 1 = 0 1 У~~и Таким образом, если умножить ковариационную матрицу слева и справа на диагональную матрицу, содержащую величины, обратные стандартным отклонениям. то мы получим корреляционную матрицу. Следовательно, если аль ии "° и~р и ~й Ке °" ~гд ~ = 1г 2 ° ° Ч~ были вычислены по корреляционной матрице, то их можно будет отнести к исходным переменным ~т.
е. они будут такими же, как если бы были вычислены по матрице $), разделив каждый коэффициент на стандартное отклонение исходной переменной, связанной с этим коэффициентом. Таким образом, нам необходимо вычислить только ~~Л» зл„. ада ~х„, ., а,"~Ф'жх„и ~~"Л ~~.„, ~'2Фж~, ", ~г,Ф як ЯЯ* Проиллюстрируем эти вычисления на примере 188, с. 4871. Корреляционная матрица и индексы производства и цен за 1919 — 1939 гг., которымн мы воспользовались для анализа„приведены на с. 246. Вопрос, который ставится в В81, состоит в следующем: какая линейная комбинация различных индексов производства позволяет наиболее удачно предсказать общий аиидексэ цен и в то же время какая линейная комбинация индексов цен позволяет паибслее удачно предсказать общий аиндекс~ производства? Ю ь Ю ИЪ СЧ СЧ ~Ф '1й 34 м О И О у~ ~~;„-~Я.
О .й сд ~~д~~~ м в ~ $Я ~амид>, $" ~' О м й О ф.. ~аДема ~©~о~~ йюа ~"'й 4~ м д©р 4ФФ Ф ~4 ~а~аО~ ~3 оооа2$. оаоожж~ ИААФ Ф~4Ж Жц> И И $4 4~ И ~ в~ 1 111 ~ 1 ~ ~~ьж-.ы Корреляционная матрица разбита таким образом, что индекс цей (У) отделены от индексов производства (Х).
Для нахождения значений Ъ и р воспользуемся уравнением (7.35), в котором заменим элементы Х на элементы Й. Следуя (7.35) и заменяя элементы Х элементами К, находим 39,60727 — 38,69914 — 0,44239 К;,' =- — 38,69914 43,91374 — 5,14729 — ОА4239 — 5,14729 6,10683 0,77450 0,76211 0,68112 К2~ К,—, ' Й1в = 0,76211 0,75227 0,67831 0,68112 0,67831 0,66885 Отсюда мы получаем 0,88147 0,77281 0,43159 й,—,1 й К-,1 К~ = — 0,01126 0,05057 — 0,01459 — 0,10595 — 0,06701 0,29178 Для этой последней матрицы мы и хотим вычислить характеристичес- ' кие корни и векторы.
Заметим, что эта матрица не является симмет- . рической, и, следовательно, подпрограмма СКАК из главы 1 яе подходит для решения этой задачи. Однако для получения требуемых кор- ' ней и векторов подпрограмму СКАК можно применить в сочетании с '„ другой подпрограммой (подпрограмма СНАК1). Эта дополнительная ' подпрограмма, приведенная в приложении к этой главе, использует; тот факт, что К,„'К„К1,'Й„есть произведение двух симметрических; матриц, а именйо К,,' и К„К„'Й„. Найденные характеристичес- ." кие корни и векторы ймеют следующие значения; Корень Соответствующий вектор 1,2510 — 0,0139 — 1,9602 — 0,0363 — 5 „8481 6,6267 0,7799 0,3818 0,0622 — 0,2697 2,3344 — 0,7646 Следовательно, оценки канонических коэффициентов корреляции ': можно получить извлечением квадратного корня из характеристичес- .
ких корней: Х, = 0,8831, Хв = 0,6179 н Хз = 0,2494. Коэффициенты, соответствующие первой канонической корреляции, имеют значения:- ф„= 1,2510, ~„= — 0,0139 и Р1з = — 0,2697. Далее, согласно (7.36) ' вектор а~ равен: й11 1~1з 111 %' х 1 с (Π— 1) (д — 1) степенями свободы. Н общем случае, если К кано- нических коэффициентов корреляции было отвергнуто вследствие их равенства нулю, то проверка того, что оставшиеся д — К коэффици- ентов равны нулю, осуществляется с помощью статистики Л~= Ц (1 — Я), Ю-К+1 ко.горая для больших выборок распределена как у = — и — 1 — К вЂ” — (р+д+1) 1пЛк 1 2 с (р — К) (д — К) степенями свободы.
Как и ранее, эти критерии' чувствительны к предположениям о нормальности, и в случае применения к экономическим временным рядам их полеэность сомнительна. ВОПРОСБ1 И ЗАДАЧИ Раздел УЛ 1. В 1881 Тннтиер„пользуясь данными, которые он собрал для одного из предыдущих исследований, попытался произвести классификацию средств производства н потребительских товаров иа основании циклического поведения их цен. В соответствии с оптовымн ценами в Англии за период 1860 — 1918 гг. он приводит данные, представленные в таблице.
Переменные в таблице имеют слсдуюаий смысл: Х, — средняя длительность цикла в месяцах; Хе — средняя доля периода повышения цен по отношению к длительности всего цикла; Хз — средняя амплитуда за цикл в процентах от тренда; Хд — среднемесячное изменение цен в течение цикла. Проведите дискримннантный анализ зтнх данных.
Выскажите свое мнение по поводу возможных трудностей при проверке гипотез. Потребительские това рм Рнс Чай Сахар Мука Кофе Картофель Масло Сыр Говядина 72,0 66,5 54„0 67,0 44,0 41,0 34,5 З4',5 24,0 50,0 48,'О 57,0 60',0 57,'О 52„0 50,0 46,0 54',О 8,0 15,'0 14,0 15,'О 14„0 18',О 4,0 8,5 3,'О 0„5 1",О 1„0 0,9 О',3 1,9 О 5 1,0 1,2 Бензин Свинец Чугун в чушках Медь Цинк Олов~ Каучук Ртуть Медный лис т железо в слитках 1. Пользуясь данными табл. 4.3, объедините оценки по рсзультагам тестов ловкости рук и лОВкОсти пяльцсв В Одну Обшую оценку нри помощи анализа главных компонент.
Затем найдите регрессию У (производительности при устаиОВке заклепок) на эту нОВую переменную и обсудитс ПОлученные результаты Обьясните, каким образом анализ главных компонент может помочь при решении проблемы мультиколлинсарности и регрессии. Роздал 7,3 Покажите, что мпожествеиныЙ козффициент корреляции между т' и т' совпадает с простым коэффициентом корреляции.
2. В ~9Ц приводится корреляционная матрица свойств пшеницы и муки (см, с. 251). Задача заключается в предсказании свойств кон~чного продукта— муки на основаиии ~войс~~ полупродукта — пшеницы. В~спользуйте~ь для зтой цели первым каноничиским козффициентом корреляции и соответствующими каноническими переменными. Поясните ваши результаты.
ПРИЛОЖЕНИЕ П.7.1.. Основная программа для дискриминантнюго анализа А. Описание. Эта основная программа вычисляет козффициенты дискримннантной функции из (7.1а), оычисляются также критическое значение $" из (7.13), фактическое значение 7' 1см. (3.23)] и критическое значение Т' |см. (3.24) 1. Кроме того, программа определяет величину разности днскриминантной функции и У~ согласно (7.15). В программе эта величина называется «величиной фупкцииъ. Если «величина функциив больше нуля, то наблюдение классифицируется как принадлежащее группе 1. Если «величина функцииэ меныые или равна нулю, то наблюдение классифицируется как принадлежащее группе 2. Наконец, программа определяет число правильных и неправильных классификаций для кащдой группы. Б.
Ограничения. Такие же, как для основной программы для проверки гипотезы о равенстве двух векторов средних (см. раздел П. 3.2). Обратите, однако, внимание на то, что в программе из раздела П.3.2 мы сначала считывали с карт оценки для неуспевающих студентов. к~~ааю Рис. П.7.$, В данной программе сначала мы счнтыВаем оценки для УспеВа!о!Цих стУДентов. Каку!о именно группу счить!Вать первой.
Не имеет 31!Зчения, но та группа, которая считалась первой, будет воспринята программой как группа 1. В. Использование. Под~отовьте карты с даннымн точно таким же образом, как в разделе П.3.2. Расположение данных показано на рнс. П.7.1. Далее приводятся результаты вычислений для рассматриваемого примера, после чего следует текст основной программы. ГРУППА 1 КЛАССИФИКАЦИЯ ГРУППА 2 НОМЕР ЗНАЧЕНИЕ НАБЛ1ОДЕНИЯ ФУНКЦИИ КЛАССИФИКАЦИЯ ЧИСЛО ОШИБОК ПРАВИЛЬНО ГРУППА 1 11.