Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 33
Текст из файла (страница 33)
В. Регрессия со степенным преобразованием. Когда Х 4= О и значение 1.'1. определено (см. приведенную далее программу), введите переменную, как обычна, и в том месте, где находится карта с комментарием, вставьте следующие операторы (в данном случае для Н = = — 0,52): Н = — 0,52 0О 17 1 = 1, М РО173=1, К 17 Х (1, Л) = (Х (1, 3)~~И. — 1,0)~Н. Единственное изменение в этих картах, необходимое при другом значении Х, касается первой карты, где Н.
задается равным любому требуемому значению, отличному от пуля. Если Г1. = О, воспользуйтесь лагарифмически линейным преобразованием. П.6.2. Основная программа для регрессионного анализа с использованием степенного преобразования А. Описание. Эта программа вычисляет 1п Е (А) согласно (6.21). Программа вызывает подпрограмму КЕб из главы 4, которая, в свою очередь, вызывает подпрограммы МЕАМ, СОБЧАК и 1ИЪ'5. Для каждого значения Х, в программе обозначаемого 1.1., вычисляется полная регрессия и затем 1п Е (Х).
Б. Ограничения. Ограничения такие же, как для подпрограммы КЕО. В принципе для Х можно выбирать произвольные пробные значения. Однако на практике диапазоп значений Х ограничен. Чтобы уменьшить время работы программ и сделать их пригодными для малых ЭВМ, во всех программах, описанных в этой книге, вычисления проводятся с одинарной точностью. В большинстве вычислительных машин при вычислениях с одинарной точностью запоминаются только восемь значащих цифр, и при возведении чисел умеренной величины в степень, выше третьей, этих восьми цифр оказывается недостаточно для запоминания результата. Поэтому если абсолютное значение Х будет слишком велико или слишком мало„та программа не сможет работать, так как переменные, поступающие в программу регрессионного анализа, окажутся практически одинаковыми и матрица х'х будет сочтена вырожденной. 215 Йо этим причинам мы рекомендуем, чтобы абсол1отное значение Й.
не превьппало 3 и чтобы увеличение Н происходило с ыигом 0„1 или или 0,01. В. Использование. На первой карте введите следующие данные: Велнчнна Значеннв Число переменных (такое же значение, как и в основной программе регрессионного анализа); набивается как можно правее в этом поле и без десятичной точки Число наблидений для каждой переменной (такое же значение, как н в основной программе регрессионного анализа); набивается как можно пра. вее в атом поле и без десятичной точки Наименьшее значение Х; набивается с десятичной .точкой; предполагается„ что ят †цел число 1т. е, — 2.0, — 1.0 и т.
д,) Наибольшее значение Х; набивается с десятичной точкой; предполагается„ что НЧ вЂ цел число (т. е. +1.0, +2.0 и т. д.) Шаг, с которым увеличивается Х; предполагается, что этот параметр равен 0.1 или 0.01 Вт ьтн 19 — 24 Рнс. П.6.1 Далее приводится текст программы, за ним следуют результаты для данного примера. В полученной таблице помечено максимальное значение 1п Е (Х).
Обратите внимание иа то, что это значение расположено в строке — .600 и в столбце .08. Сложив эти две величины, мы получим Х = — 0.600 + 0.08 = — 0.52. 216 Иа остальных картах с данными набейте точно так же„как это делалось для основной программы регрессионного анализа, значения зависимой и независимых переменных. При наличии этой информации вычислительная машина задает Н. =- 8Т, выполняет степенное преобразование, вызывает КЕб и вычисляет 1п Е (Х). Затем задается Н. = 8Т + ЯТЕР, и эта процедура повторяется до тех пор, пока не будет достигнуто Р1. = Г1Н, после чего программа останавливается.
Когда А определено, для оценки полученного уравнения можно воспользоваться основной программой регрессионного анализа. Для примера с потребительской функцией Клейна, рассматривавшегося в этой главе, первая карта выглядит следующим образом: Эта программа единственная в этой книге, выполнение которой заняло более 15 с на ЭВМ аХ08 Сигма 7э. Время выполнения этой программы составило около 20 с, что можно считать немного, если принять во внимание, что было вычислено 300 регрессий с четырьмя переменными. С ЙЕ6 ИЕЕОЕ0 01МЕИЯ?ОИ Х (10, 100), У (10, ЫО), ХВАК (10), Я (10, 10), 1~НАТ (100) „~ 1~ЕЯ (100), ~Ж (10), Р?.МАХ (10) „В (10), А (10, 10) ЙЕА0 (97,5) М, И, ЯТ, Р?И, ЯТЕР 5 РАМАТ (213, 3Р6.0) ВО 71=1,М 7 КЕЛ0 (97,9) (Ъ'(1,1), Л=-1, И) 9 РОКМАТ (8Р10.0) Я?.О=О.О ОО 10 1==1,И 1О Я?.0=Я?.б+А106 (Ъ' (1, 1)) %Й?ТЕ (99,12) 12 РОКМАТ (43Х, '?.00 ?.
(?.АМБОА)') ЮРТЕ (99, 15) 15 РОКМАТ ( 1 ') Р?.МАХ (1) = О.О 00 20 К=2,10 20 Р?.МАХ(К) -'Р?.МАХ (К вЂ” 1)+ЯТЕ АЧР1ТЕ (99,25) (Р?.МАХ (К), К= 1, 10) 25 РОКМАТ ('?.АМВВА", 10Р9.5) %Й1ТЕ (99,15) 30 СОИТ1И13Е ?30 50 К=1, 10 Р1. =- ЯТ+Р1.ОАТ (К вЂ” 1)*ЯТЕР 1Р (АВЯ (Р?.) — 0.0001) 35,35,40 35 00 38 1=1„М 00 38 3=1, И 38 Х (1,3) = А?.Об (У (1,1)) бО ТО 45 40 00 43 1=1,М ПО 43 3=1,М 43 Х (1,1)=(Ъ' (1,Л)мР?.— 1.0)/Р?. 45 СА1Л. КЕ0 (М, И, Х, ХВАК, Я, А, АА, В, ЯЕЕ, УНАТ, 1Ъ'КЕЯ, К2, Р, ЯЕЙ, ЯЯЕ) ЯЕЕ =ЯЯЕ~Р?.ОАТ (И) 50 Р1.МАХ (К) = — 0.ба?-ОАТ (И)еА1.ОО (ЯЕЕ)+(Р?.— 1.0)еЯ?.б %К1ТЕ (99,60) ЯТ„(Р?.МАХ (К), К=1,10) 60 РОГАТ (Р7.3, 10Р9.5) ЯТ = ЯТ+ 10.
ОеЯТЕР 1Р(ЯТ вЂ” Р?И) 30, 75, 75 75 Я ТОР ЕИ?) Гдава 7 ® ДИСКРИМИНАЦИЯ, ГЛАВ НЫ Е КОМП ОН ЕНТЫ И КАНОНИЧЕСКИЕ КОРРЕЛЯЦИИ В дискрилинантноя анализе рассматривается задача разделения на два или более класса исследуемого множества индивидуумов или объектов.
Владельцу банка, например, хотелось бы классифицировать .клиентов, обращающихся за ссудой, на две категории: «надежный» клиент и «ненадежный» клиент, пользуясь для этого данными о величине разницы между стоимостью товара и размером получаемой под него ссуды, месячном доходе клиента и другими показателями, которые могут показаться ему полезными.
Точно так же сотрудники службы кадров на основании результатов тестов профессиональной пригодности хотят классифицировать лиц, поступающих на работу, на категории «брать» и «не брать» и т. д. Более мрачным, но тем не менее интересным примером применения дискриминантного анализа является его применение в Бюро внутренних доходов. До общественности доходят весьма скудные сведения о подробностях этой процедуры, однако Бюро применяет дискриминантный анализ для выбора подоходных налоговых деклараций, подлежащих проверке. Применение дискриминаптного анализа обеспечивает «большую вероятность обнаружения ошибки в декларациях (т.
е. раз уж в результате дискриминантного анализа некоторая декларация была выбрана для проверки, значит, велика вероятность того„что эта декларация действительно нуждается в проверке); лучшие отношения с налогоплательщиками благодаря тому, что не выбираются случаи, проверка которых приведет к незначительным изменениям декларации или ее подтверщдению; меньшие затраты на технические и канцелярские операции»'. Как анализ глааных компоненти, так и анализ канониюеких корреляций имеют дело с системой координат многомерных наблюдений. Оба метода полезны в работах исследовательского характера, оба метода способствуют сокращению числа наблюдений, необходимых для описания того или иного явления и оба требуют большого искусства (или интуиции)„не связанных со статистикой, для своей интерпретации.
До недавнего времени анализ главных компонент и его обобщение, Факторный анализ, мало применялись в экономике. Однако в последние годы этн методы нашли применение в таких разнообразных областях, как обнаружение «факторов» экономического развития, исследование состояния денежного рынка с целью выработки валютной политики и исследование технических вопросов, связанных с применением неко- 1 Из письма директора ревизионного отдела Бюро внутреппих доходов С.
Б. Вольфа сотрудникам 8 сентнорн 1969 г. торых методов оцеиивания параметров в системе одновременных уравнений'®. Аналогично канонические корреляции используются для решения технических вопросов, возникающих при оценивании параметров системы одновременных уравнений, для исследования ассоциативного характера свойств сырья и изделий обрабатывающей промышленности и исследования связи между ценой и количеством продаваемого товара'. Дискриминантный анализ развивался по нескольким направлениям рядом авторов4. Анализ главных компонент и анализ канонических корреляций в значительной степени разработаны Хотеллингом 152), 153)**.
7.1. Линейная дискриминантная функция Вернемся к нашему примеру из главы 3, касающемуся устных и количественных оценок успевающих и неуспевающих студентов по экономике. В главе 3 мы пришли к выводу, что векторы средних оценок существенно различны, и, как оказалось, именно количественные оценки обусловливают это различие. Рассмотрим.эту задачу еще раз, пользуясь теперь методами дискриминантного анализа. Вопрос, который мы задаем в ходе дискриминантного анализа, состоит в следующем. Можно ли найти критерий, который позволил бы о~нести того или иного студента к группе успевающих или к группе неуспевающих студентовой Поскольку в нашем распоряжении имеются устные и количественные оценки, построим наш критерий на базе этих оценок. Заметим, что результативность анализа, по-видимому, можно было бы улучшить за счет привлечения других данных, но для обеспечения простоты вычислений мы пе будем пользоваться дополнительными данными.
Критерий, который мы будем строить, представляет собой некоторую линейную комбинацию имеющихся двух оценок. Кроме того, будет задано некоторое критическое значение этого критерия„причем такое, что если для данного студента значение критерия окажется ниже критического, то этот студент будет отнесен к одной группе; если же значение критерия для этого студента окажется выше критического, то он будет отнесен к другой группе.
Ясно, что если эти две группы студентов достаточно схожи с точки зрения экзаменационных оценок (т. е. достаточно близки их векторы з См. (3), Щ и (38). Л. Андерсон в цитируемой статье также нашел интересное применение днскриминантного анализа. ~ Системы одновременных уравнений широко применяются в теории н практике зконометрического моделирования (см., например, (9~)). — Примеч.
ред. а Применение к одновременным уравнениям рассматривается в ~48) и ~22]. Обзор других применений дается в ~88). 4 По-видимому„дискриминантиый анализ разработали независимо друг от друга Фишер, Хотеллинг и Макалаиобис. Хороший исторический очерк содержится в (6)„причем особенно много внимания уделяется байесовскому подходу„который мы здесь не рассматриваем. " Весьма полное изложение(адресованное ~прикладниками) методов дискримипантного„компонентного и факторного анализа читатель найдет в )2)'.— При.неч. рад.