Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 17
Текст из файла (страница 17)
К категории П относятся университеты, присуждающие более высокую степень, чем степень бакалавра, но ие входящие в категорию 1, Воспользуйтесь а = 0,05 и проверьте гипотезу о том, что средняя заработная плата в университетах этих двух категорий одинакова. Для завершения анализа используйте линейные комбинации (если это необходимо). Сформулируйте ваши предположения, Категория ! 18~ЮО 19740 21 000'2! 470 18110 17310 19610 13960 !4520 15040 14970 14040 13680 14550 11 610 11820 12030 11 900 11 600 13360 11 960 9 030 9 190 9 270 9 390 8 490 8 510 8 990 Профессор 20 080 17 260 Адъюнкт 14 090 13 450 Ассистент 11 520 11 380 Преподаватель 8 760 8 760 Категория !1 Профессор 17470 15930 15630 16930 18750 !7720 14760 14980 16300 Адъюнкт 13340 12980 12570 13660 14660 13830 12370 12630 13270 Ассистент 10950 10740 10710 !1360 12!20 11460 10550 10530 11010 Преподаватель 9 040 8 700 8 820 9 160 9 700 9 710 8 580 8 570 8 620 1.
Проверьте предположение о равенстве ковариационных матриц для задачи 1 из Раздела З.З н задачи 1 нз раздела 3.4. Воспользуйтесь и = 0,05. Изменяют ли результаты эгих проверок ваши прежние выводМ Прокомментируйте использование для вац~нх проверок а = 0„01, Колумбия ИзРаиль . Аргентина Чили Мексика Тайвань Египет Япония 11,2 40,4 17„7 20„7 9„4 17,5 24,0 25 9 19,5 9,7 33,6 26,9 22,5 32,1 52,3 50,5 П РИЛож ЕН И Е П.'ЗЛ. Основная программа для проверки гипотезы о равенстве вектора средних заданному постоянному вектору А.
Описание, Эта основная программа вычисляет фактическое значение Т® из (3.9) и критическое значение Т' из (3.11). Она также выводит на печать ковариационную матрицу и обратную ей матрицу. Б. 0граничениа. Максимальное число переменных равно 10, максимальное число наблюдений по каждой переменной равно 100. В. Использование.
На первой карте данных набейте число М переменных в колоуках 1 — 3 и число Ф наблюдений по каждой переменной в колонках '4 — 6. Расположите зти числа как можно правее в их полях и не набивайте десятичной точки. В колонках 7 — 16 набейте критическое значение Р с десятичной точкой. Для примера из раздела 3.2 первая карта будет выглядеть следующим образом: Рне. П.3.1 На второй карте набейте гипотетические средние с десятичной точ-,::: кой в колонках 1 — 10, 11 — 20 и т. д. Если М:> 8, перейдите на тре- .;; тью карту. Для примера из раздела 3.2 вторая карта выглядит следую1цим образом: .596ООООЕ +ОЗ «2) ,69ХЮООЕ + ОЗ «2) На остальных картах с данными набейте значения выборочных наблюдений. Используйте обычный формат: начните с первой перемен- '.--.'.
ной, набейте ее значения с десятичной точкой в восьми полях по 10 '4 колонок каждое, продолжая на стольких картах, сколько потребуется. Значения второй переменной начните на новой карте и повторите процедуру. Первая переменная в колоде должна соответствовать первому гипотетическому среднему на второй карте, вторая переменная должна соответствовать второму гипотетическому среднему и т. д. Далее приводятся результаты для примера из раздела 3,2 и текст основной программы.
ФАКТИЧЕСКИЕ СРЕДНИЕ .576ООООЕ+03 «11 ГИПОТЕТИЧЕСКИЕ СРЕДНИЕ .59ОООООЕ 1-03 Щ П.3.2. Основная программа для проверки гипотезы о равенстве двух векторов средних А. Описание. Эта основная программа вычисляет фактическое значение Т' нз (3.23) и критическое значение Тв из (3.24). Кроме того, вьпюдятся на печать средние значения для обоих множеств переменных и объединенная ковариационная матрица, а также обратная ей матрица. Б. Ограничения. Каждое из двух множеств переменных может иметь не более 1О переменных и не более 1ОО наблюдений по каждой переменной. В. Использование.
На карте 1 набейте следующие числа без десятичной точки и как можно правее в соответствующем поле: Л Калоккк М (число переменных в каждом множестве) У~ ~число наблюдений над переменными в нервом множестве) Йа (число наблюдений над переменными во втором множестве) 1 — 3 4 — 6 7 — 9 л Ф/ ° О ° ЮОа во. Рнс. П.З.З 1ОО Наконец, в колонках 10 — 19 набейте критическое значение Е с десятичной точкой Остальные карты с данными содержат выборочные значения. Первые Й карт этой группы содержат наблюдения по первойперещнной первого множества, которые набиты на каждой карте с десятичной точкой в восьми полях по 1О колонок. Следующие Й карт содержат наблюдения по второй переменной первого множества, которые набиты точно так же, как и для первой переменной.
После того как будут закончены все переменные первого множества, аналогичным образом заносятся наблюдения по переменным второго множества. Полная колода данных для примера из раздела 3.4 представлена на рис. П.З.З. СРЕДНИЕ ДЛЯ ПЕРВОГО МНОЖЕСТВА .5760000Е+ ОЗ (1) СРЕДНИЕ ДЛЯ ВТОРОГО МНОЖЕСТВА 596461 4Е+ 03 (1) ОБЪЕДИНЕННАЯ КОВАРИАЦИОННАЯ МАТРИЦА .6467086Е+04 (1!) .2040732Е+ 04 (12) .2040732Е+ 04 (21) . 4272961Е+04 (22) МАТРИЦА, ОБРАТНАЯ ОБЪЕДИНЕННОЙ КОВАРИАЦИОННОЙ МАТРИЦЕ ,1334677Š— 03 [11) —,6374305Š— 04 (!2) —.6374305Š— 04 (21) .2644728Š— 03 (22) Т вЂ” КВАДР- ФАКТИ- Т вЂ” КВЛДР.
КРИТИЧЕСКОЕ = .162!304Е+ 02 Ч ЕСКОЕ =, 1228500Е+ 02 ,5960000Е+ ОЗ (2) С МЕАМ „СОТАЙ,ЛМО 1МЧЯ ИЕЕВЕО ИМЕЮ1ОИ Х (10,100), Х1 (!0,100),А (1О, !0),Я (10,10), ХВАЙ (10), 1ХВ0 (10) ЙЕЛЬ (5,5) М,И! „И2,Р 5 еоймАТ (313,Р10.0) 00 10 1=1,М 10 ЙЕЛ0 (5,15) (Х (1,1), 1=1,Я) 15 ПОЙМАТ «6Г10.0) 00 20 1=1,М 20 ЙЕЛ0 (5,15) (Х1 (1,1),! = 1,И2) СА1Л. МЕЛИ (М,М1,Х,ХВАЙ) ВЙ1ТЕ (6,25) (ХВЛЙ (1),1,1= 1,М) 25 гоЙмАТ'( мелик гоЙ а!акт 5ет,~,(4 (е17.7, (",12, ) ))) СЛ1 1. (ХИАЙ (М,Х1,Х,Я,ХВАЙ) ВО 40 1= 1,М ХВО (1) = ХВАЙ (1) ОО 40 3=1,М 40 А (1,1) =3(1,1) СА1Л. МЕЛК (М,И2„Х1,ХВЛЙ) %Й1ТЕ (6,45) (ХВАЙ (1),1,1=1,М) 45 ПОЙМАТ(*МЕАМЗ РОЙ ЗЕСОХО $ЕТ',/„(4 (Е17.7, (',12,')'))) СА1Л.
СОТАЙ (М,И2,Х1,8,ХВАЙ) 00 50 1.: 1,М ХЮ (1) =ХВО (1) — ХВАЙ (1) 00 50 1=1,М 50 А (1„.1) =(А (1,Ю)+5 (1„1)РВОАТ(я+Ы вЂ” 2) ай!Те (6„55) Обратите внимание, что первыми вводятся данные для второй группы. Таким образом, порядок ввода данных для этих двух групп не имеет значения. Далее приводятся результаты для примера из раздела 3.4 и текст основной программы. Гдава 4 ф ЛИНЕЙНАЯ РЕГРЕССИЯ 4Л. ПРИМЕР С ЗАВИСИМОСТЬЮ ПОТРЕБЛЕНИЯ ОТ ДОХОДА Рассмотрим гипотетическую модель потребления для домашних хозяйств в США.
Б табл. 4.1 представлены ш выборочных значений потребления У на душу населения, зафиксированных в каждой из групп домашних хозяйств с определенным уровнем душевого дохода. В этой же таблице приведены условные выборочные средние У, и условные средние генеральной совокупности О,~ (эти средние значения условные приданном значении душевого дохода ЖД. Экономическая теория и интуиция пс дсказывают нам, что душевое потребление должно быть связ~~о с доходом монотонно возрастающей з~висимо~т~ю.
П~э~о~у таблица 4.1 Дояод и потребление иа душу населении Потребление на душу население доход на дурау наееления (еерединн интереалон) ныбОрО чн06 сред- нее ередина нО сОнО- купнастн наблвдення ' Термин срегрессияе бмл введен Френсисом рельсовом для объяснения одного биологического явления. 8 настоящее вреия этим терыииом принято наэыаать подбор кривых для выборочных наблюдений. Пользуясь методами предыдущей главы, мы могли отвергнуть нулевую гипотезу о равенстве двух средних значений.
Это позволило нам сделать важный статистический вывод, используемый при классификации наблюдений, но мы не могли установить точной зависимости средних значений от некоторой другой переменной. Экономистов обычно интересуют явные соотношения, которые объясняют, почему средние статистически различны, и поэтому они часто строят модели для объяснения таких различий. В этом отношении очень полезен метод линейной регрессии~. по мере увеличения дохода (»»змерясмого серединой каждого интервала доходов Х») должны расти и условные средние значения потребления р». Гипотетические наблюдения из табл.
4.1 изображены на рис. 4.1. Каждая зачерченная точка соответствует одному домпцнему хозяйству. Игэа»»исимая переменная (доход) задается по горизонтальной оси, а эагисимая переменная (потребление) — по вертикальной оси. Изображение выборочных наблюдений часто называют диаграммой рассеяния. Наконец, кружки на рис. 4.1 соответствуни условным выборочным средним 1'„а крестики — условным средним генеральной совокупности 1»,». ф» ° Предположим, что существует „~ 1 функциональная зависимость 1А,» » ° ° ~ ~ -.~- ° отХ», т.е.
р; = ~ (Х»), » = 1„2,,„п, (4.1) заданная на рис. 4.1 сплошной '",» кривой. Назовем эту кривую функцией регрессии ггнеральной соеокупноапи. Так как каждое услов- А'» пое выборочное среднее 1'» пред- рне, 4.1. Гнпотетичеекие выборочные ставлЯе г собой нес~»еЩепнУю оц н набл»одення, средние н отношения ку соответствующего условного регреееин среднего генеральной совокупно- сти р», то пунктирная кривая на рис. 4.1, проходящая через каждое значение У», будет одной из приемлемых оценок функции регрессии совокупности.
Назовем эту кривую вь»барочной нлн оцененной фунщигй регрессии. Эта иллюстрация поясняет общий характер задачи регрессии, которая заключается в том, чтобы установить функциональную связь между одной зависимой переменной и одной нли несколькими независимыми переменными. Будучи полезной иллюстрацией, эта задача в том виде, в котором она сформулирована, представляется слишком расплывчатой, чтобы иметь существенное практическое значение.