Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 30
Текст из файла (страница 30)
Подготовив первые две (в случае МО0 Ф О) или три (в случае Я00 = О) карты данных, мы можем набивать исходную таблицу данных. Таблица данных набивается одинаково во всех четырех случаях. Столбец 1 таблицы данных набивается в восьми полях по 10 колонок и продолжается на стольких картах, сколько потребуется для набивки всех наблюдений в этом столбце.
Столбец 2 начинается на новой карте и т.д. Все эти числа набиваются с десятичной точкой. Это тот же формат, которому мы следовали в предыдущих главах. Далее приводятся результаты вычислений для данных из табл.5.2, 5.5 и 5.7 соответственно.
После этих результатов следует текст про- 1'раммы. П.5.5. Основная программа для ковариационного анализа А. Описание. Эта программа производит ковариационный анализ с одной сопутствующей переменной. Она вычисляет также средние по столбцам и общее среднее для Х и У, угловые коэффициенгы столбцов, средний и общий угловые коэффициенты. Воспроизводится вся информация из табл. 5.9 за исключением столбца, названного ~Объясняется сопутствующей переменнойэ, который при желании можно легко вычислить по остальным результатам. Вычисляются три отношении Г: первое используется для проверки равенства скорректированных средних по столбцам для К, второе — для проверки равенства угловых коэфф1щиентав столбцов, а третье — для проверки равенства нескорректированных средних па столбцам для У.
Таким образам, эти отношения Г отвечают (5.80), (4.83) и (5.29) соответственно. Б. Ограничения. Допускается не более 10 классов столбцов для Х и У и не более 50 пар наблюдений в каждом столбце. Эти ограничения могут быть изменены путем изменения операторов 01МЕЫБ1ОХ в программах. В. Использование.
На первой карте в колонке 3 набейте значение МОЮ. МО0 может быть равно О, и в этом случае числа наблюдений в классах неодинаково, или 1, и в этом случае число наблюдений в классах одинаково. Если МОЮ = О, то следующая карта данных содержит числа классов (столбцов), набитое без десятичной точки в колонках 1 — 3 и как можно правее. Третья карта содержит число наблюдений в каждом классе, которое набивается в колонках 1 — 3, 4 — 6, 7 — 9 и т. д. для стольких классов, сколько указано на предыдущей карте 2. Эти числа набиваются без десятичной точки и как можно правее в своих полях, Если МО0 = 1, та вторая карта данных содержит число классов (столбцов), набитое в колонках 1 — 3, и числа пар наблюдений в каждом классе, набитое в колонках 4 — 6; оба числа набиваются как можно правее и без десятичной точки.
Затем набивается исходная таблица данных. Сначала заносятся наблюдения У из первого класса в восьми' полях по 10 колонок каждое, эта продолжается на стольких картах, сколько потребуется. Далее, начиная с новой карты, набиваются наблюдения Х из первого класса аналогичным образом. После этого, начиная с новой карты, набиваются наблюдения У' из второго класса, за которыми следуют наблюдения Х из второго класса. Таким же образом набиваются наблюдения для всех остальных классов (сначала наблюдения У, затем Х). Далее приводятся результаты для рассмотренного в этой главе примера, после чего следует текст программы.
ОБЩЕЕ СРЕДНЕЕ ДЛЯ Х 1326.727 СРЕДНИЕ П0 СТОЛБЦАИ ДЛЯ Х 777.833 (1) 1350.125 (2) 171$.ЯО (3) ОБ1ЦЕЕ СРЕДНЕЕ ДЛЯ У 17146-227 СРЕДНИЕ ПО СТОЛБЦАМ ДЛЯ 7 8549.664 (!) 15715.875 (2) СРЕДНИЙ УГЛОВОЙ КОЭФФИЦИЕНТ 13,247 ОБЩИЙ УГЛОВОЙ КОЭФФИЦИЕНТ 15.998 УГЛОВЫЕ КОЭФФИЦИЕНТЫ СТОЛБЦОВ 12.451 (!) 10,914 (2) !4.945 (3) скОРРект Влрилция степеней СВОБОДЫ СХИМЫ КВАдРАтов и !!РОИЗВЕДЕНИй истОчни К ВАРИАЦИИ ОБЩАЯ ТЪ'Х ТХХ Т~~ . 7289!ЖЕ+ 08 .4$56406Е+07 .1410431Е+ 10 .2443523Е+09 ОШИБКА ЕУХ ЕХХ ЕУУ .2037771 В+08, !538281 Е+07 .454!865Е+09 .
!8424!7Е+09 СТОЛБЦЫ . 60! 1059Е+ 08 18 2 (ОБЫЧНЫЙ ДИСПЕРСИОН- НЫЙ АНАЛИЗ ПО У) Г=М.001 С 2 И 19 СТЕПЕНЯМИ СВОБОДЫ С ОРАХВ, СО!.5, АИР ГСА! НЕЕ!»ЕР ЯМЕЧЫОИ Х (50, !О), т' (50, !О), Н (!О), ХВСХ (10), ХВСт (10) „В (10) ВЕЛО (5,5) МОР 5 ГОРМАТ (10!3) 1Г РЮ!») 1О„ 10, 15 10 КЕАВ (5,5) КС йЕАВ(5,5)(Х(Л), Л--. 1, НС) ИТ=0.0 ОО 12 Л= 1„!!С !2 ИТ = Мт+ 1~ (Л» СО ТО 20 15 КЕАО (5,5) КС,МК ИТ=-ЫС МК 20 !»О 25 Л=1,ИС 1Г (МОЮ» 22,22„23 22 ИР= И (Л» Оо ТО 24 23 ЯР=ИВ 24 КЕАО (5,28) (У (1,Л),1-=1,ИР) 25 Р,ЕА0 (5,28) (Х (1„Л) „! =1,ИГ) 28 ГОКМАт (8Г!0.0) СА1-1- ОЙАИ0 (Х,Х,ИТ,ИС,ИЙ 1.ОМХ,ТХХ,МОЮ) Г=2.936 С 2 И 18 СТЕПЕНЯМИ СВОБОДЫ (СКОРРЕКТИРОВАННАЯ ВАРИАЦИЯ СТОЛБЦОВ) Р=.266 С 2 И 16 СТЕПЕНЯМИ СВОБОДЫ (РАВЕНСТВО УГЛОВЫХ КОЭФФИЦИЕНТОВ СТОЛБЦОВ) В главе 4 мы ограничились рассмотрением линейной регрессии. В этом случае зависимая переменная выражалась в виде некоторой линейной комбинации независимых переменных и аслучайного остатками.
Точное определение задавалось уравнением (4.1О). Конечно, значения У' могут быть связаны с Х и р многими способами, и конкретное соотногпение будет зависеть от способа задания общего вида 1спецификации) функции регрессии в (4,1). Как показано на рис. 4.1, пунктирная линия, проходящая через условные средние У'~, представляет собой одну из приемлемых оценок функции регрессии генеральной совокупности. Естественно, что если эта линия более или менее прямая, то линейная регрессия оказывается приемлемой; в противном случае следует воспользоваться нелинейной регрессией.
ВЛ. КОРРЕЛЯЦИОННОЕ ОТНОШЕНИЕ И ПРОВЕРКА ГИПОТЕЗЫ Л ИН Ей НОСТИ В табл. 6.1 приведены некоторые гипотетические данные о средней себестоимости У' и выпуске Х для некоторого предприятия. Структура этой таблицы аналогична структуре табл. 4.1. Условные средние У; изображены на рис. 6,1 и соединены пунктирной линией '. На этом риТаблица 6.1 Затраты У и выпуск Х на прщпрнитии вь~пуск, ед.
Х1' зят~>йти> дОД вУ ~ Мы по-прежнему предполагаеи, что условные распределении ааввснм переменной нормальпы и взаимна независимы, 11 12 13 14 15 1б 17 18 19 20 37, 33, 34, 33> 34, 32, 33, 31, 32, 31, 33, 32, 35, 34, 36, 39, 41, 39, 46, 47„4Б, 57, 55, 56, 63„ 67,' 67, 80, 79, 81, 35, 34 33, 31 31, 30 33,' 31 33, 34 40, 40 45, 46 57, 54 64,' 68 78, 77 34,6 32,6 31,4 32',0 34,4 39,8 45,8 55,8 65,8 79',0 Здесь К вЂ” это число наблюдений (или классов) переменной Х, а»1»вЂ” число наблюдений У для каждого класса Х».
Для нашего примера К = 10, а все п» = 5. В словеснойформе: общая вариация =объясненная вариация+необъясненная вариация. Из рис. 6.1 должно быть ясно, что если условные средние У» ие зависят от Х;, то следует ожидать, что для выборочных данных пунктирная кривая будет горизснтальной и будет соответствовать линии, представляющей общее выборочное среднее, т. е. Г» = У, а объясненная вариация равна нулю. Отсюда, отнои»ение деиермина»»ии объясненная вариация (6.3) Ч'— общая вариация характеризует степень регрессионной связи между У и Х в выборке. Квадратный корень из (6.3) называется корреляциоииым отиои»е»»иема: (6.3а) Поскольку общая вариация равна сумме объясненной и необъясненной вариации, то, очевидно, О ~ т1:= 1.
Если в выборке Х и У связаны ° ° точной функциональной зависимостью, то т) = 1.,Для нашего примера члены уравнения (6.2) равны 12375,28 =- 12305,28+ 70,00. Отсюда т)е =-= 12305,28/12375,28 = 0,9943 и т) = 0,9971. Проверка гипотез о корреляционном отношении. Проверка гипотез о корреляционном отношении аналогична проверке гипотез о коэффициенте корреляции по критерию (5.3). Семейство гипотез имеет вид: И,: т~ = О, т. е. функциональная связь отсутствует; .и',: Ч Ф О, т.
е, функциональная связь существует, где т1 — корреляционное отношение генеральной совокупности. Если верна нулевая гипотеза, то отношение ~объясненная вариация)/ (К вЂ” 1), т1зДК вЂ” 1) ~необъясненная вариация) Дл — К)»1 ~ррр, уц) Это отношение подчиняется Р-распределению с К вЂ” 1 и и — К степе- Р, нями свободы, где а = Х и». Для нашего примера »=1 12305,28Д10 — 1) 70,00~(50 — 10) Эта величина превышает критическое значение Ге,05: 9,4о = 2,12. Поэтому на уровне значимости 0,05мы отвергаем нулевую гипотезу и заключаем, что функциональная связь существует. а В Отличие от коэффициента корреляции корреляционное отношение всегдя неотрицательно. По атому отношению нельзя сказать, отношение регрессии положительно или отрицательно. На рис.
6.1 одна часть пунктирной кривой, отражаюшей зависимость между У и А,, свидетельствует об ик аотрицательнойэ связи, а другая — о аположительнойъ, так что нельзя сказать, связаны ли Х и У положительной или отрицательной зависимость»о. Для рассматриваемого примера линейные оценки условных средних определяются линейным уравнением регрессии: Г» — — ~10 + ~ Х» = — 30,11+ 4,85Х».
Разделение общей вариации согласно (6.6) дает 12375,28 = = 9716,37+ 2588,91 + 70,00. Отсюда отноп»ение я588,яд~о — 2) 70,0Щ50 — 10) ч»о превышаеткритическое значение Р~ „.„8 4~ —— 2,18. Таким образомна данном уровне значимости нулевая гипотеза отвергается и делается вывод, что отклонение регрессии генеральной совокупности нелинейно. Пользуясь обозначением предыдущей главы, мы видим, что ,К Х~ » п» (У» — К..)' представляет собой объяснениию вариацию, а В» Х»» Х»= » (У'ц — Г..)' — обиуо вариацию из раздела 5.1.