Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 26
Текст из файла (страница 26)
РогЬез, 1ап. 1 1970. Общую вариацию можно найти либо при 11омощи (см. примечание 3 в гл. 4) соотношения либо непосредственным вычислением суммы квадратов отклонений (К1» — T..). Как и ранее, косвенный способ предпочтительнее при применении настольной вычислительной машины, в то время как прямой способ предпочтительнее для цифровой вычислительной мап1ины. Для данных 1абл.
5,2 »~ Л» ;~'„~Р У7» = (14,0)'+ (12,0)а+ ... + (10,2)'+ (9,5)'= 6366,3 /=11=1 Ю$» Х Х У1»=14,0+12,0+ ...+,10,2+9,5=407,8Ф » 11=! Ц4.6 12,0 10,5 9.9 9,3 8,7 8,7 7,7 6,6 6,2 5,7 1,1 33,6 25,1 20,6 19,6 16,7 16,0 14,1 13,1 11,6 10,3 8,8 18,6 16,3 14,4 13,3 12,7 12 0 10„9 10.2 9.5 и, следовательно, У;« = Г. «+ е««, « = 1, 2, ..., К„ где е;« — остаток наименьших квадратов. Отсюда квадратов для каждого столбца ~ будет: ~ е7«=,'~ (У'~« — 7 ) 1=1 (5.23) остаточная сумма 8 Оценки наименьших квадратов параметров в (5.2Оа) при предположениях модели будут равны: и" =У" и т« — У « — У.
так что Х 2; (Ун — У,) = 6366,3 ††' '-"'1169 4. — и (407,8)~ У вЂ” а Вариацию столбцов, как правило, легко вычислить по прямой формуле: '~ а«(1'.« — У ) = 12( — 4,3771) + 11 (4,4835)~+ 9(0,3562)а =.452,2. «=1 Остаточная вариация находится пут~м вычитания: к ц« ~' (У;« — Г «)' — -общая вариация — вариация столбцов =- 1169,4— — 452,2 = 717,2. Модель, Предположим, что в пределах каждого столбца значения У„можно представить в виде г1«= Р«+ Ы~ (5.20) т. е. каждое Г;«в столбце равно сумме среднего по столбцу и ошибки е~«, которая для всех столбцов предполагается распределенной согласно У, (О, о') с соч (в;«, е;«) =- О, «4= «'. Кроме того, в заданной модели предполагается, что в генеральной совокупности среднее каждого столбца может быть представлено в виде ц.« —— р..+т«, «=-1, 2, ..., К (5.21) где р..
есть общее среднее генеральной совокупности, оцененное значением У'... а величина т«называется 9ффеквом столбца. По определению в (5.21) т« =-- р,.« — р,., т. е. эффект столбца равен разности между средним по столбцу и общим средним. Сумма эффектов столбцов, т. е. сумма всех т«, 1 = 1, 2, ..., К, в генеральной совокупности предполагается равной нул|о; это предположение просто означает, что общее среднее есть среднее арифметическое средних по столбцам. Объединяя (5.20) и (5.21), получим: 1 О = Р-* + т«+ е.«.
(5.20а) Можно показать, что в рамках принятой модели оценки наименьших квадратов для р.« в (5.20) равиьР: Р-« — У.«,,~ = 1, 21 .*, К, (5.22) Таблица БЗ Таблица диеперенонного анализа, классификация по одному признаку Чнело степеней СЬ36иий ~ средина кйздфйт Источини мрнацни Отношение Р ' И иа+лз+... +ВК. квадрат остаточной вариации представляет собой оценку дисперсии ошибки ец, т.
е. Ф. Отсюда (5.30) (5.31) К Е вЂ” --- ~Р, с„~3;, газ ! а оценка ее дисперсии равна: К ~~ = Ус~а~. (иы ~ (5.32) 1' Если нулевая гипотеза верна, то средний квадрат вариации сталбцов— также оценка Ф'. 1" См. ~8Ц. Другой метод, который был предложен Тыоки, описывается и ~673. 162 что для нашего примера дает "я 717,2 а = — '=24,7.
29 Линейные контрасты. В случае двух или более средних отбрасывание нулевой гипотезы о том, что все средние равны, не обязательно предоставляет нам какую-либо информацию относительно того, какие именно средние (одно или несколько) служили причиной отбрасывания гипотезы, Один из путей решения этой задачи заключается в применении метода линейных контрастов, предложенного Шеффе". Линейный контраст Е определяется как линейная комбинация параметров, например, ~3„~3з, ..., ~3рс с весами, сумма которых равна нулю. Таким образом, Е = Хс ~сф~, где Х~ ~с; = О. Если~~естьоценК ка ~~ с оцененной дисперсией 4 (т. е.
а,'естьоценка дисперсии ф;) и если Р~, ..., Рк взаимно независимы, то можно считать, что оценка линейного контраста равна: 100(1 — а)%-ный доверительный интервал для линейного контраста Е будет равен: ~ =Ь 8~ ИК вЂ” 1) Га; к-1„и-к ° (5.33) где Е определяется из (5.3Ц. Для нашего примера при предположениях модели (5.20) выборочное среднее столбца У.~ является оценкой р,.~ среднего по столбцу для генеральной совокупности с дисперсией й О'3 з~ ---оценка дисперсии У.~ = —, Пу где о' есть оценка о' 1см.
(5.30)1. Более того, средние Г„..., У.~ взаимно независимы, так что оценка линейного контраста средних по столбцам раина: ~ оценкой дисперсии К .3 (5.32 а) й~ Возвращаясь к численному примеру из табл. 5.2, находим, что выборочные средние по столбцам равны: [~ ~ 1~ з ~ .з1 =~8 8667 17,2~7~ 1з,10ОЙ Ь, и, п~) = И2 11 Я и а'= 24,7 согласно (5.30). Возможны три простых линейных контраста, а именно: мы можем проверить, отвергнута ли нулевая гипотеза потому, что Р,.14= р,.р, или потому, что Р,.~ Ф р.э, или потому, что р.1 4= р.~.
Для проверки гипотезы И.: Р"1 — Р. = О против двусторонней альгернативы примем 1с, с, сз1 = И вЂ” 1 01. Аналогично для проверки гипотезы НО Р РЗ 0 против двусторонней альтернативы примем ~с1 С2 М ~0 1 1~э наконец, для проверки гипотезы против двусторонней альтернативы примем 1с1 сц сз1 = 11 0 — И. 163 Выбрав а = 0,05, находим, что Ро о,;, з, = 3,3, и для первого контраста Х, = 8,3667 — 17,2273 = — 8,8606 и яе — — -24,7 «1/12+ 1/'11)= = 4,3038. Таким образом, согласно «5.33) — 14,19 с:.
р.1 — р.з е.". — 3,53. Так как этот интервал не покрывает нуль, мы делаем вывод, что н, и 1х.з Я6АЯиисЯ существенно Различными. ПродолжаЯ далее аналогичным образом, мы найдем другие контрасты: о.З. ДИСПЕРСИОННЫИ АНАЛИЗ, КЛАССИФИКАЦИЯ ПО ДВУМ ПРИЗНАКАМ Дисперсионный анализ с классификацией по двум признакам представляет собой обобщение дисперсиопного анализа с классификацией по одному признаку.
При классификации по двум признакам наблюдения У;; классифицируются как по строкам, так и по столбцам. Типичная форма представления данных показана в табл. 5.4, где в каждой из ячеек, порождаемых схемой классификации, имеется только по одному наблюдению У~~. Мы также кратко рассмотрим случай, когда в каждой ячейке имеется но несколько наблюдений.
Т а б л и ц а 5.4 Данные для диспераиоикого анализа, классификация ио двум призиакам Класснфикацня столацоя Срелнса по строке Класснфикацнл строк 3 ~ ° -* ~ К У'1Э ~ы ~за Уп ~'а1 1'! Среднее по столбцу Об~дее среднее — 1,69 ~ р,.з — р„з е-". 9,95; — 10,36 е,'-,. р,.~ — р,.з е: 0,89. Так как эти два интервала покрывают нуль, мы делаем вывод, что на данном уровне значимости эти два средних не отличаются существенно один от другого. Отсюда мы заключаем, что к отбрасыванию совместной нулевой гипотезы привело различие между средними значениями для первых двух столбцов.
Гипотеза о равенстве всех средних по строкам (средних по столбцам) эквивалентна гипотезе о том„что все эффекты строк (эффекты столбцов) равны нулю. Для строк Оа: Р! = Ре = -" = Рй = 0'1 Н,: не все эффекты строк равны нулю, а для столбцов Ов-т! ='~а = - =-тих=0; Н,: не все эффекты столбцов равны нулю.
Если верна первая гипотеза (все эффекты строк равны нулю), то эффекты строк выпадают из (5.40)„и модель принимает вид: У!! = 1х.. ~ т~ + и!у. (5.44) Поскольку оценки наименыпих квадратов этих параметров равны.: р.. = ~'.. и т! —— У".~ — $'... то Уц = У + (У'.у У .) +е!~ (5.45) Сумма квадратов остатков в (6.45) для всех строк и столбцов в соответствии с этой гипотезой равна: К й К й 5 = ~' ~~ е,*-~- — — ~ ~ (1'„— У'.,)' (5 46) ~-! ~=! 1=! ~=1 с К вЂ” У; = К (Я вЂ” 1) степенями свободы. Можно показать ", что Х й Зв =- ~~ ~; (У!у — У'..)в — й '~!~,' (У.; — У..)'.
(5.47) ! =! 1=! у ю:! Согласно основному тождеству (5. 35) разность между 5, (определенной вы!пе) и 5! ~заданной (5.43)1 для данной модели равна: й 8ю=~о — ~!=К;К А.— У..) (5*48) с Й вЂ” 1 = К (Й вЂ” 1) — (Й вЂ” 1)ф — 1) степенями свободы. Поэтому Я!! называют вариацией строк.
Если верна вторая гипотеза (все эффекты столбцов равны нулю), то можно провести аналогичные рассуждения. В соответствии с этой гипотезой модель 1см. (5.40)1 принимает вид: го=Р" +Р +во (5.49) причем оценки на!!меньших квадратов этих параметров равны р... = = У.. и Р, = У;. — У'...