Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 27
Текст из файла (страница 27)
Отсюда ,к й к й Зв =- '~'„~~' еу; — — ~Р '~Р (у"ц — 7,.)а (5.50) ~= — ! я=! ~=! !=! $3 К й К й ,'~~ ~~ 0'ц — ~'л)'= ~ ~~ И)'о — ~'..) — (Г~ — Г..)Р- ! !ив~ ;=! !=-! Рааложе!!ие виражеиии в правей !аети докааа!вае~на!ие утверждение, 168 Таблица дисперсионпого анализа с классификацией по двум признакам имеет вид табл. 5.6.
И в этом случае средний квадрат Остаточной вариации есть оценка'4 дисперсии ец, т. е. оценка о': и 81 О' ею ~Л вЂ” 1) (К вЂ” 1) (5.54) Линейные контрасты, Если бы какая-либо из нулевых гипотез была отвергнута, то нас, возможно, заинтересовал бы вопрос о том„какая строка (строки) или столбец (столбцы) привели к этому. Что касается строк, то выборочное среднее строки Т;. есть оценка среднего по строке р~. с опенкой дисперсии з~ =ОЧИ, в случае же столбцов выборочное среднее столбца Г.~ является ОценкОй среднего по столбцу для р.~ с оценкой дисперсии а~ = = о"'Я.
Отсюда оценка л инейного контраста строк равна: = Х; ~с~Г;. с оценкой Я дисперсии з~ =з3Хг 1с1. Оценка линейного контраста столбцов равна: Х, = Ху=~ с~К.~ с оценкой дисперсии з~. 170 '~ Если справедлива гипотеза о нулевом эффекте строк (столбцов), то средний квадрат вариации строк (столбцов) также является оценкой ое. =" я~Х,". ~с~". Как н ранее, предполагается, что сумма коэффициентов с, (или с~) контраста равна нулю. 100(1 — и)%-ный доверительный интервал для любого контраста строк определяется (5,33) с Я вЂ” 1 и (й — 1)(К вЂ” 1) степенями свободы для Р, так что взамен К вЂ” 1 в (5.33) появляется К вЂ” 1. 10О(1 — и)%-ный доверительный интервал для любого контраста столбцов также задается выражением (5.33) с К вЂ” 1 и (Я вЂ” 1)(К вЂ” 1) степенями свободы для Р, Несколько наблюдений в ячейке.
Дисперсионный анализ с классификацией по двум признакам можно проводить и в случае нескольких наблюдений в одной ячейке. В этой книге мы ограничимся случаем, когда во всех ячейках имеется одно и то же число наблюдении". Табл. 5.7 содержит некоторые условные данные о привесе годовалых бычков трех пород. Два бычка каждой породы в течение определенного периода времени имели три различных кормовых рациона. Мы хотим установить, существует ли существенное различие в привесе между породами и в зависимости от рациона кормов. Итак, в каждой ячейке, образованной классификацией строк и столбцов, теперь имеются по два наблюдения (или в общем случае и наблюдений). Обозначим каждое наблюдение У'~~, где ~ и ~ указывают соответственно номер строки и столбца, а 1 — номер наблюдения в ячейке.
Для каждой ячейки имеется также заключенное в рамку среднее значение наблюдений в этой ячейке, Назовем эти значения выборочными средними ло ячейке У'ц~. Таким образом„эти средние равны: Аналогично средние но строкам будут равны: $';. = '~, '~; — '~', ~--.=1,2, ..., Я, пК а средние по столбцам: й а у У'.~= 'ч 'Я вЂ” '~', у=1,2, ..., К. пй Наконец, общее среднее определяется выражением где Ф = пЯК вЂ” общее число наблюдений в таблице. " Случай неравного числа наблюдений в ячейках рассматривается в 1601. Если числа наблюдений в ячейках пропорциональны между собой, То возможны некоторые упрощения.
Как и ранее, с целью получения основного тождества для вариации разделим ОбЩи! ОтклоненеЕе, 3' Е/! — У, на составляю$ЦеЕе, Оче. видно, что для любого наблюдения существует равенство (УЕ/! — У..) =(Г!. — Р ..)+ (У./ — У..) + (УЕ/ — У!. = У.;+ У'..) + + Р'-. — 7").
(5.55) или словами: общее отклонение = отклонение строки + отклонение столбца+ + отклонение взаимодействия + ОстаточнОе Отклонение. Заметим, что если в ячейке имеется только Одно наблюдение, то У';/! = РЕ; — — УЕ/ и ~еавенство (5.55) сводится к (5.34). Иначе говоря, при наличии одного наблюдения в ячейке нельзя различить влияние взаимодействия и влияние ошибки. В (5.34) член У'Е/ — У!. — У./+ + У..
является членом ошибки только в предположении отсутствия взаимодействия. Поскольку число наблюдений во все ячейках одинакою, суммируя квадраты членов (5.55), получим Основное тождество: . И К и ~Р т~~ ~У~ (У У )з, У~ ~!Р (У У )з,~ Р У (1" У' )й ~ !=Е/=!1=! ! "ж! ;=! й К й К и +/е 2~ '~~ Р'Е/ 1! У.
+У.*) + ~ ~ ~ (УЕ/! — 7Е/)', (5.56) /=! /,= ! !=! /=! Е=! или словами: общая вариация =вариация строк + вариация столбцов + вариация взаимодействия + остаточная вариация. И на зтот раз вычисления достаточно очевидны. Пользуясь данными табл. 5.7, можно получить общую вариацию непосредственно из выражения Х Х Х ~'Е/! !72 К й л К Я п Д Д,Х,(~„,— Т..~*=,Х„Х„Х, ~ь которое для нашего примера дает '~' (УЕ/! — У..)~ = 183885,00 — 183416,06 =- 468,94. /ев! !=! ! =! Общую вариацию можно найти и из основного тождества. ВариацеЕю строк легко найти: М /еК ',Р (У!. — Г..)' = (2) (3) Ц вЂ” 0,78)'+ (0,72)'+ (0„05)'1 =- 6,78. Вариация столбцов равна: К /ЕЯ У (У. — Р..)з =(2) (З) Н вЂ” 1,28)'+( —.1,28)'"+(2,55)2) =58,77 ° /юае ! Видно, что эффект взаимодействия — зто просто разность между отклонением (р~~ — Р..) и эффектами строк и столбцов: ~ц = (Ро — Р -) — Ь+ ~)- (5.59) Подставляя (5.58) в (5.57), имеем 1'ю = Р".
+ й + т. + ~'о + еи (5,60) Оценки наименьших квадратов для параметров уравнения (5.60) равны: р.. =У'..; Р; =7~. — 1'..; т; =Г.; — Г.. (5.61) Отсюда Уг~ = ~'" + (7 . — ~.-) + 0".~ — ~'..) + (У'ц — 1'~.— ~'.~+ У ") + еж (5-62) где е;~~ = У~;~ — Гц — остаток наименьших квадратов. Следовательно, в условиях модели (5.60) общая сумма квадратов остатков будет равна: с У вЂ” ЯК степенями свободы. В соответствии с основным тождеством (5.56) 3, называется остаточной вариапией. В нашем примере 5, = = 320,50.
Гипотезы. В данной модели имеются три нулевые гипотезы, подлежащие проверке. Для строк Но: Р1 = Р2. = " = Рж = Р- Но: Р~ = Рз -= "- = Ря = 0 Н,: не все средние по строкам равны Н,: не все эффекты строк равны нулю. Лля столбцов Но: Р1 = Р а = " = Р-.к = Р" Н . т = т = -.. -*. т~ = 0 Н,: не все средние по столбцам равны нулю или Н,: не все эффекты столбцов равны нулю. Для взаимодействия Но ° 1п — ~ы — -" — ~як Н,: не все эффекты взаимодействия равны нулю. Я З»» = »»К ~~р~ (Г».— Г..)а; »=3 к Зс=пй ~ (у.,» — Г..)а; » тт-» (5.64) (5.65) 3» = та "Я "~р ()г'"»» — У».
— У.»»+ У'..)а. »=3»=» Р 66) Величина Зу называется вариацией взаимодействия с Ф вЂ” Я вЂ” К + + 1 =- Я вЂ” 1)(К вЂ” 1) степенями свободы. В нашем примере мы уже вычислили З»р = 6,78, Зс — — 58,77 и З» — — 82,89. Критерии проверки гипотез. Общий метод проверки гипотез должен быть уже ясен из сказанного ранее. Сначала мы проверяем существенность эффекта взаимодействия, для чего находим отношение Р: Зги — 1) Ж вЂ” 1) (вариация взаимодействия)/(й — 1) ® — 1) (5.67) 51»'(Ж вЂ” ЯК) (остаточная вариация)/(Ф вЂ” КК) Для нап»его примера 82,89/4 () 58 320 „5О/9 т. е.
меньше, чем Ро,ав, 4 э -— — 3,5. Поэтому нулевая гипотеза о том, что эффект взаимодействия равен нулю, ие отвергается. Если бы была установлена существенность взаимодействия, мы оказалнсь бы не в состоянии разделить независимые вклады эффектов строк и столбцов. В нашем примере некоторые рационы кормов могли бы давать заметно лучшие результаты для одной породы, чем для другой. В ряде случаев такая информация оказывается важной и может быть подвергнута дальнейшему анализу. Однако при наличии взаимодействия этот анализ может привести к совершенно ошибочным выводам". В предположении, что эффекты строк и столбцов есть фиксированные величины1', как вариация строк, так и вариация столбцов сравииваютси с остаточиой вариацией с целью проверив гипотез о тои, что 'й В 181, с.94 и последу»ощие1 дается математическая трактовка этого вопроса.
Однако, как отмечает Шеффе, ее практическое значение невелико. В этой книге мы ограничий»ся тем, что посоветуем заканчивать анализ прн обнаружении су»цественного взаимодей~~~ия. " Иногда обсужда»отся три различные модели: фиксированная модель, котору»о мы приняли здесь, случайная модель, в которой предполагается, что эффекты строк и столбцов суть случайные величины, и смешанная модель, в которой предполагается, что эффекты строк (столбцов) фиксированы, а эффекты столбцов (строк) случайны. Об отличиях, которые вносят эти предположения в проверку гипотез„см. [63, с.
591. 1ж Если справедливы нулевые гипотезы, то для каждой из трех гип»~- '; гез можно вычислить сумму квадратов остатков З„и тогда, пользуясь основным тождеством, можно показать, что разности между 3, и 3, равны: средние по строкам и средние по столбцам соответственно равны между собой. Для с~рок Яя/Я вЂ” 1) (вариация строкой — 1) ~- 68~ -'ЫФ вЂ” КК) (остаточная вариацияИИ вЂ” ИК) что соответствует отношению Р с Я вЂ” 1 и У вЂ” ЯК степенями свободы.