Шеффе Г. - Дисперсионный анализ (1185347), страница 70
Текст из файла (страница 70)
Мы можем также сделать, например, следующий вывод: если пзз =О и если одв, оэ, ов близки по значению к о';, то мощность будет меньше, чем в том случае, когда нет взаимодействий, а дисперсия ошибки о', увеличена примерно в четыре раза. Если мы рассматриваем влияние взаимодействий в приложении типа (ШП, о котором говорилось в начале параграфа, то о'-„в представляет собой значение ошибок объектов, которые не элимииируются двухфакторной группировкой экспериментальных объектов; поэтому мы должны э щ ! »РУс сравнивать(9.2.16) с рэ = ж «',+«'„в Из (9.2.6) и (9.2.7) легко видеть, что наблюденное среднее «совокупности условий» у„» является несмещенной оценкой истинного среднего «совокупности условий» и+ас„какие бы при этом взаимодействия ни присутствовали.
Следовательно, если ф=~,с а~~ (~с' с»=О) является сравнением главных эффектов фактора С, то Ф вЂ” ~ ~с д (9.2.17) будет оценкой ф 0(ф) можно непосредственно вычислить из (9.2.6) и (9.2.1!), однако окончательное выражение 0(ф) имеет довольно сложный вид, поэтому неясно, как ее оценивать. С помощью (9.2,!2) можно получить более простые результаты относительно 0(ф). Предположим сначала, что и'„в — — О. Тогда, оценивая (!»+ аД с помощью (у„»), мы получаем в силу (9.2.6), что т ошибок этих оценок (р„„, — р — аД симметрячно распределены; в частности, они имеют одинаковые !в Г, шефф« ГЛ.9, РАНДОМИЗНРОВАННЫЕ МОДЕЛИ дисперсии и одинаковые коэффипиенты корреляции.
Это позволяет применить лемму ! в конце этого параграфа и получить 0($) =т '(о', + о»в) ~,се». (9.2.18) В силу (9.2.13) т '(55,) 2,с', является верхней оценкой 0(ф), т. е. имеет положительное смещение, за исключением случая о'„=о' =О, когда эта Оценка несмешена. В общем случае мы не предполагаем о'„-в — — О. Интересуясь только оценками (у — у,»,) сравнений (ас — ас»,), являющихся разностями, мы можем получить среднее значение дисперсии этих оценок, ! осредненное по — т(т — 1) разностям, 2 2т ' ~о~ + (1 — 2т ') велес + олв1' (9.2.19) этот результат*) получается с помощью леммы 2, доказанной ниже. Возможна только приближенная оценка этой величины; статистика 2т — 1Я, обычно является верхней (в силу замеча- ния перед (9.2.14) ). Две леммы В заключение докажем две леммы, которыми мы воспользовались выше.
Обе леммы касаются дисперсий оценок сравнений параметров (01,...,0») вида ф= 2„'с»0», где Хс»=О. »» Пусть оценки (О») не смещены, т. е. О» = 8» + !», и М (('») = О. Тогда ф= ~,с»0» является несмещенной оценкой»Р. Определим 2„'(й„— и,)' ')= '(к-и и положим (т= М ((е) — ое, где символ ое Означает ~. (0» — Е.)' (К вЂ” !) Лем ма 1. Если (О») имеет одинаковые дисперсии и одинаковые коэффициенты корреляции, то 0(ф)=)тХсееы ') Получен Уилком и Кемпгорном (Уг)((г, Кегнр(ногае, !957). Доказательство. Выведем формулу для т' в общем случае, когда М (!»1»,) = р„,о,о»„а затем воспользуемся ее » вЗ.
Пвгвст»новочные кРитеРии частным случаем. Подставляя 0» — О„= (О» — О,) + (!»» — !»,) в (9,2.20) и переходя к математическим ожиданиям, мы получаем М Я) = о'- + (К вЂ” 1) М (~ !»» — К!»). Поскольку М (~ 1» 1 = '/ »l =~ о»» н М(К!.) =К 'М (ХГ»~~» ) = — К ' ~ ~~'„р»» о»о», то Ь = (К вЂ” !) (~ о» вЂ” К ~' ~ р»»,о»о».).
(9.2.21) В нашем частном случае все ржи =р при ФФ й' и все о'„=о'„ поэтому К членов с й =й' в двойной сумме (9.2,2!) равны о', » Р а остальные К вЂ” К членов равны рог Таким образом, У=(К вЂ” 1) '(Ко',— К '~Ко',+К(К вЂ” 1)ро',3=о',(1 -р). С другой стороны, если в !» (ф) = ~,)' с с„,р „,о о, мы подста. вим р»»,о»о», =о',~р+ Ь „, (! — р)), то получим 0(~р) =о~~р ~ ~с с, +(! — р) ~ ~ с,с,,б =о»(1 р) 2 с» = Р 2 с'. 1 „» „».
Лем ма 2. Среднее значение дисперсий — К(К вЂ” !) разно! 3 сгей (0» — О» ) равна 2Г. Доказательство. Для вычисления средней дисперсии мы можем взять умноженную на [К(К вЂ” 1)) — ' сумму 0(0„— О„) по всем й, й', для которых й Ф й', таким образом, каждое слагаемое встретится дважды. Однако, поскольку члены с й = Й' равны нулю, сумма не изменится, если мы будем суммировать по всем й, й'. Итак, умножая на (К(К вЂ” 1)] — ' сумму 0(0 — О,) =- ~~' 2 (о»» + о»», — 2р,о о,) =— = — 2К ~ о', — 2 ~ ~ р„,о,о,, =2К(К вЂ” 1) Г, мы получаем среднюю дисперсию; последнее равенство следует из (9.2.21). Таким образом, средняя дисперсия равна 2 г'. 0 9.3.
Перестановочные критерии Теперь мы приступим к задаче проверки гипотез в рандомнзированных моделях, которые мы определили н использовали в этой главе для оценок в планах со случайными блоками и латинскими квадратами. Точные критерии, возможные для ГЛ. з, РАИДОмИЗИРОВАННЫЕ МоделИ некоторых гипотез в рандомизированных моделях, будем называть перестановочными критериями *). Перестановочные критерии для проверки некоторой гипотезы существуют всякий раз, когда совместный закон наблюдений при этой гипотезе обладает симметрией, заключающейся в том, что существует множество перестановок наблюдений, которые не меня!от это распределение (распределение инвариантно относительно группы перестановок).
Этн критерии являются точными для очень большого числа гипотез в том смысле, что вычисленный уровень значимости зависит только от симметрии распределения и не зависит от таких дополнительных предположений, как нормальность, равенство дисперсий или независимость. Этой симметрии можно добиться следующими тремя способами: 1) с помощью предположения о том, что имеется случайная выборка из одной или нескольких популяций (как в первом из рассматриваемых ниже примеров); 11) с помощью фактической рандомизации, устанавливающей соответствие «совокупностей условий» экспериментальным «объектам» (например, в плане со случайными блоками); Ш) с помощью фактической рандомизации, по которой из множества «совокупностей условий» полного плана с несколькими факторами выбираются «совокупности условий» некоторого неполного плана, которые и используются в эксперименте (например, в плане с латинским квадратом в случае (1) $9.2).
Как мы скоро увидим, перестановочные критерии легко определяются, но связанные с ними расчеты наталкиваются обычно на крайне громоздкие вычисления. Самый интересным для нас является то, что г'-критерий, выведенный для соответствузошей гипотезы в обычной модели с постоянными факторами, включающей предположения нормальности, независимости и равенства дисперсий (или некоторое видоизменение этого критерия), часто можно рассматривать как хорошее приближение к перестановочному критерию, а этот последний является точным в менее ограничительных моделях. Прежде чем дать общее определение перестановочного критерия, рассмотрим совсем простой числовой пример, который поможет нам понять основные интуитивные идеи.
Пусть мы хотим иметь критерий для гипотезы Н, состоящей в том, что выборка объема три и выборка объема четыре являются независимыми выборками нз одной и той же популяции; предположим, что имеются упорядоченные в порядке роста чисел выборки (О, 3, 5) и (2, 3, 6, 9). (9.3.1) ') Они называются также рандомнзнрованнымн крнтериямн. Идея таких критериев принадлежит Фишеру (Г!зьеп !925, й 24; !936, $2!). $ вк пвгестхновочные кгитвгии 357 в которой значимыми являются большие ~!), величина кон- станты с| безразлична, х и г — выборочные средние, Я вЂ” объ- единенная ЯЯ 5 = ~, (х; — х)» + ~, (г; — г)', а (хьхмхз) и (гогмгмг,) означают выборки.
Для облегчения расчетов, связанных с появлением двух цифр 3 в (9.3.1), будем нх снабжать индексами ! и 2 и считать различными при счете числа перестановок или комбинаций, содержащих эти цифры; однако при определении численного значения статистики мы в обоих случаях принимаем значение 3. Таким образом, мы имеем общую составную выборку (О, 2, Зь 3„5, 6, 9). (9.3.3) В примерах, относящихся к (9.3.!), под словом «выборка» мы будем понимать «выборку, расположенную в порядке возрастания». Число способов, которыми эту выборку объема семь можно разбить на выборки объемов три и четыре, равно С»«=71(4!3!) =35; при гипотезе Н, описанной выше (9.3.1), все эти выборки равновозможны, т. е. условная вероятность того, что две выборки состоят из любой комбинации трех и четырех цифр, взятых из данной составной выборки (9.3.3), равна 1(35. Выберем уровень значимости пк идея построения перестановочного критерия, основанного на статистике ~11, состоит в следующем.
Для 35 комбинаций вычисляются 35 значений статистики ~1(, некоторые из которых совпадают. Далее определяем, какая пропорция нз этих 35 значений (!( не меньше значения ) 1( рассмотренной комбинации (9.3.1); мы отвергаем Н тогда и только тогда, когда эта пропорция не превосхолит к. Полученный критерий имеет вороятность ошибки первого рода, не большую а (т. е. вероятность отвергнуть Н, когда она справедлива); в самом деле, условная вероятность (при данной упорядоченной выборке) отвергнуть Н, когда она справедлива, не превосходит а, поэтому и безусловная вероятность На практике обычно перестановочный критерий основан нз некоторой выбранной статистике.
Предположим, что мы выбрали статистику, пригодную в обычных предположениях нормальности к проверке гипотезы Н против двусторонней конкурирующей гипотезы, т. е. против конкурирующей гипотезы, состоящей в том, что две выборки являются независимыми выборками из популяций, отличающихся друг от друга сдвигом.
Мы выбираем тогда статистику )!1=с,!х — г)5 '", (9.3.2! ГЛ.В. РАНДОМИЗИРОВАННЪ|Е МОДЕЛИ отвергнуть Н, являясь математическим ожиданием по всем упорядоченным выборкам, не больше а. Тот же результат практически можно получить, пользуясь некоторыми упрощениями. Прежде всего, достаточно вычислить просто с( = ')х — 2) для 35 комбинаций и отвергать Н при больших значениях этой статистики вместо !!), так как при данной составной статистике )!) представляет собой строго возрастающую функцию с(.
Имеется тождество ВВА+В=А, (9.3.4) справедливое для любой из 35 комбинаций; здесь ВВА есть ВВ между группами для двух выборок, Я вЂ” объединенная ВВ, определенная выше, а А — полная ВВ относительно обще~о среднего — имеет одно и то же значение для всех 35 комбинаций. Легко вычислить, что х — й=т-' ~'„х! — г-г7,е|=т-гХх! — г-г( — ~:х!)= ! ! 1=! = (т ' + г ') (~ х, — С) где С= тВ)(т+ г); в нашем примере т = 3, г = 4, В = 28, С = !2. Второе упрощение приводит к тому, что мы строим наш критерий на основе статистики ~ 2 х, — С ~. В таблице 9.3.1 Таблица 9.3.!. Зиачеиия статистики )Ч1 х! — С), С= |2 000000000000000222 2 2 2 2 2 3! 3! 3! 3! Зг Зг Зг 5 5 6 3! 3! 3! 3! Зг 5 б 9 Зг 5 6 9 5 б 9 6 9 9 Зг 5 6 7 7 5 4 ! б 4 3 0 4 3 0 ! 234 2 1 Первая выборка )~ х! — С) ЯВА — — сгг(г, (9.3.5) сггг|~ где сг) О.