Шеффе Г. - Дисперсионный анализ (1185347), страница 71
Текст из файла (страница 71)
Из формулы В= ' „,, полученной нз (9.3.2), = (Л сгдг] * (9.3.4) н (9.3.5), видно, что В является строго возрастающей функцией от с(! в то же время |!) является строго возрастающей функцией (г. Далее, пусть В= ~,х, + ~е! при всех комбинациях имеет ! одно и то же значение. Тогда $ КЗ. пегестхновочные кРитеРии 359 приведены 35 комбинаций и соответствующие значения статистик, Из этой таблицы мы видим, что значение статистики для рассмотренной комбинации равно 4 и что 15/35 комбинации дают значение статистики, не меньшее 4.
Вероятность (условная, если набл!одено (9.3.3)) получить значение (1(, не меньшее набл!оденного, равна, таким образом, 15/35; поэтому нашу гипотезу можно было бы отвергнуть по перестановочному критерию лишь с уровнем значимости, не меньшим 15!35. Уровень значимости должен быть установлен до всяких вычислений, поэтому возможно следующее третье упрощение, Предположим, например, что мы установили уровень значимости 109!9. Гипотеза должна быть принята, если четыре из 35 комбинаций дают статистике ~2 х! — С~ значение, не меньшее наблюденного значения; таким образом, кроме наблюденной, надо найти еще три комбинации с такими значениями. Теперь нам нужно вычислить лишь несколько значений в нашей таблице.
Сначала мы вычисляем, что значение ~ Хх, — С~ для ! набл!оденной комбинации равно 4. Легко видеть, что значение (х — г( будет наибольшим тогда, когда х принимает возможное наименьшее или возможное наибольшее значение (а г соответственно возможное наибольшее или наименьшее значения). Наименьшее значение х получается при комбинациях (0,2,3!) и (0,2,39), а наибольшее — при (5,6,9).
Все значения нашей статистики, вычисленные для этих трех комбинаций, не меньше 4, поэтому гипотезу следует принять. Заметим, наконец, что не обязательно даже вычислять последние три значения, если можно показать каким-нибудь более легким способом, что они не меньше 4. Этн упрощения касаются точных вычислений, связанных с перестановочным критерием; приближение перестановочных критериев будет рассмотрено ниже. Обычно необходимые вычисления легче производить в том случае, когда по перестановочному критерию гипотеза Н принимается, а не отвергается. Если число равновозможных при гипотезе Н выборок равно М (в нашем случае М = 35) и если М вЂ” наименьшее целое число )!хМ вЂ” 1, то для принятия Н достаточно любым способом найти М выборок, отличных от набл!оденнй, которые дают статистике значение, не меньшее наблюденного значения; в то же время, если критерий отвергает гипотезу Н, то обычно нелегко показать, где расположены все такие комбинации, не производя.
гораздо большего числа вычислений. Предыдущую гипотезу Н можно проверять также против односторонней конкурирующей гипотезы, заключающейся в том, что х-популяция отличается от г-популяции ГЛ. Э, РАНДОМИЗИРОВАННВВ МОДЕЛИ .бо переносом направо; соответствующий перестановочный критерий основывается на статистике х — г вместо )х — г), использованной нами выше в двустороннем случае. При этих конкурирующих гипотезах, заключающихся в сдвигах, можно рассмотреть перестановочные критерии, основанные на статистиках х — г или ~х — г(, где х и г — выборочные медианы.
Однако по причинам, указанным выше, мы будем интересоваться главным образом перестановочными критериями, основанными на тех же статистиках, которые используются и для критериев в нормальной теории. Если предыдущая гипотеза должна быть проверена при конкурирующей гипотезе, заключающейся в различии масштаба, а не начала отсчета*), то мы могли бы построить перестановочный критерий на основе следующей статистики: с (Е 2 — пгхз) ~~~~ я~~ — гхх Если мы определим основанный на этой статистике перестановочный критерий так, чтобы большие значения были значимы е'), то он будет пригоден в случае, когда прн конкурирующей гипотезе х-популяция более рассеяна по сравнению с х-популяцией. Если мы хотим проверить Н с уровнем значимости се при двусторонней конкурирующей гипотезе (о разности масштабов), то можно построить перестановочные критерии с уровнями а/2, основанные на 5 и 1/5, и отвергать Н, если ее отвергает хотя бы один из этих критериев.
Критерий, основанный на !(~, можно было выразить только через 2,кг, статистику 5 г можно выразить в терминах )' х, и ~ хз. г 1 Основную идею построения перестановочных критериев можно извлечь из только что разобранного примера. Перестановочные критерии могу быть построены для проверки таких гипотез Н, при которых распределение обладает определенной симметрией, упомянутой выше (инвариантно относительно группы перестановок). Мы сформулируем сейчас это свойство симметрии несколько иным способом, которое, будучи математически равносильным, более длинно, но его легче применять. Пусть вектор г) = (у|,...,у„)' случайных величин представляет ') Определенного, например, с помощью медианы популяпнн.
"ч) Если мы хотим отвергнуть гипотезу прн какнх-то других значеннях статистики (напрнмер, прн больших абсолютных значеннят, малых алгебрах. ческнх значеннях нлн значеннях, близких к нулю), то мы всегда можем тах переопределять статистику, чтобы прнйтн к этому же условию (напрнмер, выше мы использовали (() вместо Г). 4 э.з. пеРестлновочные кРитерии Зб1 собой вектор наблюдений, или выборку; пустьуа = (у!о,, у.з)' означает возможное значение у. (Нам здесь надо различать обозначения случайной выборки у, которая может принимать различные возможные значения, и одно из этих возможных значений ур. Применяя сформулированные определения, мы представляем себе уо возможным значением, а у — действительно наблюденным.) Предположим, что существует множе. ство б, состоящее из Ь перестановок и элементов у, которое обладает следующим свойством симметрии.
Обозначим Я(уо) множество из Е выборок, порожденных применением множества перестановок 6 к уз. Тогда нам потребуется следующее свойство симметрии. Если дано, что у попало в множество 5(ус), то условная вероятность (при Н) того, что у принимает любое фиксированное из Т. значений 5(уо), равна !/Ь для каждого из этих Ь значений; это свойство симметрии должно выполняться для всех значений уз, которые у может принимать.
Если уо содержит некоторые равные элементы, то нх надо различать, когда мы приписываем им Ь равных вероятностей (в нашем примере мы снабжали такие элементы индексами). Перестановочный критерий с уровнем значимости а является правилом "), по которому для каждого возможного множества 5(уо) определяется подмножество У(уо) выборок, число которых не превышает аЬ; гипотеза Н отвергается тогда и только тогда, когда наблюденная выборка уз содержится в 5'(уз). Подмножество 5'(уо) «значимых» выборок обычно определяется с помощью некоторой статистики (как в разобранных выше примерах). Проиллюстрируем это общее определение перестановочного критерия разобранным выше случаем.
Вектор у в нашем частном случае равен (х!,..., х, гь..., Е,), и = ги + и. Множество сг перестановок, обладающее требуемым свойством, в нашем случае является множеством всех перестановок элементов у, *) Более строгое математическое изложение перестановочных критериев смотрите у Шеффе (Ясьеий, !943), Хефдннга (Ноеиьчпя, 1952) нлн Лемана (1е1зшапп, !959а). Если встать на более строгую, нежели принятая в этой книге, точку зрения, то следует рассмотреть некоторые подробности, которые усложняют простую интуитивную идею.
Так, множества Зг(ра] должны быть выбраны таким образом, чтобы их объединение по всем уз являлось борелев. ским множеством в выборочном пространстве. Это будет так, если критерий основан на измеримой па Борелю статистике. Далее, возникают некоторые трудности точного определения условных верояткостей при данном у еи 5(уз), так как последнее событие имеет пулевую верояткость, когда у распределено непрерывно. Н накоиеп, для любого выбранного сх можно сделать вероят. ность ошибки первого рода точно равной сз вместо (а, выигрывая при этом а мошиости; для этого надо ввести для некоторых значений данных рандо.
мизапию (когда данные уже получены) и решать вопрос о том, припять Н илп отвергнуть по результату этой рандомнзаиии. Хотя этот прием и полезен при сравнении мошкостей критериев, я все же считаю применение его в реальных приложениях нежелательным Гл. з. рдндомизировянныв моднли зев а случайные величины и константы (обозначаемые соответственно латинскими и греческими буквами) подчиняются условиям, установленным в $ 9.1. В этой модели распределение при гипотезе Нл. «все иг = О» не обладает такими свойствами симметрии, чтобы можно было построить перестановочный критерий, Однако мы можем построить перестаиовочный критерий для гипотезы Н, заключающейся в том, что между «совокупностями условий» нет абсолютно никакой разницы, т.
е. (1) аз„-=олв — — а'и — — О и (11) совместное распределение технических ошибок 1Х объектов не зависит от того, как «совокупности условий» поставлены в соответствие «объектам», Мы можем написать, что при Н Уц = 1» + йг + Е г(цч (сыч + мгч) ч (9.3.6) где и;, †техническ ошибка, связанная с объектом ((,ч); раньше мы ее записывали вц„ а теперь предполагаем, что она не зависит от «совокупности условий», которая применяется к «объекту».
По определению, йг((иг«) = О; в остальном совместное аспределение (игъ) произвольно. К ерестановочные критерии будут строиться на основе множества 6 перестановок внутри блоков. Производя в каждом из Х блоков по одной из Л возможных перестановок наблюде- ') Точные пересгвновочные критерии днсперсионного вивлнзв можно в случае однофзкторного анализа рассчитывать с комбинациями перествновок вместо перестановок. так что число Е всех перестановок в б равно л!.
Значение любой статистики, симметричной по всем х и симметричной по всем г (например, г, ) г(, 5, 1/5), не меняется, если перестановка из б переставляет только х между собой и только г между со- бой; таких перестановок в 0 существует т1г1, поэтому вместо Е = п) равновозможных перестановок мы можем рассматри- вать Лг = л! (лг)г1)-' равновозможных их комбинаций *) (как мы и делали выше). Дальнейшее развитие применения общего определения к нашему случаю не представляет труда, Перестановочный критерий для случайных блоков Рассмотрим совсем общую модель, в которой наблюдение при (-й «совокупности условий» в рм блоке имеет вид уц — — 1»+ аг + бг+ уц + ец + ац, где ошибки объекта ец и технические ошибки ец равны вц = ~~г Йц.,ецч, ец = Х Йцчегио ч 4 зз, пеРестлноеочные кРнтеРии 363 ний этого блока, мы получаем элемент в б. Таким образом, число перестановок в б равно 7.