Шеффе Г. - Дисперсионный анализ (1185347), страница 20
Текст из файла (страница 20)
Поэтому мы можем полагать, что Т-метод дает для этих разностей более узкие интервалы. Это положение обычно не сохраняется, когда мы применяем Т-метод к более сложным сравнениям. Для иллюстрации относительной эффективности этих двух методов рассмотрим отношение )с квадратов* ) длин интервалов, полученных 8- и Т-методами соответственно. В теореме 2 $3.6 выберем случай й =6, т=оо, а=0,05; в 5-методе мы тогда положим д = й — 1. Предположим, что мы рассматриваем сравнения, являющиеся разностями между средними от (ОД.
Через [п1,па) будем обозначать сравнение, равное разности между средним от л1 парал1етров (О;)и средним от аа параметров (О;); такой тип сравнения является обычно наиболее важным. Пример: 9 (О + О ) 4 (О + О + О + О ) 1 1 является [2, 4) сравнением; 1 з (Оа+ Оз+ 8а) — Оа является [3, 1) сравнением. *) Рассматривать нвадраты длин предпочтительнее, чем канны;кк как квадраты длин интервалов, нлв нх математические ожидания (по крайнев мере прн больших л). обратно пропорпнональны и.
4 3.7. з. и г.методов. другнн мнтоды В рассматриваемом случае относительная эффективность этих двух методов показана в таблице 3.7.1. Например, значение гс = 0,68 для 12, 2) имеет тот смысл, что для получения одной н той же точности сравнений типа [2, 2) по 5-методу требуется только около 68сгр наблюдений, требующихся при использовании Т-метода. В таблице 3.7.1 приведены сравнения для линейных, квадратичных и кубичных эффектов. Если считать, что 16)) соответствуют равноотстоящим значениям независимого переменного, то коэффициентами при 16!) будут соответствующие значения ортогональных полиномов *).
Позднее (5 4.1) мы введем другой важный класс сравнений, называемый взаимодействиями; для этого класса 5-метод тоже обычно оказывается лучше. Таблица показывает, что Т-метод предпочтительнее, когда нас интересуют только сравнения типа О, — Отч а 5-метод дает более узкие интервалы для более сложных сравнений. Т а бл н да 3.7.1 "). Относнтельнав вффектнвность 3- н Т-методов, равная аг-отношенню квадратов длнн интервалов В=В, и= ос, а=0,05 ') Заимствовано: А те)Ьпд гсг )пав)пк ан спи!гав!в Ш )Ье апа)увн а! чаг)апис Н. ЗсЬепв Нмтенжа, т. ЕО (1%3), сер.
93. Отметим то немногое, что известно об оперативной характеристике Т-метода. Т-метод соответствует критерию, построенному по стьюдентизированному размаху 16,), так же как 5-метод соответствует Р-критерию. По каждому методу находится по крайней мере одно сравнение, значимо отличающееся от нуля, тогда и только тогда, когда соответствующим критерием отвергается гипотеза равенства нулю всех сравнений.
Мощность соответствующего критерия хорошо известна для 5-метода, но неизвестна для Т-метода. Кроме того, для 5-метода известны формулы вероятностей ошибок двух родов, аналогичных до некоторой степени двум родам ошибок в теории проверки гипотез; ошибка первого рода связана с утверждением, «) Фншер н Иэйтс (Г)аьег й 'га!еа, !943, таблица ХХ111). 4 Г.
ШеФФе гл, з. одноадкторныи лнллнз, множкственнов стлвнениа что нулевые сравнения значимо отличаются от нуля, а ошибка второго рода — с противоположным утверждением для ненулевых сравнений' ). Т-метод более ограничен в приложениях, так как он применим только в случае равных дисперсий оценок (О;). Преимущество 5-метода заключается еще в том, что он нечувствителен к нарушению предположений о нормальности и равенстве дисперсий (9 !0.6). Другие методы множественного сравнения В этом разделе мы кратко рассмотрим несколько других методов множественного сравнения е*).
Один нз них основан на увеличенном стьюдентизированном размахе, а другой — иа стьюдентнзированном максимуме модулей. Сейчас мы ях определим. Предположим, что (хь...,х,) независимы и нормально распределены с параметрами (О, и ), а тз'„/аз является )(з и не зависит от (х!), как в конце $2.2. Максимум модулей (х!) равен М=шах~хс). Стоюдентизированный максимум модулей определяется фор. мулой гнв, э —— М/з,. Его верхний а-предел обозначим через изиль,, Эту величину при а = 0,05 табулировали Пиллай н Рамачандран (1954). Увеличенным размахом Н' величин (х;) называется большее из двух чисел М и )с, где )с является размахом (хс). Увеличенный стоюденгизированный размах равен 4',,,- Л'(з.
Обозначим его верхний а-предел через д,',, Эта величина ') См. работу Шеффе (ЗснеЩ 1955), з которой, помимо тзблины 37.1, содержится еще сравнение этих двух методов. ") Я не эключил методы множестзеныого срэзненни Д. В. Даыкзна, так кзк я не был способен понять их обоснование. Дзикзн был одним нз сзмых ранних исследователей н этой области. Его правила различении любой пары средних (кзкне средние различны, з если рэзлнчны, то в кзкоы направлении) не имеют быстрого зозрэстэиня нечуэстзительности с ростом ч или К что может рэзочзроэзть использующих 3- и Т-методы, нечузстэительность которых прнзодит к увеличению длины нитеризлоз дли срззыений, Читатель, зэинтересозэзшийся этими методами, отсылэетсн к объяснительной работе Дэнкэиа (Рппсзп, 1955) н к последующим рлботзм Крамера (Кгашег, !956) и Дзыкзиа (0ппсзп, !957).
Работа Дэикзнз ((!ппсзп, !952), з которой обоснозыээются его методы, содержит ошибки (иапример, г з осноэыом рэспределеиии (2) не может быть центральным Р, кзк это принято автором). 4 згь з- н г-мнтодов. дртгнз мктоды не табулнрована, но для й) 2 н сс(0,05 было показано' ), что она практически мало отличается от соответствующего верхнего сь-предела де, ь,, стьюдентнзнрованного размаха (9 2.2).
Мы будем пользоваться тем, что увеличенный размах выборки х!, ..., х„является обычным размахом множества нз л+1 случайных величии хе, х!, ..., х„, где «случайная величина» хе полагается тождественно равной нулю. В предположениях (3.6.1) могут потребоваться совместные ,«ю «з *ф! „з 1«-Е„з,) ...р !-! обязательно являются сравнениями, как обычно предполагалось выше. Тогда теорема 2 ($3.6), которая обосновывала Т-метод, остается справедливой "), если д„, а,, заменить на г)' н — т) )с,) на дв, где д определяется как наибольшая г-! нз двух величин: суммы положительных (с!) н суммы отрицательных (с!), взятой с обратным знаком.
Для доказательства используем следующий прием. Определим ее= — 8« = 0 н запн. шем зр формально в виде сравнения параметров (8е,йь...,йа), ь ь т, е. зр ~ с,б„где с, = — Е с,. Положим и! = 8! — 8!. Мы вн!-е ! ! днм, что множество (ие,и!,...,иь,аяза) имеет такое же распределение, как определенное выше множество (х„х„..., х, з') с п,=па.
Отсюда следует, что вероятность неравенства тих и! — ш(п и! (~ Т'з, (3.7.1) г-о,...,а г-е,...,а где 7'=аб,', „„равна 1 — а. Продолжая дальнейшие рассуждения так же, как в доказательстве теоремы 1 5 3.6), мы найдем, что (3.7.1) эквивалентно неравенствам ~ и! — иг1~<Т'а прн г, !'= О, 1, ..., й. Теорему 2 теперь легко получить, если нспользовать лемму к теореме 2 (с заменой (и!,..., иа) на (пе,..., иь)) н равенство а ь а * Е! !=К!,!«!«|=К!«!.> К„/ ! о ! ! г=! ! ! — Хс — Е с+~ Хс+ Е с~.
гиР !Ял ~! ЯР гем Входящие в это равенство множества Р н Ф были определены в доказательстве леммы. Легко вндеть, что зто равенство яв- «) Тычки (Тпкеу, !993, гл. 14). ««) Этот результат и его метод доказательства, заключающийся в том, что линейная Фуииции от А переменных рассматривается как сравнение Ф веремеиныз и нуля, были предложены тычки (тп)геу, !9бз, гл. 1О).
)оз гл. з. одноолкторнып лнллиз, множкстваннов свавнеиин ляется удвоенной функцией пэ, определенной выше. Прежнее доказательство теоремы 3 для зависимых (О!,...,Оь) может быть использовано, чтобы установить следующее утверждение: если предположения (3.6.5) выполнены, то множество линейных функций ф= Е с!О, удовлетворяет теореме 3 с заменой ! ! в неравенстве (3,6.3) Т=ад. ь . на Т'=ад,'! е,н о ~~~~)с,.)над . ! ! Так как при й ) 2 и сс ( 0,05 величина д' е „практически Равна !7щз,„, то в этом слУчае мы использУем !)ма,«вместо д'. а,, в аналогах теорем 2 и 3; таким образом, с величиной д„,!ь,, мы получим доверительные интервалы и для линейных функций, не являющихся сравнениями. В некоторых случаях мы можем быть более заинтересованными в получении совместных интервальных оценок для истинных средних (О!,...,Оь), чем для сравнений нли других линейных функций; такой случай может быть, если, например, (О!) являются истинными ординатами в регрессионной задаче и мы не хотим делать какие-либо предположения о форме регрессии, или если (О!) являются средними ячеек в дисперсионном анализе и мы, главным образом, заинтересованы непосредственно в этих средних.
Пусть оценки (О!) удовлетворяют предположениям (3.6.1). Положим и = О! — Оь Дальше, рассуждая так же, как в доказательстве теоремы 1 ($3.6), можно установить следующее утверждение: вероятность того, что одновременно все (О!) удовлетворяют неравенствам ()! — атлв! е «,(О! ~<0!+ алев: ь,,з, где птп;а,« — верхний сс-предел стьюдентизированного максимума модулей, равна 1 — сс. Использование опясанного здесь метода для этих специальных целей дает более узкие интервалы для параметров (О!), чем интервалы, полученные обобщением Т-метода или 8-методом с д = Й.
Если эксперимент был специально предназначен для исследования некоторых допускающих оценку функций (ф!,зрз, " ...,ф!), то принцип задачи 2.5 может быть применен к получению совместных утверждений относительно (ф!) следующим образом в): прежде чем обрабатывать данные, нужно кроме «) Чем больше зависимость оценок (ф!, ..., ф,), тем меньший эффект дает этот метод.
Принципиально существует эффектнвный метод, как, например, обсуждаемый в связи с (3.7.2), но необходнмые постоянные, определяющне длины ннтервалов, обычно очень трудно вычисляются. Точно так же прннцнпнальяо существует более эффективный метод, чем составленный нз ь н о-методов (см, следующий абзац). з з,г. з.
и г.методов. дрггня мятоды функций (гр;) рассмотреть множество соответствующих (аг), сумма которых имеет порядок величины се, принимаемой за допустимую вероятность ошибки; для каждой ерг строится доверительный интервал при помощи 1-распределения с вероятностью попадания вне интервала, равной сеп таким образом будет получен симметричный доверительный интервал вида (2.3.7) с заменой ф, ер, а на фь фь сеь Тогда вероятность того, что все интервалы одновременно накроют истинные значения, ! не меньше, чем ! — ~ а,, г ! 5-метод хорошо приспособлен к обработке данных, которые протнворечат ожидавшемуся результату эксперимента.