Шеффе Г. - Дисперсионный анализ (1185347), страница 18
Текст из файла (страница 18)
3-метод множественного сравнения. Общий случай Вернемся теперь к общим понятиям $ ).4. О п р е д е л е н и е. Множество 1'. допускающих оценку функций (ф) называется д-мерным пространством функции, допускаюи4их оценку, если существует д линейно независимых допускающих оценку функций (фг, ..., зрч) таких, что каждая ф из Е имеет вид ф= ~ Й!ф1, где Ьь ..., й — известные постоянные 1-! коэффициенты; иными словами, Е является множеством всех линейных комбинаций фь фч.
пример. Обозначим 1 средних (как н в 5 3.1) через ()1, ..., р. Рассматривается классификация по одному признаку. Тогда множество всех сравнений (Р!) пвляется (1 — 1)-мерным пространством функций. допускающих оценку; базис можно выбрать разними способамн, например (Р— Р!), где ч 2, 3, ..., 1, нлн (Рт — Р,), или (Р— Р !). )(окажем, например, что (О„- Р!1 является базисом. Отметим, во-первых, что в атом случае все па. раметрические функции (р!) допускают оценку (для ~ с!р! оценка равна ! ~ с!у„), во-вторых, что 1 — 1 функций (Рч — Рд линейно независимы. Дей- 1 ствнтельно, если ~ пч (Рч — Р!) 0 тождественно по (Р!), то, подставляя ч-х в зто тождество Рг=в,! (1=1,..., 1), получим, что пи 0 (р 2, ..., 1). 1 Предположим далее, что ф = ~ с!р является сравненнеи, так что ~ с, О.
1 1 ! 1 1 Отсюда ф ~ с (р — р) ~ с!(р — р!), а ато значит, что ф прннадле! ! ! х Э ад л метод множественного снлвннния зт жвт пространству ь, порожденному базисом. Обратно, если !р ~ Е, то ! ! ! Е= х". й,(р,— В,)-7,с,ас с,— — Хй., с,-й, ч и ч 3 ! при ! > 1. Отсюда ~ с, =О и, следовательно, зр является сравнением. ! ! 5-метод (общий случай)*) ьг: у имеет распределение М(Х'(), оЧ), г(Х') = г, принятых в $2.1. Рассмотрим !)-мерное пространство Е функций, допускающих оценку, порожденное д линейно независнмымн допускающими оценку функциями (зр!,...,чре). Пусть для л всякой !рыб функция зр= Ха!у! является ее мнк-оценкой, г-! так что В(зр) равна л з зхл 3 о- =и г. ан ! ! Дисперсия ф имеет несмещенную оценку бес = з ~! а„ с-! тде зх — средний квадрат ошибок 55, с и — г ст. св. Следующая теорема является основой 5-метода.
Т е о р е м а. Вероятность того, что одновременно для всех зреЕ зр — 5о- (зр(ар+ 5оЕ, еде постоянная 5 определяется по формуле (3.5.1) 5 = И" о!а,л-с) гб равна 1 — а. «) Простейшим нетривиальным (с > 1) примером специального случая в-метода является доверительное множество для линии регрессии, построен. Вое Уоркннгом и Хотеллингом (ууогЫпи д Но1е)11пщ 1929), Результаты этого раздела 9 3.3 получены в общих предпо- ложениях ЗВ ГЛ. А ОД!зОФАКТОРНЫИ АНАЛИЗ. МНОжЕСТВГННОЕ СРАВНЕНИЕ Доказательство" ). В й 23 для точки (фь ..., фч) был получен доверительный эллипсоид (ф Ч) В ! (зть ф) ( Чззра ю где ф (ф!..., ф ), зр является вектором жнк-оценок (зр1, ...
..., ф,), а В = о-'Г„. Удобно теперь сохранить символы (ф„...,ф ) для обозначения истинной точки параметров, а через (х!,...,ха) обозначить произвольную точку зу-мерного про. странства значений (фь...,ф,). Тогда указанный выше доне. рительный эллипсоид означает, что вероятность того, что (фь.... фч) находится внутри эллипсоида (л — зр)'В-'(л — тр)( цз'Ео, „„(3,5.2) равна 1 — а. Но (фз,...,фе) лежит внутри (3.5.2) тогда и только тогда, когда она лежит между любой парой параллельных плоскостей, касавшихся эллипсоида. Если Ь = (Ьь..., Л,)' — произвольный ненулевой вектор, то, как было показано в (1П.
11) приложения П1, точка (фз,...,фч) находится между двумя опорнымн плоскостями эллипсоида (3.5,2), ортогональными Л, тогда и только тогда, когда !Л'(ф — ф)( ~ (ЛВ 'Л) ' (3.5.3) где В=(д.зР.,, „,)- В- =(юзз )- В-. Следовательно, вероятность того, что прн всех Ь (Л'тр — Л'тр! < Бл(Л'ВЬ)'1, (3.5.4) равна 1 — а. Отметим, далее, что фен х, тогда н только тогда, когда ф имеет вид ~. Ьззр! = Л'ф. Тогда по следствию 1 й 1.4 мнк-оценка ! ! ф вычисляется по формуле ф ~ Лзф! = Л'ф, дисперсия ф в силу ! ! (1.2.10) равна ааЛ'ВЛ, а й'- = з'Ь'ВЬ.
Таким образом, приведенные э) Простое доказательство, использующее проектирование сферы нз различные прямые линии, вместо использования опорных плоскостей эллипсоида, приводится в работе Шеффе (Бсьене, 1953). Это доказательство, от. личающееся от приведенного здесь, может быть распространено на метод множественного сравнения, который мы введем в гл. 8. Этот метод находится в такой же связи с Тз-критерием Хотеллннга, как л-метод с Р-критерием. Важно отметить, что доверительный эллипсоид, построенный по Р, имеет определенное положение и форму, тзк что определенным преобразовайием ои может быть переведен в сферу, тогда как эллипсоид, востроеиный по Тв, нвзеет случайную форму н расположение, и следовательно, соответствующее преобразование булет случайным.
е зл. Л.мгтод множественного селпмеыня 89 утверждения, включая (3.5А), показывают, что вероятность неравенства ( $ — Ф (я-=504 для всех ф~5 равна 1 — сс. Последнее равносильно (3.5,1). П р н м е р. В начале этого параграфа мы показалн, что в случае класснфнкацня по одному признаку множество всех сравнений ! средннх (р~( яэ. ляется (! — !).мерным пространством функций, допускающих оценку. Теорема в $ ЗА о 5-методе оценкн всех сравненнй немедленно следует нз только что доказанной теоремы. Теперь предположнм, что мы хотнм прнменнть б-метод к более широкому классу ь влек линейных функций от (Щ, уже не обязательно являюшнхся сравненяямн. Очевидно, этот класс (. является (-мерным пространством функцнй, допускающих оценку.
Тогда доказанная теорема г т применима се=(4 =~~ с!Рг ф=~ с.уы, ае — — з л! ( — (без какнх-либо ограничений на (о!. Связь 5-метода с Р-критерием Рассмотрим в обшей формулировке $ 2.4 Р-критерий для проверки гипотезы Н в предположениях (1 с уровнем значимости а. Гипотеза Н утверждает, что ф1 = фз = ... = фр, где (фь...,фч) являются заданным множеством линейно независимых функций, допускающих оценку. Это множество порождает о-мерное пространство 5 функций, допускающих оценку; гипотеза Н эквивалентна следующей; Н: ф = 0 для всех чр ~ !..
Из доказанного выше следует, что по Р-критерию гипотеза Н отвергается тогда и только тогда, когда по крайней мере для одной ф ~ ь ее мнк-оценка ф значимо отличается от нуля в смысле следующего определения. О п р е д е л е н и е. Для данного пространства 5 функций, допускающих оценку, и доверительного коэффициента 1 — се ммк-оцеика ф допускающей оценку функции ф еи !. значимо отличаегся от нуля ао Б.критерию, если интервал (3,5.1) ие на.
крывает ф = О, т. е. если ! ф ( > 5ае. Любой паре параллельных опорных плоскостей соответствует ортогональный вектор Ь (не единственный). Применяя к паре плоскостей рассуждения, приведшие к (3.5.3), и заменяя (фь...,фе) на (0,...,0), мы получим, что начало координат находится между плоскостями тогда и только тогда, когда ~й (О ф) ~ «= (й Е-!й) гч нли ! й'ф ~ ( (Ь'Е-'й) '(ч (3.5.5) ВО гл. з. одпоелкторнып лнллпз мпожсствготпон сравнение Мы видим, что начало координат лежит внутри доверительного эллипсоида и, следовательно, по Р-критерню Н будет приниматься тогда н только тогда, когда (3.5.5) выполняется для всех й, так как тогда начало координат должно находиться между всеми парами опорных параллельных плоскостей.
Но тогда (3.5.3) накрывает значение Ь'ф = 0 для всех Ь, а это эквивалентно тому, что (3.5.1) накрывает значение зр = 0 для всех тр ец Ь. Из этой связи 5-метода с Р-критерием вытекает, по-видимому, его главное применение. "всякий раз, когда гипотеза Н отвергается по Р-критерию, мы можем исследовать различные допускающие оценку функции в т'., чтобы выяснить, какие из них ответственны за отбрасывание Н. Конечно, 5-метод дает много больше, чем то, что говорилось; часто его можно рассматривать как главный статистический аппарат, а Р-критерий — как предварительный прием, с помощью которого решается, стоит лн продолжать исследования другими методами. Эта связь, показывающая, что 5-метод имеет в некотором смысле такую же чувствительность, как Р-критерий, может помочь победить недоверие к 5-методу тем, кто привык приме.
нять Р-критерий и придерживается в случае отбрасывания гипотезы сомнительной практики*) вычисления многих доверительных интервалов по одним и тем же данным, используя всюду верхний а/2-предел (-распределения. Они не доверяют длине 5-интервалов, хотя не выражают недовольства по поводу нечувствительности Р-критерия. Автор предлагает применять 5-метод с сс = !Оп4 вместо построения индивидуальных интервальных оценок по данным с использованием верхнего 2,59п (двусторонний 5% ) предела т-распределения. Гарантированный 90м доверительный коэффициент предпочтительнее номинального 95о , если, как обычно, неизвестно, насколько далеко истинное значение от 957з.
Связь 5-метода с Р.критерием может быть выражена другим путем, который, кроме того, дает возможность понять природу Р-критерия, Обозначим через (.' множество, полученное из Е вычеркиванием тр, тождественно равных нулю для всех (()т). Теперь ф значимо отличается от нуля тогда и только тогда, когда (3.5.6) ~ ф ~ > 5йф. Отсюда следует, что для любой ф ~ Г и любой тр = йзр (по.
стоянная й ~ 0) оценка зр значимо отличается от нуля в том и только в том случае, когда значимо отличается тр, так как ') Некоторые численные результаты о выводах таков практики сц, Шеффе (Бспецб, !953, таблицы З н 6). Э з к з-метод множественного сгхвнвння 91 ф=лч б"- =йбЕ и следовательно, (3.5.6) выполняется для ф тогда и только тогда, когда оно выполняется для ф Чтобы установить, для каких функций феи Е оценки ф значимо отличаются от нуля, мы можем ограничиться подмножеством 1." множества А, определяемым следующим способом: Е" состоит из всех ф ен (., для которых дисперсия их мнк-оценки равна Саз, где С вЂ” положительная постоянная, которую мы можем произвольно выбрать, а затем фиксировать. Мы можем ограничиться Е", так как каждой ~р е=- Г соответствует функция ф = йф ев Е"; 1 если 0(ф)=Ао', то мы выберем й=(С/А)'.