Шеффе Г. - Дисперсионный анализ (1185347), страница 17
Текст из файла (страница 17)
Тогда 'В,— В 1= — Ь 2 для двух экстремальных (1, и =0 для других; таким образом, об' з, б (7) ( /' ! По определению Оз в $ 2.8 с д= / — 1, находим Ф=/ Тб, нли вз гл. з. одноехктогнып лнхлиз. множгствгнног. сравнении Полагая У = 8, Л = 10000 фунтов/ кв. дюйм, и= 3000 фунтов/кв. дюйм, получим 6 (3.3.2) Теперь мы можем обратиться к диаграммам Пирсона — Хартли с ч = 7 и а —.- 0,05. Для первого приближения У на кривой чз — — со мы находим при р = 0,9 значение Ф вЂ” — 1,50. Подставляя это в (3.3.2) и разрешая относительно У, находим У = 3,24.
Первое приближение У, полученное по кривой тз.= оо, будет всегда слишком плохим, так как для ась кого конечного У мы должны будем выбирать кривую правее, чем ч; =. оо, а на этой более правой кривой при () =- 0,9 значение Ф больше найденного и, следовательно, по формуле (3.3.2) должно быть больше и У. Если мы положим У = 4, то число ст. св. ошибки будет чз — — У(У вЂ” 1)= 24; тогда согласно (3.3.2) Ф= з, Интерполив руя на глаз между кривыми тз = 20 и чз = 30, мы найдем, что з прн тз = 24 и Ф= — мощность () = 0,87, Аналогично прн 3 У = 5 мы найдем, что чз = 32, Ф = 1,86, откуда (! =- 0,95. Наименьшим У, при котором р ) 0,9, является У =- 5; однако мы можем вновь рассмотреть () = 0,87, чтобы уже окончательно решить, не достаточно ли оно близко к 0,90, и тогда использовать в этом случае У = 4.
Всякий раз, когда приходится подгонять 8 к номинальному значению, лучше, если соседние значения 8 не сильно отличаются (0,87 и 0,95 в разобранном выше примере). Предположим теперь, что значение о=3000 фунтов/кв. дюйм было ошибочно, а действительное на 50ав больше, т. е. а= = 4500 фунтов/кв. дюйм, Если мы подставим Л/о = 1О/4,5, У = 8 и У = 4 в (3.3.!), то найдем, что Ф = 1,1!.
Интерполируя между кривыми для этого Ф и те = 24, получим 8 = 0,47. Таким образом, если нулевая гипотеза неверна, мы будем ее принимать чаще, чем отбрасывать! Этот пример показывает, что нежелательна такая чувствительность мощности к значению и, которое по й-предположениям неизвестно. Чтобы обойти эту трудность в некоторых случаях, подобных рассматриваемому примеру, может быть лучше задавать Л или другую меру разброса (р;) (например, (,)' (8; — р,)'~п ) в виде кратностей и.
Если мы решим, что важно обнаружить разности порядка 2о, то можно потребовать большую мощность для Л/и = 2. В дру! гих задачах важно обнаружить разности порядка и или — а. 2 Используя изложенный выше метод, читатель может проверить, 4 з.з. пРимеР Вычисления мощнОсти 88 что при мощности 0,9 и б > 2О первое приближение 1= 9,0 и что для 1 = 10 мощность ~ = 0,90. При конкурирующих гипотезах, использованных в предшествующих вычислениях мощности, возможен другой критерий, который по интуитивным соображениям конца $3.7 является более мощным. Гипотеза Н по этому критерию отвергается, если минимум и максимум выборочных средних (уы) отли- чаютсЯ больше, чем на 1 ьтд„т тз, где д„, л, ЯвлЯетсЯ веРхним сз-пределом стьюдентизированного размаха, определенного в $2.2, зз равен 55„а т — его число ст, св. Таблиц и диаграмм мощности этого критерия не существует.
Однако если мы используем 1, вычисленное по г-критерию, для получения заданной мощности, то мы превысим эту мощность, пользуясь критерием стьюдентизированного размаха при рассматриваемых конкурирующих гипотезах. В планировании эксперимента иногда целесообразно иметь небольшую таблицу мощности с двумя входами для мало отличающихся объемов выборок и конкурирующих гипотез (в рассмотренном случае конкурирующая гипотеза определяется Ь/и). Может оказаться необходимым снизить значение мощности или увеличить отличие конкурирующей гипотезы от основной, если заданная мощность не получается, для того чтобы определить осуществимый объем выборки. Желательно провести вычисление мощности планируемого эксперимента перед экспериментом, так как может оказаться, что число наблюдений будет слишком мало, чтобы дать даже 50% шансов (р ( 0,5) определения практически важных различий, или, как другая крайность — окажется слишком много наблюдений.
Другим — или лучше дополнительным путем Вычисления объемов выборок является во многих случаях определение такого объема, который обеспечивает достаточную узость доверительных интервалов для интересующих нас величин, вычисленных в предположении, что неизвестное значение а' равно 55,. Этими интервалами являются обычно интервалы 5- или Т-методов (Я 3.5 — 3.7), Сначала, может быть, нужно провести предварительные наблюдения*) для получения соответствую- «) Точная теории двухступенчатых критериев, мощность которых не зависит от и, построена Стейном ($(е(п, 1848).
Эта теориа была распространена Хили (Неа1у, 1986) на методы множественного сравнении. Некоторые практвкн не решались применить теорию Стейна, поскольку а ией длн оценки а используетси только информация первой ступени (втораи ступень может «указывать» сильна отлнчающиесн значения). Вычисленные вероатностн ошибок налились, конечно, правильными, ио безусловные вероитностн ошибок по грактическому опыту статистика и всех его заказчиков могли менее удовлетворить заказчиков, чем некоторые условные вероятности (полученные нз частного опыта заказчика). Эта задача, нуждающанси в уточнении формулн.
рокки, была поставлена пеоедо мной профессором Ходжесон. 34 Гл 3 Олз!ОьлктОРзц!и лз!лл!зз м!зохгГстпГззз!Он сглвивг!ия щей оценки О, если только мы не будем точно определять неко. торые величины, а именно средние длины доверительных интервалов, через кратности О. Эти величины аналогичны рассмотренному выше сз. $3.4.
Сравнения. 3-метод оценки всех сравнений Если в однофакторном анализе по г"-критерию гипотеза равенства средних отвергается, то результирующее заключение, что средние рз, рз, ..., р! не все равны между собой, обычно не удовлетворяет экспериментатора, Тогда рассматриваются методы получения дополнительных выводов о средних. В общем случае, описанном в 3 2.4, для произвольных ьз и О может возникнуть в результате применения гцкритерия аналогичная задача.
Дальнейшие выводы относительно средних можно просто получить при помощи методов множественного сравнения, рассмотренных в Я 3.5 — 3.7. Эти методы мы будем называть 5-методом и Т-методом. В однофакторном анализе методы множественного сравнения позволяют нам делать заключения, аналогичные следующему. Предположим, что! = 7, и мы перенумеровываем истинные средние в соответствии с выборочными так, что рз(~ ~())з» ... =бт. Мы можем делать, например, такие утверж.
дения: йт большем, чем ()з (а, следовательно, больше, чем ))з. йз, ()з, если объемы выборок (Уб равны). Недостаточно ясно, что 3! больше, чем ()з нлн рз', если зто так, то развоств не превосходят р! — 3з < 2,1, ))з — рз < 3,2. Среднне рз н йз меньше, чем ()з (н, следовательно, меньше, чем рз, ))„рз, если (Ц равны).
После анализа зтнх данных отмечается, что образцы 1, 2, 3, 4 содержат алюмнннй, а образцы б, 6, 7 содержат медь. Для дополнительной проверки сделанного утверждения естественно рассмотреть разность средних 1 1 ф — (рз+ Рз+ Вз) — — (рз+ рз+ йз+()з). 3 4 Эта разность удовлетворяет неравенству 3,4 ( ф ( 9,5. Неравенства полезны для любых других сравненнй (см ннже), так как указывают путь обработнн данных. Общий довернтельный каэффнцнент равен 90з)з для множества всех утверждений о сравнениях (для всех утверждений, которые мы сделалн, в для всех возможных утвержденна, которые мы еще не сделали). Сравнения Определение.
Сравнением параметров рз, ..., ))! является линейная функция ~, с!))! с известными постоянными ! ! ! козффициентами, удовлетворяющими условию ~ с, = О. з-! 4 ае сила!!ения. з метод оценки всех сравнннни 85 Например, является сравнением разность любых двух средних )); — р,', илн среднее некоторого подмножества (р,) минус среднее другого подмножества. (Другими полезными примерами сравнений являются линейные функции, называемые взаимодействиями, см.
гл. 4.) Гипотеза Н из $ 3.1 эквивалентна утверждению, что любые сравнения Щ равны нулю. В случае классификации по одному признаку сравнение имеет несмещенную оценку $ = 1 сгнг = Х сгуы. Дисперсия ф равна а. = ~ с~)У(уы) =а~~ ( — '), а ее оценка задается формулой г г) 2 ай — — з лт ! — ~, где и =55,. В следующем параграфе мы докажем, что для сравнений справедливо следующее вероятностное утверждение'). Теорема. Вероятность того, что величинызз) всех сравнений одновременно удовлетворяют неравенствам Ф вЂ” Зо,<ф<Ф+За,, (3.4.1) где постоянная 5 определяется формулой = (1 1) Ра: г-г, з-г~ *) Тьюки первый ввел метод совместной оценки сразу всех сравнений; ссылки на Тычки, Л.
Б. Ланкане и Шеффе см. в работе Шеффе (8сйеие, !953, стр. 88, сноска). Методы, называемые здесь Т- н 5.методамн, были вве. деиы соответственно Тычки н мной. *') Мы используем один и тот же символ ф для сравнении, нвляюнгегося линейной фуккцнеа от (рг), и для его истинного значения, которое является значением функции от неизвестных истинных (йД. равна 1 — а. При классификации по одному признаку в 5-методе для сравнений используются интервалы (3.4,!). Существует связь этих интервалов с Р-критерием ($ 3.1) для проверки гипотезы Н о равенстве всех (йг). Мы говорим, что оценка сравнения ф значимо отличается от нуля, если интервал (3.4.1) не содержит значения ф = О, и незначимо, если содержит.
В $3.5 мы дока- ай гл. 3. ОдноолктоРнын АИАлиз множестве!!Иое сРлвнение жем, что по р-критери!о гипотеза Н отвергается в том и только в том случае, когда существует некоторая ф значимо отличающаяся от нуля. Иными словами, тогда и только тогда по р-критерию с заданным уровнем значимости а определяют, что истинные сравнения не все равны пулю, когда при помощи упомянутых выше методов найдутся оценки сравнений, значимо отличающиеся от нуля. Однако может случиться, что ни одно из соответствующих этим оценкам сравнений не представляет практического интереса. (Примером сравнения, которое обычно не представляет практического интереса, является сравнение, соответствующее максимальному оцениваемому нормированному сравнению, описанному в конце $ 3.5.) Отметим здесь, что если все (1 одинаковы и если рассматриваются только сравнения вида Р1 — ()с, то Т-метод (5 3.6) предпочтительнее, так как он дает для этих сравнений более узкие интервалы, чем (3.4.1), $3.5.