Шеффе Г. - Дисперсионный анализ (1185347), страница 42
Текст из файла (страница 42)
Итак, бв является параметром нецентральности статистики Р для проверки Па (все (); = О) в предположениях 0 и, следовательно, по сделанному в конце 9 2.7 замечанию о мощности этого критерия ба не может зависеть от (ь и от (аь). Но при 0' (5.2.47) является условным математическим ожиданием ЯЗв при условии (йг). Безусловное математическое ожидание можно вычислить как математическое ожидание правой части (5.247), учитывая, что (Ь,) независимы и имеют распределение ЛГ(О,О').
Так как (5.2.47) зависит только от о,' и от (51 = 5~ — Ь,), то полученное математическое ожидание может зависеть только то а', н а' Если мы теперь при вычислении допустим, что (т' = О и ал = О, то (11г), (У;) и (Агь) будут иметь нулевые средние, и тогда математические ожидания их квадратов будут равны их дисперсиям. Используя это в (5.2.19), получим М (ЗЯа) = й-'! 0(йг)+(гЖ)-'7 0(У~) — г-' 0(д~). (5 248) э ка иеполиыв БлОки сматриваемом случае, имеет вид Е ~ ~ К0КИ; (А+ Ьп) (уы — П' — а3 (угу — р' — аг), (5 2.49) 3 где а~в, гР(г — Х) 1в' 2 2 + ьав+ а~ Ю Для получения статистических выводов относительно (аД удобно определить величины (а)) формулами: при 2г~ У аа, + а'а," ь+ е' где а, задано формулой (5.2.18), а а," .формулой (5.2,35); при 2г) У ва,+я а, й+ й' где а задано формулой (5.2.26), а 6~ формулой (5.2.36).
В обоих случаях М ~ г — А й== й= — „ Ф *2 аае а1 где о~~ определяется (5.2.46), однако ЮЙ вычисляется по (5.2.19) прн 2г ( У н по (5.2.28) при 2г ) 7. Оценки (ф*) сравнений (ф), где ф = ~ с;а, и ~ с, = О, могут быть вычислены ! ! по формуле ф"= ~с,й). Эти оценки имеют одно и то же значение при обоих определениях (а~). Статистические выводы о (а~) можно получить приближенно, если предположить, что оценки й и й' весов в и ы' равны неизвестным истинным значениям„ определенным формулой (5.2.41), иными словами, если считать, что прн всех (с;) с Ес, =0 оценка ф' имеет распределение М(ф, ~'.,с(1'(в+ ю')) с гв и в', равными й и й'.
Это приводит к приближенному критерию для проверки НА (все ви = 0), по которому Нз отвергается, если (й+ й') х' (а) — а.') ) (1 — 1) Ра; г-ь м. (5.2.50) Правая часть (5.2.50) может быть заменена на х~.г, По этому критерию НА отвергается тогда н только тогда, когда существует некоторая оценка сравнения ф*, которая значимо 210 ГЛ. 5. НЕКОТОРЫЕ НЕПОЛНЫЕ КЛАССИФИКАШ5И отличается от нуля в соответствии с приближенным 5-методом множественного сравнения.
По этому методу вероятность того, что одновременно все сравнения (ф) удовлетворяют неравенствам где 85 равно правой части (5.2.50) и б'=~ ст/(в+в'), приближенно равна 1 — а. Приближенный Т-метод может быть основан на утверждении: вероятность того, что все !тр) одновременно удовлетворяют неравенству равна приближенно 1 — а. Так как эти приближенные методы не учитывают выборочную ошибку и и ы', то истинная вероятность всех этих утверждений может быть несколько меньше ! — а, а ошибка 1 рода будет несколько больше а.
Чтобы практически оценивать, стоит ли использовать информацию между блоками, мы можем определить долю дополнительной информации как некоторую величину, которая не превосходит отношение !А(тр) к дисперсии величины (5.2А2), или отношение Ф' г — в о, ) — « ое о, '+ «отв (« — 1)! о', + «ав и оценить последнее выражением — — — (5.2.51) («1) 1«(~ 1) ~~вал (1 «) ~~е Мы можем отказаться от вычислений, необходимых для получения информации между блоками*), если отношение (5.2.51) будет меньше некоторого уровня, например 1Оо)с (практически, если оно отрицательно). й 6.3.
Планы с группировкой Рассмотрим сначала возможную связь факторов в неполном анализе, называемом группировкой, которая заставляет нас пересмотреть свои представления о главных эффектах и взаимодействиях. Говорят, что уровни фактора С группируются по уровням фактора А, или С группируется по А, если каждый *) Оператнвнан характеристика этого интуитивного правила ненэвестна. » 53. ПЛАНЫ С ГРУППИРОВКОЙ уровень С в наблюдениях появляется только с одним уровнем А.
Если А имеет ! уровней, то это приводит к тому, что уровни С распадаются на ! множеств таких, что Ре множество появляется только с (-м уровнем А. Приведем пример. Рассмотрим эксперимент, в котором изучается влияние некоторых факторов на устойчивость против коррозии оловянных полосок, свернутых в рулон; термообработка этих полосок проводится различными способами. Весь рулон можно обработать только одним способом и нельзя выделить в нем части, чтобы обрабатывать их разными способами. Пусть имеется ! режимов термообработки, которые будем называть ! уровнями фактора А.
Предположим, что 7~ рулонов обрабатываются при первом режиме, 7» при втором, ..., 7~ обрабатываются при 1-м режиме. Мы будем называть ~ 7, рулонов ~~' У, уровнями фактора С. Здесь С Г группируется по А. Хотя в этом примере было бы более реалистично рассматривать эффекты С как случайные (и действительно, модели со случайными факторами или смешанные являются обычно более реалистическими), но мы отложим такое рассмотрение до гл. 7 и 8, а здесь будем рассматривать только модели с постоянными факторами. Мы введем новые индексные обозначения, которые обычно используются в планах с группировкой.
Эти обозначения будут полезны при вычислениях математического ожидания средних квадратов в других моделях ($ 8.2). ь!тобы дополнительно охарактеризовать связь между двумя факторами, встречающимися в каждом множестве наблюдений, удобно назвать факторы пересекаюи(имися, если ни один из них не группируется по другому; говорят, что они полностью пересекаются, если каждый уровень одного появляется с каждым уровнем другого, т. е. если они рассматриваются в плане полного двухфакторного анализа, когда другие факторы игнорируются; во всех других случаях говорят, что факторы частично пересекаются.
В новых обозначениях используется два индекса (илн больше, если больше факторов), указывающих номер уровня группирующегося фактора. Так, в приведенном выше примере 7Г рулонов с бм режимом термообработки нумеруются парами (81), (82)...,, (1,Х;). С этой нумерацией характер неполноты плана с группировкой показан в таблице 5.3.1, где крестами отмечены ячейки, в которых проводятся наблюдения. Истинное среднее ячейки с 1-м уровнем А н (й !)-уровнем С будет обозначаться просто Пп, а не г1ь О,п. Заметим, что замена в средних пп одного индекса ! приводит к смене уровней обоих факторов, так что т(п при различных ! и одинаковых ! «Не имеют ничего общего»; так, в рассматриваемом примере при ! = 1 Я/2 ГЛ.
Х НЕКОТОРЫЕ НЕПОЛНЫЕ КЛАССИФИКАЦИИ т а б л и к а 5.3.! Файла С /',/'= В этих равенствах веса (О/) н (и///) неотрнцательны, о/ не все равны нулю и при каждом / не все и/ц равны нулю; таким образом, не нарушая общности„мы можем предположить, что ~.и/=1, ~„ю,/=-1 при каждом /. / / Допустим, что (Чн) могут быть выражены указанным способом. Тогда, умножая (5.3.1) на ю// и суммируя по /, получим ~ и///Ч// — — Н+а/. Умножая полученное равенство на о/ и сум/ мируя по 1, находим ~ ~, О/и///ч// — — н. итак, и, (а,), (у//) одно/ / значио определяются формулами Н - Е Е о/ю//Чц> / / и/ Х и'цЧц — Н Уц = Чц — Н вЂ” и/ / (5.3.2) и / = 1, 2 мы имеем первый рулон, обработанный при первом режиме, и первый рулон, обработанный прн втором режиме.
Если, например, все первые рулоны получены с одного завода, все вторые с другого и т, д., то фактор С будет не группироваться по А, а пересекаться с А. Теперь мы рассмотрим возможность представления истинного среднего ячейки Чц в виде суммы генерального среднего Н, эффекта сс/ /'-го уровня А, эффекта уц (/,1)-го уровня С Ч// Н + а/+ У//. (5.3.1) Величины в правой части будут однозначно определяться по (Ч//), если мы введем дополнительные условия (по 1' суммируется от 1 до Х/) и/цу / = О, Е о и/ = О.
/ % з.з. плАны с ГРупшнвопкоп 213 С другой стороны, ясно что произвольное множество средних ячейки (з1ц) может быть выражено н виде (5.3.1) через р, (сс~), уц), определенные (5.3.2). Таким образом, если рассматривать а,) как «главные эффекты» А, а (уц) как «главные эффекты» С, то нет нужды вводить взаимодействия для выражения среднего ячейки в общем случае, как это было, когда фактор С пересекался с А. Конечно, определенные таким способом «главные эффекты» обычно не совпадают с главными эффектами, определенными в обычной схеме полного анализа с ! ~.' У, ячейками таблицы 5.3.1 по средним ячейки (ч1 В трехфакторном эксперименте возможны различные комбинации группировки н пересечения.
Примером эксперимента с тремя факторами С, В и Т, в котором Т группируется по В, а В по С, является эксперимент, поставленный для изучения изменений некоторого свойства ткани. Ящики с кусками ткани были куплены в з' городах (фактор С), причем в зьм городе У~ ящиков (фактор В). Затем из (1,/)-го ящика было взято Кц кусков ткани (фактор Т), т. е. из 1-го ящика бго города. Для проверки некоторой качественной характеристики было проведено Мця-измерений с (51, й)-м куском ткани, т.
е. с и-м куском из (51)-го ящика. Вводя подходящие обозначения, мы можем в этом примере наблюдения (уц» ) записать в виде уца = и+ у + рц+ тца+ еца . (5.3.3) Дополнительные условия для этой (нереалистической) модели с постоянными факторами будут рассмотрены ниже (см, равенства (5.3.13)); анализ тоже будет проведен ниже. Пример с тремя факторами А, С н Е, в котором С группируется по А, а Е пересекается с А и С, можно получить из рассмотренного ранее примера, в котором А соответствует режимам термообработки, а С рулонам.