Учебник_Бочаров_Печинкин (846435), страница 60
Текст из файла (страница 60)
Значение статистики н = 8,54/1,50 = 5,69. Параметры Тшраспределения, используемого для нахождения критического значения С, равны 3 — ! = 2 и (3 — 1) + (2 — !) + (4 — !) = 6. В (1, с. 208) отыскиваем 0,95-квантиль рдде = 5,1433 Тшраспределения с параметрами 2 и 6, совпадаюгцую с критическим значением С критерия Фишера Поскольку н > рддд, есть серьезные основания отвергнуть гипотезу Нд о равенстве среднего содержания примесей в минералах всех трех месторождений П Прежде чем переходить к дальнейшему изложению, придадим рассмотренной задаче несколько иную формулировку.
Будем считать, что имеется некоторый фактор, который может действовать на 1 уровнях. При этом действие на анализируемое явление фактора на 1-м уровне определяется математическим ожиданием т, Такая модель в дисперсионном анализе называется однофакторной 1-уровневой (предостережение: не надо путать с факторной моделью, расмотренной в параграфе 4 гл. 3, где сам фактор являлся случайным и мог появляться с определенной вероятностью в каждом наблюдении на каком-то одном из уровней). Задача заключалась в том, чтобы проверить гипотезу Ыо об одинаковом действии фактора на всех уровнях или, по-другому, об отсутствии влияния на результат эксперимента уровня действия фактора. Рассмотрим теперь случай действия двух факторов, причем первый фактор может действовать на 1! уровнях, а второй на (з уровнях (двухфакторная (1!,1з)-уровневая модель дисперсионного анализа).
282 Гл. 4. Некоторые задачи, связанные с нормальными выборками 1, ~(Х„ь — т„.) г=! ч=! (и„— 1) =! г=г Зч =1 во 1, 1г— 1=1з=-1 где — среднее по наблюдениям, в которых первый и второй факторы подействовали на уровнях г и 1, г=г г=! Ч=! т !г и, *=1 г=! общее среднее всех наблюдений. Теперь, если м = в! "/во* ( р! 1 где р — гя-квантиль с -распределения с параметрами ~ ~ (н,.
— !) г=1з=! и 1!1з — 1, то мы должны с уровнем значимости о принять гипотезу Но о полном отсутствии влияния уровней действия обоих факторов. Однако можно произвести более детальный анализ модели. Будем предполагать, что выполнено условие а, = п (общий случай различных и, исследуется несколько более сложным образом). Введем Предположим, что произведено нз: наблюдений, в которых первый фактор подействовал на 1-м уровне, а второй на 1-м. Результаты наблюдений Х,.ь представляют собой независимые нормально распределенные случайные величины с одинаковой (неизвестной) дисперсией аз и, вообще говоря, с различными (также неизвестными) средними т, .
Будем опять-таки проверя~в еипотезу Но об отсутствии влияния (уровней действия) первого и второго факторов на результаты наблюдений, т. е. о равенстве всех щ, Поскольку действие двух факторов на уровнях 1! и 1з соответственно можно отождествить с действием одного фактора на 1!12 уровнях, то для проверки гипотезы Но воспользуемся однофакторной 1!12-уров- невой моделью и в соответствии с построенным для нее критерием вычислим значения статистик в~о" и в1*! 2ВЗ 7. Диапераионньсй анализ статистики и т (ц = 2,,'т„Лмь . т=! ь=! п гп ссс = 2 2 Х ю "",=! с-! сг в~(зС = — ' — ~ (пс*(зС вЂ” тп*)з, у=! пс! з(с*! .— — — ~ (пс,*(сС вЂ” т'), 1! — 1 ~=! с, 2 п 2 (тпм — тсСсС вЂ” т !21 + та ) . т=ст=! Эти статистики имеют весьма простой смысл: т,*,, (тт, ) — выборочное среднее при условии, что первый (второй) фактор подействовал на УРовне т', (~); з(*сС (зс~'>) — выбоРочнаЯ диспеРсиЯ, свЯзаннаЯ с действием первого (второго) фактора; зз(*„С вЂ” выборочная дисперсия взаимодействиЯ фактоРов.
Статистики в(,*р зс* и зс,*, ЯвлЯютсЯ независимыми. Следующая гипотеза, которую мы рассмотрим, — гипотеза Н' о линейности действия факторов, т. е. о возможности представления с!с сзс Рс теоретического среднего в виде псм — — пс„, + и, где т, (т,,; )— неизвестное среднее значение, вносимое первым (вторым) фактором при действии на уровне т (~). Естественно, гипотеза Но верна далеко не всегда, поскольку довольно часто существенное влияние на результат эксперимента факторы оказывают только при совместном их действии на определенных уровнях (например, урожайность сельскохозяйственной культуры высока только при внесении необходимых удобрений в предписанных количествах; при любых отклонениях от агротехнических норм эффект от внесения удобрений существенно уменьшается). Оказывается, при условии справедливости линейной гипотезы Н' дисперсия взаимодействия з,.
также является несмещенной оценкой ст, 2* а с точностью до множителя (1! — 1)(!з — 1)с!аз распределенной по закону ~з с (1! — 1)(12 — 1) степенями свободы; в противном случае эта оценка имеет положительное смещение. Поэтому критерий принятия линейной гипотезы Но тпри заданном уровне значимости гт заключается в выполнении неравенства тт = в,', ссзо* ( ср! и, где р о-квантиль Г-распределения с параметрами ~1! — 1)(12 — 1) и 1с(з(тс, — 1). Если линейная гипотеза считается выполненной (по результатам проверки или в силу априорных предположений), то можно прове(з! рать гипотезьс Н( и Н( об отсутствии действия первого или второго факторов. В частности, если справедлива гипотеза НС С! тп = ... = т , то статистика зс опять-таки будет являться несмещенной оценкой а~, с точностью до множителя (1! — 1)Саа имеющей т -распределение с 1! — 1 степенями свободы.
Значит, мы можем срав- 2 284 Гл. 4. Некоторые задачи, связанные с нормальными выборками нить ее или с остаточной дисперсией вг*, или с дисперсией взаимодей- ствия вгцз), или, еще лучше, с объединенной дисперсией 1~1гчгп 1)вьв*+ гч11 — 1И1г — 1)вьйг 1112Л 11 ь + 1 ьь образованной остаточной дисперсией и дисперсией взаимодействия, и воспользоваться критерием Фишера. В частности, если мы пользуемся объединенной дисперсией в,*, то должны принять гипотезу Н при я* П1 выполнении неравенства м = в~,*)/в~ь' < р~, где, как обычно, р о-квантиль Г-распределения с параметрами 1~ — 1 и 111гп — 11 — 1г + 1. Аналогично проверяется гипотеза Н ): т~ ) = ...
= тг1 ). Отметим, что проверку гипотезы Но о 1полном) отсутствии действия обоих факторов можно производить только в том случае, когда хотя бы одно пку больше единицы; в противном случае мы не смогли бы определить остаточную дисперсию вг и не имели бы «эталонной» оценки дисперсии о~. Если же все ть, равны единице, то возможны два пути: либо потребовать, чтобы была известна теоретическая дисперсия ог наблюдений Х,гн либо априори считать справедливой линейную гипотезу, тогда лэталоннойь оценкой дисперсии аа будет дисперсия взаимодействия в1*, ).
2* Совершенно аналогично рассматривается случай действия трех и более факторов. Однако здесь появляется новое осложнение: если имеется к факторов, причем 1-й фактор действует на 1, уровнях, то для того, чтобы произвести хотя бы по одному наблюдению со всевозможными комбинациями уровней действия факторов, необходимо в общей сложности 11...1н наблюдений. В частности, при четырех факторах и пяти уровнях действия каждого из них необходимо б25 наблюдений. Ясно, что на практике такое количество наблюдений обычно нереально.
Поэтому следует так спланировать эксперимент, чтобы, с одной стороны, число наблюдений было разумным, а с другой стороны, мы бы получили достаточно аргументированные статистические выводы. Возможные методы решения этой задачи мы рассмотрим в следующем параграфе, сейчас же еще раз заметим, что в общей модели нельзя уменьшить число наблюдений с сохранением достаточной мощности критерия, поскольку влияние факторов может проявиться только при определенной комбинации уровней их действия, а так как эта комбинация нам заранее не известна, необходимо испробовать все возможные комбинации.
Значит, нужно отказаться от общей постановки задачи. В дальнейшем мы будем рассматривать только линейную модель, т.е. модель, в которой т,, „=- тч + ... + тн . М 8. Планирование эксперимента 285 8. Планирование эксперимента Прежде чем переходить к рассмотрению задач планирования эксперимента, сделаем замечание по поводу использования самого термина «планирование эксперимента». Дело в том, что разные специалисты под ним понимают различные проблемы вплоть до того, что некоторые авторы называют «планированием эксперимента» фактически всю прикладную математику, усердно сдобренную практическими рекомендапиями по применению того или иного математического метода.
Мы будем придерживаться традиционного определения «планирования эксперимента» как части дисперсионного анализа. Напомним общую постановку задачи. Пусть имеется 1 факторов, причем Рй фактор может действовать на любом из и, уровней, а выбор уровня действия фактора находится целиком в руках экспериментатора. Действие всех ) факторов на уровнях )н ..., и приводит к тому, что результат наблюдения является нормально распределенной случайной величиной с неизвестным средним т, , и неизвестной дисперсией о~, не зависящей от уровней действия факторов.
Всюду далее будем предполагать, что факторы действуют линейно (часто говорят независимо), т. е. т 5 т — — тэ, + ... + гп, . (о Требуется так спланировать эксперимент, т.е. указать все возможные комбинации Он ...,2~) уровней действия факторов, для которых нужно произвести наблюдения, чтобы, с одной стороны, количество наблюдений не было бы большим, а, с другой стороны, результаты эксперимента достаточно хорошо проверяли бы гипотезы об отсутствии действия каждого фактора, т.е. гипотезы Но ~: т~ — — ...
— — т~~,~. Естественно, планом эксперимента будем называть сам перечень всех наборов (ун ..., и) уровней действия факторов, для которых необходимо произвести наблюдения. При этом будем предполагать, что для каждого набора Он ...,2~), входящего в план эксперимента, производится только одно наблюдение Хл. Отметим, что план эксперимента, состоящий из всех возможных комбинаций Цп..., л) уровней действия факторов и рассмотренный в параграфе 7, называют (полным) факторным планом.
Однако, как уже говорилось, факторный план требует слишком большого количества наблюдений. Разумным представляется потребовать от плана эксперимента, чтобы результаты эксперимента можно было бы достаточно просто обработать. С этим мы уже столкнулись в параграфе 7, когда в двухфакторную модель пришлось ввести условие одинакового числа наблюдений при каждом наборе уровней действия обоих факторов. Ортогональность планов или сбалансированность блоков, которые будут использоваться далее, не только упрощают расчеты, но и приводят к независимости статистик, служащих для проверки отсутствия действия 286 Гл. 4.














