Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 16
Текст из файла (страница 16)
Она используется для того, чтобы оп953. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХределить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же математическое ожидание:ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,11;2,12;1,97;2,10;2,17;2,12;1,93;2,28};1;3)=0,006459.В качестве аргументов функции ТТЕСТ, кроме самих выборочных значений (которые стоят в фигурных скобках), используется еще такие два параметра, как "Хвосты" = 1 (для односторонней альтернативной гипотезы) и "Тип" это вид исполняемого t-теста. В данном случае "Тип" = 3, поскольку необходимопровести двухвыборочный t-тест с неравными дисперсиями.
Полученное в данном случае значение t-теста говорит о том, что вероятность равенства математического ожидания прочности окатышей по новой (вариант 1) и старой технологии их обжига очень мала (составляет только 0,6%), следовательно, новаятехнология по варианту 1 действительно является более предпочтительной,чем старая.В продолжение примера 3.7 ответим на вопрос: есть или нет какое-либозначимое различие между двумя новыми технологиями обжига (по варианту 1 и2) с точки зрения повышения механической прочности окатышей?1.
В соответствии с общим алгоритмом проверки статистических гипотезсформулируем Н0: M1 = M2.2. Поскольку предполагается, что обе новые технологии равнозначнымежду собой, то альтернативная гипотеза выбирается в виде Н1: M1 ≠ M2.3. Для того чтобы определить тип t – теста, сравним между собой дисперсии Н0: σ12 = σ22 = σ2 в предположении, что обе новые технологии дают одинаковый разброс в значениях прочности, альтернативная гипотеза выбираетсяв виде Н1: σ12 ≠σ22.Статистика критерия Фишера при этом равна F = 0,0068/0,003029 = 2,25(в числителе критерия Фишера всегда должна стоять большая дисперсия), апоскольку при α = 0,05 F(0,05/2);8-1;8-1 = 4,99 (см.
табл. П.5) и F < F(0,05/2);8-1;8-1 (2,25 <4,99), то действительно можно считать, что σ12 = σ22 = σ2.S – обобщенное среднее квадратичное отклонение тогда будет равно(см.(3.46))963. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ(8 − 1)0,003029 + (8 − 1)0,0068= 0,07 .8+8−2S=4. Поскольку дисперсии не имеют значимого отличия, статистика t – критерия принимает вид (см. (3.50))t=2,23 − 2,19= 1,14 .1 10,07 +8 85. Выбираем уровень значимости α = 0,05 и определяем число степенейсвободы m = 8 + 8 – 2 = 14.6. Для построения критической области находим табличное значениеt0,05;14=2,15 (СТЬЮДРАСПОБР(0,05;14) = 2,144789).7. Поскольку рассчитанное ранее значение статистики не попадает в критическую область 1,14 < 2,15, то нулевая гипотеза Н0: M1 = M2 принимается вкачестве рабочей, т.е.
новые технологии как по варианту 1, так и по варианту 2равнозначны между собой с точки зрения повышения механической прочностиокатышей.Вероятность ошибки (первого рода) при этом можно оценить величинойСТЬЮДРАСП(1,14;14;2) = 0,272934, т.е. если бы мы в подобных ситуациях отвергали нулевую гипотезу, то примерно в 27 случаях из 100 мы поступали неверно. В данном случае "Хвосты" = 2, и функция СТЬЮДРАСП возвращаетдвустороннее распределение, поскольку альтернативная гипотеза была принята в виде Н1: M1 ≠ M2, а не в виде Н1: M1 > M2.Для определения найденного нами значения уровня значимости α = 0,27в электронных таблицах Microsoft Excel также могла быть использована функцияТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2,21;2,06;2,31};2;2)= 0,272934.В данном случае "Хвосты" = 2 (для двусторонней альтернативной гипотезы) и "Тип" = 2, поскольку используется двухвыборочный t-тест с равными дисперсиями.973.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХИ наконец, в задаче сравнения двух неизвестных математических ожиданий M1 и M2 рассмотрим ситуацию, когда исследуемые выборки зависимы между собой.t-критерий для зависимых выборок очень полезен в тех довольно частовозникающих на практике ситуациях, когда важный источник внутригрупповойвариации (разброса или ошибки) может быть легко определен и исключен изанализа. Это относится к экспериментам, в которых две сравниваемые группыполучены на одной и той же совокупности наблюдений (субъектов), которыетестировались дважды (например, до и после термообработки проката, до ипосле вакуумирования стали, измерения, производимые на одних и тех же партиях продукции различными методами или различными приборами и т.д.).
Вподобных экспериментах значительная часть внутригрупповой изменчивости(вариации) в обеих группах может быть объяснена индивидуальными различиями субъектов (различиями в свойствах отдельных прокатанных полос, каждой конкретной плавки или партии продукции). Если та же самая выборка тестируется дважды, то можно легко исключить эту часть вариации. Вместо исследования каждой группы отдельно можно рассматривать просто разности междудвумя измерениями для каждого субъекта (например, анализировать одни и теже плавки "до вакуумирования " и "после вакуумирования "). Вычитая первыезначения из вторых (для каждого субъекта: прокатанной полосы, плавки илипартии продукции) и анализируя затем только эти "чистые (парные) разности",появляется возможность исключить ту часть вариации, которая является результатом различия в исходных уровнях индивидуумов.
Именно так и проводятся вычисления в t-критерии для зависимых выборок. В сравнении с t-критериемдля независимых выборок такой подход дает всегда "лучший" результат (критерий становится более чувствительным).Реализация t-критерия для зависимых выборок начинается с того, чтостроится новая выборка из n = n1 = n2 элементов (парные наблюдения), определяемая как разность значений первой и второй выборок: x∆i = x1i – x2i и по нейрассчитываются оценки математического ожидания x ∆ и среднеквадратичногоотклонения S∆:983.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХx∆ =1 n⋅ ∑ x∆i ; S∆ =n i =1n12⋅ ∑ ( x∆ − x∆i ) .n − 1 i =11. Выдвигается нулевая гипотеза о том, что математическое ожиданиеразности равно нулю Н0: M∆ = 0.2. Как и для случая независимых выборок, можно сформулировать триальтернативных гипотезы:Н1(1): M∆ > 0; Н1(2): M∆ < 0; Н1(3): M∆ ≠ 0;3. Используется t-критерий для зависимых выборок (парный).4. Статистика критерия Стьюдента, учитывая, что M∆= 0, примет вид (см.(3.49))t=x∆ − M ∆x −0x⋅ n= ∆⋅ n = ∆ ⋅ n.S∆S∆S∆(3.52)5. В зависимости от условия решаемой задачи выбирается необходимыйуровень значимости α. Число степеней свободы для зависимых выборок равноm= n – 1.6. Границы критической области устанавливаются в зависимости от видаальтернативной гипотезы по значениям квантилей распределения Стьюдента tα; m илиt 2α; m.7. Нулевую гипотезу принимают, т.е.
полагают, что M∆ = 0 при выполнении неравенств:•для альтернативных гипотез Н1(1): M∆ > 0; Н1(2): M∆ < 0•для альтернативной гипотезы Н1(3): M∆ ≠ 0t ≤ t 2α ,m ;t ≤ tα , m .Еще раз обратимся к числовому материалу примера 3.7 и переформулируем условия задачи таким образом, чтобы как по варианту 1, так и по варианту2 были приведены данные для одной и той же новой технологии, полученныедважды на одних и тех же партиях окатышей, но измерения прочности выполнены по двум различным методикам.993. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХМожно ли сказать, что результаты измерения прочности, полученные дляновой технологии по различным методикам на одних и тех же партиях окатышей, не имеют значимого различия?Поскольку при таких условиях задачи выборки по варианту 1 и 2 становятся зависимыми друг от друга (значения прочности окатышей по каждой извосьми партий произведены дважды, но про разным методикам), то для решения необходимо воспользоваться описанным выше парным t-критерием.Рассчитанные значения x∆i, x ∆ и S2∆ приведены в табл.
3.4 (см. последний столбец).S ∆ = 0,001371 = 0,037 .1. Выдвигаем нулевую гипотезу Н0: M∆ = 0.2. Поскольку между двумя методиками не предполагается никакого различия, то альтернативную гипотезу выбираем в виде Н1: M∆ ≠ 03. Используется t-критерий для зависимых выборок (парный).4. Статистика критерия Стьюдента в этом случае представляет собойt=x∆0,04⋅ n=⋅ 8 = 3,055.S∆0,0375.
Выбираем уровень значимости α = 0,05 и определяем число степенейсвободы m = 8 - 1 = 7.6. Для построения критической области находим табличное значениеt0,05;7=2,37 (СТЬЮДРАСПОБР(0,05;7) = 2,364623).7. Поскольку рассчитанное ранее значение статистики попадает в критическую область 3,06 > 2,37, то нулевая гипотеза Н0: M1 = 0 отвергается, и в качестве рабочей необходимо принять альтернативную Н1: M∆ ≠ 0, т.е.
методикиопределения прочности по варианту 1 и по варианту 2 дают значимо различныерезультаты на одних и тех же партиях и для одной и той же новой технологииотжига окатышей.Вероятность ошибки первого рода при этом составляет ("Хвосты" = 2, поскольку Н1: M1 ≠ 0) СТЬЮДРАСП(3,055;7;2) = 0,018453, т.е., отвергая в анало1003.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХгичных условиях нулевую гипотезу, мы примерно только в одном или двух случаях из 100 будем допускать ошибку.Найденная оценка α = 0,018 в электронных таблицах Microsoft Excel может быть рассчитана с использованием функции ТТЕСТ.ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2,21;2,06;2,31};2;1)= 0,018452.Последний параметр в этой функции "Тип" = 1 (парный t-тест).Если сравнить результаты, полученные в примере 3.7 по t-тесту на двухсовершенно одинаковых выборках (вариант 1 и 2) при условии, что эти выборкинезависимы (двухвыборочный t-тест с равными дисперсиями) и зависимы (парный t-тест), то можно увидеть, что они дают совершенно противоположные результаты. Когда на выборки по варианту 1 и 2 мы смотрели как на независимые, мы не видели различия в их математических ожиданиях, но при условиизависимости в математических ожиданиях удалось установить значимые расхождения.
Этот числовой материал подтверждает ранее уже высказанное положение о том, что t-критерий для зависимых выборок является более чувствительным.Поскольку методика парного t-теста полностью повторяет алгоритм сравнения неизвестного математического ожидания M1 с конкретным числовым значением M, то статистическая функция ТТЕСТ в электронных таблицах MicrosoftExcel применима и для решения задач о соответствии полученного в эксперименте выборочного среднего x1 известному математическому ожиданию.Так, для примера 3.6 (о наличии погрешности в показаниях Рh-метра).ТТЕСТ({8,7;9,2;9,1;9;9,4;9,6;9,7;8,9;8,8;8,7;9,8;9,3;9,8;8,8};{9;9;9;9;9;9;9;9;9;9;9;9;9;9};2;1) = 0,088025, что при найденном в этом примере значении статистики t =1,84, числе степеней свободы m = 14 – 1 = 13 и альтернативной гипотезе Н1: M1≠ 9 ("Хвосты" = 2) соответствует СТЬЮДРАСП(1,84;13;2) = 0,088706.