Гмурман - Теория вероятностей и математическая статистика (969547), страница 49
Текст из файла (страница 49)
Итак, пользуясь требованкем (е), мы в ве ятностью а рискуем совершить ошибку первого рода. Г аметим кстати, что в книгах по контролю качества продукпии вероятность признать негодной партию годных изделий называют ериском производителя», а вероятность принять негодную партию— ериском потребителя». Замечание 3. Пусть нулевая гшютеза принята; ошибочно думать, что теи самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения, еще не доказывает его. Поэтому-более правильно гаво- рить »данные яаблюденнй согласуются с нулевой гипотезой и, следовательно. не дают оснований ее отвергнуть». На практике для большей уверенности принятия гипотезы ее проверяют другими способами или повторяют эксперимент, увеличив обьем выборки.
Отвергакн гипотезу более категорично, чем принимают. Действительно, известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то »тат факт и служит примером, противоречащим нулевой гипотезе, что позволяет ее отклонить. й б. Отыскание левосторонней и двусторонней критических областей Отыскание левосторонней и двусторонней критических областей сводится (так же, как и для право- сторонней) к нахождению соответствующих критических точек. Левосторонняя критическая область определяется (см.
$ 4) неравенством К < йар(й„р < 0). Критическую точку находят исходя из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее й „ была равна принятому уровню значимости: Р (К < й„) = сс. Двусторонняя критическая область определяется (см. 2 4) неравенствами К < йы К > А». Критические точки находят исходя из требования, чтобы при спра- 286 ведливости нулевой гипотезы сумма вероятностей того, что критерий примет значение, меньшее я, нли большее й„ была равна принятому уровню значимости: Р (К < й,) + Р (К ) )т,) = сс.
(е) Ясно, что критические точки могут быть выбраны бесчисленным множеством способов. Если же распределение критерия симметрично относительно нуля и имени ся основания (например, для увеличения мощности е') выбрать симметричные относительно нуля точки — й„, и А„,(а„н) 0), то Р (К < — (ген) = Р (К > А„е).
Учитывая («), получим Р (К > й„е) = а/2. Это соотношение н служит для отыскания критических точек двусторонней критической области. Как уже было указано (см. З 6), критические точки находят по соответствующим таблицам. й 7. Дополнительные сведения о выборе критической области. Мощность критерия Мы строили критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равна са при условии, что нулевая гипотеза справедлива. Оказывается целесообразным ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.
Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирукхцая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза. Пусть для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный объем.
Остается произвол в выборе критической области. Покажем, что ее целесообразно построить так, чтобы мощность критерия была максимальной. Предварительно убедимся, что если вероятность ошибки второго рода м Определение мощности дано н й 7. (принять неправильную гипотезу) равна р, то мощность равна 1 — р. Действительно, если р — вероятность ошибки второго рода, т.
е. события «принята нулевая гипотеза, причем справедлива конкурирующая», то мощность критерия равна 1 — р. Пусть мощность 1 — р возрастает; следовательно, уменьшается вероятность р совершить ошибку второго рода. Таким образом, чем мощность больше, тем вероятность ошибки второго рода меньше. Итак, если уровень значимости уже выбран, то кри. тическую область следует строить так, чтобы мощиость критерия была максимальной. Выполнение итого требова* ния должно обеспечить минимальную ошибку второго рода, что, конечно, желательно. 3 а меча н и е 1.
Поскольку вероятность события «ошибка вто рого рода допущена» равна й. то вероятность противоположного события «ошибка аторяго рода не допущена» равна 1 — й, т. е. мощности критерия. Отсюда следует, что мощность критерия есть вероятность того, что не будет допущена ошибка второго рода. Замечание 2. Ясно, что чем меньше вероятности ошибок первого и второго рода, тем критическая область «лучйе».
Однако при заданном объеме выборки уменьшить одновременно м и р невозможно; если уменьшить а, то й будет возрастать. Например, если принять а О, то будут приниматься все гипотезы, в том числе и неправильные, т. е. возрастает вероятность р ошибкй второго рода.
Как же выбрать а наиболее целесообразноР Ответ на этот вопрое зависит от «тяжести последствий» ошибок для каждой конкретной задачи. Например, если ошибка первого рода повлечет большие по гери, а второго рода — малые. то следует принять возможно меньшее с». Если а уже выбрано, то, пользуясь теоремой Ю. Неймана и Э. Пирсона, изложенной в более полных курсах, можно построить критическую область, для которой й будет минимальным н, следовательно, мощность критерия максимальной.
Замечание 3. Единственный способ одн о в реме н ного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок. ф 8. Сравнение двух дисперсий нормальных генеральных совокупностей На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т. д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.
е, наименьшую дисперсию. Пусть генеральные совокупности Х и У распределены нормально. По независимым выборкам с объемами, соответственно равными и, и п„извлеченным из Этих совокупностей, найдены исправленные выборочные дисперсии з~х н ф. Требуется по исправленным дисперсиям при заданном уровне значимости а проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: И,: Р (Х) = 0 ()'). Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий (см. гл. ХУ(, Э 13), т. е. М [зл) = Е) (Х), М [5Ц = () (Ъ ), нулевую гипотезу можно записать так: Оо: М [зх) = М [ау1. Таким образом, требуется проверить, что математические ожидания исправленных выборочных дисперсий равны между собой.
Такая задача ставится потому, что обычно исправленные дисперсии оказываются различными. Возникает вопрос: значимо (существенно) или незначимо различаются исправленные дисперс и и? Если окажется, что нулевая гипотеза справедлива, т. е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки.
Например, если различие исправленных выборочных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность. Если нулевая гипотеза отвергнута, т. е. генеральные дисперсии неодинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Например, если различие исправленных выборочных дисперсий результатов измерений, произведенных двумя приборами, оказалось значимым, то точность приборов различна.
В качестве критерия проверки нулевои гипотезы о равенстве генеральных дисперсий примем отношение большей исправленной дисперсии к меньшей, т, е. слу- 19 з7ч~ 28Э чайную величину Р = ~б/~м Величина Р при условии справедливости нулевой гипотезы имеет распределение Фишера — Снедекора (см. гл. Х11, $15) со степеиямн свободы й,=п,— 1 и й,=п,— 1, где и,— объем выборки, по которой вычйслена большая исправленная дисперсия, и, †объ выборки, по которой найдена меньшая дисперсйя. Напомним, что распределение Фишера †Сиедеко зависит только от чисел степеней свободы и не зависит от других параметров. Критическая область строится в зависимости от вида конкурирующей гипотезы.
П е р в ы й с л у ч а й. Нулевая гипотеза О,: б)(Х) = 0(г'). Конкурирующая гипотеза Н,:О (Х) > Р(г). В этом случае строят одйостороннюю, а именно правостороннюю, критическую область, исходя из требования, чтобы вероятность попадания критерия Р в зту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости: Р(Р>Р„р(а; й„й,)1 а. Критическую точку Р„р(а; й„, й,) находят по таблице критических точек распределейия Фишера — Снедекора (см.
приложение 7), и тогда правосторонняя критическая область определяется неравенством Р > Р„„а область принятия нулевой гипотезы — неравенством Р < Р„,. Обозначим отношение большей испранленной дйсперсии к меньшей, вычисленное по данным наблюдений, через Р„б, и сформулируем правило проверки нулевой гипотезы. Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Об: Р (Х) = В (У) о равенстве генеральных дисперсий нормальных совокупностей прн конкурирующей гипотезе О,:б)(Х) > В(У), надо вычислить отношение большей исправленной дисперсии к меньшей, т.