С.Л. Ахназарова, В.В. Кафаров - Методы оптимизации эксперимента в химической технологии (1062947), страница 8
Текст из файла (страница 8)
47) Задавшись доверительной вероятностью В, определим по таблицам функции Лапласа /са- с„/ аж Тогда доверительный интервал для математического ожидания будет иметь вид К вЂ” я о-~т аК+йбе— к В к' 4! Вероятность )) называется доверительной вероятностью, она характеризует надежность полученной оценки, Интервал та -а* й с называется доверительным интервалом Границы интервала а'-а* — ср и а" -а*+ + ср называются доверительными гранииами, Доверительный интервал при данной доверительной вероятности определяет сочность оценки.
Величина доверительного интервала зависит от доверительной вероятности, с которой гарантируется нахождение параметра а внутри доверительного интервала; чем больше величина )), тем больше и величина са (т е чем с большей надежностью хотим гарантировать полученный результат, тем в большем интервале значений он может находиться). Увеличение числа опытов проявляется в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероятное~и при сохранении доверительного интервала. Обычно на практике фиксируют на определенном уровне значение доверительной вероятности (0,9, 0,95 или 0,99) и исходя из этого определяют доверительный интервал результата /В Прн построении доверительного интервала решаешься задача об абсолютном отклонении: +$ Р((а~ «) ~ьв)=Р(да~еб)=Р(кв) Р( —.В)= ) 7(к)д»= 'В а а йв ~т ~ «+йв Ул Уп (11. 48) «з — аи! ( ~т ~ «з+ аи (11.49) где и, вуз — квантиль стандартного нормального распределения, Стан- дартное нормальное распределение симметрично относительно нуля, поэтому ижз — — из-втз, Пример 3.
Среднее значение земпературы печи, полученное по четырем независимым измерениям оптическим пирометром, 2250'С. Ошибка при этом мезоде измерения 10'С Нанти с надежностью 95% доверител„ные гранины, внутри которых лежит истинное значение измеряемой температуры Р е ш е н и е, Полагая, что ошибка измерения — это известный тенеральныи стандарт а„-10'С и что случаиная величина Х (температура печи) распределена нормально, по Формуле (Ц 49) имеем !О !О 2250 — «В ~ т ~ 2250 + й — . У4 )24 При 0=95% й -1,90 и, следовазельно, истинное значение измеряемой температуры в находится с належносзыо 95% в следуюших доверительных совпис!ах; 2240,2 ~ т ~ 2259,8.
(П. 50) Закон распределения оценки а* зависит от закона распределения случайной величины Х, в частности о г самого параметра а, Чтобы обойти это затруднение, в математической статистике применяют обычно два метода 1) приближенный — при и ь50 заменяют в выражении для св неизвестные параметры их оценками; 2) от случайной величины а* переходят к другой случайной величине, закон распределения которои не зависит от оцениваемого параметра а, а зависит только от объема выборки и и ог вида закона распределения величины Х, Такого рода величины наиболее подробно изучены для нормального распределения случайной величины Х, В качестве доверительных границ а' и а" берут обычно симметричные квантили (11.5!) а( — Вцг жа~а(!+ или с учетом (11,44) (11.52) ар(г ~ а ~ а! Р(г Из этой оценки видно, что уменьшение доверительного интервала обратно пропорционально корню квадратному из числа наблюдений, Следовательно, если надо уменьшить возможную ошибку в два раза, необходимо увеличить число наблюдений в четыре раза, Знание генеральной дисперсии ог позволяет оценивать математическое ожидание даже по одному наблюдению.
Если для нормально распределенной случайнои величины Х в результате эксперимента по !Учено значение хи то доверительный интервал для математического ожидания с доверительной вероятностью 13 = 1 — р имеет вид Рис 16 Проверка сзатистических ти потех 9. Проверка статистических гипотез. Под статистическими гипотезами понимаются некоторые предположения от- Хл Х! Хе Х 2 2 2 носительно распределений генеральной совокупности той или иной случайноЙ Рис !5, критическая область гипотезы величины.
Проверка гипотезы заключается в сопоставлении некоторых стати- ((в) стических показателей, критериев про- в верхи (критериев значимости), вычисляе- а мых по выборке, со значениями этих показателей, определенными в предположении„ что проверяемая гипотеза верна. При проверке гипотез подвергает- вр в ся испытанию некоторая гипотеза Но в сравнении с альтернативной гапон(етой Й когорая формулируется или подразумевается, Альтернативных гипотез может быть несколько Чтобы принять или отвергнуть гипотезу, еще до получения выборки задаются уровнем значимости р Наиболее употребительны уровни значимости 0,05; 0,02; 0,01; 0,10; 0,001.
Уровню значимости соответствует доверительная вероятность () =1-р, По этой вероятности, используя гипотезу о распределении оценки О* (критерия значимости), находят квантильные доверительные границы, как правило, симметричные О„„и О! нз. Числа Ору! и О! р/2 называются критическими значениями гипотезы; значения О*,меньшие Ору!и большие О! 2)з,образуюткритическуюобласть гипотезы, или область непринятия гипотезы (рис, 15). Если найденное по выбоРке значение Оо попадает междУ О!(, и О! руз, то гипотеза допУскает такое значение в качестве случайного, и поэтому нет оснований ее отвергать, Если же найденное значение О, попадает в критическую область, то по данной гипотезе оно является практически невозможным, Но так как оно все-таки появилось, то отвергается гипотеза.
При проверке гипотез можно совершать ошибки двух типов, Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна, Вероятность такой ошибки не больше принятого уровня значимости Например, при р-0,05 можно совершить ошибку первого рода в пяти случаях из ста Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она неверна Вероятность ошибки второго рода зависит от характера проверяемои гипотезы, от способов проверки и от многих других причин, что сильно усложняет ее оценку. Эта вероятность тем меньше, чем выше уровень значимости, так как при этом увеличивается число отвергаемых гипотез. Одну и ту же статистическую гипотезу можно исследовать при помощи различных критериев значимости, Если вероятность ошибки второго рода равна и, то 1 — а называют мощностью критерия, На рис 16 приведены две кривые плотности вероятности случайной величины О, соответствующие двум конкурирующим гипотезам Н(а) и Й(б), Если из опыта получается значение 0 > Отч отвергается гипотеза Н и принимается альтернативная гипотеза Й и наоборот, если О < Ов, Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Н вправо от О,, равна уровню значимости р, т, е, вероятности ошибки первого рода Плошадь под кривои вероятносги, соотаетствуюшей справедливости Й влево от О„равна вероятности ошибки второго рода а, а вправо от О, — мошности критерия.
Таким образом, чем больше р, тем больше 1 — а Для проверки гипотезы стремятся из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода, Например, найдены два значения а*, и а,* некоторого выборочною параметра Эти значения можно рассматривать как оценки генеральных параметров а, и аз. Высказывается гипотеза, что различие между а) и а* случайное и что генеральные параметры равны между собой т,е а,-а, Такая гипогеза называется нулевой или нуль-гипотезой по терминологий Р, Фишера Для проверки этой гипотезы нужно выяснить, значимо ли расхождение между а*, и аь в условиях нулевой гипотезы, Для этого обычно исследуют случайную величину Ла"-аь, — а" и проверяют,значимо ли ее отличие от нУлЯ.
Иногда Удобнее РассматРивать величинУ а', з'аьз, сРавнивая ее с единицей, Отвергая нулевую гипотезу, тем самым принимают альтернативную, Альтернативная гипотеза распадается на две а*, >а* и а*, <а'. Если одно из этих неравенств заведомо невозможно, го альтернативная гипотеза называется односторонней и для ее проверки применяются односторонние критерии значнности (в отличие от обычных, двусторонних), При проверке гипотез очень важно учесть априорную информацию о возможных значениях оцениваемых параметров, выяснить, что один из сравниваемых параметров не может быль больше другого Иногда этот факт вытекает из постановки задачи Например, изучая изменение чистоты реактива, заранее знаем, что в связи с разложением на сне~у чисзота его с течением времени може~ только уменьшиться. Такая информация даст возможность при проверке гипотезы применить односторонний критерий значимости, который имеет меньшую вероятную ошибку второго рода, чем соответствующий двусторонний.
Если известно, что одно из неравенств аз( >а,* или о', < а", заведомо невозможно, то и рассматривать необходимо лишь одну из половин кригической области (см, рис 15). Например, р=0,05 при двустороннем критерии соответствуют критические значения О, „и О,я., г е значимыми (неслучайными) считаются О", принявшие значения 0*< Ооь,ь и О*> >О,р,ь При одностороннем критерии значимости одно из этих неравенств (например, О* <О, ~а) заведомо невозможно и значимыми будут лишь О'>О„.
Вероятность последнего неравенства равна 0,025, и, следовательно, уровень значимости будет равен 0,025 Таким образом, если при одностороннем критерии значимости использовать ге же критические числа, что и при двустороннем, этим значениям будет соответствова|ь вдвое меньший уровень значимости Обычно для одностороннего критерия берут тот же уровень значимосги, что и для двустороннего, При этих условиях оба критерия обеспечивают одинаковую ошибку первого рода.