К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 26
Текст из файла (страница 26)
Величина чувствительности — важный фактор для разрешающей способности [уравнение (6.13)). Литература 1, АдсегдепЬов А Оьег йе 8епапе Вегйсйв!сМ!8пп8 г!ев В!!пг!пеггев Ье! Ьо1опгаегпвсЬеп Меввппбеп. — 2. апа1, СЬет., 157 (1957) 161. 2. !!пегие! К. 7!о!!х хпт Пгп8апй ппг В!!пг$пеггеп, — 3. СЬет., 8 (1968) 236/237. 3. Кагвег Н, Яресьег Н. Вепег!ппй ппд Чегб!е!сЬ топ Апа!увептег1аьгеп — 3. апа1. СЬет., 149 (1956) 46/56. 4.
Камег Н. Епго РгоЫегп г!ег ХасЬпе!в8гепхе. — 2. апа1. СЬет., 209 (1965) 1/10. 5. ЕЛгьсЛ С. гп: 3рагепапа1уве !и ЬосЬвсЬгае!хепг!еп Мега11еп. Ьегрхг8: !уепгвсЬег Ъ'ег!аб !аг Сгопдвго!Ьпг!пвгг!е, 1970. 6. Ьйебег1апйвсЬе Хопп ХЕ!Ч 1047 В!ан 2.1 (Пех. 1967). 7. !31Х 1333, ХаЫемап8аьеп — Те!1 2; Вппг!еп (т81, !7егхе!сьп!в а118егпегпег Ъ'о1всЬппеп). 8. Воег!уе! К., ЕсьвсЫадег К., Неппоп С. СЬегаогаегпвсЬе Я!гахеййеп ш дег Апв1у!!Ь.
Ьегрхг8: Венсвсьег 1гег!а8 /йг Сгапг!вго!Ьпг!пв!г!е, 1990. Дополнительная литература Афонин Ю. Н., Ложкам В. Я. Зависимость границы обмаружения РФА от порядковых номеров элемента. — Завод. лаб., 44 (1978) 1086/1088. Бернер А. И., Гимельфорб Ф. А., укорская Т. А. Прогноз границы обмаружеимя элемента в РФА. — Ж. анап. хны., 34 (1979) 10/19.
Блюм И. А. Обобщенная интерпретация точности н нижней границы определени~ методов химического анализа. — Завод. лаб,, 43 (1977) 1441/1444. Блюм И. А. Воспронзводимость н грамицы обмаружения фотометрнческого анализа. — Завод. лаб., 44 (1978) 660/666. Ваигев О. Ь., СоЫвппгЛ Р. Ягайвйса1 МегЬог!в ш ВевеагсЬ апд Ргойкйоп. 4-вЬ Еб. ЕйпЬпгбЬ: 01гтег апг! Воуй 1972. 010 32 645; ИасЬпе!в- апг! Вевг!пппапбв8гепхе. 7 Статистические методы проверки гипотез Все результаты анализа, а также все производные от них показатели всегда содержат неустранимую случайную ошибку. И всегда важно ее учитывать при сравнениях любых результатов измерений. Возможность учета открывают статистические методы проверки гипотез.
При заданной статистической надежности (и соответствующем ей риске) эти статистические методы проверки гипотез позволяют дать объективную и общепринятую интерпретацию результатов анализа. 7.1. принцип работы Для осуществления проверки выдвигается статисшическал гипотеза о генеральных совокупностях, из которых извлекаются результаты измерений. По проверяемым выборкам результатов вычисляют определенное критическое значение некоторой случайной величины Л и находят область Л (при условии, что соответствующее проверяемое распределение выполняется), внутри которой надо ожидать Л с заданной вероятностью Р.
Если же критическое значение Л лежит вне области Л, то исходная гипотеза отбрасывается. Различие между гипотетическими и наблюдаемыми величинами называется значимым или статистически досшоеернмм. Однако зто различие не может служить достаточно надежной мерой оценки различия в самих генеральных совокупностях, к которым отнесены результаты измерений. Из статистически достоверной разности, например, двух средних У1 — Уэ — — ЬУш еше не следует, что соответствующие совокупности отличаются именно на величину ЬУш, Поэтому ни в коем случае нельзя делать вывод о некотором конкретном числовом различии, опираясь на результаты проверки.
Если критическое значение Л находится внутри области Л, то проверяемая гипотеза принимается. Однако из этого не следует еще, что она совершенно верна. Можно только сказать, что результаты измерений ей не противоречат. Поэтому такое различие в результатах называют недостоверным или исзначижы.м. Из утверждения, что разность некоторых величин статистически незначима, еше не следует их равенство. Вопрос о том, можно ли рассматривать такую "незначимую" разность одновременно и как "чисто случайную", нужно Решать пр полном понимании статистических методов проверки гипотез (см. [1, 2, 7!) Решение об отбрасывании или принятии статистической гипотезы принимается по выборочным данным. Поэтому приходится считаться и с возможностью ошибочного решения Если с вероятностью Р, установленной до проведения проверки, отбрасывается, например, гипотеза о том, что средние У1 и яв принацлежат к одной генеральной совокупности, то отсюда следует вывод о различии этих двух средних.
Но вероятность того, что оба средних все же принадлежат к одной и той же генеральной совокупности, равна а = 1 — Р. Следовательно, 7.1.Припаял работы 115 Р= 0,90 Р= 0,95 Р=0,99 Р = О, 999 симптоматическое различие, значимое различие, очень значимое различие, в высшей степени значямое различие можно ввести риск а того, что при использовании критерия А > Л будет отброшена гипотеза, которая в действительности справедлива.
Такое ошибочное заключение, возможное в 100а% всех случаев, называется ошибкой первого рода. Напротив, может случиться, что, несмотря на А < Л, гипотеза принимается, хотя она ошибочна. Это ошибочное заключение называют ошибкой второго рода или риском д. Допустимый процент возможных ошибок первого рода — вопрос взаимной договоренности, кроме всего прочего здесь должны приниматься во внимание возможные последствия принятия ошибочного решения. Ложные решения, например, при экспертизе могут иметь более серьезные последствия, чем ошибочно декларированная чистота химического реактива, Поэтому в первом случае должны быть предусмотрены более высокая достоверность и, следовательно, более низкое число возможных ошибок первого рода, чем во втором случае.
Обычно придерживаются следующих правил: 1. Проверяемая гипотеза отбрасывается, если ошибка первого рода может появиться в менее чем 100а = 1% всех случаев (т.е. Р > О, 99). Тогда рассматриваемое различие считается значимым. 2. Проверяемая гипотеза принимается, когда ошибка первого рода возможна в более чем 100а = 5% всех случаев (т.е. Р < 0,95). Тогда рассматриваемое различие считается негночиммм. 3. Рассматриваемую гипотезу надо обсуяспать дальше, если число возможных ошибок первого рода лежит в интервале между 5% и 1% (О, 95 < Р < О, 99). Обнаруженная разность интерпретируется как епорнап. Часто дополнительные измерения могут прояснить ситуацию.
Если по каким-то причинам дополнительных измерений окажется недостаточно, то полученные данные следует интерпретировать в расчете на самый неблагоприятный случай. Эти три правила будут использоваться в дальнейшем. Однако стоит еще раз подчеркнуть, что выбор а является делом обоюдной договоренности и что кроме обшепринятых могут выбираться и другие значения. Например, при решении многих внутрипроизводственных вопросов достаточным считается число ошибок первого рода 100а = 10% Напротив, в особых сиучаях практически должна быть исключена возможность ошибочного решения (например, при оценке токсического действия фармацевтического препарата). Тогда проверяемая гипотеза отбрасывается, как только число возможных ошибок первого рода достигнет такого пренебрежимо малого уровня, как, например, 100а% = О, 1%.
Риски ошибок первого рода а и ошибок второго рода д при прочих равных условиях зависят друг от друга. Чем меньше выбирают а = 1 — Р, тем больше будет д (и наоборот). Поэтому нет никакого смысла для проверки значимости выбирать слишком высокое значение Р (а следовательно, и очень низкое а), так как из-за этого очень вырастет неизвестное Р.
Практически это ведет к тому, что никак не удается выяснить, каковы же отличия от нулевой гипотеза (см. также выше обсуждение, следуюшее за формулой (6.21)). При интерпретации критериев иногда приводят данные о "ступенях значимости", например, 116 Глава 7. Сгагнстнчеснне мекоды дровернн гндогез Такая градация может ввести в заблуждеиие, так как оиа никак ие связана с вероятностью ошибки 17. Ояа указывает прежде всего иа ошибочиое проведение проверки, когда уровень значимости критерия назначается ие до его проведения, а только восле. (Выбор Р, а следовательио, и а относится (см. выше) к фазе планирования эксперимента!] Гипотеза, формулируемая для статистической проверки, может относиться к параметрам предполагаемого распределеиия геиеральиой совокупности (иапример, к среднему р или дисперсии оз нормального распределения). Критерий для проверки такой гипотезы о параметрах иазывается параметрическим критерием.