А.В. Гармаш, Н.М. Сорокина - Метрологические основы аналитической химии (PDF) (2) (1060732), страница 4
Текст из файла (страница 4)
Поэтому для проверки значимости различиямежду x и a можно вычислить соответс твующую тестовую статистику исравнить ее с критическим значением - в данном случае табличнымзначением коэффициента Стьюдента. Если тестовая статистикапревосходит критическое значение, различие между сравниваемымивеличинами следует признать значимым.Описанный способ сравнения случайных величин - вычислениетес товой статис тики и сравнение ее с табличным критическим значением 16является весьма общим.
На таком принципе основано множествостатистических тестов (или критериев) - процедур, призванныхустановить значимость различия между теми или иными случайнымивеличинами. Тест, представленный формулой (18) и предназначенный длясравнения среднего значения и константы, называется простым тестомСтьюдента. В химическом анализе его следует применять всегда, когдавозникает задача сравнения результатов анализа с каким-либо значением,которое можно считать точной величиной.Пример 2. При определении никеля в стандартном образце сплаваполучена серия значений (% масс.) 12.11, 12.44, 12.32, 12.28, 12.42.Содержание никеля согласно паспорту образца - 12.38%. Содержит лииспользованная методика систематическую погрешность?Решение . Паспортное содержание никеля считаем действительным(точным) значением и применяем простой тес т Стьюдента.
Имеем:x = 12.314, s(x)=0.132, n=5, f=4, a=12.38.ξ=x−as( x)n =12.38 −12.3145 = 1.12 < t(P=0.95, f=4)=2.780.132Отличие результата анализа от дейс твительного значения незначимо,методика не содержит систематической погрешности.Сравнение двух средних. Модифицированный тест СтьюдентаПри интерпретации результатов химического анализа возникают иболее сложные задачи. Предположим, необходимо сравнить два результатаанализа одного и того же образца, полученные разными методами, и приэтом оба результата содержат сравнимые между собой случайныепогрешности. В этом случае уже нельзя ни один из результатов считатьточной величиной и, соответственно, применять прос той тест Стьюдента.Математически задача сводится в этом случае к установлению значимостиразличия между двумя средними значениями x1 и x 2 .Для решения этой задачи используют модифицированный тестСтьюдента.
Он существует в двух вариантах: точном и приближенном.Точный вариант применяют тогда, когда дисперсии соответс твующихвеличин s12 = s 2 ( x1 ) и s22 = s 2 ( x 2 ) различаются незначимо (что, в своюочередь, необходимо предварительно проверить с помощью еще одногостатистического теста - тес та Фишера, см. следующий раздел).
При17значимом различии s12 и s22 применяют приближенный вариант(приближение Уэлча).В точном варианте модифицированного теста Стьюдента тес товаястатистика вычисляется какξ=x1 − x 2n1 n2n1 + n2s ( x)(19)Как видим, по способу вычисления она весьма похожа на тестовуюстатистику простого теста Стьюдента (см. формулу (18)). В выражении(19) n1 и n2 - числа параллельных значений, из которых рассчитанывеличины x1 и x 2 , соответственно, а s (x) - среднее стандартноеотклонение, вычисляемое какs ( x) = s 2 ( x ) =f 1 s12 + f 2 s22f1 + f2(20)Величины f 1 и f2 - числа степеней свободы соответствующих дисперсий,равные n1 -1 и n2-1. Критическим значением служит коэффициентСтьюдента t(P,f) для выбранной доверительной вероятнос ти P (обычно0.95) и числа степеней свободыf=f1 +f2 =n1 +n2 -2(21)Таким образом, значимое различие между x1 и x 2 имеет место тогда, когдаx1 − x 2s (x )n1 n2> t ( P, f = n1 + n2 − 2)n1 + n2(22)В приближении Уэлча тес товая статистика вычисляется следующимобразом:ξ=x1 − x221(23)22ss+n1 n 2Критическим значением вновь служит коэффициент Стьюдента t(P,f).Число степеней свободы в этом случае вычисляется как18f =( s12 / n1 + s22 / n2 ) 2(s12 / n1 ) 2 ( s22 / n2 ) 2+n1 − 1n2 −1(24)и округляется до ближайшего целого числа.
Приближенный вариант тестаСтьюдента недостаточно достоверен, особенно при малых значениях f 1 и f 2.Сравнение воспроизводимостей двух серий данных. Тест ФишераДля выбора между точным и приближенным вариантоммодифицированного тес та Стьюдента необходимо предварительноустановить, есть ли значимое различие между величинами s12 и s22 , т.е.воспроизводимостями обеих серий данных. Разумеется, задача сравнениявоспроизводимостей имеет и вполне самостоятельное значение.2Как и средние x , дисперсии s тоже представляют собой случайныевеличины.
Поэтому и их сравнение тоже нужно производить сиспользованием соответствующих статистических тестов. Тест длясравнения двух дисперсий был предложен английским биологомР.Фишером и носит его имя.В тес те Фишера тестовой статистикой служит отношение большейдисперсии к меньшей:s12ξ= 2s2(25)Подчеркнем, что необходимо, чтобы s12 ≥ s22 и, соответс твенно, ξ≥1, впротивном случае индексы следует поменять местами. Критическимзначением служит специальный коэффициент Фишера F(P, f1 , f 2 ),зависящий от трех параметров - доверительной вероятности P и чиселстепеней свободы f1 и f2 дисперсий s12 и s22 , соответственно.
Значениякоэффициентов Фишера для стандартной доверительной вероятностиP=0.95 приведены в табл. 2 (приложение). Обратите внимание, что F(f1 ,f2 )≠F(f2 , f 1), поэтому при пользовании этой таблицей надо быть оченьвнимательными.Если отношение дисперсий (25) меньше, чем соответствующеезначение F(P, f1 , f 2), это означает, что различие между s12 и s22 незначимо воспроизводимость обеих серий одинакова, - или, как говорят, "дисперсииоднородны".
В этом случае можно вычислить среднюю дисперсию s 2 по19формуле (20) и пользоваться ею как общей характеристикойвоспроизводимости обеих серий. Число степеней свободы этой дисперсииравно f1 + f2 . Если же дисперсии неоднородны, вычисление среднейдисперсии, очевидно, лишено смысла.Еще раз обратим внимание, что тес т Фишера предназначен длясравнения только воспроизводимостей результатов, но никак не самихрезультатов (т.е. средних). Делать какие-либо выводы о различии среднихзначений, наличии в той или иной серии данных систематическойпогрешности, различиях в составе образцов и т.д.
на основании тестаФишера недопустимо. Для сравнения средних значений после тестаФишера следует применять тест Стьюдента (в той или иной егоразновидности).Пример 3. Примесь тиофена в бензоле (% масс.) определялиспектрофотометрическим (1) и хроматографическим (2) методами.Получили следующие серии данных:(1) 0.12 0.19 0.16 0.14(2) 0.18 0.32 0.24 0.25 0.28Известно, что хроматографическая методика не содержит систематическойпогрешности. Содержит ли систематическую погрешностьспектрофотометрическая методика?Решение .
Вычислим средние и дисперсии для обеих серий:(1) x = 0.153, s12 = 8.91 ⋅ 10 −4 , n1 =4, f 1=3(2) x = 0.254, s22 = 2.68 ⋅ 10 −3 , n2 =5, f 2=4Сравним воспроизводимости серий по тес ту Фишера:ξ= s22 / s12 =3.0 (делим большую дисперсию на меньшую!)Критическое значение F(0.95, 4, 3) = 9.1 (не F(0.95, 3, 4)= 6.6!)ξ<F, воспроизводимости данных одинаковы. Поэтому вычисляем среднеестандартное отклонение и применяем точный вариант теста Стьюдента:3 ⋅ 8.91⋅ 10 −4 + 4 ⋅ 2.68 ⋅10 −3s ( x) == 0.04373+40.254 − 0.153 4 ⋅ 5ξ== 3.27 t(P=0.95, f=7) = 2.370.04374 +5ξ>t, средние различаются значимо, спектрофотометрическая методикасодержит систематическую погрешность (отрицательную).Пример 4. В образце сплава определили медь спектрографическиматомно-эмиссионным (1) и титриметрическим (2) методами.
Полученыследующие результаты (% масс.).(1) 12.1 14.1 13.6 14.8(2) 13.40 13.75 13.65 13.58 13.60 13.4520Известно, что титриметрическая методика не содержит систематическойпогрешности. Содержит ли систематическую погрешность атомноэмиссионная методика?Решение . Вычислим средние и дисперсии для обеих серий:(1) x = 13.65, s12 = 1.31 , n1 =4, f 1=3(2) x = 13.57, s22 = 1.66 ⋅ 10 −2 , n2 =6, f 2=5Сравним воспроизводимости данных по тесту Фишера:ξ= s12 / s 22 =78.8Критическое значение F(0.95, 3, 5) = 5.4.
ξ>F, воспроизводимости данныхразличаются. Для сравнения средних значений применяем приближенныйтес т Стьюдента-Уэлча:ξ=13.65 − 13.571.31 1.66 ⋅ 10 −2+46= 0.14,f =(1.31 / 4 +1.66 ⋅ 10 −2 / 6) 2= 3.05 ~ 3,(1.31 / 4) 2 (1.66 ⋅ 10− 2 / 6) 2+35t(P=0.95, f=3) = 3.18. ξ<t, значимое различие между средними исистематическая погрешность атомно-эмиссионной методики отсутствуют.Поскольку случайная погрешность титриметрических данныхнамного меньше, чем атомно-эмиссионных, можно значение 13.57 считатьточной величиной и применить простой тест Стьюдента:ξ =13.65 −13.571.314 = 0.14 < t(P=0.95, f=3)=3.18И в этом случае также делаем вывод об отсутствии систематическойпогрешности атомно-эмиссионной методики.Выявление промахов.
Q-тестВ обрабатываемой серии данных должны отсутствовать промахи (с.8). Поэтому прежде, чем проводить любую обработку данных (начиная свычисления среднего), следует выяснить, содержит ли она промахи, и еслида, то исключить их из рассмотрения. Для выявления промахов служитеще один статис тический тес т, называемый Q-тестом.Алгоритм Q-теста состоит в следующем. Серию данныхупорядочивают по возрастанию: x1 ≤ x2 ≤ ... ≤ xn-1 ≤ xn.
В качествевозможного промаха рассматривают одно из крайних значений x1 или xn то, которое дальше отстоит от соседнего значения, т.е. для которогобольше разность x2 -x1 либо, соответственно, xn -xn-1. Обозначим этуразность как W1 . Размах всей серии, т.е. разность между максимальным иминимальным значением xn -x1 , обозначим W0 . Тестовой статис тикойявляется отношение21ξ=W1W0(26)Эта величина заключена в пределах от 0 до 1. Чем дальше отстоит"подозрительное" значение от основной массы данных, тем вышевероятность того, что это промах - и тем больше, в свою очередь, величинаξ.
Критической величиной служит табличное значение Q-коэффициентаQ(P, n) (табл. 3, приложение), зависящее от доверительной вероятности иобщего числа данных в серии. Если тестовая статистика превышаеткритическую величину (ξ>Q), соответс твующее значение считаютпромахом и из серии данных исключают. После этого следует проверитьна наличие промахов оставшиеся данные (с другим значением Q),поскольку промах в серии может быть не один.При применении Q-теста вместо стандартной доверительнойвероятности, равной 0.95, обычно используют значение P=0.90. Наиболеедостоверные результаты получаются при n=5-7.