А.В. Гармаш, Н.М. Сорокина - Метрологические основы аналитической химии (DOC) (1060728), страница 4
Текст из файла (страница 4)
Для проверки значимости различия между средним и константой вместо вычисления доверительного интервала можно поступить следующим образом. Легко видеть, что выражение (17) эквивалентно выражению
Величина, стоящая в левой части выражения (18), характеризует степень различия между и a с учетом случайной погрешности s(x). Она называется тестовой статистикой (и в общем случае обозначается в дальнейшем как ) для сравниваемых значений. Коэффициент Стьюдента, стоящий в правой части выражения (18), в этом случае непосредственно является критической величиной. Поэтому для проверки значимости различия между
и a можно вычислить соответствующую тестовую статистику и сравнить ее с критическим значением, в данном случае табличным значением коэффициента Стьюдента. Если тестовая статистика превосходит критическое значение, различие между сравниваемыми величинами следует признать значимым.
Описанный способ сравнения случайных величин - вычисление тестовой статистики и сравнение ее с табличным критическим значением - является весьма общим. На таком принципе основано множество статистических тестов (или критериев) - процедур, призванных установить значимость различия между теми или иными случайными величинами. Тест, представленный формулой (18) и предназначенный для сравнения среднего значения и константы, называется простым тестом Стьюдента. В химическом анализе его следует применять всегда, когда возникает задача сравнения результатов анализа с каким-либо значением, которое можно считать точной величиной.
Пример 2. При определении никеля в стандартном образце сплава получена серия значений (% масс.) 12.11, 12.44, 12.32, 12.28, 12.42. Содержание никеля согласно паспорту образца - 12.38%. Содержит ли использованная методика систематическую погрешность?
Решение. Паспортное содержание никеля считаем действительным (точным) значением и применяем простой тест Стьюдента. Имеем:
s(x)=0.132, n=5, f=4, a=12.38.
= =
= 1.12 < t(P=0.95, f=4)=2.78.
Отличие результата анализа от действительного значения незначимо, методика не содержит систематической погрешности.
К этому выводу можно прийти и путем непосредственного расчета доверительного интервала среднего значения результатов анализа (формула (16)):
Паспортное содержание никеля попадает в доверительный интервал.
Сравнение двух средних. Модифицированный тест Стьюдента
При интерпретации результатов химического анализа возникают и более сложные задачи. Предположим, необходимо сравнить два результата анализа одного и того же образца, полученные разными методами, и при этом оба результата содержат сравнимые между собой случайные погрешности. В этом случае уже нельзя ни один из результатов считать точной величиной и, соответственно, применять простой тест Стьюдента. Математически задача сводится в этом случае к установлению значимости различия между двумя средними значениями и
.
Для решения этой задачи используют модифицированный тест Стьюдента. Он существует в двух вариантах: точном и приближенном. Точный вариант применяют тогда, когда дисперсии соответствующих величин и
различаются незначимо (что, в свою очередь, необходимо предварительно проверить с помощью еще одного статистического теста - теста Фишера, см. следующий раздел). При значимом различии
и
применяют приближенный вариант (приближение Уэлча).
В точном варианте модифицированного теста Стьюдента тестовая статистика вычисляется как
Как видим, по способу вычисления она весьма похожа на тестовую статистику простого теста Стьюдента (см. формулу (18)). В выражении (19) n1 и n2 - числа параллельных значений, из которых рассчитаны величины и
, соответственно, а
- среднее стандартное отклонение, вычисляемое как
Величины f1 и f2 - числа степеней свободы соответствующих дисперсий, равные n1-1 и n2-1. Критическим значением служит коэффициент Стьюдента t(P,f) для выбранной доверительной вероятности P (обычно 0.95) и числа степеней свободы
f=f1+f2=n1+n2-2 . (21)
Таким образом, значимое различие между и
имеет место тогда, когда
В приближении Уэлча тестовая статистика вычисляется следующим образом:
Критическим значением вновь служит коэффициент Стьюдента t(P,f). Число степеней свободы в этом случае вычисляется как
и округляется до ближайшего целого числа. Приближенный вариант теста Стьюдента недостаточно достоверен, особенно при малых значениях f1 и f2. На практике тест Стьюдента-Уэлча применяют очень редко. Вместо него почти всегда можно использовать простой вариант теста Стьюдента (см. пример 4).
Сравнение воспроизводимостей двух серий данных. Тест Фишера
Для выбора между точным и приближенным вариантом модифицированного теста Стьюдента необходимо предварительно установить, есть ли значимое различие между величинами и
, т.е. воспроизводимостями обеих серий данных. Разумеется, задача сравнения воспроизводимостей имеет и вполне самостоятельное значение.
Как и средние , дисперсии s2 тоже представляют собой случайные величины. Поэтому сравнивать их тоже нужно с использованием соответствующих статистических тестов. Тест для сравнения двух дисперсий был предложен английским биологом Р. Фишером и носит его имя.
В тесте Фишера тестовой статистикой служит отношение большей дисперсии к меньшей:
Подчеркнем, что необходимо, чтобы и, соответственно, 1, в противном случае индексы следует поменять местами. Критическим значением служит специальный коэффициент Фишера F(P, f1, f2), зависящий от трех параметров - доверительной вероятности P и чисел степеней свободы f1 и f2 дисперсий
и
, соответственно. Значения коэффициентов Фишера для стандартной доверительной вероятности P=0.95 приведены в табл. 2 (приложение). Следует обратить внимание, что F(f1, f2)F(f2, f1), поэтому при пользовании этой таблицей надо быть очень внимательными.
Если отношение дисперсий (25) меньше, чем соответствующее значение F(P, f1, f2), это означает, что различие между и
незначимо - воспроизводимость обеих серий одинакова, или, как говорят, "дисперсии однородны". В этом случае можно вычислить среднюю дисперсию
по формуле (20) и пользоваться ею как общей характеристикой воспроизводимости обеих серий. Число степеней свободы этой дисперсии равно f1 + f2. Если же дисперсии неоднородны, вычисление средней дисперсии, очевидно, лишено смысла.
Еще раз обратим внимание, что тест Фишера предназначен для сравнения только воспроизводимостей результатов (т.е. дисперсий), но никак не самих результатов (т.е. средних). Делать какие-либо выводы о различии средних значений, наличии в той или иной серии данных систематической погрешности, различиях в составе образцов и т.д. на основании теста Фишера недопустимо. Для сравнения средних значений после теста Фишера следует применять тест Стьюдента (в той или иной его разновидности).
Пример 3. Примесь тиофена в бензоле (% масс.) определяли спектрофотометрическим (1) и хроматографическим (2) методами. Получили следующие серии данных:
(1) 0.12 0.19 0.16 0.14;
(2) 0.18 0.32 0.24 0.25 0.28.
Известно, что хроматографическая методика не содержит систематической погрешности. Содержит ли систематическую погрешность спектрофотометрическая методика?
Решение. Вычислим средние и дисперсии для обеих серий:
Сравним воспроизводимости серий по тесту Фишера:
= =3.0 (делим большую дисперсию на меньшую!)
Критическое значение F(0.95, 4, 3) = 9.1 (не F(0.95, 3, 4)= 6.6!)
Получаем <F, воспроизводимости данных одинаковы. Поэтому вычисляем среднее стандартное отклонение и применяем точный вариант теста Стьюдента:
Видно, что >t, средние различаются значимо, спектрофотометрическая методика содержит систематическую погрешность (отрицательную).
Пример 4. В образце сплава определили медь спектрографическим атомно-эмиссионным (1) и титриметрическим (2) методами. Получены следующие результаты (% масс.).
(1) 12.1 14.1 13.6 14.8;
(2) 13.40 13.75 13.65 13.58 13.60 13.45.
Известно, что титриметрическая методика не содержит систематической погрешности. Содержит ли систематическую погрешность атомно-эмиссионная методика?
Решение. Вычислим средние и дисперсии для обеих серий:
Сравним воспроизводимости данных по тесту Фишера: