Том 2 (1109662), страница 22
Текст из файла (страница 22)
Если же известны лишь их приближенные оценки х и s, то для расчета вероятностей и соответствующих им границ значений вместо распределения Гаусса следует использовать распределение Стьюдента (^-распределение). Оно оченьчасто используется в различных статистических тестах.Сравнение среднего значения и константы:простой t-тест СтьюдентаЭкспериментальное среднее значение, рассчитанное из конечногочисла данных — случайных значений, также является случайнойвеличиной. Поэтому для проверки любых предположений о возможном значении среднего следует использовать статистические тесты проверки гипотез.
Отметим, что любой статистический тестможет подтвердить или отвергнуть выдвигаемую гипотезу лишь снекоторой статистической вероятностью.6.1. Методы обеспечения качества результатов анализаI 19Для сравнения экспериментального среднего х для конечногочисла данных и среднего /J, для бесконечного числа данных (иликакой-либо иной постоянной, точно известной величиной) используют простой £-тест Стьюдента.
Условием его применимости являетсяподчинение исходных данных (значений х) нормальному распределению.Выдвинем гипотезу Щ о том, что величины х и \х представляютсобой, по сути, одно и то же значение, а возможное различие междуними носит чисто случайный характер. Назовем эту гипотезу нульгипотезой и символически запишем ее как х = /i. Подчеркнем, чтознак равенства здесь не следует понимать в буквальном, «арифметическом» смысле: численно величины х и ц могут различаться, знакравенства символизирует лишь то, что это отличие не выходит зарамки случайного.Альтернативная гипотеза Н\ состоит в том, что различие между х и /i не случайно. Это утверждение можно символически записать как х Ф /i.Поскольку проверка гипотез носит статистический характер,всегда существует вероятность ошибочно принять или отвергнутькак нуль-гипотезу, так и альтернативную гипотезу.
Как правило,заранее задают некоторую достаточно малую допустимую вероятность ошибочно принять альтернативную гипотезу (или, что тоже самое, ошибочно отвергнуть нуль-гипотезу). Эту вероятность,называемую уровнем значимости, обозначают а и обычно выбирают равной 0,05 или 0,01 (см. табл. 6.3).Простой £-тест Стьюдента для проверки гипотезы о различиимежду средним х и постоянной величиной /J, начинается с вычисления величины t, называемой тестовой статистикой:t=Ix^jA ^(б7)sгде s — оценка стандартного отклонения той серии данных,"гиз которой рассчитана величина х;" п— число данных в этой серии."Затем рассчитанное значение t сравнивают с табличным критическим значением функции ^-распределения для выбранного уровнязначимости а и числа степеней свободы / = п — 1 (табл. 6.4).
Еслирассчитанное значение не превышает табличного, принимают нульгипотезу, в противном случае — альтернативную гипотезу.Пример. Для стандартного образца сточной воды было выполнено три параллельных определения содержания фенола. СреднееГлава 6. Хемометриказначение составило х = О,513 мг/л, а стандартное отклонение s == 0,05 мг/л. Аттестованное содержание фенола в образце составляет /i = 0, 52 мг/л. Можно ли утверждать, что погрешность определения носит случайный характер? Уровень значимости а = 0,05.Сформулируем нуль-гипотезу и альтернативную гипотезу.H0 : х = /i,Щ-.хфt-ц,|0,513 -0,521 уVзd --U0, 224242.0 0 5Из табл.
6.4 находим критическое значение (для двустороннеготеста) £(а = 5%, / = 2) = 4,303. Поскольку рассчитанное значениеменьше критического, различие между величинами незначимо, т.е.случайно.В этом примере мы использовали тест Стьюдента в двустороннем варианте, поскольку нас интересовало, есть ли вообще значимоеразличие (в любую сторону) между сравниваемыми величинами. Односторонний вариант теста следует применять в тех случаях, когдаважно выяснить, превышает или нет экспериментальное значениенекоторую заданную величину. Можно ли, например, из приведенных данных утверждать, что содержание фенола превышает предельно допустимую для стран Европейского Союза величину, равную 0, 5 г/л? В этом случае нуль-гипотеза и альтернативная гипотеза будут выглядеть так:H0 • х < ц,Н\ : х > /i,[0,513-0,5| / t==—^05—^0 45'-Теперь (односторонний вариант теста!) табличное значение равно t(a = 5%, / = 2) = 2, 920.
И в атом случае рассчитанное значениетакже меньше критического. Утверждать о превышении предельнодопустимой концентрации нет оснований.Сравнение двух средних значений: расширенный t-тестСтьюдентаСравнение двух средних значений х\ и Х2 производится аналогичносравнению среднего и константы. Для этого случая тестовая стати-6.1. Методыобеспечениякачестварезультатованализа121стика вычисляется как* =F l - Х2\щщSd(6.8)у П1 + П2Здесь: щ , П2 — числа значений в сериях данных, из которых рассчитаны, соответственно, х\ и 5¾; ^d — среднее стандартное отклонение, вычисляемое как'(П1_1)82Sd =Таблица 6.4.+(П2_1)а2«1 + п 2 - 2Критические значения для двустороннего и одностороннего t-теста Стьюдента для различных уровней значимостиа и чисел степеней свободы / от 1 до 20.Двусторонний t-тест Стьюдента/1а = 5%а = 1%12, 70624,30333,18242,77652,57162,4477Односторонний <-тест Стьюдентаа = 2, 5%/а = 5%63,65716,31412, 7069,92522,9204,3035,84132,3533,1824,60442,1322,7764,03252,0152,5743,70761,9432,4472,3653,49971,8952,36582,3063,35581,8602,30692,2623,25091,8332,262102,2283,169101,8122,228112,2013,106111,7962,201122,1793,055121,7822,179132,1603,012131,7712,160142,1452,977141,7612,145152,1312,947151,7532,131162,1202,921161,7462,120172,1102,898171,7402,110182,1012,878181,7342,101192,0932,861191,7292,093202,0862,845201,7252,086122 Глава 6.
ХемометрикаНуль-гипотеза о равенстве значений ^i и Х2 (точнее говоря, отом, что их возможное различие носит лишь случайный характер)принимается, если рассчитанное значение t не превышает табличную величину t(a, f — п\ + П2 — 2).Предпосылкой применения расширенного f-теста, помимо подчинения исходных данных нормальному закону распределения, является однородность дисперсий S^ и s\. Термин «однородность» означает отсутствие значимого различия, т.
е. тот факт, что возможноеразличие между численными величинами дисперсий можно объяснить лишь случайными причинами. Символически это можно записать как s\ = Sg) если понимать знак равенства так же, как ввыражении х = \х (см. выше). Гипотезу об однородности двух дисперсий проверяют при помощи еще одного статистического теста,называемого F-тестом Фишера.Сравнение двух дисперсий: F-тест ФишераДля сравнения двух дисперсий применяют F-тест Фишера. Тестоваястатистика в этом случае обозначается как F и вычисляется какотношение большей по величине дисперсии к меньшей:F=4(*? > 4)-(6.9)Как и при использовании теста Стьюдента, нуль-гипотеза s\ = s%принимается, если рассчитанное значение F меньше критическойтабличной величины F для заданного уровня значимости а и чиселстепеней свободы / i = щ — 1 и /г = пг — 1. Критические табличные величины ^-распределения для уровней значимости 1% и 5%приведены в табл.
6.5.Сравнение нескольких средних значений:простой дисперсионный анализПомимо сравнения одного среднего значения с константой (уравнение (6.7)) и двух средних значений между собой (уравнение (6.8)),часто возникает необходимость сравнения нескольких (более двух)средних значений. Предположим, что в одном и том же образце питьевой воды определяли содержание нитратов в четырех различныхлабораториях. В каждой лаборатории выполнили по три параллельных определения и рассчитали среднее значение (табл.
6.6). Средниезначения, полученные в различных лабораториях, находятся в диапазоне от 10,20 до 10, 77 мг/л.6.1. Методы обеспечения качества результатов анализаCN-РЛ ч-1S«о,"• ^со1- « О »"ИiO W о> W„CD0,, CN I . 0AA,«?. I CN,*• •* Г А ^ -1 П Л ' ' AA ^T A-. ' ' AA ^J' AAf **J к^_ ' ' А—O t D S O t M O a e O N W r o W n W o o ' l i b - o O, » , ,»,A-* AA *•1" -1' П„СО123„А,.А„А„А„А„А„А„А„А,.Аэтсвгчв>«)«юн^атвмю«^мт11оИммнМннннJ 4- 00' 00IO СЭ CJi 05„СОTf,„СОс?„А„А„А00 , , 0 5 .„А„00 t o "» т-i 00 «5 со, CJ ,А„А„А„А„А„АC i O H C S o O N i O r i T f f f l c o N n W n i O l N ^ l N f l N W i - l N r t H H Hoo,—,йxrf CN(M СО00X*3xfCJi1-н^3rчf t -oАгГ 5O - Г 00 ' Ю W o O ^ ' ^ ' - ' i - i M c j i O O t ^ . ' l ' i o O O T - i O l c X i ^ i O *„ А „ А „ А „ А „ А „ А „ А „ А „ А „ А05 „СО „ T f05 00 CN Ю r H x f 0 5 C O l ^ C 0 C 0 C 0 k 0 C M T f ( M T f C M C . < M C N i - l C N T - l r H.CN«О50«, к- г^ тН .