Г. Кристиан - Аналитическая химия, том 1 (1108737), страница 29
Текст из файла (страница 29)
Дело в том, что неопределенность в четвертой цифре каждого из них достаточно велика (существенно превышает одну единицу в соответствующем знаке); вследствие этого и неопределенность результата оказывается выше, чем это могло бы показаться на первый взгляд. Относительная неопределенность результата вычислений составляет 0,0075, а наибольшая из относительных неопределенностей аргументов — 0,0066, очень близкое значение. ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИ1414 Контрольная карта результатов определения кальция за октябрь 2007 +2,5о 5,2 +2о 5,1 з .$ з Ы;- лея 50 оно кнн ~-о ~ 49 о Е о ок и я 4,8 -2о -2,5а Окт. 1 2 3 4 6 6 7 8 9 10111213141618171819202122232426262728293031 Дата РИС. 3.6. Типичная контрольная карта значений, а на карте откладывать среднее из них.
Но в этом случае случайный разброс данных должен быть в 477' раз меньше по сравнению с разбросом единичных результатов. Если на карте обнаруживается систематический дрейф в одном направлении (точек с одной стороны от средней линии становится существенно больше, чем с другой), на это следует обратить особое внимание.
Это может означать, что либо эксперимент выходит из-под контроля, либо наблюдаются систематические погрешности анализа. Тенденция к выходу точек за контрольные границы указывает на наличие одного или нескольких источников детерминированных погрешностей. Аналитик должен проверить, не испортились ли реактивы, правильно ли работают приборы, нет ли помех за счет внешних условий и других факторов.
Появление дрейфов может также указывать на загрязнение реактивов, ошибки в градуировке или приготовлении стандартов, а также на изменение состава контрольных образцов. 3.12. Доверительный интервал: насколько надежно значение? Стандартное отклонение, рассчитанное из серии экспериментальных данных, обобщенно характеризует воспроизводимость, присущую данной методике анализа. Но эта величина сама по себе еще не содержит информации о том, насколько близко может находиться среднее значение х от истинного значения. Здесь и далее будем считать, что систематические погрешности отсутствуют; в этом случае истинное значение равно и. Однако теория статистики позволяет, исходя из экспериментальных значений среднего и стандартного отклонения, рассчитать интервал, внутри которого может с заданной вероятностью находиться величина р. Этот интервал называется доверительным интервалом, его границы— доверительными границами, а соответствующая вероятность — доверительной вероятностью (ее обычно выражают в процентах).
ЗД2. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ; НАСКОЛЬКО НАДЕЖНО ЗНАЧЕНИЕ? 141 Положение доверительных границ для среднего значения рассчитывают по формуле: (3.9) Здесь 1 — статистический коэффициент, величина которого зависит от заданной доверительной вероятности и числа степеней свободы (напомиим, что оно равно числу результатов измерений минус единица). Значения 1 для различных доверительных вероятностей и значений числа степеней свободы ч приведены в табл. 3.1. Заметьте, что полуширипа доверительного интервала — это произведение коэффициента1иа стандартное отклонение среднего (з/ /М).
Аналогично можно рассчитать доверительный интервал и для единичного значения х (в этом случае Ф= 1). Доверительный интервал для единичного значения равен х+ бь Он в /тч' раз шире, чем для среднего. При этом число степеней свободы коэффициента т должно быть равно числу степеней свободы стандартного отклонения з (число данных, из которых оно рассчитано, минус единица). Таблица 3.1 Значения коэффициентов т для и степеней свободы при различных доверительных вероятностях* Доверительны веровтиость 95% 99% 99,5% 90% Ро 15 20 25 * ч = ?ч' — ! — число степеней свободы.
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,753 1,725 1,708 1,645 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,131 2,086 2,060 1,960 63,657 9,925 5,841 4,604 4,032 3,707 3,500 3,355 3,250 3,169 2,947 2,845 2,787 2,576 127,32 4,089 7,453 5,598 4,773 4,317 4,029 3,832 3,690 3,581 3,252 3,153 3,078 2,807 142 ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ Пример 3.15 Образец технической соды проанализировали на содержание ХазСОз гитрованием стандартным раствором соляной кислоты. Для трех параллельных титрований получены значения 93,50, 93,58 и 93,43;4 МазСО .
В каком интервале значений с 95о -й вероятностью при отсутствии систематических погрешностей находится истинное содержание ХазСО ? Решение При слишком большой доверительной вероятности доверительный интервал оказывается слишком широким и может захватывать значения, содержащие систематическую погрешность.
При слишком малой доверительной вероятности доверительный интервал оказывается слишком узким, в него могут не попасть значения, не содержащие систематической погрешности. Обычно оптимальными считаются доверительные вероятности 90 — 95;4. Среднее значение составляет 93,50;4. Абсолютное стандартное отклонение (рассчитайте его при помощи электронной таблицы1) составляет 0,075о . Для 95;4-й доверительной вероятности и двух степеней свободы ~ = 4,303, и доверительный интервал составляет ж 4,303 0,075 Доверительный интервал = х + — =93 50+ ' ' = 93 50+019 4 ,/м Таким образом, при отсутствии систематических погрешностей истинная величина с вероятностью 95' находится между 93,31 и 93,69',4.
Этот интервал является доверительным интервалом для среднего результата измерений. В то же время мы видели, что для единичного результата при бесконечном числе измерений истинное значение в 95;4 случаев попадает в интервал шириной в два стандартных отклонения (рис. 3.2). Действительно, для ч = о величины г равна 1,96 (табл. 3.1). Вспомним также (разд. 3.7, рис.
3.2), что единичный результат измерения в 68' случаев попадает в интервал +1а, в 95',4 случаев — в интервал й2о и в 99;4 случаев — в интервал+2,5 о. Поэтому возможно оценить величину стандартного отклонения, зная величину доверительного интервала, и наоборот. Если для единичного значения для 95'.4-й доверительной вероятности доверительный интервал составляет 27,37 + 0,06 г, то стандартное отклонение примерно в два раза меньше 0,06, т. е. 0,03 г. Эта величина одновременно является полушириной доверительного интервала для 68' -й доверительной вероятности. Строго говоря, эти выводы справедливы лишь для бесконечной серии измерений. При малом числе измерений значения коэффициентов ~ увеличиваются, и пропорционально им увеличивается ширина доверительного интервала. 3.13.
ТЕСТЫ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ: ЕСТЬ ЛИ РАЗЛИЧИЕ МЕЖДУДАННЫМИ? Для среднего значения ширина доверительного интервала непрерывно уменьшается с ростом Ф, поскольку при этом уменьшаются ! и з1~/М. Поэтому чем больше измерений вы проведете, тем более уверенно можете гарантировать, что истинное значение при отсутствии систематических погрешностей будет находиться в заданных границах или, наоборот, что эти границы будут более узкими прн заданной доверительной вероятности.
В то же время с некоторого А! значения г (как и з1~~У) начинают убывать очень медленно (табл. 3.1). Поэтому существует разумный предел, выше которого нецелесообразно увеличивать число параллельных измерений для увеличения точности. 3.13. Тесты статистической значимости: есть ли различие между данными? Р'-тест Р'-тест показывает нам, имеется ли значимое различие между стандартными от- клонениями двух серий данных. Для этого вычисляют величину Р; представляю- щую собой отношение дисперсий (т. е. квадратов стандартных отклонений) сравниваемых серий: 2 р 1 г 2 (3.10) При этом необходимо, чтобы з! было больше з .
Величина Г характеризуется 2 2 двумя значениями числа степеней свободы ч! и вз, каждое из которых равно числу данных в соответствующей серии минус единица. Если величина Г, рассчитанная по уравнению (3.10), превосходит соответствующую табличную величину Г для выбранной доверительной вероятности, В ходе разработки новой методики анализа часто возникает необходимость сравнить ее результаты с результатами общепринятой (возможно — стандартной) методики. Но как можно выяснить, есть ли значимое различие между результатами, полученными при помощи двух методик? Здесь мы опять должны прибегнуть к помощи статистики.
Решение вопроса о том, значимо ли один набор данных отличается от другого, зависит не только от степени различия средних значений, но также от количества данных и степени их разброса. Существуют специальные статистические таблицы, с помощью которых можно оценить, насколько велико должно быть различие результатов, чтобы его нельзя было считать случайным.
Для оценки степени различия между разбросами серий данных используют Г-тест, а для оценки различия между средними значениями — Г-тест. оижотхдданныхи злбктгонныетаблицы Таблица 3.2 Коэффициенты Г для 95%-й доверительной вероятности ч, 2 3 4 5 б 7 8 9 10 15 20 30 к, 19,3 19,4 19,4 19,4 8,94 8,89 8,85 8,81 6,16 6,09 6,04 6,00 4,95 4,88 4,82 4,77 4,28 4,21 4,15 4,!О 3,87 3,79 3,73 3,68 3,58 3,50 3,44 3,39 3,37 3,29 3,23 3,18 3,22 3,14 3,07 3,02 2,79 2,71 2,64 2,59 2,60 2,51 2,45 2,39 2,42 2,33 2,27 2,21 то различие между дисперсиями значимо. Табличные величины Г для 95%-й до- верительной вероятности приведены в табл.
3.2. Пример 3.16 Вы разрабатываете новую фотометрическую методику определения ппокозы в сыворотке крови и используете для сравнения стандартную методику Фолинь — Ву. Пользуясь приведенными ниже результатами параллельных анализов одной и той же пробы, установите, существует ли значимое различие в воспроизводимости двух методик. Ваша методика (мь~дл) 127 125 123 130 131 126 129 среднее (х!) 127 Методика Фалинь — Ву (мг/дл) 130 128 131 129 127 125 среднее (хз) 128 2 3 4 5 6 7 8 9 !О 15 20 30 19,0 19,2 ! 9,2 ! 9,3 9,55 9,28 9,12 9,01 6,94 6,59 6,39 6,26 5,79 5,41 5,19 5,05 5,14 4,76 4,53 4,39 4,74 4,35 4,12 3,97 4,46 4,07 3,84 3,69 4,26 3,86 3,63 3,48 4,10 3,71 3,48 3,33 3,68 3,29 3,06 2,90 3,49 3,! 0 2,87 2,71 3,32 2,92 2,69 2,53 19,4 19,4 19,4 19,5 8,79 8,70 8,66 8,62 5,96 5,86 5,80 5,75 4,74 4,62 4,56 4,50 4,06 3,94 3,87 3,8! 3,64 3,5 1 3,44 3,38 3,35 3,22 3,15 3,08 3,14 3,01 2,94 2,86 2,98 2,85 2,77 2,70 2,54 2,40 2,33 2,25 2,35 2,20 2,12 2,04 2,16 2,01 1,93 1,84 3.13.
ТЕСТЫ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ: ЕСТЬ ЛИ РАЗЛИЧИЕ МЩ)У ДАННЫМИ? Решение з,= ' = — =83 ~~~(хп х1 ) 50 У,— 1 7 — 1 г,» (х;г хг) 24 А~г Г = — '=1,7 8,3 4,8 Отношение дисперсий рассчитывают таким образом, чтобы оно было больше единицы. Табличное значение Р'для ч1 = 6 и чг = 5 составляет 4,95. Поскольку рассчитанное значение меньше табличного, мы приходим к выводу, что значимого различия в воспроизводимостях методик нет, т. е. их случайные погрешности — одного порядка. е-Тест Стыодента: есть ли различие в результатах анализа по разным методикам? Очень часто возникает необходимость установить, существует ли статистически значимое различие между результатами, полученными при помощи двух разных методик. Иными словами: можно ли считать результаты этих методик одной и той же величиной? Для решения таких задач используют г-тест Стьюдента.