Основы-аналитической-химии-Скуг-Уэст-т1 (1108740), страница 14
Текст из файла (страница 14)
Взамен мы вынуждены пользоваться средним малой выборки измерений х. В большинстве случаев х несколько отличается от 14. Эта разность обусловлена, конечно, случайной ошибкой, возможную величину которой мы и пытаемся определить. Важ~но подчеркнуть, что любая ошибка в определении х вызывает соответствующую ошибку в величине о (уравнение (4-4)1. Поэтому для малой выборки не только среднее х отличается от р, но, что очень важно, оценка стандартного отклонения также может оказаться неверной.
Таким образом, мы должны иметь дело с двумя погрешностями, одна из которых заключена в значении среднего, другая — в значении стандартного отклонения. и и (х; — хр 1= 1 и — 1 (4т5) Обратите внимание на два отличия уравнения (4-5) от уравнения (4-4), Во-первых, в знаменателе теперь стоит и — 1. Во-вторых, вместо действительной, но неизвестной величины 14 стоит среднее малой выборки измерений х. Чтобы подчеркнуть„ что полученное стандартное отклонение является лишь приближением к действительному значению, принято обозначать его буквой зз а не с.. Пример. Рассчитайте стандартное отклонение з для выборки, состоящей иэ первых пяти значений, приведенных в табл.
4-3. Погрешность в оценке о. Уменьшение числа членов выборки оказывает двойственное влияние на стандартное отклонение. Вопервых, число очень высоких и очень низких значений о возрастает, т. е. воспроизводимость о ухудшается. Во-вторых, стандартное отклонение становится отрицательно смещенной оценкой воспроизводимости. Это смещение выражается в большей частоте появления малых величин о по сравнению с большими и в уменьшении среднего значения и при уменьшении числа повторных измерений. Появление отрицательного смещения в значении о для малой выборки объясняется тем, что и среднее и стандартное отклонение нужно получить из одной и той же небольшой серии данных. Можно показать, что это смешение в значительной мере устраняется введением в уравнение (4-4) н — 1 числа степеней свободы вместо п.
Таким образом, для малой выборки стандартное отклонение определяется по формуле 73 Оценка достоверности аналитических данных (хт -х )а ) хг — х) хг а ~Х~4 (х; — х)т = 165,4 Рз ' 5 ) 49,912 9,9824 = х Из уравнения (4-4) .х / 165,4 1О-х ~/ ' ' 6 4.10-х ~0 006 5 — 1 Обратите внимание, что данные не округлились до конца вычислений. Целесообразность подстановки ('и — 1) в уравнение (4-5) объясняется следующим образом. Если ут неизвестно, мы используем конечную выборку для получения двух величин — х и з. Необходимость определения среднего и исключает одну степень свободы, т. е. при сохранении знаков сумма отдельных отклонений от х должна быть равна 0; если определены значения и — 1 отклонений, то последнее отклонение также, безусловно, известно.
Поэтому при оценке воспроизводимости выборки только и — 1 отклонений представляют независимые величины. Оценка величины з по ш. Для малой выборки результатов (до 15) можно также рассчитать з, исходя нз размаха варьирования ш при помощи соотношения (4-6) где с( — статистический коэффициент, зависящий от числа измерений (см. табл. 4-5). Оценка з по уравнению (4-6) более проста, но несколько менее надежна, чем по уравнению (4-5). Интересно отметить, что величина т( в табл. 4-5 примерно равна корню квадратному из и.
Поэтому в первом приближении нт х— тх л . (4-7) где и†число измерений. 9,990 9,986 9,973 9,983 9,980 7,6 10-х 3,6.!О х 9,4 ° 10-х 0,6.!О- 2,4 10 х 57 8.10-в 13,0 !О-х 88 4,10-в 0,4 10 ' 5,8 10-' 74 Гяаэв 4 Таблица 4-5 Коэффнцненты для вычисления стандартного отклонения з по величине размаха варьнровання ш с нспользованнем соотношения з=ш/а а Числа проб л Число проб л Число проб и 2,704 3,258 3,336 3,407 3,472 1,128 1,693 2,059 2,326 2,534 12 8 ! 9 !О !! 2,847 2,970 3,078 3,173 13 14 15 Использование методов статистики Экспериментатор применяет статистические вычисления, чтобы улучшить свою оценку влияния случайных ошибок. Такая оценка включает: 1.
Интервал вокруг среднего выборки, в который с определенной вероятностью попадает действительное среднее. 2. Число параллельных измерений, необходимых для попадания с определенной вероятностью экспериментального среднего в предсказанный интервал вокруг действительного среднего. 3. Решение вопроса о том, следует лн прн расчете среднего выборки оставить нлн исключить выпадающее значение серии параллельных результатов. 4.
Вероятность того, что два образца, проанализированные аналогичным методом, отлнчаются по составу, т. е. обусловлена лн разница в экспериментальных результатах случайной ошибкой нлн действнтельнымн различиями в составе. 5. Вероятность того, что между результатами, полученными двумя методами анализа, существуют расхождения в воспроизводимости. В последующем изложении мы рассмотрим первые четыре пункта. Доверительный интервал Действительное среднее р — постоянная, значение которой всегда остается неизвестным. При помощи статистики, однако, можно установить пределы области вокруг экспериментально найденного среднего х, внутри которой следует ожидать с данной степенью вероятности нахождения истинного среднего. Пределы, полученные таким образом, называются доверительными гран!зиами.
Интервал, ограниченный этими пределами, называется доверительным интервалом. Заслуживают внимания некоторые свойства доверительного интервала. Для данной выборки величина интервала частично определяется заданной степенью надежности. Очевидно, для абсолют- 75 Оцанна дасвоварнастн ананнтннвсннв данных но правильного предсказания мы должны были бы выбрать достаточно большой интервал и включить в него все мыслимые значения, которые может принять хь Такой интервал, конечно, не имеет ценности.
Напротив, если мы примем, что вероятность попадания в интервал составляет 99 правильных результатов из 100, ои не должен быть столь большим; его можно сделать еще меньше, если считать приемлемой вероятность 95Ъ. Короче, чем меньше вероятность правильного предсказания, тем меньше интервал, ограниченный доверительными границами. Величина доверительного интервала, будучи производной от стандартного отклонения з метода измерения, зависит от достоверности, с которой определена величина з.
Часто химик вправе утверждать, что найденное им экспериментальное значение з является отличным приближением к и. Однако в некоторых случаях величина з может содержать значительную погрешность. В этих случаях доверительный интервал должен быть расширен. Методы получения хорошего приближения к и. Флуктуации при расчете величины з по уравнению (4-5) уменьшаются с ростом числа измерений кп действительно, можно допустить, что для практических целей з и о идентичны, если и больше 20.
Это позволяет химику получить хорошее приближение к з, если метод измерения не слишком трудоемкий и имеется соответствующее количество проб, Например, если в ходе исследования возникла необходимость измерить рН очень большого числа растворов, то может оказаться целесообразным определение з в серии предварительных экспериментов. Техника проведения такого измерения очень проста и заключается в погружении пары промытых и высушенных электродов в исследуемый раствор; разность потенциалов между электродами служит мерой рН. Для определения з можно измерить рН в 20 — 30 порциях раствора с фиксированным значением рН, точно соблюдая последовательность операций. Обычно можно допустить, что случайная ошибка этой серии будет такая же, как и при последующих измерениях, и что величина з, рассчитанная по уравнению (4-5), будет верной и точной мерой теоретической величины и.
Для трудоемких анализов описанная процедура на пракгике обычно не применяется. Однако в этом случае данные различных выборок часто можно объединить, чтобы получить величину более надежную, чем величина з отдельной выборки. И снова приходится допустить, что причины случайной ошибки при анализе всех проб одни и те же. Эти допущения обычно оправданы при условии, что пробы близки по составу и каждая проанализирована в идентичных условиях.
Чтобы получить объединенную оценку е, отклонения от среднего каждой выборки возводят в квадрат; квадраты отклонений всех выборок затем складывают и делят на Глава 4 соответствующее число степеней свободы. Объединенную величину з получают, извлекая квадратный корень из частного. В каждой выборке теряется одна степень свободы. Следовательно, число степеней свободы для расчета объединенной величины з равно общему числу измерений минус число выборок. Далее приводится пример такого расчета. Пример.
В образцах из семи рыб, выловленных в озере Эри, ртуть атомно-абсорбционным методом. Результаты приведены ниже те стандартное отклонение метода по объединенным результатам. Число Номер парад- Среднее. проем лельнмл Реаультагм («одержание На>, и.!Π— и Н п.ш-а а', намеренна определили Рассчитай- Сумма аеадрагоа огнлоиениа от среднего Значение для пробы 1, приведенаое в столбце 5, получено следующим образом: (к !) !кс — хг / (г,, ха) 0,0161 0,0087 000!! Сумма квадратов = 0,0259 0,127 0,093 0,033 1,80 1,58 1,64 3 ! 5,02 хам - 1,673 Аналогично получены остальные данные, приведенные в столбце 5. Отсюда 0,0259+ 0,0!!5+ 0,0242+ 0,0611+ 0,0!14+ 0,0685+ 0,0!70 и 28 — 7 = 0,10 10 а и6Нй При числе степеней свободы больше 20 оценка з может считатьсн хорошим приближением к и. Доверительный интервал нри хорошем приближении з к а.
Как указывалось ранее, ширина кривой нормального распределения ошибок определяется величиной о. То же относится к величине х в уравнениях (4-2) и (4-3). По уравнению (4-2) можно рассчитать плошадь под кривой нормального распределения ошибок, отнесен- 5 6 7 Число измере- ний 4 5 4 28 1,80; 1,58; 1,64 0,96; 0,98; 1,02; 1,!О 3,13; 3,35 2,06; 1,93; 2,!2; 2,16; 1,89, 1,95 0,5?; 0,58; 0,64; 0,49 2,35; 2,44; 2,70; 2,48; 2,44 1,11; 1,15; 1,22; 1,04 1,673 0,0259 1,015 0,0115 3,240 0,0242 2,018 0,0611 0,570 0,0114 2,482 0,0685 1,!30 0,0170 Сумма квадратов=0,2196 Оценка достоверности аналитических данных Таблица 4-6 Доверительные вероятности для различных значений г Дввврвтвльвая а вврвятввать, % Доверительная вероятность, % ~2,00 ~ 2,58 Б-З,ОО ~ 3,29 96 99 99,7 99,9 ~0,67 ~1,00 ж1,29 ~1,64 ~1,9Б 50 68 80 90 95 (4-8) доверительные границы для р = х ~ го. Ниже приведен пример использования уравнения (4-8).