Г. Кристиан - Аналитическая химия, том 1 (1108737), страница 26
Текст из файла (страница 26)
предельное значение среднего при Ф-+ о. В действительности мы всегда располагаем лишь конечным набором результатов. Среднее конечного набора данных обозначается х и вычисляется как ,) (х,.,! Ф), х — э ц с увеличением А!'. Величину х можно использовать вместо и при вычислении стандартного отклонения. Но в этом случае сумма квадратов отклонений единичных значений от среднего (числитель дроби в выражении (3.1)1 содержит не А!', а только (А! — 1) независимых слагаемых (поскольку, зная (А! — 1) единичных результатов и среднее, всегда можно вычислить оставшийся единичный результат).
Как говорят статистики, в этом случае из исходных А! степеней свободы одна степень свободы использована для вычисления среднего, а для вычисления стандартного отклонения остается (А!- 1) степеней свободы. Можно показать, что для конечного числа данных (особенно при А! < 30) более точное приближение для с! (оценка) получатся в случае, если в знаменателе выражения (3.1) вместо общего числа данных А! использовать число степеней свободы (А! — 1) (для компенсации возможных различий между х и и). Тогда стандартное отклонение, рассчитанное из конечного числа данных, будет выражаться следующей формулой: 3.7. СТАНДАРТНОЕ ОТКЛОНЕНИŠ— ВАЖНЕЙШАЯ СТАТИСТИЧЕСКАЯ ВЕЛИЧИНА ',х, 47,39 15,80 М 3 0,0819 3 — 1 Стандартное отклонение можно рассчитать и по следующей формуле, эквивалентной выражению 13.2): (3.3) Эту формулу удобно использовать при вычислениях на калькуляторе.
Отметим, что многие калькуляторы снабжены встроенными программами для автомати- ческого вычисления стандартного отклонения после ввода данных. Пример 3.8 Рассчитайте стандартное отклонение для данных, приведенных в примере 3.7, пользуясь уравнением ('3.3). Решение (74869 — (((,39) (3 Различие в 0,01 г по сравнению с результатом расчета в примере 3.7 статистически незначимо, поскольку колебания самих данных составляют по меньшей мере Ю,2 г. Пользуясь формулой 13.3), следует в промежуточных вычислениях Тх, ) сохранять одну или даже две дополнительные цифры. г Стандартное отклонение, рассчитанное описанным выше способом, является оценкой возможной погрешности результата единичного измерения. Средний результат из ЛТ измерений характеризуется меньшим возможным разбросом значений по сравнению с единичными результатами.
Чем больше АТ, тем меньше этот разброс. При очень большом Ф среднее практически не отличается от 1(, и 15,67 15,69 16,03 Х 47,39 г 245,55 246,18 256,96 748,69 ОБРАБОТКА ДАННЫИ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ разброс его значений стремится к нулю. Можно показать, что среднее из Фрезультатов в ч' Тч' раз более достоверно, чем единичное значение. Так, случайная погрешность среднего из четырех результатов измерений вдвое меньше, чем погрешность результата единичного измерения.
Воспроизводимость среднего значения возрастает пропориионально корню квадратному из числа измеренийТаким образом, (3.4) Стандартное отклонение среднего иногда называют стандартной погрешностью. Часто стандартное отклонение выражают в относительной форме — в виде относительного стандартного отклонениа, представляющего собой отношение стандартного отклонения к среднему. Обычно его выражают в проиентах и в этом случае иногда называют коэффициентом вариации.
Пример 3.9 При выполнении параллельных взвешиваний получены четыре результата: 29,8, 30,2, 28,6 и 29,7 мг. Рассчитайте стандартное отклонение единичного результата и среднего значения. Выразите их в абсолютных единицах измерения и в отно- сительных величинах (%). Решение х,. х = — '=29,6 118,3 4 П,41 з = ~ — ' = 0,69 мг (абсолютное стандартное отклонение) 14 — 1 0,69 — 100% = 2,3% (относительное стандартное отклонение) 29,6 0,69 з = — ' = 0,34 мг (абсолютная стандартная погрешность) ч'4 0,34 100% = 1, 1% (относительная стандартная погрешность) 29,6 29,8 30,2 28,6 29 7 Х 1!8 3 х,.— х 0,2 0,6 1,0 01 Х 1,9 (х, — х)2 0,04 0,36 1,00 О 01 У. 1,41 3.7. СТАНДАРТНОЕ ОТКЛОНЕНИŠ— ВАЖНЕЙШАЯ СТАТИСТИЧЕСКАЯ ВЕЛИЧИНА Воспроизводимость результатов измерений можно повысить, увеличив число данных.
Однако, как видно из уравнения (3.4), стандартное отклонение среднего обратно пропорционально не числу измерений, а лишь корню квадратному из этого числа. Рано или поздно даже незначительное улучшение воспроизводимости потребует слишком большого числа дополнительных данных. А чтобы уменьшить стандартное отклонение, например, в 10 раз, число измерений необходимо увеличить в 100 раз. Фактор случайности необходим для того, чтобы результаты статистических расчетов получились правильными.
Мудрость аналитика Числом повторных измерений, достаточным для практических целей, можно считать такое, при котором стандартное отклонение среднего, характеризующее случайную погрешность, станет сравнимым по величине с систематической погрешностью (если последнюю, разумеется, невозможно выявить и скорректировать). Это связано с тем, что систематические погрешности невозможно устранить посредством повторных измерений. Из величины стандартного отклонения можно рассчитать интервал, в который результат измерения попадает с той или иной вероятностью. На рис. 3.2 изображены такие интервалы применительно к нормальному распределению.
Пользуясь уравнением кривой нормального распределения, можно показать математически, что 68;4 всех величин отклонений единичных данных от среднего попадает в интервал с полушириной з (точнее, о, поскольку этот вывод, строго говоря, справедлив лишь для бесконечной серии данных). Аналогично, 95;4 отклонений попадают в интервал с полушириной 2х, а 99'.4 — в интервал с полушнриной 2,5ж Таким образом, 68'.4 результатов единичных измерений находятся в интервале х+ з, 95;4 — в интервале х+ 2х, 99;4 — в интервале х+ 2,5з и т. д. Повторим, что величины этих интервалов рассчитаны в предположении, что серия результатов измерений бесконечна (см, ниже о понятии «доверительный интервал» а также пример 3.15). В действительности нельзя утверждать, что истинное значение с вероятностью 95'Уь попадает в интервал х + 2ж На то есть, по крайней мере, две причины.
Во-первых, это могло бы быть справедливо только при отсутствии систематических погрешностей. Систематические погрешности приводят к смещению всей кривой нормального распределения относительно истинного значения. Во-вторых, число результатов всегда конечно. При этом, чем оно меньше, тем менее достоверны значениях и ж В то же время существует способ расчета доверительных интервалов (см. далее) из величин х и х, который учитывает это обстоятельство.
Понятно, что данные по воспроизводимости результатов можно представить разными способами. Если результат представлен в виде х + б, всегда следует указывать, к каким условиям это относится и что именно означает б. В частности, это может быть х, 2х, стандартное отклонение среднего или относительное стандартное отклонение. 124 ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ В статистике часто используют величину, называемую дисперсией. Она представляет собой квадрат стандартного отклонения зз. Мы будем пользоваться величинами дисперсий при рассмотрении г=теста Фишера и наложения погрешностей (разд.
3.13). 3.8. Электронные таблицы Электронные таблицы — это эффективные вычислительные программы, которые можно использовать в различных целях, в частности, для анализа данных и построения графиков. Ими удобно пользоваться в ходе обработки данных, прн выполнении повторных измерений, отображении результатов в графической или табличной форме. Электронные таблицы имеют встроенные функции, например, для вычисления стандартных отклонений и других статистических величин, выполнения расчетов по формулам и с данными, вводимыми пользователем.
К широко используемым электронным таблицам относятся М)сгозо!1 Ехсе1, Ьошз 1-2-3 и Опайго Рго. В основе они все сходны, небольшие отличия есть в конкретных командах и синтаксисе. В наших примерах мы будем использовать Ехсе! как наиболее распространенную и доступную программу. Возможно, вы уже пользовались электронными таблицами ранее и знакомы с их основными функциями. Здесь мы обобщенно рассмотрим те аспекты, которые представляют наибольший интерес для решения прикладных задач аналитической химии.
За более подробной информацией следует обратиться к руководствам по работе с таблицами или справочной системе самой программы Ехсе1 Не!р, нажав соответствующую кнопку на панели инструментов. На странице )шр:Лзс!епсе.сзпз!ап.ебпн!!опа1! ЕхеИпбех. Ытп находится превосходное руководство по пользованию таблицами Ехсе1, составленное преподавателями Университета штата Калифорния (округ Станислаус).
В нем описаны основные рабочие функции этих таблиц, включая ввод данных н формул, форматирование ячеек, построение графиков и регрессионный анализ. Обязательно прочтите его перед тем, как продолжать работу, — вы найдете это руководство очень полезным. Сайт Университета западного Кентукки .Моз.ебп/-сопгееб! СНЕМЗЗО содержит сводку инструкций по построению графиков при помощи таблиц М!сгозой Ехсе! и Ьо!из 1-2-3. Посетите также сайты, на которые ссылаются страницы ехсе1!запбоп! !зпп! и !опззЬзапбопг Нпп1.
Лист электронной таблицы состоит из ячеек, расположенных по столбцам (обозначенным А, В, С, ...) и строкам (1, 2, 3, ...). Отдельная ячейка обозначается комбинацией буквы столбца и номера строки, например, ВЗ. Это обозначение ячейки называется также ее адресом нли ссылкой.
Для иллюстрации на рис. 3.3 в некоторых ячейках приведены их обозначения-адреса. Если навести указатель мыши (в форме крестика) на любую ячейку и щелкнуть левой кнопкой мыши, то соответствующая ячейка становится активной (ее границы выделяются жирными линиями), обозначение активной ячейки отображается в верху экрана слева от окна формул, а ее содержимое — правее, в окне формул после знака равенства.
3.6. элекГРОннце тАБлицы Заполнение ячеек 126 В каждую ячейку можно ввести текст. число пли форм~:зу. Именно благодаря использованию формул злсктро~ные саблины так удобны в рабоче. Опи позволяют проводить олнп и те же вычисления с разными числами, 1!равиля пользова- 126 ОБРАБОТКА ДАННЫХ И ЭЛБКТРОННЫБ ТАБЛИПЫ Продолжите ввод. Ячейка ВЗ: 1 Ячейка СЗ: 2 Ячейка В4: 47,702 Ячейка С4: 49,239 Ячейка В5: 27,687 Ячейка С5: 29,199 Ячейка Вб: =В4-В5 Формулу в ячейку Вб можно ввести и так: ввести символ «=», затем щелкнуть на ячейке В4, затем ввести символ «-», затем щелкнуть на ячейке В5.