К. Доерфель - Статистика в аналитической химии (1969) (1109659), страница 5
Текст из файла (страница 5)
Большая разница между ) х— указывает на кажущуюся или действительную асимметрию распределения или на лежащее в стороне крайнее значение. 2.2,2. ГРАНИЦЫ РАЗБРОСА Отдельные измеренные или наблюдаемые значения распределения частот более или менее кучно разбросаны вокруг среднего значения. Описание этого разброса является второй характеристикой цифровых данных. В качестве границ разброса в аналитической химии почти без исключения используют квадратичную ошибку, иначе называемую стандартным отклонением, и размах варьирования. Обе меры разброса следует выбирать в соответствии с преследуемой целью.
Средняя квадратичная ошибка (стандартное отклонение). Среднюю квадратичную ошибку выборки определяют посредством 3= ~ (х — ')' (2.5) где х; — единичное значение; х — среднее вз всех ю,; и — число всех измерений. Она является мерой разброса, используемой в аналитической химии почти всегда и характеризующей случайную ошибку метода анализа (но не единичные значения, ср, гл.
6). Средняя квадратичная ошибка е является лучшим приближением для соответствующей величины и в генеральной совокупности. Ее квадрат е' (соответственно пэ) называют дисперсией. Сумма квадратов в числителе равенства (2.5) подсчитывается чаще всего не по этой определяющей формуле. Путем преобразования" получают гг~ (х; — х)в =- ~>~ х';— (2.6а) = в,хв — НХ (2.6б) " Указанное равенство (2.6) находят следующим путем: а '(х; — х)э = ~, (х'; — 2х;х Р хв) †.
~к~~ хг — 2х ~~ х; К кхэ По равенству (2.1) * = 2х~/и, отсюда пояставовкой получают рввовства (2.6э) в (2.6б). ЗО Глава 2 Эмиирические распределения настст Равенство (2.6а) дает только малую ошибку после округления. Поэтому оно особенно подходит для цифровых вычислений. Равенство (2.66) используют при работе с малыми вычислительными машинами. Целесообразно всегда применять одинаковые формулы для подсчета суммы квадратов. В дальнейшем будет всегда использоваться равенство (2.6а).
При вычислениях результаты измерений преобразуют так, чтобы отбросить лишние цифры и опустить запятые. Последние потом снова восстанавливаются. Прн вычислениях пользуются таблицей квадратов чисел (см. табл. 12.7). Величина п — 1, стоящая в знаменателе равенства (2.5), называется числом степеней свобода. Эту величину можно интерпретировать как число контрольных измерений, которым соответствует результат, уже полученный из намерений. Число степеней свободы в дальнейшем обозначается Г. При наличии логарифмического распределения (ср. пример (2ей)) подсчитывается средняя квадратичная ошибка е~з для логарифмов измеренных величин (ср. пример !5.3)). 12.71. Иэ десяти определений марганца требуетск подсчитать среднюю квадратичную ошибку в одинаковых пробах. Получены следующие звачевив (Мп, %): 0,69 0,70 0,67 0,66 0,67 0,68 0,67 0,69 0,68 0,68 Результаты измерений преобразуют по формуле Х =- =- 100х — 68; вследствие этого отбрасывают запитую при подсчете.
Вычитанием значения 68, примерно соответствующего арифметическому среднему, сводят результаты иэмеревия к малым числам; кроме того, последний член в уравнении (2.6а) становится веэвачительвым. Получаются следующие преобразованные значения: -).1 +2 — 1 — 2 — 1 ЕХ! = — 1 0 — 1 +1 0 0 и="10 Иэ уравнении (2.6а) находят сумму квадратов ,"„(Х,— Х)э=1+2+(э+...
( ') =18 10 д =- $'ТЗ!9 = 1,2 Затем делают обратное вреобраэовапие, причем вмчптаемый член ве привимают во внимание, и получают в качестве средней кзадратичвой ошибки в =- О, 01 с6 Мп при 1= 9 степеней свободы Скорость вычисления по уравнению (2.6а) можно значительно увеличить применением таблицы обратных величин (табл. 12.8). Вычисляют е.х;, возводят в квадрат и умножают на 1/и. Результат с отрицательным знаком задают вычислительной машине, а затем прибавляют единичные значения хе, взятые из табл. 12.7 (ср.
гл. 10). Размах варьирования. Разница между наибольшим и наиМеньшим значением ряда измерений определяется как размах варьирования Л. Следовательно, Л = хааке хмии (2.7) Размах варьирования особенно подходит для характеристики рассеяния при выборке малого объема (и ( 10). При наличии большого числа измерений (и ) 10) размах варьирования является плохой оцеякой рассеяния в генеральной совокупности, так как он (в противоположность средней квадратичной ошибке) учитывает только два значения целой серии измерений.
На величину размаха варьирования влияет объем выборки; при остающейся одинаковой случайной ошибке Л возрастает с увеличивающимся числом измерений. При определенных предположениях по размаху варьирования выборки можно получить представление о средней квадратичной ошибке генеральной совокупности (ср. равд. 5.1). 2.2.3. АСИММЕТРИЯ И ЭКСЦЕСС В равд.
2.1 указаны некоторые причины, которые могут вести к якобы асимметричному распределению. Все соответствующие распределения частот можно при помощи подходящих преобразований (например, переход к логарифмическому масштабу) перевести в симметричные распределения. Поэтому речь идет не об истинной асимметрии. Истинная асимметрия имеет место, если при достаточно большом числе измерений и после ликвидации всех технических или возможных математических причин асимметрия сохраняется. Такое распределение, кроме среднего значения и границ разброса, характеризуют дополнительно асимметрией р.
Она определяется формулой (2.8) 32 Глава 2 Эмпирические распределения частот Х = 1ооя — 50 <Х, — Х1 <Х, — Х>с и <Х. — Х<Я 1 0,52 0,53 0,54 0 55 0,56 0,57 -) 2 3 +4 +5 +6 +7 9 — 1,75 11 — 0,75 9 -(025 5 +1,25 4 +2,25 2 +3,25 — 5,3594 — 0,4219 +0,1563 +1,9531 +Н,3906 ( 34 3281 — 48,2346 — 4,6409 +1,4067 +9,7655 +45,5624 +68,6562 ~~ Хе=150 п= 40 ~~3 ~п1(Х< — Х)9=+72,5153 Х= 3,75 ~", Х,=--646 (~ Х<) /а=563 Ю.=~/ ' =1,46 паз = 124,4854 72,5153 р1 = 124'4854 =+058 Для второго распредвлеиия частот таким же путем получают рэ = + 0,09. Асимметрия распределения также проявляется особенно четко при малом содержании пробы 1 (ср.
пример [2 3[) а Недостатки в условиях проведения опыта могут привести к тому, что кривая распределения частот будет иметь слишком заостренный, или, наоборот, слишком * Лриведепные здесь примеры вада рассматривать лишь как некоторую иллюстрацию. Надо проявлять очеяь большую осторожность при определевии асимметрии и эксцесса по малым выборкам. Нужно всегда оценивать степень точности полученных зиачевий так, как это показано в кинге Н. В.
Смирнова и И В. ДунинаБарковского (см. стр. 277, 1963) — Прим. ред. где и. — число измеренных значений в )'-м классе; и— число всех измеренных значений. Асимметрия является безразмерной величиной для симметричного распределения р = О. Левосторонняя асимметрия оказывается при р ) О, правосторонняя асимметрия при р ( О. [2.8), В качестве вримера эмпирического распределения частос с истиввой асимметрией часто приводят данные по определению кремния. Для распределения, представленного иа рис. 2.4, требуется определить асимметрию.
Из зпачеиий для пробы 1 (первое распределевие) получается следующая схема расчета: пологий максимум. Заостренное распределение получают, например, если выборка была сделана неслучайно; пологое распределение возникает, если при постановке совместного опыта в отдельных лабораториях преобладали весьма различные условия работы. Подобные искаженные распределения частот характеризуют дополнительным показателем — эксцессом е, который определяется формулой ~Ч3, п;(к< — к)а [2.9) пса Заостренное распределение частот дает значение э ) О, пологое распределение ведет к 8 ( О.
[2.9[. Два примера распределений с ненулевым эксцессом приве- девы ва рис. 2.6. Заостренное распределевие результатов анализа мышьяка показывает, что здесь была иарушева случайность. Опре- 088 088 070,)ч Ас 0008 0,012 00!В,Ь А< Р и с. 2.6. Распределение частот с эксцессом, отлич. вьем от нуля. деление малых количеств алюмивия в стали особенно сильно водвержево влияиию веболыпих систематических ошибок, свяэаввых со спецификой работ различиых лабораторий.
Лоэтому при совместио проводимых авалиаах алюминия часто получают пологие распределения, 9 — 198 к к К о о Р Р Р Е Е Е Е 0 с с с С Р С Е С В 0 Н 0 В А С В А А 0 К 0 В А А В 9 9 0 о О 0 0 0 0 Р 0 Р 0 0 с с, С А С С А А 9 Я Н 9 Н Н Н Н Р Е Р Е Р Е Е Е в в А В А В В Раааа 2 абсолютная частота номер ласс т.» ие гранины класса часто та,«4 число штриховая таблица т (х,. — х>«а. <х, — й)« <х( — х) х,.= <оса,— аз (5) = (э)х 4 -8 Па= («)и(5 +16 <а) (4) (т) (з) (т) 3,9 3,9 01 0,66 0,67 0,68 0,69 0,70 0,71 — 3 — 2 — 1 — О +1 +2 1 3 23 7 2 — д — 2 — 1 О +1 +2 +81 +16 +1 О +1 +16 81 48 4 О 7 32 36,6 31,7 — 1 -33 +ЗЗ 33 42,3 77,9 0 0 0 аа 14 8<003 97 1 19,2 420 +1 +20 «2 «6 (и004 20 100,0 и! 172 е = — — 3-+1 30 40 ! Ета + принятое среднее начеине(серевина классое-класс т=о г =о,поза ширина класса <( 0,001 л=104 81= Я Етз ат Р=-16 х =0,0024 3] ага прочие значения: Подсчет отклонений для первого распределения дается следующей схемой; — — 2 л .---40 ~к~ л<(Х( Х)«172 Х вЂ” О ~ Х< =46 (~«Х<) !л — О Х= ~/4()/39 — 1 ла"« = 40 Подобным же путем для второго распределения частот (А1 в стали) получается с, =- — 0,88.