К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 30
Текст из файла (страница 30)
1-критерии особенно удобен при больших сериях (уравнение (7.18)). Однако при сериях большого объема критерий знаков дает мало информации (см. табл. 7.2). Разности И,, возникающие при сравнении двух Рядов измерений, должны иметь нерегулярное чередование положительных и отрицательных знаков. Однако иногда наблюдают то короткие, то более длинные серии разностей Ы ) О и Ит ( О.
Тогда возникает вопрос: следует ли считать такое частое появление одинаковых знаков все еще случайным? На этот вопрос легко ответить, применив непараметрический критерий серий Вальда-Вольфовица. Определяют число Разностей с положительными и отрицательными знаками (л+ и к ). Число сеРий Ф в экспериментально полученных данных нужно сравнить со значениями из табл.
7.3. Нулевая гипотеза — рассеяние знаков совершенно случайно— "Ринимается, если при данном 1+ и 0 число серий Л~ меньше или больше, чем указанные границы. 129 7.8. Сравиение частот [7.8] При сравнении двух серий измерений были получены разности со знаками ++++-- - - - - -++. Следовательно, (се = б, и = 7 и А/ = 3.
По табл. 7.3 определяем, что для х~ = б и х = 7 число серий должно быть А/ < 4 и А/ > 11, когда нулевая гипотеза прм Р = 0,98 отбрасывается. В данном случае прм А/ = 3 это как раз имеет место, поэтому нулевую гипотезу следует отбросить и предположить, что возможма периодичность. 1.6. Сравнение частот (7.9) Измерения а-активности двух препаратов дали щ = 17 и рз = 13 импульсов в минуту. Первый результат подсчитав за шесть, а второй — за семь минут. Результаты можно представить следующей таблицей; Проба Частота импульсов Время счета Число импульсов Т( — — б т =7 ю =17 ьз = 13 х, = 102 хз = 91 В соответствии с уравнением (7.22) получим =((о ( — ( б)/~6 ((етс)=((( Из табл. А.2 находим и(Р ж 0,98) = 1,98. Следовательно, разность между обоими результатами недостаточно велика, чтобы можно было считать ее значимой.
Если приближение распределения Пуассона гаусовым распределением невозможно из-за малого числа данных (хт < 15; хз < 15), то можно провести провер ку при помощи следующего Г-критерия( Тз(2х7 + 1) (7.23) Т7(2хх + 1) где Т) и Тх — два интервала счета. При этом предполагают, что верно Тз(2х7 + 1) > Т7(2хз + 1), т.е. что дробь больше единицы. Подсчитанные частные сравнивают с процентными точками Различие между двумя отсчетами х7 и хз, подчиняющимися распределению Пуассона, можно интерпретировать аналогично тому, как интерпретируют разность между двумя средними.
В предположении, что хт > 15 и хз > 15, распределение Пуассона можно приближать гауссовым распределением (см. разд, 3,2). Проверяют, принадлежат ли обе вычисленные частоты двум генеральным совокупностям с одним и тем же параметром х, т.е. справедливо ли равенство х1 = хх = х. Затем предполагают, что х7 и хз — абсолютные значении, полученные за два отрезка времеми Т7 и Тз, а не отнесенные к единице времени (например, минуте) значения.
Если это предположение справедливо, получают следующее выражение: „=(.,т,-*,т(/ттт7;, *,) (7.22) подчиняющееся нормальному распределению. Сравнением с табличным и(Р) можно обычным путем оценить значимость различия между обоими числовыми результатами. 129 Глава Г, Статистические методы проверки гияотез Р-распределения Р(Р;,г1, уз) при у, = 2к1 + 1 и уз = 2хз + 1 степенях свободы (см. табл. А.б, с.
246). Различие считается значимым, если Е > Р(Р; ут„бт), [7.10] Обогащение цирконом (Ет610ч) тяжелых фракций песков контролируется подсчетом числа флуоресцируюших частиц пиркона. Выло обнаружено 500 вспышек. В двух пробах найдено х~ = 15 и зз = 9 флуоресцнрующих зерен. Применяя уравнение (7.23), получим 500(2 15 + ) 500(2 ° 9 + 1) Как уже было показано ранее (см. пример [6.6[), и здесь при небольшом числе данных этот критерий сравнения имеет очень низкую чувствительность.
Применение статистических методов поэтому безусловно необходимо, если из результатов хотят получить обоснованные выводы. 7.7. Выявление грубых ошибок При многократном повторении некоторого измерения какое-нибудь одно значение часто особенно сильно отклоняется в ту или другую сторону без достаточного на то основания. Тогда важно решить, идет ли речь лишь о случайном особенно резком отклонении или о действительно "грубой ошибке", которая может быть сглажена при дальнейшей обработке числовых данных или — лучше — должна быть исключена из повторяющихся результатов измерений [6). Поскольку в аналитической химии чаще всего речь идет о сериях с малым числом измерений, определение грубых ошибок проводят в основном с помощью выборочного размаха [уравнение (2.9)). Значение, которое может рассматриваться как грубая ошибка, обозначают как хы а л результатов упорядочивают по величине.
Затем вычисляем [9[ для и = 3... 7 Я = — з (7,24а) лля и = В... 10 Я = Хс — Кт к1 ки-1 (7.246) Найденное значение Я сопоставляют с табличным Я(Р; и) (табл. 7.4). Величину к1 можно считать грубой ошибкой, если 57 > Я(Р; ~). Из табл. А.ба (с. 24б) интерполяцией находим Р(Р = О, 95; Л = 31;,5 = 19) ю 2, 07.
Так как Р = 1, б3 ( У(Р ж О, 95; П; уг), то не вмязляется значимое различие между обоимн результатами. 7.7. Выявлеяяе грубых ошибок Таблица 7.4. Числовые значения для сг(Р; и) [9) я Р 0,90 и 0,95 Р 0,99 3 0,89 0,94 0,99 4 0,68 0 77 0,89 5 0,56 0,64 0,76 6 0,48 0,56 0,70 7 0,43 0,51 0,64 8 0,48 0,55 0,68 9 0,44 0,51 0,64 10 0,41 0,48 0,60 В области 3 = и = 6 в качестве ириближеиия можно исиользоватзо « Я(У = О, 95; 7') ш — ' 3,84 и+1 [7.11) При определении графита в сером чугуне получены следующие результаты (в % графита), уиорядочеииые ло величине: 2,86 2,89 2,90 2,91 2,99 Значение хз = 2,99% подозрительно велико и похоже иа грубую ошибку.
В соответствии с уравнением (7.24а) получим 2,99 — 2,91 2,99 — 2,85 Из табл. 7А найдем Я(Р = 0,95;из = 5) = 0,64. Так как 1,'~ < Я(Р,из), можно считать, что подозрительное значение ие грубая ошибка. В дальнейших расчетах его кадо учитывать наряду с другими результатами. С помощью указанного в табл. 7.4 приближения для Р = О, 95 из уравнения (7,24а) получим (*1 — *2)( + 1) (7.25) Когда Со ) 0(ш0,03), можно без всякой табл. 7.4 приближенно оценить з1 как грубую ошибку. Если в результате проверки не удается кнтерпретировать как грубую ошибку результат, явно выпадающий из ряда данных, тогда стоит воспользоваться для характеристики ряда измерений медианой й [уравнение (2.4)).
Однако надо иметь в виду, что — например, при сравнении нескольких серий измерений нельзя одновременно использовать и медиану, и среднее. Описанный здесь метод выявления грубой ошибки будет недостаточно чувствителен, если имеется большое число измерений, потому что вывод этого метода опирается только на подозрительное значение и еще два результата иэ Ряда 132 Глава 7. Статлстячеслвс методы проверки гллотез измерений. Более эффективен в таких случаях метод, описанный Графом и Хеннингом [10) и применимый для значений 4 ( п ( 1000. Б этом методе для проверки грубой ошибки по всем данным, кроме подозрительного значения, вычисляют среднее арифметическое и стандартное отклонение.
Если имеется более десяти измерений, то пропущенное значение считается явной грубой ошибкой при условии, что оно удалено от среднего более чем на 4зг). 7.3. Проверка эмпирических распределений г ч (л л!) Х ш~ 5, (7.26) Если теоретические значения Ь, для отдельных классов достаточно велики ()гг > 5, см., однако, подход Кохрена [11)), то найденное выражение будет следовать хи-квадрат-распределению с у = гл — lс степенями свободы. При этом lс представляет число параметров, необходимых для описания выборки. Для нормального (гауссова) распределения )с = 3 (среднее У, стандартное отклонение з и объем выборки и), для распределения Пуассона /с = 2 (среднее У и объем выборки и).
Требуемое для отдельных классов значение Ьг > 5 можно получить, объединяя несколько соседних классов, Если при проверке получается, !) ! Оценка грубмх ошибок — зто весьма делнкаткал зацача. Ей посвяшена большая лнтератуРа. См., напрямер, обзор Н. Г. Мнкешяной — Завод. лаб., № 3, с, 310 — 318. — 1966. (Прим, род. нсреого изданил В. В. Налимоеа,) Теперь есть спецяалькая мокографял на зту тему; Вепесс йа 1 ен!з Т.
Оп!!)еш ш Зганаг)са! Васа. 2-6 есй 74еп г'ог)с: 1.УУ!!еу, 1984. На русском языке см., напрнмер: Кендалл М., Сглимарш А. Статястяческяе выводм я салан. Пер. с англ. /Под 1'ед А.Н.Колмогорова. — Мл Наука, 1973, с. 707-712; Л- ансон Н., Лион Ф. Статистика я плавярованяе зксперямента в техняке я науке. Методы обработки данных. Пер. с англ./Под Рсд. Э. К. Лецкого. — Мл Мяр, 1980, с. 285-297; Закс Л. Статястяческое оценяванке. Пер. с нем./Под ред. Ю. П. Адлера, В.
Г. Горского. — Мл Статкстнкь, 1976, с. 286 — 261; Химмелнблау Л. Аналяз процессов статистическими методами. Пер. с англ./ Под ред. В.Г. Горского. — Мл МЯР, 1973, с. 177 — 181ьдребнер Н., Сминг Г. Прикладной регресснонный анализ. — Изд. 2-е, 1.
Пер. с англ. — Мл Финансы я стьтястяка, 1986, с. 199. — Прим. ред. Пусть дан ряд из и измерений. В дополнение к графическим методам из гл. 3 важно установить, можно ли описать эти и значений с помощью принятой теоретической модели. Наиболее часто прибегают к моделям гауссова распределения или распределения Пуассона. Для проверки тогда выдвигают нулевую гипотезу о том, что между эмпирическим распределением и теоретической моделью нет някакого различия.
Из и значений (и > 50) вычисляют среднее )г и стандартное отклонение и, а затем разбивают п значений на гп ~/л классов. Для каждого полученного класса определяют абсолютную частоту 5 попавших в него значений и сопоставляют ее с частотой Ьг, теоретически ожидаемой в соответствии с моделью. Для разных теоретических распределений частоты протабулированы при гг = 1. Поэтому прежде всего для их расчета стандартизуют классы по формуле и = (х — )т)/гг. Для таких нормированных значений в соответствующей таблице (см. табл. А.1) находят соответствующие им ординаты. Принимая во внимание число измерений п, ширину класса И и стандартное отклонение и, вычисляют теоретически ожидаемые абсолютные частоты Ьг попадания в отдельные классы.
Из эмпирических н теоретических частот составляют выражение 1.8. Проверка эмпирических распределении 1ЗЗ что Х > Х (Р,У), то проверяемая гипотеза отбрасывается; между эмипнриче- 2 2 ским и теоретическим распределением существует значимое различие. Различие незначимо, если Х2 < ут(Р, Г) (хи-квадрат-критерий~. Вычисление теоретических частот и величины Х происходит по схеме, приведенной в примере (7.12]. Значения ординат гауссова распределения (о(и) надо брать из табл. А.1. Соответствующие значения для распределения Пуассона можно брать из статистических таблиц, если не использовать метод проверки, описанный ниже на с.