К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 13
Текст из файла (страница 13)
Если результаты варьируют в широком диапазоне (песколько десятков пропептов), то вероятностная бумага с логарифмическим масштабом па оси абсцисс 0,008 0,010 0,012 0,014 0,016 0,018 0,020 2 16 18 14 5 1 2 6 22 40 54 59 60 3,3 10,0 36,7 66,7 90,0 98,3 100,0 3.2. Гауссово (или нормальное) распределение 53 52 % 25 У 50 !0 2 0555 5ов йй йи Фю йм 50 аос 2 50 [ 52 И [И ОГ551а ь-ОРООИ Ь О,ООйт йи йй й22 йм 025 ОМ 022 %5п— 0 тсфю9-0002022 000025Ь5й Рис. 3.0.
Проверка распределения на нормальность на вероятностной бумаге. Рис. 3.7. Проверка логарифмически нормального распределения иа вероятностной бумаге. При проверке с помощью вероятностной бумаги надо считаться только с явными признаками. Незначительные отклонения от прямой почти никогда не бывают достаточно убедительными. Если гауссов интеграл [уравнение (3.5а)] подсчитывать в пределах 1 Р(х) = — ( ехр( — нз/2)с2и ъ'2т ./ (3.6) то получится доля Р от обшей плошади Р = 1, 000 (рис. 3.10). Эта часть пло Шали соответствует вероятности появления результата, попадаюШего в интервал очень облегчает работу, Однако такая функциональная миллиметровка не подходит, если результаты охватывают относительно узкий диапазон, как в примере [3.2].
Тогда отрезок используемой абсциссы оказывается слишком сильно сжатым. На вероятностной бумаге часто обнаруживаются двухвершинные распределения, что проявляется в таком расположении точек, которое позволяет провести две прямые с разными значениямк, соответствующими У = 50%.
Эти прямые пересекаются, если различны стандартные отклонения составляющих распределений (а2 ф аз); они параллельны при о2 = от. [3.3]. Первый случай иллюстрируется данными из рис. 2.2, приведенными парис. 3,8 на вероятностной бумаге. А на рис. 3.9 приведены результаты межлабораторных анализов алюминия в магниевом сплаве для двух лабораторий на одном графике.
Глава 3. Теоретлческле раслрелелеллл 54 У! 60 60 60 60 <ро оуг о,и о,и онана»060 Д! В йе» 060 йМ ОМ 066%6! 6(Я» Рис. 3.9. Распределение с двумя мак- симумами 0»»6 и» н а» = ом Рис. 3.8. Распределение с двумя мак- симумами щ Ф В» и е! Ф 0». г' Ф Р Заштрихованная площадь = 66» Ъ 65,0 Ъ я,» % от общей площади под нормальной кривой Рис. 3.10. Интегрнрованпе гауссовой кршюй в пределах и к о(Р)п. -па... + иа.
Вероятность того, что результат оказывается вне указанных пределов, равна а = 1 — Р. Часть площади Р также выражают в процентах от общей плошади и называют сташпсшичесхой надежностью. Чем дщ»ьше раздвинуты пределы интегрирования кпо, тем больше будет пло»дадь Р и тем больше результатов будет попадать внутрь и меньше вне пределов ~по (см. рис. 3.10). Из табл. 3.2 следует, что при достаточно большом числе измерений: 3.1. Гауссоао (алп пормвльяое) распределение Таблица 3.2. Некоторые значения интеграл~ 1 пусса при интегрировании в пределах -ио... + ип Р а=1 — Р и Р а=1 — Р 0,500 0,383 О,б17 1,9б 0,95 0,05 О,б75 0,500 0,500 2,58 0,99 0,01 1,000 0,883 0,317 З,ОО О,ООТЗ 0,003Т 1,б40 0,900 0,100 4,00 0,9999 0,0001 в области -и...+и лежит 68,3% (более двух третей) всех результатов. Около 15% значений меньше а и около 15% больше +оЗ в границах -1, 96п...
+ 1, 96п находится 95% всех значений; 2,5% лежит ниже — 1,96п и 2,5% — выше +1,96т; интервал -Зп...+Зп охватывает 99,73%, практически все значения. Остается всего только 0,27% значений — так мало, что имн можно пренебречь,— лежащих за заданными пределами. 1 Р(и) = 1 —— „г (3.7) Если можно предположить, что распределение имеет максимум частоты ~близи среднего (условие Кэмпа — Майделла), то для вычисления Р можно юпользовать следующее приближение: 2 1 2 25и2 (3.8) Некоторые значения Р с учетом этих двух условий дает табл.
3,3. Хорошо ~идно уменьшение Р по сравнению с нормальным гауссовыМ распределением (см. .абл. 3.2). Стандартное отклонение для средних из нормального распределения задает:я выражением (3.4) в виде пм = 2т/ /й.. Здесь и означает число параллельных определений, по которым получают каждое нз средних. Разности между ~ыборочным средним У и генеральным средним Р примерно с вероятностью Р Часть площади Р, полученная по уравнению (3.6), зависит от задаваемых тределов интегрирования. Выбор одной величины определяет другие.
Чтобы гояснить зту связь, в дальнейшем пределы интегрирования будем обозначать терез и(Р)п, При помощи табл. 3.2 легко обьяснить графическое определение стандартно;о отклонения, приведенное на с. 52. Площадь под гауссовой кривой в области -п... + и составляет 68,3% общей площади. В графе накопленных частот нахотим абсциссы -и и +и, им соответствуют ординаты уг = 50 — (68, 3/2) = 15, 9% 3 Уг = 50 + (68, 3~2) = 84, 1%. Вероятности, приведенные в табл.
3.2, пригодны естественно только в предюложении, что выполняется гауссаво распределение. Связи, подобные тем, что :уществуют между пределами интегрирования и частью площади Р, можно ука~ать для любых распределений. Тогда по Чебышеву справедливо равенство Глава 3. Теоретнчеснне распределения Таблица 3.3. Некоторые значения Р(в) по Кэмпу н Майлеллу (соотношение (3.8)] и по Чебышеву (соотношение (3.7)] Р(в) в Квыа — Мввлелл Чебышев 0,556 0,834 0,844 0,933 0,951 0,972 1,00 1,64 1,96 2,58 3,00 4,00 0,628 0,740 0,850 0,889 0,938 попадают в границы — и(Р)ам и +и(Р)ам а я — и(Р) — < р — х < +и(Р)— ,/и (3.9) Прибавляя х,получим а а х — и(Р) — < )е < х+ и(Р)— (3.10) (3.11) получится доверительный иншереал яшах среднего значения х с вероятностью Р.
Между этими пределами +вью и -Ьх в 100РЪ всех случаев должно оказаться истинное значение р. Поэтому указывая доверительный интервал, характеРизуют надежность измеренного значения. При нарушении нормальности для заданного д уменьшается достоверность вывода (см. табл. З.З), При определении доверительного интервала важно выяснить, интересны ли цля анализа обе границы (верхняя и нижняя) или только одна из них (см.
Рис 3 11). Если доверительный интервал используют для указания ошибки некоторого среднего, то естественно интересны обе границы. В этом случае говорят о двусторонних границах с вероятностью Р. При такой постановке вопроса ординатами х+и(Р) — '„' справа и слева отсекаются площади, равные (1 — Р)/2 = о/2. В~против, для характеристики результатов часто устанавливают только одну границу, требуя, например, чтобы содержание примесей не превышало некотоРого заданного значения — верхней границы. В этом случае говорят об одноешоронней границе с вероятностью Р. Она определяется частью площади, ограниченной значениями х = -со, х = и(Р) — ' (см.
Рис. 3.11). При установлении /й Шносторонней границы слева или справа от ординаты в точке х + и(Р) ~ нли При очень большом числе повторений такой серии измерений можно ожидать, что в 100% всех полученных выборок генеральное среднее р должно попасть внутрь найденного интервала х ш и(Р) — '. Если задать гл 57 3.2. Рвскределекке Пуассона ~а(р>(г -и ни а +а(г(в Рис. 3.11.
Границы доверительного кптервала прк двустороккей (слева) и одкостороиией (справа)постаковке задачи. Таблица 3.4. Величины Р Р. Соотношение между Р к Р для одкостороккего к двустороннего доверктельиого интервала Р Р Р Р 0,90 0,95 0,99 0,995 0,95 0,975 0,997 0,998 0,98 0,990 0,999 0,9995 к — и(Р) — „отсекается площадь, равная 1 — Р = (г. Между вероятностями для односторонней и двусторонней границ (соответственно Р и Р) существует зависимость: Р = О, 5+ Р/2 13.12) Более полное сопоставление величин Р и Р дается в табл, 3.4; значения для гауссова интеграла в диапазоне — оо... ик можно взять иэ табл. А.2 (с.
242). 3.2. Распределение Пуассона В ряде современных методов аналитической химии результаты представляются в виде функций от дискретных величин. Примерами могут служить подсчет импульсов в ралиохимии, подсчет квантов в рентгеноспектральном анализе, подсчет структурных элементов при исследовании шлифов и прочее. Всем этим методам присуще общее характерное свойство — число возможных событий (н~ пример, число распадающихся ядер атомов) очень велико, а число фактически происходящих событий (распад отдельных ядер), напротив, очень мало.
Вслед отвис редкости этих событий в наблюдаемом интервале времени состав пробы меняется несущественно. Если один и тот же опыт повторять многократно, то вероятность появления результатов измерения з можно описать следующей за висимостью: Р* ехр1-д) (3.13) 58 Глава 3. Теоретлчоскпе распрепелеппл 01334 013 31373 0133316703Ю р 3 Р 3 Рнс. 3.12. Распределеппе Пуассона для различных зпачеппй среднего арифметического р. Такое распределение называется распределением Пуассона.
Поразительно, что распределение Пуассона характеризуется только одним параметром — средним значением 73. Между средним 71 и стандартным отклонением о существует зввисимостьк (3.14) В отличие от нормального распределения распределение Пуассона дискретно. Для малых значений 73 оно обладает значительной асимметрией (рис. 3.12).
Асимметрия очень быстро уменьшается с ростом 73, а форма кривой приближается к форме нормального распределения со средним 73 и стандартным отклонением а = з/р. Для практических целей вполне удовлетворительное приближение к нормальному распределению достигается уже при х > 15. Тогда в соответствии с табл.
3.2 68,3% всех значений попадают в интервал 73 — Я... 71+ Я. Благодаря такой близости к гауссову распределению и здесь можно применять вероятностную бумагу для проверки гипотезы о распределении Пуассона. В этом случае накопленные частоты дают прямую, проходящую через точки (3.15) Рю(х„= д; У~ = 50%), Р,(х, =,и — з77д; 11 —— 15, 9%) Рг(хг = 73 + з/р; Уг = 84, 1%) Для практического выполнения этой проверки прежде всего строят сглагкиваюшую прямую, пользуясь накопленными частотами н соответствующими им содержаниями вещества. По индивидуальным измерениям находят среднее х и вычисляют на его основе с учетом равенства (3.15) координаты точек Рг и Рг.