К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 46
Текст из файла (страница 46)
Подозрение о наличии систематических изменений возникает также тогда, когда; из 7 последовательных значений 7, из 11 последовательных значений 10, нз 14 последовательных значений 12, иэ 17 последовательных значений 14, из 20 последовательных значений 16 оказываются по одну сторону (выше илн ниже) от средней линии. Особое преимущество такого метода контрольных нарт заключается в том, что он позволяет обнаружить медленно накапливающиеся изменения еше до того, как они отрицательно скажутся на процессе.
Некоторые типичные структуры контрольных карт показаны на рис. 12.1. Фальсификации, возможные при ведении контрольных карт, часто очень легко обнаруживаются. Если точки, которые должны были бы лежать за пределами контрольных границ, искусственно переносятся внутрь этих границ, то получаются скопления точек около контрольной границы.
Тогда рядом с максимумом у средней липни часто получается еше один максимум как раз около границы. В описанном методе контрольных карт предполагается значимость стандартного отклонения временного ряда, т. е. флуктуации внутри временнбго ряда должны быть в основном обусловлены стандартным отклонением рм (например, флуктуации показателей качества). Относительно р ошибка анализа еА (с ~А степенями свободы) должна быть пренебрежимо мала. В предположении мА с рм проверяют в соответствии с неравенством (7.36) гипотезы: мА Х (1 Р УА) УА Прн выполнении этого неравенства можно считать с вероятностью Р, что ошибка анализа мА относительно о пренебрежимо мала, Если вместо ре известна только ее оценка е (с ~,. степенями свободы), проводят проверку по Р = (м,/еА) н сравнивают с Р = (Р = 0,99;те; гА) [уравнение (7,1)).
Толь- 209 1Д1. Ояясаяяе стохастяческях временяйх рядов Верхняя конт- рольная граница Средняя линия Нинсняя конт- рольная граница Процесс управляем Процесс искусственно яукорачивается",хотя он неуправляем Медленнмй временной дрейф Процесс неуправляем Разрыв Подозрение на большее чем случайное изменение Периодичность Рис. 12.1. Типичные рисунки контрольнмх карт. ко в том случае, если ошибкой анализа лд можно пренебречь, контрольные карты можно вести в соответствии с рис.
12.1, в противном случае к каждой точке нужно уназывать доверительный интервал (Р = 0,95), рассчитанный из лд 1т. е. вместо простой точки ° вносить в контрольную карту ~). Выход за пределы контрольных границ вверх или вниз достигается только тогда, когда соответствующая точка, включая ее доверительный интервал, лежит вне зто" границы. В предположении, что процесс протекает без смещения, по п измерениям вре менного ряда л;(1) можно прогнозировать будущее (еще не измеренное) значение Глава И.
Дискретные вреыеннйе ряды 210 х'„+д(1). А именно [13): н †х„'+1(1) = К Е х,(1Н1 — К)" '(9=01,2. Пс) 1ин-$ Каи(1) + К(1 — К)вн-3(1) + К(1 К) ан-2(1) + +К(1 — К) э -з(1) (12.2) К = 2/(пц + 1) (12.3) Длина интервала сглаживания оказывает решающее влияние на прогнозируемое значение. Большой интервал сглаживания уравновешивает флуктуации во временном ряду для прогноза, а прогнозируемое значение будет близко к средней линии временнбго ряда при меньшей дисперсии прогноза. При коротком интервале сглаживания прогнозируемое значение быстрее реагирует на флуктуации значений временного ряда при безусловно более высокой дисперсии прогноза.
Подходящий интервал сглаживания целесообразно подбирать экспериментальным путем в ходе предварительного исследования (наиболее часто встречающееся стартовое значение пц = 20). [12,1) В одном процессе полцмеризации с интервалом в 4 часа были измерены и = 10 выходов (в %): 10 — 8 — 11 — 12 — 13 — 9 — 8 — 7 — 11 — 10. Отсюда для интервала сглаживания но = 9 (и соответственно К = 0,2) получи- лось следующее прогнозируемое значеиие длн одиннадцатого результата (из равенства (12.2): х[, = 0 2[10+0 8 11+0 8 '7+О 8~'8+0 8 '9+ +0,8 13+ 0,8 12+0,8 11+ 0,8 ° 8) = 8,42 Прн интервале сглаживания но = 3 (К = О, 5) получается близкий прогноз (з[1 = 8, 38).
Оба прогнозируемых значения хорошо подтвердились в последующем измерении (хы = 9%). После измерения хы была введена в процесс актнвхрующая добавка, что привело к более высоким выходам. Прогнозируемые значения, вычисленные с но = 9 и ио = 3, и также измеренные выходы дают следующую картину: 12 13 14 15 8,40 8,39 8,67 8,90 8,00 9,50 9,13 9,50 12 10 14 10 Предварительно вычислено црн Впоследствии измерено но =9 но =3 При этом скользящее среднее К взвешивает отдельные значения временного ряда для прогнозируемого значения э'„+7(1). Эти веса уменьшаются по экспоненте с "возрастом" значения. Поэтому такой тиц распределения весов называют экспоненциальным сглаживанием, Ожидаемое значение, производное от экспоненциально сглаженных данных, соответствует ожидаемому (предсказываемому) результату наблюдений. Дисперсию экспоненциального среднего получают из дисперсии процесса [уравнение (12.1б)[ в виде К/(2 — К)ат.
Оценка текущего среднего К зависит от ллины интервала сглаживания (пс-число измерений) по формуле: 211 Ы.З. ВЫяелеияе детермииироваяиыя компонентов Значения, которые были вычислены прн по = 9, не учитывают тенденцию увеличения выхода более чем на 4%. А прогноз прн по = 3 уже прнспособнлся к новой ситуация по последним нзмеренням, но имеет большой разброс. 12.2. Выделение детерминированных компонентов Во временнбм ряду могут содержаться в качестве детерминированных компо- нентов скачкй, периодичности или дрейфы. Скачки выявляют с помощью 2- критерия (см. разд. 7.3). При этом проверяется разность между двумя средними значениями по формуле («1(2) «2( )~ п1п2 ч +. (12.4) где в — рассеяние процесса, п1 + пт — число измерений, относящихся к обоим периодам.
Периодичности во временном ряду можно определить с помощью критерия знаков (см. разд. 7.5), Центрированный временнбй ряд делят на два отрезка, по возможности одинаковой длины (п, и пц п/2). Оба этих отрезка упорядочивают таким образом, чтобы положения максимумов и минимумов коррелировали как можно лучше. Длп каждой отдельной пары значений «(2) и «~1(с) составляют выражение знак (1)(«~(1) « ~(2)], 1 = 1,2,... и п/2 (12.5) Значимый перевес положительных знаков (выражение (7.20)) может служить указателем периодичности.
В коротких временных рядах можно определить периодичность с помощью критерия серий Вальда-Вольфовица (см. разд. 7.5). Для обнаружения дрейфа (тренда) во временнбм ряду используют критерий на дрейф Нойманна. При этом в качестве нуль-гипотезы проверяют, зависимы ли результаты измерений в предыдущем временном ряду друг от друга, т. е. есть ли временной дрейф. Для этого строят; и 1( )2 ~ 2 — 1( )2 2(„1) п~» 2 Д «,) и сравнивают с Р(Р;и) (см, табл, 12.1). В отличие от только что описанного критерия (ср. гл. 7) нуль-гипотеза отклоняется, если В лежит ниже О(Р; п) (т. е. 12 < 0(Р; и)).
Отклонение нуль-гипотезы подтверждает наличие дрейфа во временнбм ряду. В качестве приближения в области 10 ( и < 30 можно использовать: Р(Р = 0,95; п) нз 0,02п+ 0,88 0(Р = 0,99; п) и 0,035п+ 0,11 (12.2) Для внутреннего контроля в аналнтнческой лабораторнн ежедневно но два раза вводили контрольную пробу известного содержання. В течение одной декады Описанная здесь модель ограничена процессами без дрейфов.
Однако прогноз возможен также и для процессов с дрейфами. Для этого надо обратиться к дополнительной литературе (см. в конце главы). 212 Глава 12. Дяскретяые времевнйе ряды Таблица 12.1. Критические зиачеиия для критерия дрейфа Нойманна е Р 0,95 Р 0,99 4 0,78 0,59 5 0,82 0,42 6 0,89 0,36 8 0,98 0,40 10 1,06 0,48 12 1,13 0,56 14 1,18 0,62 16 1,23 0,68 18 1,27 0,74 20 1,30 0,79 25 1,37 0,88 30 1,41 0,96 35 1,49 1,08 иолучились следующие разности (в % Сн) между кайдеккыми значениями к задаяной величиной: — 0,002 — 0,003 +0,001 кО -0,002 кО +О, 001 +О, 001 +О, 003 +О, 004 Из рассмотрения графика возникает подозрение о тендендки к положителькым значениям, а следовательно, и о наличии положительной скстематической ошкбкк. Проверка дрейфа (уравнекие (12.6)) дает (х — хом) = 3,2 10 1 з = 2,21.
10 з В = 3,2 10 ~/(9 4,88 10 ) = 0,73 Это значит (см. табл. 12Л) ' 73(Р = О, 95, к = 10) = 1,06 > В = 0,73 > Р(Р = 0,99, к = 1О) = 0,48 По правилам из равд. 7.1 надо иризиать, что иодозренке о скстематической положительной ошибке (а следовательно, и о снижении качества аналитической работы) имеет основание. С помощью эмпирического приближения 0(Р = О, 05с и) хз О, 02п+ О, 88, данного в табл. 12.1, уравнение (12.6) можно преобразовать в [вт(п — 1)ЦО, 02к+ О, 88) Е,"=~'(х — *.+ )' При этом Св > Цш0,03) означает, что во временибм ряду надо ожидать наличия тренда (дрейфа). Такая оценка в области 10 с к < 30 не требует использования таблицы.
213 12.2. Выделеняедетермнннрованных компонентов Быстрее всего обнаружить дрейф позволяет критерий знаков (равд. 7.5). Временной ряд (т значений) делят пополам и вычитают соответствующие значения первой половины из второй. Проверяют, нет ли среди знаков разностей 4 перевеса каких-либо одних аманов. Тогда можно говорить о восходящей или нисходящей тенденции во временнбм ряду. Эту проверну выполняют по пн = п/2 разностям. Поэтому значения временнбго ряда используются с меньшей эффективностью.
Следовательно, этот метод проверки лучше использовать при длинных рядах измерений. Здесь благодаря своей простоте он оказывается особенно выгодным. Детерминированные компоненты во временных рядах можно особенно наглядно и эффективно выделить с помощью метода кумулятивных карт (метода "ку-сумм", или "сп-вшп") [1]. Для последующей оценки временнбго ряда образуют разности со средней линией Ы,(1) = х,(1) — х(1) (12.7) При текущей оценке временного ряда вместо средней линии берут требуемое число х'. И,(1) = х,(1) — х' (12.7а) Эти разности постоянно суммируются с учетом знака.
Затем полученная от начала наблюдений (1 = 0) до соответствующего момента времени (1 = 1,) сумма разностей Р наносится на график, т. е. с=ь (12.8) Пока отдельные разности И,(1) случайно рассеиваются под влиянием только о, кумулятивная сумма остается постоянной во времени. Если в показателях качества появляются отклонения от среднего или заданного значения, они действуют на кумулятивную сумму Р(1) и вызывают ее отклонение от постоянного значения в ту или другую сторону. При правильном выборе масштаба в изображении "ку-сумм" даже небольшие смешения — где-то в пределах жо .
— можно распознать уже через несколько точек. Контрольные карты для таких кумулятивных сумм разностей (метод "ку-сумм" ) целесообразно строить так, чтобы величина 2а на оси ординат и временной отрезок между двумя измерениями на оси абсцисс имели одинаковый масштаб. При таком выборе случайные колебания проявятся так, что небольшие смещения ку-сумм в пределах ж2а дадут линию под углом 45' относительно горизонтали. Характер прямой линии постоянно проверяется при каждой новой точке на графике с помощью Ч-образной маски. Для предложенного здесь масштаба по осям абсцисс и ординат угол маски составлнет 14', а последняя, подлежащая проверке, точка находится на расстоянии и = 8 единиц времени от вершины угла.