К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 48
Текст из файла (страница 48)
В соответствии с высотой этой запыленности на графике получктся "карта местностн" с различной окраской (рмс. 12.7,е). Можно сделать выводы о распространении запыленностм мо площади н мере ее роста. 12.3. Корреляция внутри временного ряда Между и значениями временнбго ряда, полученными через равные промежутки времени, существует более или менее выраженная зависимость. Ее можно описать как зависимость от сдвига во времени 1с Ьс значений (й = О, 1,2...) функцией автокорреляции (ФАК).
Для вычисления ФАК сначала центрируют временнбй ряд по формуле х,(1) — х(1) = х„(С) (12.13) где х„(1) — центрированные значения временного ряда, х(1) — средняя линия [уравнение (12.1)] для й ча п(1с = О, 1, 2,...), и вычисляют функцию автоковариации (ФАС) [5) по формуле 1 и-Ь суэс(~) — ~~ хю(1)Хсбзэ)(1) с=1 (12.14) ФАС соответствует ковариации [уравнение (92)) для у = х,+1 и х = у = О. Значение функции Ф (й = 0) — дисперсия процесса оз [уравнение (3.2б)]. Из ФАС получают функцию автокорреляции по формуле: (12.15) Р„(й) = су„(1с)/чс,(/с = О) В приближении 2.,"= " х.*(1) х*(+ь)(1) Р*е (сС) ФАК соответствует коэффициенту корреляции [уравнение (9.0)] для у = х,+ь; х = у = 0 и з, = з„.
ФАК вЂ” четная фуннции с максимумом при р„(й = 0) = 1. Обычно рассматривают только часть при 1 > О. С ростом сдвига х (= увеличение расстояния между измеренными значениями во временнбм ряду) уменьшается Р (й). Сдвиг, необходимый для затухания до значения функции Лежащее в основе этой модели предположение о линейных зависимостях приводит к значительному упрощению. Поэтому такая модель особенно применима для определения тенденций.
В целом же она применима для интерпретации двумерных значений (например, распределение элементов на поверхности, см. дополнительную литературу). Глава О2. Дискретные времевмйе рады 0 $, мес е Юг) О. -тО б) Рис. 12.7,а,б. (Продолзксние см. на с. ООО.~ 223 128. Корреляция внутри временного ряда +15 +10 1987 1984 1985 1986 и) Рис.
12.7. Амализ распределений из времемных рядов. а — временные ряды для омределемия заиылеммости в трех разных местах; б — периоды содермсамий; е — изобраисеине в виде "географической карты". при дисп.рис(1с) = — ~ — (1 — р ) — 2бр (1+ р вь 2в) р2 1 -(А — С) и (12.19) причем р=е у* (12.20) Значения (А — С) для малых б дает табл. 12.3. Значения функции р и((с) внутри доверительного интервала (для двух- или односторонних ограничений!) не считаются значимыми. Вид ФАК прямо зависит от характеристики временного ряда. ФАК стохастического ряда экспоненциально падает до значения, равного нулю.
В простейшем случае такую характеристику можно описать в виде: рее(1с) = е (12.21) 1/е, обозначается как постоянная времени б„а соответствующее время — как период (интервал)корреляции Т,. Итак, Т, = к,Ы (12.17) Два измеренных значения х(1) и х;41(1), отстоящие во времени дальше, чем Ы ) Т„считаются некоррелированными. Поэтому во временнбм ряду должно быть Ы = Т,. Граница доверительного интервала ФАК определяется (б) как < а~-о) = игьГ~Й-Ф~ (12,18) 224 Глава 12.
Дяеярегяые времеяяйе ряды 1с 8, 0,5 $, 1 8, 2 lс, 3 lс, 5 О 0 0,406 4 0,315 7 0,6976 0,5742 1,111 7 0,996 3 1,370 2 1,3166 1,5292 1,5583 1,6256 1,7400 1,6$3 3 1,875 7 О 0 О 0 0,5 0,$72 7 0,679 8 0,4949 1 0,990 8 0,929 9 0,795 1 2 1,0176 1,1026 1,1531 3 1,0185 1,1379 1,3257 4 1,01$5 1,144 5 1,406 3 5 1,0185 1,145 7 1,442 9 6 1,0185 1,145 8 1,4591 (12.22а) и центрируют в соответствии с ям(1) = в,'(1) — а — Ь, (12.22б) Для временных рядов со скачками точно так же центрируют каждый отдельный сегмент и затем объединяют отдельные отрезки.
После этого динамика внутри временного ряда должна стать постоянной. Возможные различия в распределении частот в двух половинах ведут к изменениям числа 9, значений, расположенных между экстремумами. Подсчитывают зти значения в обеих половинах (~ 9,1 и ~ 9,2). При точном делении на две половины временнбго ряда (- пс = яц значений) проверяют по уравнению (7.22): и= ' -~и(Р) ! Е 9сс — Е 9сг~ (12. 23) 9сс + 1 9сг В случае независимых измерений во временнбм ряду ("чисто случайный процесс" ) ФАК падает до нуля уже при Ь < 1 (Ь, < Ь) и затем случайно колеблется вокруг этого значения (рис.
12.8,а). Если соседние значения зависят друг от друга (рис. 12.8,6), то между экстремальными значениями временного ряда появляются еще другие промежуточные значения (" процессы с памятью"). Это ведет к ФАК с (с, > (с (а также Т, > сзг). Постоянная (с, растет по мере роста числа точек между экстремумами, т е по мере замедления флуктуирования значений временнбго ряда. Интервал корреляции Т, таким образом служит мерой динамики временнбго ряда. Во временных рядах с дрейфом (рис.
12.8,в) значение функции для (с, устанавливается только эа очень долгое время, поэтому не удается получить оцениваемых ФАК. Периодичности (или периодические прыжки) во временнбм ряду (см, рис. 12,8,в) приводят к периодической ФАК с идентичным периодом и к времеинбму ряду с соответствующей амплитудой (например, я = в)пг — рее = асовг;я = 2в(пг — р = 2асовг).
Из сильно возрастающего периодического временнбго ряда получают невозрастающую периодическую ФАК. Для вычисления ФАК требуется достаточно большое число значений (п > 180). При центрировании необработанных данных надо заодно корректировать возможно имеющийся дрейф ("нестационарный процесс"). Для этого временнбй ряд вс линеаризуют [уравнение (9.18)]' я',(1) = а+ Ь, 225 12.3. Корреляция влутри времемибго ряда а) 113В в 0 О б) 9211 е О О 2 в) 9311 Рис. 12.8. Временные ряды х(1) и соответствующие функции автокорреляции. а— независимые измеремия х(1); б — зависимые измереиия х(1); в — времеммбй ряд с дрейфом; е — зашумлеммая периодическая функцкя.
При этом не должно быть никакой значимой разницы [и < и(Р = О, 95)]. В случае значимой разницы между 2 9,1 и 2 ' 9,7 (а также в случае нелинейности самого ряда) надо применять соответствующие фильтры (7, 8]. (12.6] Для дистилляциоммой коломки с интервалом ЙС ш 3 ч определяли содержамие ароматических веществ в головной фракции. Из 240 значений, получемпых в течемие месяца, миже приводятся первые тридцать (% суммы ароматических веществ) 7,12 — 7,24 — 6,86 — 6,88 — 6,70 — 7,02 — 7.24 — 7,46 — 8,08 — 7,90- 7,32 — 7,14 — 7,06 — 7,48 — 7,60 — 7,82 — 7,24 — 7,46 — 7,18 — 7,00- 6,92 — 6,84 — 7,36 — 7,68 — 7,60 — 7,32 — 7,84 — 8,06 — 8,28 — 8, 10 По этим данным надо найти интервал корреляции Т, процесса дистилляции. 1.
центрирование и корректировка дрейфа Линейная регрессия по уравнениям (9.16) и (9.17) ведет к х,(1) = 7, 00+ 0,02ь 1, 1, (Ы11 1 е ], Глава 12. Дмскретмые времемяйе ряды После этого измерения центрируются и проводится корректировка дрейфа (уравяемие (12.22)]: хм(Г) ы хю(Ф) — О, 02а — 7, ОО Получклись следующие значемия; +0,1 + 0,2 — 0,2 — 0,2 — 0,4 — 0,1 + 0,1 +0,3 +0,9 +0,7 + 0,1 -0,1 — 0,2 +0,2 +0,3 +0,5 — 0,1 +0,1 -0,2 — 0,4 — 0,5 — 0,6 — 0,1 +0,2 +0,1 — 0,2 +О,З +0,5 +0,7 +0,5 Для упрощения последующих вычислений проводим преобразование Хн(1) = 10хь,(Ф) 2. Вычисление ФАК Вычисление р„,(8) происходит в соответствии с уравнениями (12.14) — (12.16). й ЕХвйм в 'в-8 и (8) 6 [ур.(12.14)[ [ур.(12.15)) Из графического представления (рис.
12.9) получается (с, = 1,67 и, следовательно, интервал корреляции (уравнение (12.17)] равен Т, = 1,67 3 = 5 ч. 3. Яоеериюельнмй интервал (Р ы О, 95) Смачзла вычисляют р = е 'Гны~ гл 0,5488 (уравнение (12.20) ('-'- Зтдт = 1,8619) (м А) [уравнение (12.19)] Дальнейшие вычисления проводятся в соответствии со следующей схемой: рм 1-Ры (й 23рм ~В- С) ( В) 1,65 [7 30 0 0 0 0 0,6981 1,3019 0,603 $ 0,251 7 0,9088 1,6950 0,3646 03475 0,9725 1,8137 0,1651 О,ЗМО 09917 1,8495 00665 04023 09975 1,МОЗ 00251 04081 0,9992 1,8636 0,0091 0,4102 Графическое представление Ьрел(й) (рис.
12.9) показывает, что змачение функции Р**(4,) лежит вие границы обнаружения (Р = 0,95). интервал корреляции Й„равный Тс = 5 ч, нельзя поэтому использовать в качестве показателя динамики процесса дистиллЯции. Рис. 12.9 демоистРиРУет далее сильиУю зависимость ЬР л(8) от числа 415 264 90 -51 -83 -54 -4$ о ~з ре рб рз рп 30 29 28 27 26 25 24 13,383 3 9,1034 3,214 3 -1,8888 -3,192 3 -2,160 0 -1,9167 1,0000 0,658 1 0,240 2 -0,1411 -0,238 5 -0,1614 -0,143 2 12.3. Корреляния внутри времеяибго ряда 227 ! 9хх00 0 Рис. 12.0. Функция автокор- реляцки к доверительяый ин- тервал (и = 20 и и ж 240) к примеру [12.6]. значений (а значит, часто затрудненный вывод функции автокорреляцни из временного ряда с малым числом измерений), (12.24) 9ж( -«)/р (12.7) На рис.
12.8,6 временибй ряд образован из о = 17 значений, он содержит р ж 6 экстремальных значений. Следовательно, 8 = (17 — б)/б = 1,83 ж 2. Промежуток времени между измерениями, нредусмотреииый для оценки корреляционной функции, пока нельзя рассматривать как достаточный. Для временнбго ряда из рнс. 12.8,о точно таким же образом получается д = О, 18. (Первое значение ие учтено, так как его невозможно однозначно упорядочить относительно экстремального значения.) Низкое значение д указывает на то, что времеинбй ряд состоит из независимых значений. Корреляция значений внутри временнбго ряда позволяет сделать прогноз о будущем (еще не измеренном) значении я;+ь(1) на основании измеренного значения х;(1). Знал интервал корреляции Т„можно указать пределы обнаружения в зависимости от 1с (9 = 1, 2...), внутри которых значение я;+ь(1) следует ожидать с вероятностью Р.