Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 71
Текст из файла (страница 71)
. . , xn совокупность из n − 1пар: (x1 , x2 ), (x2 , x3 ), . . . , (xn−1 , xn ). Первый элемент каждой пары,в силу стационарности, мы можем рассматривать как реализацию слу"чайной величины Xt , а второй — как реализацию случайной величиныXt+1 . Тогда, согласно (9.17) оценка коэффициента корреляции междуXt и Xt+1 может быть записана в виде:n−1t=1 (xt − x(1) )(xt+1 − x(2) )r 1 = ,.(11.16)/,n−1n−122t=1 (xt − x(1) )t=1 (xt+1 − x(2) )гдеx(1) =n−1t=1xt /(n − 1),x(2) =nОбратим внимание читателя, что точность приближения (11.18)заметно снижается с ростом лага k, как в силу ухудшения точностииспользованных выше замен, так и в силу уменьшения числа наблю"дений используемых для вычисления оценки rk Поэтому на практикеобычно ограничиваются изучением небольшого числа первых членовавтокорреляционной функции.
Вряд ли имеет смысл рассматриватьоценки rk при k > n/4.Функцию rk аргумента k при k = 1, 2, . . . называют выборочнойавтокорреляционной функцией или, если не возникает недоразуме"ний, просто автокорреляционной функцией. (При k = 0 r k по опре"делению равно 1 и это значение обычно исключают из рассмотрениякак не несущее никакой информации.) В англоязычной литературеэту функцию также называют сериальной корреляцией. График выбо"рочной автокорреляционной функции называют коррелограммой. Наэтом графике (см.
рис. 11.3) кроме значений самой функции, обычноуказывают доверительные пределы этой функции в предположении, чтозначения автокорреляционной функции равны 0 для всех k = 0. Болееподробно об интерпретации графика выборочной автокорреляционнойфункции будет рассказано ниже при рассмотрении роли коррелограммыв практическом анализе временных рядов (см. п. 12.4.2).xt /(n − 1),t=2соответственно оценки средних значений величин Xt и Xt+1При больших значениях n, учитывая что x(1) ≈ x(2) ≈ x и n/(n−1) ≈1, выражение (11.16) часто заменяют гораздо более простым:n−1(xt − x)(xt+1 − x)r 1 = t=1n.(11.17)2t=1 (xt − x)Аналогичным образом может быть определена оценка корреляциимежду Xt и Xt+k или k"го члена автокорреляционной функции rk :n−k(xt − x)(xt+k − x)r k = t=1n.(11.18)2t=1 (xt − x)353Рис.
11.3. Коррелограмма с доверительными интервалами (приравенстве нулю автокорреляционной функции для всех k = 0)Свойства. Изучение свойств выборочных оценок автокорреляцион"ной функции временного ряда — в общем случае довольно сложная идо конца не решенная задача.М.Бартлетом в 1946 г. для случая бесконечного дискретного времен"ного ряда (−∞ < t < ∞) было указано выражение дисперсии оценки354rk для гауссовского процесса:Dr k =t=∞# 2$1r + rt−k rt+k − 4rk rt rt+k + 2rt2 rk2 .n t=−∞ tтельной трубки. Это обстоятельство также затрудняет интерпретациюкоррелограммы.(11.19)Этот результат показывает, что мы не можем оценить по конечномуотрезку временного ряда дисперсию оценки rk , так как она зависитот бесконечного неизвестного числа автокорреляций rt .
Поэтому напрактике приходится довольствоваться лишь приближениями для вы"ражения (11.19).Другая проблема изучения свойств совокупности оценок r k связанас тем, что оценки с различным лагом k коррелированы между собой.Это заметно затрудняет интерпретацию коррелограммы. Не касаясьболее подробно этих и других проблем (см.
[37], [51]), укажем свойстваоценок rk для наиболее простого и практически важного случая. Аименно, рассмотрим свойства оценок автокорреляций для временногоряда, являющегося стационарной последовательностью независимыхнормально распределенных случайных величин или, другими словами,гауссовским белым шумом (см. п. 11.7). В этом случае для любых k, неравных нулю, по определению rk = 0.
Таким образом, все слагаемые,стоящие под знаком суммы в выражении (11.19), равны нулю, кромеr02 = 1. Отсюда дисперсия rk равна:Dr k =1nПериодограмма. Завершая рассказ об оценках основных числовыххарактеристик временного ряда, кратко остановимся на периодограмме — характеристике, особенно полезной для анализа временных рядов,допускающих представление в виде полигармонических моделей (11.5).Многие временные ряды, возникающие в физических и техническихприложениях, удобно рассматривать не во временной области значенийаргумента, а в частотной. Этот переход можно совершить с помощьюпериодограммы. Ее назначение — обнаружение периодических соста"вляющих в рассматриваемом ряде.
Первое представление о наличиитаких составляющих может дать обычный график. Если стационарныйвременной ряд на графике ведет себя более гладко и регулярно, чемгауссовский белый шум (см. рис. 11.1д), то можно предположить, чтов нем есть периодические составляющие.В настоящее время определение периодограммы часто используетпонятие спектральной плотности, но так как это понятие не рассматри"вается в настоящей главе, мы дадим определение периодограммы в томвиде, как оно было предложено А.Шустером в 1898 г.Пусть xt — временной ряд с нулевым средним, а t пробегает целыечисла от 1 до n. Рассмотрим ковариацию ряда xt с рядами cos(2πt/λ)и sin(2πt/λ), где λ — некоторая фиксированная величина, обычноименуемая периодом, или длиной волны.
Пусть:22πtxt cos,n t=1λnОбратим внимание на то, что оценка rk в форме (11.18) являетсясмещенной. Можно показать, что M r k ≈ − n1 , однако величина этогосмещения стремится к нулю с ростом объема изучаемого ряда и нестоль существенна в прикладном анализе.Другим важным свойством оценки rk является ее асимптотическаянормальность при n → ∞.Таким образом, для каждого отдельного значения r k мы мо"жем указать√ приблизительный 95% доверительный интервал в виде:−1/n ± 2/ n. Границы этого доверительного интервала обычно нано"сятся на график коррелограммы и называются доверительной трубкой.Они в определенной мере позволяют судить о том, насколько изучаемыйпроцесс напоминает белый шум. Указание 95% доверительных границдля каждого коэффициента автокорреляционной функции в отдельностине означает, что с 95% вероятностью все рассматриваемые оценки r kодновременно попадают в доверительную трубку.
Так, рассматривая 20первых оценок r k для гауссовского белого шума, довольно часто можнонаблюдать, что одна или две из оценок выходят за границы довери"355A=22πtxt sin.n t=1λnB=Введем величину S 2 (λ):S 2 (λ) = A2 (λ) + B 2 (λ)Определение. График зависимости S 2 (λ) от длины волны λназывается периодограммой.По замыслу, функция S 2 (λ) должна принимать большие значения(иметь локальные максимумы — пики) для тех значений λ, которыеявляются периодами для имеющихся у ряда xt периодических соста"вляющих. Практически это далеко не так, и часть максимумов S 2 (λ)к реальным периодам ряда xt не имеет отношения. Вообще анализпериодограммы очень часто ведет к ложным выводам, и потому к немунадо подходить с осторожностью.
Эти вопросы подробно освещены влитературе по спектральному анализу временных рядов. (Смотри, вчастности, критический анализ в [75] и в гл. 4 книги [97].)35612•"…… : …ƒ•12.1. …ƒ …… Кратко опишем общий порядок прикладного статистического анали"за временных рядов. Обычно целью такого анализа является построе"ние математической модели ряда, с помощью которой можно объяснитьповедение ряда и осуществить прогноз его дальнейшего поведения.Построение и изучение графика.
Анализ временного ряда обыч"но начинается с построения и изучения его графика. Если нестацио"нарность временного ряда очевидна, то первым делом надо выделить иудалить нестационарную составляющую ряда. Методы, используемыедля этого, описаны в п. 12.3. Процесс удаления тренда и других компо"нент ряда, приводящих к нарушению стационарности, может проходитьв несколько этапов.
На каждом из них рассматривается ряд остатков,полученный в результате вычитания из исходного ряда подобранной мо"дели тренда, или результат разностных и других преобразований ряда.Кроме графиков, признаками нестационарности временного ряда могутслужить не стремящаяся к нулю автокорреляционная функция (за ис"ключением очень больших значений лагов) и наличие ярко выраженныхпиков на низких частотах в периодограмме.Подбор модели для временного ряда. После того, как исход"ный процесс максимально приближен к стационарному, можно при"ступить к подбору различных моделей полученного процесса. Цельэтого этапа — описание и учет в дальнейшем анализе корреляцион"ной структуры рассматриваемого процесса.
При этом на практикечаще всего используются два типа моделей: параметрические моделиавторегрессии"скользящего среднего (ARMA"модели) и полигармониче"ские модели (см. п. 11.6). ARMA"модели мы будем рассматриваитьв главе 14, а описание способов подбора полигармонических моделейможно найти в книгах [37], [75], [87], [123].Модель может считаться подобранной, если остаточная компонентаряда является процессом типа белого шума (см. п. 11.7, 11.9). Послеподбора модели обычно выполняются:357оценка дисперсии остатков, которая в дальнейшем может бытьиспользована для построения доверительных интервалов про"гноза;анализ остатков с целью проверки адекватности модели.Прогнозирование или интерполяция.