Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 73
Текст из файла (страница 73)
Метод наименьшихквадратов состоит в том, что мы выбираем функцию тренда так, чтобыn[xti − f (ti , θ)]2 → minθi=1Для временных рядов типично, что статистические предпосылки ре"грессионного анализа, как они перечислены в (8.2), (8.3), выполняютсяне полностью. Это особенно касается предположения о независимостислучайных отклонений. Для временных рядов характерна именно вза"имная зависимость его членов (по крайней мере, не далеко отстоящихпо времени). Тем не менее, оценки тренда и в этих условиях обычнооказываются разумными, если выбрана адекватная модель тренда и еслисреди наблюдений нет больших выбросов. Упомянутые выше наруше"ния предпосылок регрессионного анализа сказываются не столько назначениях оценок, сколько на их статистических свойствах.
Так, приналичии заметной зависимости между членами временного ряда оценкидисперсии, основанные на остаточной сумме квадратов (8.10), дают не"правильные результаты. Неправильными оказываются и доверительныеинтервалы для коэффициентов модели, и т.д. В лучшем случае их можнорассматривать как очень приближенные.Это положение может быть частично исправлено, если применятьмодифицированные алгоритмы метода наименьших квадратов, такие каквзвешенный метод наименьших квадратов [50], или метод наименьшихквадратов для коррелированных наблюдений [27]. Однако для этихметодов требуется дополнительная информация о том, как меняетсядисперсия наблюдений или их корреляция.
Если же такая информациянедоступна, исследователям приходится применять классический методнаименьших квадратов, несмотря на указанные недостатки.Пример 1. Проиллюстрируем применение метода наименьших ква"дратов для данных об урожайности зерновых в СССР, представленныхв табл. 1.2 и на рис. 11.1а. Визуальное изучения графика данных по"зволяет предположить, что тренд этого ряда может быть задан в видепрямой линии trt = b0 + b1 · t. С помощью метода наименьших квадратовпо формулам, аналогичным (8.7) и (8.8), находим, чтоi = 1, .
. . , n(где x =nгде f — функция тренда (она обычно предполагается гладкой), θ — не"известные нам параметры (параметры модели временного ряда), а εi —3611xt ) ,n t=1nb̂0 = xb̂1 =362t(t+1)t=1 (xt − x) (t −2 )nt(t+1) 2t=1 (t −2 )(12.1).(12.2)В формуле (12.2) в качестве независимой переменной фигурируетвремя t.Для данных рассматриваемого ряда b̂0 = 5.868, b̂1 = 0.275. При этомкоэффициент b̂0 показывает среднюю урожайность зерновых в началь"ный (1945 г.) момент времени рассматриваемого ряда, а коэффициент b̂1дает оценку среднегодового прироста урожайности.
Подробная таблицарезультатов процедуры выделения тренда, а также дальнейший анализряда, приведены в главе 13, где рассматривается решение этой задачис помощью статистических пакетов ЭВРИСТА и SPSS.висимостью. Найдя с помощью метода наименьших квадратов значенияоценок коэффициентов b̂0 = 1675.33 и b̂1 = 3.722, и, вычтя значениятренда из рассматриваемого временного ряда, получим остаточную ком"поненту. Ее график приведен на рис. 12.2.Рис.
12.2. График ряда остатков, полученный в результатеудаления из ряда курса доллара линейного трендаРис. 12.1. График ряда остатков, полученный в результатеудаления из ряда урожайности зерновых в СССР линейного трендаНа рис. 12.1 дан график остатков временного ряда после удаленияиз него подобранной модели тренда trt = 5.868 + 0.275 · t.
Дальнейшийанализ полученного ряда (см. главу 13) показывает, что его уже можнорассматривать как последовательность независимых случайных вели"чин. Более того, для описания остатков можно применять гауссовскуюмодель, согласно которой их совокупность можно рассматривать каквыборку из некоторой нормальной совокупности (с нулевым средним).Последнее означает, что на базе подобранной модели тренда и моделислучайной составляющей (независимые ошибки) можно осуществлятьпрогноз будущих значений ряда и строить доверительную зону для про"гноза, используя оценку (8.11) дисперсии остатков.Даже визуальный анализ показывает, что остатки ведут себя не какпоследовательность независимых одинаково распределенных случайныхвеличин (сравните рис.
12.2, например, с графиком гауссовского белогошума на рис. 11.1д). Действительно, приведенные на рис. 12.3 гра"фики выборочной автокорреляционной функции и выборочной частнойавтокорреляционной функции (см. п. 14.3) показывают, что соседниезначения этого ряда сильно зависимы при значениях лага от 1 до 5. Придальнейшем увеличении значения лага зависимость исчезает. Как сле"дует интерпретировать графики указанных функций и что они означают,мы подробно расскажем ниже в п.
12.4.Пример 2. Поведение случайной компоненты, которое мы наблюда"ли в примере 1 — это скорее исключение, чем правило. Чтобы убедитьсяв этом, рассмотрим поведение случайной компоненты у курса долларавесной и летом 1994 г. (рис. 11.1б). График этого ряда позволяетпредположить, что его тренд также описывается простой линейной за"363Рис. 12.3.
a) – выборочная автокорреляционная функция ряда остатков,полученный в результате удаления из ряда курса доллара линейноготренда; б) – выборочная частная автокорреляционная функция того же ряда364Замечание. Как будет показано ниже в п. 12.4, такое поведение вы"борочной автокорреляционной и частной автокорреляционной функций харак"терно для процессов авторегрессии первого порядка (см.
п. 11.7 и 14.1). Уэтих процессов значение в момент времени t формируется из их значения впредыдущий момент времени с некоторым весовым коэффициентом (в данномслучае этот коэффициент равняется примерно 0.7) и независимой случайнойдобавки — белого шума.Простые разностные операторы. Наряду с методом наимень"ших квадратов, для удаления тренда можно использовать и ряд другихметодов. Одним из них является метод перехода от исходного рядак ряду разностей соседних значений ряда. В более общем виде этаидея описывается с помощью применения к ряду разностных операто"ров различных порядков. Эти методы сведения временного ряда к ста"ционарному являются частным случаем общего метода, предложенногоДж.Боксом и Г.Дженкинсом в 1970 году [17].
В целом, мы относимсяк разностным методам критически, но считаем нужным упомянуть оних. Они часто обсуждается в литературе и представлены во многихстатистических пакетах.ровать ряд остатков, полученный после удаления линейного тренда ме"тодом наименьших квадратов (рис. 12.1), чем ряд первых разностей. А вобщем случае, к сожалению, нельзя сказать, какой из этих двух методовудаления тренда предпочтительней. Все зависит от заранее неизвестнойструктуры случайной компоненты временного ряда εt .
Так, для времен"ного ряда с независимыми приращениями проще анализировать ряд егопервых разностей. Он будет представлять из себя просто белый шум.Определение. Процедура перехода от ряда xt при t = 1, . . . , nк ряду yt = xt − xt−1 = ∇xt при t = 2, . . . , n называется взятиемпервых разностей, а оператор ∇ называется простым разностнымоператором первого порядка.Рис. 12.4.
Ряд первых разностей для урожайности зерновыхЗаметим, что длина ряда первых разностей yt на единицу меньше,чем длина исходного ряда xt . Покажем, как действует разностныйоператор на временном ряде xt , содержащем простой линейный трендtrt = b0 + b1 · t :Аналогичным образом можно ввести разностный оператор второгои более высоких порядков. Так, простой разностный оператор второгопорядка преобразует ряд xt к ряду yt , гдеyt = ∇xt = xt − xt−1 == xt − 2xt−1 + xt−2 .= b0 + b1 t + εt − b0 − b1 (t − 1) − εt−1 = b1 + εt − εt−1(12.3)Из (12.3) видно, что в отличие от ряда xt , преобразованный рядyt уже не содержит тренда, однако структура случайной компоненты внем уже другая. Так, если εt была последовательностью независимыхслучайных величин, то последовательность εt −εt−1 , t = 2, .
. . , n, этимсвойством уже не обладает. Корреляция между соседними членами этойпоследовательности равна −0.5.Итак, удалить линейный тренд из временного ряда можно разнымиспособами: с помощью метода наименьших квадратов или с помощьюпростого разностного оператора первого порядка.На рис. 12.4 приведен график ряда, полученного в результате при"менения разностного оператора ∇ к ряду урожайности зерновых. Даль"нейшие исследования показывают, что в данном случае проще анализи"365yt = ∇2 xt = ∇(∇xt ) = ∇(xt − xt−1 ) = ∇xt − ∇xt−1 =Часто для записи разностных операторов используют оператор B«сдвига назад»: Bxt = xt−1 . При этом∇xt = (1 − B)xt ,∇2 xt = (1 − B)2 xt ,∇k xt = (1 − B)k xt .Ясно, что длина ряда ∇k xt на k единиц меньше длины исходного ряда.Простые разностные операторы более высоких порядков позволяютудалять из ряда полиномиальные тренды соответствующих порядков.Возможно, разностные операторы действительно пригодны для уда"ления трендов, особенно если не видна подходящая аналитическая мо"дель тренда.
Беда же метода разностных операторов в том, что невсегда ясно, как приложить к исходному временному ряду результатыстатистического анализа его разностей. В частности, это относится кзаконам распределения ошибок. К тому же эти разности могут иметь (и366часто имеют) гораздо более сложную статистическую структуру, неже"ли исходный ряд.
Рассмотрите, например, первые разности для процессаавторегрессии первого порядка. (Об авторегрессии см. п. 14.1.)12.3.2. "… ƒ…… <<Многие временные ряды, особенно экономические, содержат сезонные компоненты. Сезонные компоненты ряда могут как представлятьинтерес сами по себе, так и выступать в роли мешающего фактора. Вобоих случаях задача исследователя — выделить и устранить их из ряда.Для этого есть несколько способов. Их выбор обычно определяетсямоделью подбираемого временного ряда. Ниже мы рассмотрим две наи"более распространенных модели описания экономических временныхрядов.
Первая из них включает в себя тренд (trt ), сезонную (st ) ислучайную (εt ) компоненты:xt = trt + st + εt(12.5)Циклическая компонента ct в экономических временных рядах отражаетпериоды роста и спада экономической активности различной амплитудыи продолжительности. (Более подробно о каждой из компонент моделивременного ряда рассказано в п.