Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 76
Текст из файла (страница 76)
Соседние члены ряда скользящих средних сильно коррелированы, так какв их формировании участвуют одни и те же члены исходного ряда. Это можетприводить, к тому, что ряд скользящих средних может содержать циклическиекомпоненты, отсутствующие в исходном ряде. Это явление носит названиеэффекта СлуцкогоЮла (см. [52], [51]).3. В качестве метода усреднения, кроме упомянутых выше среднего арифме"тического и медианы, можно рассматривать взвешенные скользящие средние,когда значения исходного ряда суммируется с определенными весами. Подобныепроцедуры целесообразны, если изменение временного ряда во времени носитявно нелинейный характер.
Мы не будем более касаться этого вопроса. Онподробно изложен, например, в [51].377Оценка сезонных компонент. Предположим, что наблюдаемыйвременной ряд имеет структуру xt = trt +ct +st +εt , где trt +ct — тренди циклическая составляющая, st — сезонная составляющая, а εt —случайная составляющая ряда. Пусть p — период последовательностиst , так что st = st+p для всякого t. Пусть величина p нам известна. Мыхотим оценить значения st по наблюдениям xt .Порядок оценки сезонных компонент в этом случае, в целом, ана"логичен рассмотренному в п. 12.3.2. Только вместо оценки тренда ме"тодом наименьших квадратов мы будем использовать скользящее сред"нее в качестве совместной оценки тренда и циклической компоненты.Обозначим через x̂t скользящее среднее с периодом p, построенное поряду xt .
Для упрощения обозначений начнем нумерацию величин x̂t сединицы, так что ряд из скользящих средних есть: x̂1 , x̂2 , . . . , x̂k . Соот"ветственно изменим нумерацию исходного ряда так, чтобы величине x̂tсоответствовал член xt . (При этом приходится отбросить [p/2] первыхчленов исходного ряда, для которых значения x̂t не определены. Здесьчерез [p/2] обозначена целая часть от деления p пополам.)Ради простоты предположим, что k = (m + 1)p, где m — положи"тельное целое число. (Обратим внимание, что общая длина n исходногоряда при этом равна n = (m + 2)p при четном p и n = (m + 2)p − 1при нечетном p.) Для каждого сезона i, 1 i p, рассмотрим всеотносящиеся к нему разностиxi − x̂i , xi+p − x̂i+p , . . .
, xi+mp − x̂i+mp .(12.13)Каждое из этих отклонений xi от x̂i можно рассматривать какрезультат влияния сезонных изменений. Усреднение этих разностейдает нам оценку сезонной компоненты si . В качестве простейшейоценки можно взять простое среднее, т.е. положитьŝi =m+11 (xi+lp − x̂i+lp )m+1дляi = 1, . . . , p(12.14)l=1Как и выше (см. 12.7), вместо простого среднего можно взятьвзвешенное среднее, цензурированное среднее, медиану и т.д., дляуменьшения влияния резко выделяющихся наблюдений.Для мультипликативной модели временного ряда, когда xt = trt ·ct · st · εt целесообразно перейти к логарифмам yt = log xt . Тогдаyt = dt + gt + rt + δt , где dt = log trt , gt = log ct , rt = log st , δt = log εt .К ряду yt можно применить изложенную выше методику, начиная свычисления скользящих средних и кончая составлением оценки r̂i дляri .
Оценкой для исходной величины si = eri будет служить er̂i , если378log x — натуральный логарифм x, либо ŝi = 10r̂i , если наши логарифмыдесятичные.Удаление сезонной компоненты. Оно проводится так же, как и вразобранном выше случае. Для аддитивной модели удаление сезоннойкомпоненты сводится к вычитанию оцененной сезонной компонентыиз исходного ряда. Для мультипликативной модели эта процедуразаключается в делении значений исходного ряда на соответствующиесезонные индексы.Пример оценки и удаления сезонных компонент с помощью скользя"щего среднего рассмотрен ниже в главе 13 (пример 13.2к).
Этот примеррешается с помощью компьютерных программ SPSS и Эвриста.12.3.4. ƒ…… ƒ…… Рис. 12.10. Ряд сезонных разностей для продаж шампанскогоЕще один способ удаления сезонных компонент из ряда основанна использовании специальных разностных операторов, которые назы"ваются сезонными. Использование этих операторов особенно распро"странено в линейных моделях временных рядов типа авторегрессии"скользящего среднего (см.
главу 14).Пусть x1 , . . . , xn — реализация временного ряда, а p — период егосезонности.Определение. Процедура перехода от ряда xt (при t = 1, . . . , n )к ряду yt = xt − xt−p = ∇p xt (при t = p + 1, . . . , n ) называетсявзятием первой сезонной разности, а оператор ∇p называетсясезонным разностным оператором с периодом p.Преобразование xt − xt−p может быть также записано с помощьюоператора сдвига назад B в виде:yt = xt − xt−p = (1 − B p )xtНа рис. 12.10 изображен результат применения сезонного оператора∇12 к ряду месячных продаж шампанского за 7 лет. Длина полученногоряда сократилась на 12. Разброс значений полученного ряда суще"ственно сократился и в нем уже не просматриваются периодическиеколебания.Для этого ряда теперь можно попытаться подобрать, например, ли"нейную параметрическую модель типа авторегрессии"скользящего сред"него (см.
гл. 14). В случае успешного подбора модели можно осуще"ствить прогноз для ряда разностей. Этот прогноз может быть пересчи"тан и для исходного ряда.379Другим способом устранения сезонности может служить метод наи"меньших квадратов, в котором используется полигармоническая модель(11.5) для описания периодически повторяющихся сезонных эффектов.Сравнивая эти два подхода устранения сезонных эффектов, заметим,что метод сезонных разностей значительно проще и наглядней.Сезонные операторы более высоких порядков. Как и в случаес простыми разностными операторами (см. п. 12.3.1), иногда бываютполезны сезонные операторы более высоких порядков. Так, сезонныйоператор второго порядка с периодом p задается соотношением:∇2p xt = ∇p (∇p xt ) = ∇p (xt − xt−p ) = xt − 2xt−p + xt−2pили, с помощью оператора сдвига назад B:∇2p xt = (1 − B p )2 xt = (1 − 2B p + B 2p )xt .Смешанные разностные операторы.
Выше указывалось, чтопростые и сезонные разностные операторы могут быть использованысоответственно для удаления тренда и сезонной компоненты из вре"менного ряда. Если временной ряд одновременно содержит обе этикомпоненты, то их удаление возможно с помощью последовательногоприменения простых и сезонных операторов. Нетрудно убедиться, чтопорядок применения этих операторов не существен:∇∇p xt = ∇(xt − xt−p ) = (xt − xt−1 ) − xt−p − xt−p−1 ) = ∇p ∇xt .Замечание. Существуют и другие методики оценивания и учета сезон"ных эффектов.
Часть из них опирается на совместное использование методоводнофакторного анализа и анализа временных рядов. Другие используют обоб"щенные сезонные модели процессов авторегрессии"скользящего среднего. Мыне будем останавливаться на этих вопросах.38012.3.5. ƒ… ;К преобразованиям значений временного ряда (точнее — к преобра"зованиям той шкалы, в которой измерены значения временного ряда)прибегают обычно по двум причинам: либо для того, чтобы приблизитьраспределение к нормальному (например, избавиться от его скошенно"сти), либо для того, чтобы сделать дисперсию временного ряда болеепостоянной (иными словами, стабилизировать дисперсию временногоряда).Пусть переменная x употребляется для записи значений временногоряда. Рассмотрим преобразование x в y по правилу y = f (x), где f обо"значает некоторую определенную функцию.
(Обычно f — монотоннаяфункция; тогда от значений y можно однозначно вернуться к значениямx.) Применяя преобразование f к каждому члену ряда xt , мы получимновый временной ряд yt = f (xt ).Логарифмическое преобразование. Чаще других используемоепреобразование — логарифмическое, когдаy = log x,либоy = log(x + c),где c — некоторая постоянная величина, выбор которой находится враспоряжении исследователя.
При логарифмическом преобразованииyt = log(xt + c).Логарифмическое преобразование можно применять только к по"ложительным величинам. В тех случаях, когда часть членов ряда xtотрицательна, перед переходом к логарифмам ко всем членам ряда при"бавляют постоянную c, добиваясь того, чтобы xt + c > 0 при всех t.Посмотрим, как действует логарифмическое преобразование напрактике. Скошенные (асимметричные) распределения довольно ча"сто появляются в экономической статистике. Типичным примером явля"ются данные о душевом доходе: лиц с небольшими и средними дохода"ми гораздо больше, чем лиц с высокими доходами. А этих последнихзначительно больше, чем лиц с очень высокими доходами.
Примернаягистограмма распределения доходов приведена на рис. 12.11а. Проло"гарифмируем данные о доходах и вновь построим гистограмму. Онаприведена на рис. 12.11б. Видно, что в логарифмической шкале распре"деление доходов близко к нормальному (гауссовскому).Логарифмическое преобразование может оказаться полезным и принекоторых нарушениях стационарности наблюдаемого ряда. Допустим,что мы наблюдаем процесс xt = bt ·zt , где zt — стационарный ряд, а bt —некоторая положительная неслучайная последовательность. Обозначив381Рис. 12.11.
Гистограмма данных о доходах: a) исходная шкала,б) логарифмическая шкала (для наглядности на график (б)наложена функция плотности нормального распределения)Dzt через σ 2 , получим, что Dxt = σ 2 b2t изменяется во времени. Переходк логарифмической шкале yt = log xt даетyt = log bt + log zt .При этом ряд log zt — стационарный, его дисперсия во времени неизменяется. Это позволяет применить метод наименьших квадратов длявыделения тренда log bt из ряда yt .Примером временного ряда, дисперсия которого изменяется со вре"менем, является ряд продаж шампанского (рис. 11.1.в). На рис. 12.12приведены данные о продажах шампанского в логарифмической шка"ле. Видно, что логарифмирование устранило рост размаха сезонныхколебаний значений ряда.Рис.
12.12. Данные месячных продаж шампанского в логарифмической шкалеПреобразование Бокса?Кокса. Логарифмическое преобразованиеявляется частным случаем некоторого семейства преобразований, кото"рое ввели Дж.Бокс и Д.Кокс в 1964 г. [126]. С тех пор эти преобра"зования приобрели популярность. Преобразования, образующие это382семейство, зависят от параметра λ, λ 0. Если вернуться к формулепреобразований y = f (x), то можно сказать, что теперь y = f (x, λ), гдезначение λ 0 исследователь может выбрать по своему усмотрению.Бокс и Кокс предложили следующую формулу(xλt − 1)/λпри λ > 0f (x, λ) =(12.15)log xtпри λ = 0преобразование Бокса"Кокса, ко всем членам ряда прибавляют постоянную c.Члены преобразованного ряда получают по формуле(xt + c)λ − 1λесли выбранное λ > 0. Для λ = 0 преобразование Бокса"Кокса действует какуже упомянутое логарифмическое: yt = log(xt + c).yt =12.4.