Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 74
Текст из файла (страница 74)
11.5.)Сезонные эффекты на фоне тренда. Предположим, что рассма"триваемый временной ряд x1 , . . . , xn может быть описан аддитивной мо"делью (12.4). Пусть p — период последовательности st , так что st = st+pдля всякого t. Наша задача — оценить значения st по наблюдениям xtпри том, что величина p известна.Для этого сначала мы должны оценить тренд trt . Это можно сделатьс помощью метода наименьших квадратов или его модификаций. Обо"ˆ t полученную оценку тренда. Обычно она выражается взначим через trвиде некоторой достаточно гладкой функции зависящей от времени t иодного или нескольких неизвестных параметров. Оценки этих параме"тров и дает метод наименьших квадратов. Наиболее распространенныефункции тренда приведены в п.
11.6.Затем для каждого сезона i, 1 i p, рассмотрим все относящиесяк нему разностиˆ i , xi+p − trˆ i+p , . . . , xi+mp − trˆ i+mp .xi − tr(12.6)3671 ˆ i+lp )(xi+lp − trm+1mŝi =дляi = 1, . . . , p(12.7)l=0В качестве других оценок ŝi можно взять взвешенное среднее, цензу"рированное среднее, медиану и т.д. Перечисленные средние уменьшаютвлияние резко выделяющихся наблюдений.Часто бывает желательно, чтобы сумма сезонных эффектов равня"лась нулю. Тогда переходят к скорректированным оценкам сезонныхэффектов в виде(12.4)Вторая модель, кроме перечисленных выше компонент, включает ещеи циклическую компоненту (ct ):xt = trt + st + ct + εt(для простоты изложения мы предполагаем, что в рассматриваемомряде содержится целое число периодов, т.е. n = (m + 1)p.) Каждое изˆ i можно рассматривать как результат влиянияэтих отклонений xi от trсезонных изменений.
Усреднение этих разностей дает нам оценкусезонной компоненты si . В качестве простейшей оценки можно взятьпростое среднее, т.е. положить1= ŝi −ŝi .p i=1ps∗i(12.8)В практических задачах распространена ситуация, когда сезонныеколебания пропорциональны среднему значению процесса в рассматри"ваемый момент времени. Для описания подобных данных можно ис"пользовать одну из следующих моделей:xt = trt · st + εtxt = trt · st · εt .Первая из них является смешанной мультипликативно"аддитивноймоделью, вторая — мультипликативной моделью временного ряда. Длямодели xt = trt · st + εt при оценке сезонных эффектов вместо сово"купности (12.6) рассматривают совокупность (12.9) частных от деленияˆ i+lp , выраженных в процентах.xi+lp на trxi+lp· 100%при l = 0, 1, 2, . .
. , m(12.9)ˆ i+lptrВ этом случае оценкой сезонной компоненты или сезонным индексомназывают величину:m 1 xi+lpŝi =· 100%где 1 i p(12.10)ˆ i+lpm+1trl=0Так же, как и в случае аддитивной модели, вместо среднего арифме"тического в правой части (12.10) может фигурировать взвешенное или368цензурированное среднее, медиана или другие более устойчивые к гру"бым выбросам оценки. Сезонные индексы (12.10) особенно популярныпри анализе экономических временных рядов. Оценка сезонного ин"декса для мультипликативной модели будет рассмотрена ниже в болееобщей ситуации.На практике считается, что оценки сезонных эффектов недостаточноточны, если число периодов в исследуемом сезонном временном рядеменьше пяти"шести. Это означает, например, что при рассмотрениимесячных данных для достаточно точной оценки сезонных эффектовнеобходимы, как минимум, наблюдения за пять"шесть лет.Удаление сезонной компоненты. Получив оценки сезонных эф"фектов (12.7), в аддитивной модели легко провести удаление этих эф"фектов из рассматриваемого ряда, вычитая их из начальных значенийряда.
Подобная процедура часто носит название сезонного выравнивания ряда или сезонной коррекции ряда. Еще одно название этой про"цедуры — сезонная декомпозиция. Для мультипликативно"аддитивноймодели эта процедура сводится к делению значений исходного ряда насоответствующие сезонные индексы и умножению на 100%.Проиллюстрируем оценку сезонных индексов и их использованиепри прогнозировании на основе данных о производстве молока в России.Ïðèìåð. В таблице 12.1 и на рис.
12.5 приведены величинымесячного производства молока (в тыс. тонн) в России с января 1992 г.по октябрь 1996 г. (по данным ЦСУ Госкомстата России).Таблица 12.1Производство молока в России с января 1992 г.по октябрь 1996 г. (тыс. тонн в месяц)Месяц \ годянварьфевральмартапрельмайиюньиюльавгустсентябрьоктябрьноябрьдекабрь19922015212326242891333540714040339224672092149415621993175917732361264932033936386133212438176012991345199415101484198822112559320932042687203115061050105419951172122616511859239228642714242019251338984102019961038110414391521182724462369208115771081График ряда показывает, что производство молока имеет тенденциюк сокращению, обусловленную сокращением поголовья молочного ста"369да, и подвержено сильным сезонным колебаниям с максимумом произ"водства в летние месяцы и минимумом — в зимние.
При этом величинасезонных колебаний пропорциональна среднему уровню производства.Рис. 12.5. Ежемесячное производство молокав России с 01.1992 по 10.1996 (в тыс. тонн)Оценим сезонные индексы этого ряда и проведем выравнивание рядас учетом сезонности. Для описания тренда используем линейную модельtrt = a + b · t, где t = 1, 2, . . . , 58. Оценки неизвестных коэффициентов aи b методом наименьших квадратов есть: â = 2841.1 и b̂ = −23.63. Такимˆ t = â + b̂ · t. Подобраннаяобразом, в каждой точке t можно вычислить trмодель тренда описывает общую тенденцию поведения ряда.
Но сделатьна базе этой модели достаточно точный прогноз ежемесячного произ"водства молока в следующем году нельзя, учитывая большую сезоннуюизменчивость ряда. Для построения месячного прогноза необходимооценить сезонные эффекты, или сезонные индексы.На графике 12.5 видно, что величина сезонных колебаний пропор"циональна среднему уровню производства. Поэтому для описания се"зонных колебаний следует использовать мультипликативно"аддитивнуюили мультипликативную модель.
Воспользуемся первой из этих моде"лей. Для получения оценок сезонных индексов используем формулы(12.9) и (12.10).ˆtВ таблице 12.2 приведены в процентах значения отношений xt /trдля каждого месяца t. Обратим внимание на то, что полученные длякаждого месяца индексы в таблице 12.2 довольно устойчивы. Так,производство молока в июне в среднем на 155% превышает среднего"довой уровень, а в октябре — составляет только 75% от него. Дляполучения сезонных индексов производства молока (12.10) для каждого370Таблица 12.2ˆ t для временного рядаЗначения отношений xt /trс данными о производстве молока в России (в %)Месяц \ годянварьфевральмартапрельмайиюньиюльавгустсентябрьоктябрьноябрьдекабрь199271.5275.9994.72105.26122.48150.82150.99127.9093.8680.3157.8861.07199369.4270.6394.95107.55131.30162.93161.41140.22103.9775.8256.5459.15199467.1066.6590.23101.45118.70150.50151.95128.8898.5373.9152.1352.95199559.5963.0986.0198.05127.76154.93148.71134.34108.2876.2856.8659.75199661.6766.5287.9694.34115.00156.29153.69137.107105.5473.51Рис.
12.6. Сезонное выравнивание ряда производства молока в Россиимесяца следует провести усреднение данных по строкам таблицы 12.2.Полученный результат приведен в таблице 12.3.Таблица 12.3Сезонные индексы производство молока в России (в %)МесяцянварьфевральмартапрельмайиюньиюльавгустсентябрьоктябрьноябрьдекабрьИндекспо всемданным65.8668.5890.77101.33123.05155.09153.35133.69102.0475.9755.8558.23этот пример, как иллюстрацию вычисления сезонных индексов, мы не касаемсяв нем вопросов выбора наилучшей модели. Эта обширная тема, требующаяопределенной подготовки, выходит за рамки данной книги.Прогнозирование. Посмотрим к каким результатам привела быэта методика, если бы мы хотели получить прогноз на 1996 г.
по данным1992–1995 гг. Учитывая устойчивое поведение сезонного индекса вданной задаче, мы проведем его оценку по данным за 4 года. (В другихзадачах такой объем данных может быть недостаточным.) Повторимописанные выше действия для данных 1992–1995 гг. Подобраннаяˆ t имеет вид:модель линейного тренда trИндекспо данным1992–1995 гг.66.9669.2391.84103.64126.01156.18154.83134.46102.6477.7356.8059.31ˆ t = 2899.9 − 26.64 · ttrДля проведения сезонного выравнивания каждое значения исходно"го ряда следует разделить на соответствующий ему сезонный индекси умножить полученный результат на 100%.
Полученный результатприведен на рис. 12.6. Как видно из графика, выровненный ряд имеетярко выраженную тенденцию линейного убывания.Замечание. Для прогнозирования поведения рассмотренного ряда могутбыть применены и другие методы. В частности, можно описывать этот ряд моде"лью, использующей простые и сезонные разностные операторы. Рассматривая371(12.11)Ее коэффициенты в целом не сильно отличаются от коэффициентов,полученных выше по всем данным. (Следует учитывать, что оценкаb̂ по всем данным несколько завышена. Это связано с отсутствиемданных последних двух месяцев 1996 г., которые с учетом сезонностиявляются обычно самыми низкими в году. Здесь уместно заметить, чтоиспользование метода наименьших квадратов для подбор модели трендасезонных рядов с незавершенными циклами, как это было сделано выше,обычно влечет за собой подобные смещения оценок.