Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 75
Текст из файла (страница 75)
Поэтому лучшеэтого избегать или использовать устойчивые методы оценивания.)Оценки сезонных индексов для данных 1992–1995 гг., рассчитанныепо (12.9), приведены в таблице 12.4. Сравнение данных таблиц 12.2 и12.4 показывает, что они хорошо согласуются между собой. Для полу"чения сезонного индекса ŝt усредним по строкам данные таблицы 12.4.Полученный результат приведен в третьем столбце табл.
12.3. Из этой372Таблица 12.4Месяц \ годянварьфевральмартапрельмайиюньиюльавгустсентябрьоктябрьноябрьдекабрь199270.1374.5893.05103.50120.54148.57148.89126.2592.7479.4457.3160.54199368.8870.1694.43107.09130.89162.62161.29140.30104.1776.0656.7959.49199467.5967.2391.16102.64120.29152.75154.47131.23100.5075.5253.3754.30199561.2264.9588.71101.34132.32160.80154.69140.06113.1679.9059.7162.91таблицы видно хорошее согласие сезонных индексов, что говорит обустойчивости этого показателя.Для осуществления прогноза ряда на 10 месяцев 1996 г. следуетсначала рассчитать предварительный ежемесячный прогноз progt поподобранной модели тренда (12.11). А именно, вычислить значенияˆ t для следующих 10"ти значений t, то есть для t = 49, 50, 51, .
. . , 58trРезультаты этого прогноза приведены во втором столбце таблицы 12.5.Для получения окончательного прогноза ряда надо скорректироватьпредварительный прогноз с помощью полученных сезонных индексов,вычислив (progt · st )/100 для указанных выше значений t. Результатыэтой процедуры приведены в третьем столбце табл. 12.5. В четвертомстолбце таблицы приведены реальные данные за 10 месяцев 1996 г.Наглядное сравнение прогноза с реальными данными дано на рис.
12.7,где пунктирной линией обозначены реальные данные за 1995–1996 гг.,а сплошной линией — построенный прогноз на 1996 г.В табл. 12.5 и на рис. 12.7 видно хорошее согласие прогноза среальными данными в первые 5 месяцев. Относительная погрешностьпрогноза здесь не превышает 3%. В последующие 4 месяца прогнозниже реальных данных на 6–10%. Относительная ошибка прогнозав последний, 10"ый месяц не превышает 3%. Заметим, что наиболь"шие различия прогноза с реальными данными наблюдаются в летниемесяцы, сезонный индекс которых подвержен наибольшим колебаниям(см. табл. 12.2 и 12.4). Эти колебания из года в год имеют порядок10–20%.
С учетом этого, можно признать в целом хорошее согласиепрогноза с реальными данными.Аналогичным образом можно осуществить прогноз на 1997 г. поданным 1992–1996 гг. Говорить о достоверности подобного прогнозаможно лишь при сохранении общих тенденций, наблюдаемых в предыду"373Рис. 12.7. Производство молока в России за1995–1996 гг. и прогноз на 1996 г. (в тыс. тонн)Таблица 12.5Прогноз производства молока в России на 1996 г.(в тыс. тонн) и его сравнение с реальными даннымиМесяцянварьфевральмартапрельмайиюньиюльавгустсентябрьоктябрьТренд1595156815411515148814611435140813811355Прогнозна 1996 г.1068108514151569187522822221189314181053Реальныеданные1038110414391521182724462369208115771081щие годы.
Для более аргументированных прогнозов необходимо привле"чение дополнительной информации (например, о тенденциях измененияпоголовья молочного стада).12.3.3. $ ƒ* …При наличии в ряде циклической компоненты расчет сезонных эф"фектов несколько отличается от описанного выше. В этом случае длявыяснения сезонных вкладов в виде (12.6) или (12.9) необходимо оце"нить не только тренд, но и циклическую компоненту. Проще всегоодновременно оценить тренд и циклическую компоненту можно с помо"374щью скользящего среднего.
Этот метод полезен и тогда, когда модельтренда не ясна. Рассмотрим его подробнее.О методе скользящих средних. Метод скользящих средних —один из самых старых и широко известных способов сглаживания вре"менного ряда. Он основан на переходе от начальных значений ряда к ихсредним значениям на интервале времени, длина которого выбрана за"ранее.
При этом сам выбранный интервал времени скользит вдоль ряда.Получаемый таким образом ряд скользящих средних ведет себя го"раздо более гладко, чем исходный ряд, за счет усреднения отклоненийисходного ряда. Таким образом эта процедура дает представление обобщей тенденции поведения ряда. Ее применение особенно полезнодля рядов с сезонными колебаниями и неясным характером тренда. Вчастности, переход к ряду скользящих средних может быть исполь"зован для выявления сезонной компоненты (или сезонного индекса)временного ряда.Вид средних.
Применяя метод скользящих средних, можно исполь"зовать различные виды усредения значений ряда: среднее арифметиче"ское (простое или с некоторыми весами), медианы и др. К сглаживаниюс помощью медианы (медианное сглаживание) прибегают тогда, когдасреди наблюдений есть выбросы (резко выделяющиеся данные).ла, в другие дни загрузка повышается. Кроме того, вероятно, имеет ме"сто плавный рост объема загрузки с начала месяца к его концу. Такимобразом, можно предположить, что рассматриваемый временной рядимеет тренд и сезонную компоненту с периодом сезонности p = 7 дней.Рис.
12.8. Среднесуточный трафик в Кбит/сектелекоммуникационного канала Париж"Москва в феврале 1996 г.:а) исходный ряд; б) исходный ряд и его скользящее среднееÏðèìåð 2. На рис. 12.9а приведен график ежемесячных продажшампанского за ряд лет. На графике отчетливо прослеживаются сезон"ные колебания с пиками в декабре каждого года и спадами в летниемесяцы. Период сезонности этих данных равен 12.Примеры для обсуждения. Мы дадим формальные определенияметода скользящих средних, используя для их иллюстрации два сле"дующих примера. В первом из них величина интервала сглаживанияравна 7, по числу дней недели. Во втором примере величина интерваласглаживания равна 12, что соответствует двенадцати месяцам года.
Этотипичные интервалы сглаживания в экономических временных рядах.Для ежеквартальных данных подходящим может оказаться сглажива"ние с интервалом 4, для почасовых данных, собираемых круглосуточ"но, сглаживание с интервалом 24, и т.д. Вообще говоря, величинуинтервала сглаживания целесообразно выбирать равным или кратнымпериоду сезонности. При этом каждый интервал вычисления сколь"зящего среднего будет содержать данные, отвечающие всему периоду(периодам) сезонности.Ïðèìåð 1. На рис.
12.8а приведен среднесуточный трафик (ве"личина загрузки) телекоммуникационного канала Париж"Москва сетиInternet за четыре последовательных недели (февраль 1996 г.). Этот гра"фик характеризует интенсивность (в килобитах в секунду) полученияинформации западными пользователями с российских компьютерныхсерверов по указанному каналу.
Из графика видно, что в отдельные днинедели (субботу и воскресенье) происходит уменьшение загрузки кана"375Рис. 12.9. Месячный объем продаж шампанского за ряд лет:а) исходный ряд; б) исходный ряд и его скользящее среднееВычисление скользящего среднего. Дадим формальное опре"деление скользящего среднего сначала для интервалов сглаживания,длина которых выражается нечетными числами. Причина, по которойчетные и нечетные длины рассматриваются порознь, выяснится чутьниже. Пусть p = 2m + 1. Обозначим через x̂t результат усредненияэлементов рядаxt−m , .
. . , xt−1 , xt , xt+1 , . . . , xt+m .376Если обсуждаемое среднее есть среднее арифметическое, то1(xt−m + . . . + xt−1 + xt + xt+1 + · · · + xt+m ).2m + 1Для медианного сглаживанияx̂t =x̂t = med(xt−m , . . . , xt−1 , xt , xt+1 , . . . , xt+m ).Для четных p = 2m определение несколько сложнее. Причина втом, что вычисленное по аналогичным формулам (как среднее ариф"метическое, медиана и т.д.) усредненное значение нельзя сопоставитькакому"либо определенномуt=2m моменту времени t. Например, среднее1арифметическое 2mt=1 (xt ) следовало бы сопоставить моменту вре"мени t = (2m + 1)/2, но такого момента во временном ряде нет. А этосильно осложняет дальнейшее выделение сезонных эффектов.Поэтому при четном интервале сглаживания 2m в усреднении задей"ствуют не 2m, а 2m + 1 значений временного ряда, но значения на краяхинтервала сглаживания берут с весами 1/2.
Так, при использовании дляусреднения среднего арифметического получается следующая формула:111x̂l =xl−m + xl−m+1 + · · · + xl+m−1 + xl+m(12.12)2m 22Выражение (12.12) задает величину простого скользящего среднегоx̂l для l = m + 1, m + 2, . . . , n − m при четной величине интерваласглаживания p = 2m.Свойства скользящего среднего.
Скользящее среднее, сглаживая исход"ный ряд, дает представление об общей тенденции поведения ряда — его трендеи циклической компоненте. Сделаем несколько замечаний о его свойствах.1. При применении метода скользящих средних выбор величины интерваласглаживания должен делаться из содержательных соображений и привязывать"ся к периоду сезонности для сезонных данных. Если процедура скользящегосреднего используется для сглаживания несезонного ряда, то чаще всего вели"чину интервала сглаживания выбирают равной трем, пяти или семи. Чем большеинтервал усреднения, тем более гладкий вид имеет график скользящих средних.2.