Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 82
Текст из файла (страница 82)
Диалоговое окно процедуры полиномиального прогнозированияРис. 13.30. Диалоговое окно процедуры Атрибуты переменнойРезультаты прогнозирования могут быть сохранены в численномвиде в отдельной переменной и помещены в электронную таблицу. КДля удобства дальнейшего анализа и выдачи результатов определимдополнительно календарную структуру исходных данных. А именно,415416укажем, что мы имеем дело с ежемесячными данными, начиная с января1992 года. Для этого в пункте меню Таблица надо выбрать пункт Открытьи в его подменю выбрать пункт Атрибуты переменной. Диалоговое окноэтой процедуры показано на рис. 13.30. В нем следует указать файлmilk.gnt и имя переменной milk, а в поле Временной интервал выбрать значениеМесяц.
Затем надо щелкнуть мышью по кнопке Òèï диалогового окнадля указания стартовых календарных значений исходного ряда. Приэтом откроется окно Параметры временного ряда (рис. 13.31), в которомуказываются день, месяц и год первого значения ряда (первое января1992 года) и временной интервал между наблюдениями (1 месяц). Длязапоминания календарных атрибутов переменной необходимо нажатьфункциональную клавишу «F2».но, приведенное на рис.
13.33. В нем указываем: период сезонности —12 месяцев, тип сезонной компоненты — мультипликативная или адди"тивная, и форму вывода результатов. После заполнения всех параметрови нажатия OK метод следует запустить на счет с помощью соответству"панели управления пакета.ющего пункта меню или пиктограммыРис. 13.33.
Диалоговое окно процедуры Сезонной КомпонентыРис. 13.31. Окно задания параметров рядаГрафик ряда производства молока в России приведен на рис. 13.32.(Порядок вывода данных на график описан в предыдущей задаче. Вданном случае в качестве типа графика был выбран не X–Y график, аграфик временного ряда, а значения по оси ординат были прочитаны изкалендарной структуры переменной milk, созданной выше.)Порядок работы процедуры выделения сезонной компоненты в паке"те Эвриста включает переход от мультипликативной модели к аддитив"ной, выделение тренда и циклической компоненты методом скользящихсредних, затем — вычисление сезонных оценок в аддитивной моделии возврат к мультипликативной модели исходного ряда.
Для удалениятренда с помощью метода наименьших квадратов можно воспользовать"ся процедурой Анализ тренда, разобранной выше, а потом применить кряду остатков процедуру оценки сезонной компоненты.Результаты. На рис. 13.34 приведены оценки сезонных индексовв процентах.
По оси абсцисс приведены номера месяцев года (от 1 до12), а по оси ординат значения сезонных индексов. Обратим внимание,что полученные сезонные индексы немного отличаются от тех, чтоприведены в таблице 13.3, так как для их вычисления использовалисьразные модификации этого метода.Рис. 13.32. График ряда производства молокаВыбор процедуры. Для вычисления оценок сезонной компонентыряда следует в пункте меню Метод выбрать подпункт Предварительный анализи в нем процедуру Сезонная Компонента. При этом возникает диалоговое ок"417Рис. 13.34.
Сезонные индексы для ряда производства молока418Для получения сезонно"выровненного ряда следует повторить запускпроцедуры Сезонная компонента, изменив форму выдачи результатов нарежим «сезонность устранена». Результаты работы этой процедурыприведены на графике (рис.
13.35).линейный тренд. (В этом можно убедиться проведя оценку тренда мето"дом наименьших квадратов.) Устраним этот тренд с помощью простогоразностного оператора первого порядка. Для этого в пункте Предвари'тельный анализ меню Метод выберем процедуру Разности. В диалоговом окнеэтой процедуры (которое мы не приводим) следует указать единствен"ный параметр — порядок разности, то есть 1 для наших данных. Рядпервых разностей запишем в переменную differ файла trafik и выберемее как рабочую для дальнейшего анализа. (Описание этих операций впакете Эвриста дано в примере 13.1к.) Вид графика первых разностей(рис. 13.37) позволяет заключить, что в полученном ряде отсутствуеттренд и его можно рассматривать как стационарный.Рис. 13.35.
График ряда производства молока после удаления сезонности13.2.4. … …ƒПример 13.3к. Для ряда среднесуточного трафика (количествапереданных данных) компьютерного телекоммуникационного каналаМосква"Новосибирск сети RUNNet подберем и оценим модель авто"регрессии, а затем осуществим прогноз на базе этой модели.Подготовка данных. Пусть данные среднесуточного трафика за10 последовательных недель находятся в переменной var0 файла trafik.gnt.(Различные способы загрузки данных в пакет Эвриста, их редактирова"ние и вывод на график обсуждались в примере 13.1к.) График данныхтрафика приведен на рис. 13.36.Рис. 13.37.
Ряд первых разностей трафика в Кбит/секПодбор порядка модели авторегрессии. Для предварительногоподбора порядка модели авторегрессии построим выборочную частнуюавтокорреляционную функцию (ЧАКФ) ряда первых разностей и из"учим ее значения. Для этого в пункте АРСС Модели меню Метод выберемпроцедуру Идентификация. Эта процедура осуществляет построение вы"борочных автокорреляционной и частной автокорреляционной функцийдля указанного числа задержек (лагов). График полученной частнойавтокорреляционной функции приведен на рис. 13.38.Замечание.
В пакете Эвриста график ЧАКФ (рис. 13.38) имеет следую"щие особенности: включение значения ЧАКФ для нулевой задержки (котороепо определению равно 1) для лучшего визуального восприятия графика и от"сутствие границ доверительных интервалов для ЧАКФ. Последнее неудобствокомпенсируется наличием в пакете нескольких эффективных тестов для опре"деления порядка АР"модели, о которых мы скажем чуть ниже.Рис.
13.36. Среднесуточный трафик в Кбит/секВыбор процедуры. Визуальный анализ трафика и результатыпредварительных расчетов показывают, что ряд содержит локально"419Для предварительного выбора порядка АР"модели по ЧАКФ следуетнайти такую задержку p, после√ которой все значения ЧАКФ по абсо"лютной величине меньше 2/ n, где n — размер временного ряда (этоправило объясняется далее в п. 14.3). Указанное значение p и можетрассматриваться как предварительный порядок АР"модели.
В рассма"420Юла"Уолкера (см. п. 14.3) с использованием рекурсии для оценки па"раметров модели. Вторая группа алгоритмов представляет различныемодификации метода наименьших квадратов. Для получения более по"дробной информации об особенностях этих методов пользователь можетобратиться в гипертекстовой статистический справочник пакета, нажавкнопку Help в диалоговом окне (рис. 13.39).Рис. 13.38.
График частной автокорреляционной функциитриваемом примере размер исходного ряда равен 70. Соответственно√размер ряда первых разностей n = 69. Таким образом 2/ n = 0.2407.Значение ЧАКФ для второй задержки явно превышает этот уровень, авсе последующие значения ЧАКФ укладываются в указанные границы.Таким образом, в качестве предварительного порядка модели авторе"грессии можно рассматривать значение 2.Возможны два различных режима оценки порядка модели: автома"тический и вручную. При выборе последнего режима пакет проводитэкспертную оценку порядка модели с помощью различных критериев(Парзена, Акаике, Хеннана"Куина) и выдает их результаты в окно за"дания порядка модели (рис.
13.40). В этом окне необходимо указатьвыбранный вами порядок. Заметим, что различные статистические кри"терии подтвердили наш выбор, сделанный на базе изучения частнойавтокорреляционной функции.Оценка коэффициентов модели. Для оценки коэффициентовАР(2) модели в пункте АРСС Модели меню Метод выбираем процедуруАР'Модель. В диалоговом окне этой процедуры (рис. 13.39) необходимоуказать один из четырех возможных алгоритмов оценки параметров мо"дели и режим выбора порядка модели.
При надобности можно заказатьоценки некоторых дополнительных характеристик модели, напримерспектральной плотности.Рис. 13.40. Окно задания порядка АР"МоделиРезультаты. Результаты выполнения процедуры (рис. 13.41) поме"щаются в специальное текстовое окно. Эти результаты включают зна"чения оценок параметров модели и их статистические характеристики,включая уровни значимости для гипотезы о равенстве коэффициентовмодели нулю, а также ряд других характеристик.Рис. 13.39. Диалоговое окно процедуры оценки АР"МоделиАлгоритмы оценки параметров модели, реализованные в пакете,можно разбить на две группы.
К первой относятся методы Левинсона"Дурбина и Бурга. Они заключаются в решении системы уравнений421Рис. 13.41. Окно результатов оценки АР"Модели422Полученные результаты показывают, что ряд первых разностей мо"жет быть описан моделью:X(t) = −0.229X(t − 1) − 0.362X(t − 2) + εtПрогнозирование. Для использования построенной модели припрогнозировании будущего поведения ряда необходимо записать оце"ненную модель в специальный файл на диске. Для этого служит ко"манда Сохранить модель в меню Результат. Пусть название этого файлабудет traffic.mod.Выберем исходный ряд в качестве рабочей переменной (описаниеэтой процедуры дано в примере 13.1к).
В меню Метод выберем пунктПрогнозирование, а в его подменю — процедуру АРСС Прогнозирование. Вдиалоговом окне этой процедуры (рис. 13.42) укажем число шагов про"гнозирования, скажем 5, время начала прогноза и уровень доверия. Таккак прогноз осуществляется на базе модели ряда первых разностей, то вполе порядок разностей указана 1.