Временные ряды
Тема 2. Временные ряды.
Виды временных рядов.
Статистическое описание развития экономических процессов во времени осуществляется с помощью временных рядов.
Временным рядом называется ряд наблюдений за значениями некоторого показателя (признака), упорядоченный в хронологической последовательности, т.е. в порядке возрастания переменной t - временного параметра. |
Уровнями временного ряда называют отдельные наблюдения этого ряд |
Временные ряды делятся на:
· моментные
· интервальные.
Рекомендуемые материалы
В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени.
Например, моментными являются временные ряды цен на определенные виды товаров, временные ряды курсов акций, уровни которых фиксируются для конкретных чисел. Примерами моментных временных рядов могут служить также ряды численности населения или стоимости основных фондов, т.к. значения уровней этих рядов определяются ежегодно на одно и то же число.
В интервальных рядах уровни характеризуют значение показателя за определенные интервалы (периоды) времени.
Примерами рядов этого типа могут служить временные ряды производства продукции в натуральном или стоимостном выражении за месяц, квартал, год и т.д.
Иногда уровни ряда представляют собой не непосредственно наблюдаемые значения, а производные величины: средние или относительные. Такие ряды называются производными. Уровни таких временных рядов получаются с помощью некоторых вычислений на основе непосредственно наблюдаемых показателей.
Примерами таких рядов могут служить ряды среднесуточного производства основных видов промышленной продукции или ряды индексов цен.
Уровни ряда могут принимать детерминированные или случайные значения. Примером ряда с детерминированными значениями уровней служит ряд последовательных данных о количестве дней в месяцах. Естественно, анализу, а в дальнейшем и прогнозированию, подвергаются ряды со случайными значениями уровней. В таких рядах каждый уровень может рассматриваться как реализация случайной величины - дискретной или непрерывной.
В таблице 1.1. приведены примеры временных рядов: первый ряд является моментным; второй ряд – интервальным. Уровни третьего временного ряда – расчетные величины, сам временной ряд месячной динамики является производным.
Таблица 1.1.
Примеры временных рядов
I) Цены акций промышленной компании на момент закрытия торгов (долл.) | ||
Дата | t | yt |
6.9.99 | 1 | 383 |
7.9.99 | 2 | 392 |
8.9.99 | 3 | 391 |
9.9.99 | 4 | 399 |
10.9.99 | 5 | 397 |
13.9.99 | 6 | 399 |
II) Фонд заработной платы работников предприятия (тыс. руб.) | ||
Месяц | t | yt |
Январь | 1 | 79,5 |
Февраль | 2 | 84,1 |
Март | 3 | 85,5 |
Апрель | 4 | 88,5 |
Май | 5 | 89,9 |
Июнь | 6 | 90,0 |
III) Среднесуточное производство продукции на предприятии (шт.) | ||
Месяц | t | yt |
Январь | 1 | 1570 |
Февраль | 2 | 1590 |
Март | 3 | 1595 |
Апрель | 4 | 1603 |
Май | 5 | 1610 |
Июнь | 6 | 1600 |
Важное значение для дальнейшего исследования процесса имеет выбор интервалов между соседними уровнями ряда. Удобнее всего иметь дело с равноотстоящими друг от друга уровнями ряда. При этом, если выбрать слишком большой интервал времени, можно упустить существенные закономерности в динамике показателя. Например, по квартальным данным невозможно судить о месячных сезонных колебаниях. Информация может также оказаться слишком "короткой" для использования некоторых методов анализа и прогнозирования динамики, предъявляющих "жесткие" требования к длине рядов. В то же время, слишком малые интервалы между наблюдениями увеличивают объем вычислений, а также могут приводить к появлению ненужных деталей в динамике процесса, засоряющих общую тенденцию.
Безусловно, вопрос о выборе интервала времени между уровнями ряда должен решаться исходя из целей каждого конкретного исследования.
Требования, предъявляемые к исходной информации и методы их достижения.
Процесс прогнозирования экономических временных рядов базируется на выявлении закономерностей, объясняющих динамику процесса в прошлом, и использовании этих закономерностей для описания развития в будущем. При этом проведение анализа развития и прогнозирования, как правило, опирается на математический аппарат, предъявляющий определенные требования к исходной информации.
Одним из важнейших условий, необходимых для правильного отражения временным рядом реального процесса развития, является сопоставимость уровней ряда. Для несопоставимых величин неправомерно проводить исследование динамики. Появление несопоставимых уровней может быть вызвано разными причинами: изменением методики расчета показателя, изменением классификаций, терминологии и т.д.
Например, уровни временного ряда, характеризующие количество малых предприятий, могут оказаться несопоставимыми из-за изменения самого понятия "малое предприятие". Подразумевается, что это понятие должно быть одинаковым для всего исследуемого периода. Чаще всего несопоставимость встречается в стоимостных показателях, что вызвано изменением цен в анализируемом периоде.
Несопоставимость может возникнуть вследствие территориальных изменений, например, как результат изменения границ области, района, страны. Другой причиной несопоставимости являются структурные изменения, например, укрупнение нескольких ведомств путем слияния их в единое целое, или укрупнение производства за счет слияния нескольких предприятий в одно объединение.
В большинстве случаев удается устранить несопоставимость, вызванную указанными причинами, путем пересчета более ранних значений показателей с помощью формальных методов. Хотя далеко не всегда проведение такой обработки обеспечивает требуемую точность, что может привести к снижению ценности исходной информации, а, следовательно, и к затруднению дальнейшего анализа.
Для успешного изучения динамики процесса важно, чтобы информация была полной, временной ряд имел достаточную длину.
Например, при изучении сезонных колебаний на базе месячных или квартальных данных желательно иметь информацию не менее, чем за 3 года.
Применение определенного математического аппарата также накладывает ограничение на допустимую длину временных рядов.
Например, для использования регрессионного анализа требуется иметь временные ряды, длина которых в несколько раз превосходит количество независимых переменных.
Временные ряды не должны иметь пропущенные наблюдения. Пропуски могут объясняться как недостатками при сборе информации, так и происходившими изменениями в системе отчетности, в системе фиксирования данных.
Например, изменяется круг основных видов промышленной продукции, данные о производстве которых, собираются на базе срочной отчетности. Решение об исключении какого-то показателя может быть отменено через некоторое время, в связи с тем, что становится очевидной его важность для аналитических исследований. В этом случае для использования этого временного ряда в дальнейшем анализе необходимо восстановить пропущенные уровни одним из известных способов восстановления пропусков (выбор метода зависит от специфики конкретного временного ряда). Если же в систему показателей включен новый признак, учет которого не проводился ранее, то необходимо подождать, пока ряд достигнет требуемой длины или попытаться восстановить прежние значения косвенными методами (через другие показатели), если такой путь представляется возможным.
Уровни временных рядов могут содержать аномальные значения или “выбросы". Часто появление таких значений может быть вызвано ошибками при сборе, записи и передаче информации. Возможными источниками появления ошибочных значений являются: сдвиг запятой при перенесении информации из документа, занесение данных в другую графу и т.д.
Выявление, исключение таких значений, замена их истинными или расчетными является необходимым этапом первичной обработки данных, т.к. применение математических методов к "засоренной" информации приводит к искажению результатов анализа. Однако, аномальные значения могут отражать реальное развитие процесса, например, "скачок" курса доллара в "черный вторник". Как правило, эти значения также заменяются расчетными при построении моделей, но учитываются при расчете возможной величины отклонений фактических значений от полученных по модели.
Соответствие исходной информации всем указанным требованиям проверяется на этапе предварительного анализа временных рядов. Лишь после этого переходят к расчету и анализу основных показателей динамики развития, построению моделей прогнозирования, получению прогнозных оценок.
Компоненты временных рядов.
Значения уровней временных рядов экономических показателей состоят из следующих компонент:
1. Тренд.
2. Сезонная составляющая.
3. Циклическая составляющая.
4. Нерегулярная составляющая.
Под трендом понимают изменение, определяющее общее направление развития, основную тенденцию временного ряда. Это систематическая составляющая долговременного действия.
Наряду с долговременными тенденциями во временных рядах экономических процессов часто имеют место более или менее регулярные колебания - периодические составляющие рядов динамики.
Если период колебаний не превышает 1 года, то их называют сезонными. Чаще всего причиной их возникновения считаются природно-климатические условия. Иногда причины сезонных колебаний имеют социальный характер, например, увеличение закупок в предпраздничный период, увеличение платежей в конце квартала и т.д.
При бОльшем периоде колебания, считают, что во временных рядах имеет место циклическая составляющая. Примерами могут служить демографические, инвестиционные и другие циклы.
Если из временного ряда удалить тренд и периодические составляющие, то останется нерегулярная компонента.
Факторы, под действием которых формируется нерегулярная компонента:
· резкого, внезапного действия (стихийные бедствия, эпидемии и др.), вызывают более значительные отклонения по сравнению со случайными колебаниями (катастрофические колебания);
· текущие факторы – вызывают случайные колебания, являющиеся результатом действия большого числа побочных причин. Влияние каждого из текущих факторов незначительно, но ощущается их суммарное воздействие.
Если временной ряд представляется в виде суммы соответствующих компонент, то полученная модель носит название аддитивной (1.1), если в виде произведения - мультипликативной (1.2) или смешанного типа (1.3):
Yt = ut + st + vt + et | (1.1) |
Yt = ut *st *vt *et | (1.2) |
Yt = ut *st *vt + et | (1.3), |
где yt- уровни временного ряда;
ut -трендовая составляющая;
st- сезонная компонента;
vt - циклическая компонента;
et- случайная компонента.
Проверка гипотезы о существовании тенденции
Решение любой задачи по анализу и прогнозированию временных рядов начинается с построения графика исследуемого показателя, тем более, что современные программные средства предоставляют пользователю большие возможности для этого. Не всегда при этом четко прослеживается присутствие тренда во временном ряду. В этих случаях прежде, чем перейти к определению тенденции и выделению тренда, нужно выяснить, существует ли вообще тенденция в исследуемом процессе.
Основные подходы к решению этой задачи основаны на статистической проверке гипотез. Критерии выявления компонент ряда основаны на проверке гипотезы о случайности ряда.
Рассмотрим наиболее часто используемые на практике критерии проверки "наличия-отсутствия" тренда:
критерий восходящих и нисходящих серий
критерий серий, основанный на медиане выборки;
метод Фостера - Стюарта.
Критерий восходящих и нисходящих серий реализуется в виде следующей последовательности шагов:
- Для временного ряда определяется последовательность знаков «+» или «- « исходя из следующих условий:
2. Подсчитывается число серий (V(n)) в совокупности знаков. Под серией понимается последовательность несколько подряд идущих «+» или «-«. Причем один «+» или «-« тоже считается серией.
3. Определяется протяженность самой длинной серии ǐmax(n)
4.Проверка гипотезы основывается на том, что при условии случайности ряда (т.е. при отсутствии трендовой составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий -слишком маленьким.
Если нарушился хотя бы одно из следующих неравенств, то гипотеза об отсутствии тренда отвергается с определенной доверительной вероятностью (≈0,95). Неравенства:
n<26 io = 5
26<n<153 io = 6
153<n<170 io = 7
Пример:
t | Yt | Si |
1 | 6.7 | … |
2 | 7.3 | + |
3 | 7.6 | + |
4 | 7.9 | + |
5 | 7.4 | - |
6 | 8.6 | + |
7 | 7.8 | - |
8 | 7.7 | - |
9 | 7.9 | + |
10 | 8.2 | + |
11 | 8.4 | + |
12 | 9.1 | + |
13 | 8.3 | - |
14 | 8.7 | + |
15 | 8.9 | + |
16 | 9.1 | + |
17 | 9.5 | + |
18 | 10.4 | + |
19 | 10.5 | + |
20 | 10.2 | - |
21 | 9.3 | - |
2) V(21) = 8
3) imax (21) = 6
4)
Ответ: Тренд присутствует.
Критерий серий, основанный на медиане выборки, реализуется в виде следующей последовательности шагов:
1) исходный временной ряд ранжируют;
2) определяют медиану из этого ряда; Nме =
3) образуют последовательность знаков из «+» и «-» по следующему правилу:
Si=
Если Yt = Me, Ye опускается
4) подсчитывается общее число серий V(n) и протяженность самой длинной серии imax (n).
5) Проверяется гипотеза о наличии или отсутствии тренда. Если нарушается хотя бы одно из следующих неравенств, то гипотеза об отсутствии тренда отвергается:
Пример:
t | Yt | Yt´ | Si |
1 | 509 | 507 | - |
2 | 507 | 508 | - |
3 | 508 | 509 | - |
4 | 509 | 509 | - |
5 | 518 | 510 | + |
6 | 515 | 511 | - |
7 | 520 | 512 | + |
8 | 519 | 514 | + |
9 | 512 | 515 | - |
10 | 511 | 516 | - |
11 | 517 | 517 | + |
12 | 524 | 518 | + |
13 | 526 | 518 | + |
14 | 519 | 519 | + |
15 | 514 | 519 | - |
16 | 510 | 520 | - |
17 | 516 | 521 | - |
18 | 518 | 524 | - |
19 | 524 | 524 | + |
20 | 521 | 526 | + |
2) Ме =
4)
8>6
4<7
Ответ: Оба неравенства выполняются: тренд отсутствует.
Метод Фостера-Стьюарта реализуется в следующей последовательности шагов:
1) каждый уровень ряда сравнивается со всеми предшествующими и определяются значения вспомогательных характеристик
2)вычисляется характеристика dt=mt-lt
3)находится Д =
4)определяется характеристика t наблюдаемое:
t наблюдаемое =
5) расчетное значение t наблюдаемое сравнивается с t критическое, взятым из таблицы;
6) если t наблюдаемое > t критическое, то гипотеза об отсутствии тренда отвергается.
Пример:
t | Yt | mt | lt | dt |
1 | 509 | - | - | - |
2 | 507 | 0 | 1 | -1 |
3 | 508 | 0 | 0 | 0 |
4 | 509 | 0 | 0 | 0 |
5 | 518 | 1 | 0 | 1 |
6 | 515 | 0 | 0 | 0 |
7 | 520 | 1 | 0 | 1 |
8 | 519 | 0 | 0 | 0 |
9 | 512 | 0 | 0 | 0 |
10 | 511 | 0 | 0 | 0 |
11 | 517 | 0 | 0 | 0 |
12 | 524 | 1 | 0 | 1 |
13 | 526 | 1 | 0 | 1 |
14 | 519 | 0 | 0 | 0 |
15 | 514 | 0 | 0 | 0 |
16 | 510 | 0 | 0 | 0 |
17 | 516 | 0 | 0 | 0 |
18 | 518 | 0 | 0 | 0 |
19 | 524 | 0 | 0 | 0 |
39 Хронический лимфолейкоз - лекция, которая пользуется популярностью у тех, кто читал эту лекцию. 20 | 521 | 0 | 0 | 0 |
3)Д=3, 4) t набл=, 5) t крит = 2,093, 6) t набл < t крит, 1,316 < 2,093, Ответ: Тренда не