Доверительные интервалы прогноза
Тема 8. Доверительные интервалы прогноза. Оценка адекватности и точности моделей
Доверительные интервалы прогноза
Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упреждения. Полученный таким образом прогноз называется точечным прогнозом. На практике в дополнение к точечному определяют границы возможного значения прогнозированного показателя, то есть вычисляют интервальный прогноз.
Несовпадение фактических данных с точечным прогнозом может быть вызвано:
1) субъективной ошибочностью выбора вида кривой;
2) погрешностью оценивания параметров кривых;
3) погрешностью, связанной с отклонением отдельных наблюдений от тренда.
Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал прогноза определяется в следующем виде:
Рекомендуемые материалы
Ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении Sр, так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения
Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.
По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).
В таблице приведены значения K* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n) значения K* уменьшаются, с ростом периода упреждения L значения K* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L.
Например, для временного ряда розничного товарооборота региона, длиной 20, оценены параметры модели yt=10,2+1,2t, и дисперсия отклонений фактических значений от теоретических S2y=0.25. Используя эту модель рассчитать точечный и интервальный прогнозы в точке n=21.
Упрогн=10,2+1,2*21=35,4
Sy== =0.5
K*=1.9117
Упрогн=35,4±0,5*1,9117=35,4±0,96=
Проверка адекватности выбранных моделей
Проверка адекватности выбранных моделей реальному процессу строится на анализе случайной компоненты. Случайная (остаточная) компонента получается после выделения из исследуемого ряда тренда и периодической составляющей. Предположим, что исходный временной ряд описывает процесс, не подверженный периодическими колебаниями, то есть примем гипотезу об аддитивной модели временного ряда:
Уt=ut+et
Тогда ряд случайной компоненты будет получен как отклонение фактических уровней временного ряда (yt) от выровненных, расчетных
Принято считать, что модель адекватна описываемому процессу, если значения остаточной компоненты удовлетворяют свойствам независимости и подчиняются закону нормального распределения.
При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений et от времени, или, что то же самое, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из критериев, например, критерий серий.
Если вид функции, описывающей тренд, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, так как они могут коррелировать между собой. В этом случае имеет место явление автокорреляции.
В условиях автокорреляции оценки параметров модели будут обладать свойствами несмещенности и состоятельности.
Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Дарбиным и Уотсоном.
Критерий Дарбина-Уотсона связан с гипотезой о существовании автокорреляции первого порядка (то есть между соседними остаточными уровнями ряда). Значение этого критерия определяется по формуле:
d=
Можно показать, что величина d приближенно равна:
где r1- коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя рядами e1, e2, ... ,en-1 и e2, e3, ..., en).
Из последней формулы видно, что если в значениях et имеется сильная положительная автокорреляция ,то величина d=0 , в случае сильной отрицательной автокорреляции d=4. При отсутствии автокорреляции .
Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Авторами критерия границы определены для 1, 2,5 и 5% уровней значимости.
Рассчитанные значения d сравнивают с табличными значениями. Здесь ( в таблице): d1 и d2 - соответственно нижняя и верхняя доверительная граница критерия d;
К – число переменных в модели
n – длина ряда.
При сравнении величины d с d1 и d2 возможны следующие ситуации:
1) d< d2, то гипотеза об отсутствии автокорреляции отвергается;
2) d> d2, то гипотеза об отсутствии автокорреляции не отвергается;
3) d1≤ d≤ d2, то нет достаточных основании для принятия решений, величина попадает в область неопределенности.
Рассмотренные варианты относятся к случаю, когда в остатках имеется положительная автокорреляция. Когда же расчетное значение d превышает 2, то можно говорить о том, что в et существует отрицательная автокорреляция. Для проверки отрицательной автокорреляции с критическими значениями d1 и d2 сравнивается не сам коэффициент d, а 4-d.
Поскольку временные ряды экономических показателей, как правило, небольшие, то проверка распределения на нормальность может быть произведена лишь приближенно на основе исследования показателей ассиметрии и эксцесса.
При нормальном распределении показатели ассиметрии и эксцесса равны нулю.
Можно рассчитать показатель ассиметрии и эксцесса, их средние квадратические ошибки:
А=
Э=
Если одновременно выполняются следующие неравенства:
,
то гипотеза о нормальном характере распределения случайной компоненты не отвергается.
Если выполняется хотя бы одно из следующих неравенств:
,
то гипотеза о нормальном характере распределения отвергается.
t | Yt |
1 | 47 |
2 | 51 |
3 | 55 |
4 | 59 |
5 | 62 |
6 | 66 |
7 | 70 |
8 | 75 |
9 | 79 |
10 | 82 |
11 | 86 |
12 | 89 |
13 | 92 |
14 | 96 |
15 | 100 |
16 | 103 |
d=
Еt= уt-утеор
Yтеор=a0+a1t
а0= а1=
n=16
К´=1
d1=1.1
d2=1.37
d=1.4E-17
Гипотеза об отсутствии автокорреляции отвергается.
Характеристики точности моделей
Чтобы судить о качестве выбранной модели необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность. О точности прогноза судят по величине ошибки прогноза.
Ошибка прогноза – это величина, характеризующая расхождения между прогнозным значением показателя и фактическим значением.
Абсолютная ошибка прогноза определяется по формуле:
у прогн. – yt
Относительная ошибка прогноза:
δt=
Используются также средние ошибки по модулю.
Абсолютная ошибка по модулю:
Относительная средняя ошибка по модулю:
S=
Если абсолютная и относительная ошибка >0, то это свидетельствует о завышенной прогнозной оценке, а если <0, то прогноз был занижен. Эти характеристики могут быть вычислены после того, как период упреждения уже закончился и имеются фактические данные о прогнозируемом показателе.
При проведении сравнительной оценки моделей прогнозирования применяются также дисперсия и среднее квадратическое отклонение:
S2=
S=
Чем меньше значение дисперсии и среднее квадратическое отклонение, тем выше точность модели.
О точности модели нельзя судить по одному значению ошибки прогноза, поскольку единичный хороший прогноз может быть получен и по плохой модели, поэтому о качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими.
Простой мерой качества прогнозов может служить характеристика . Это относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом:
,
где Р – число прогнозов, подтвержденных фактическими данными;
q – число прогнозов, не подтвержденных фактическими данными.
Сопоставление характеристик для разных моделей может иметь смысл при условии, что доверительные вероятности приняты одинаковыми.
t | yt | Условное время | Утеор | ||
1 | 91,6 | - | - | -5 | 91,64 |
2 | 91,5 | -0,1 | - | -4 | 91,47 |
3 | 91,3 | -0,2 | -0,1 | -3 | 92,3 |
4 | 91,1 | -0,2 | 0 | -2 | 91,13 |
5 | 91,0 | -0,1 | 0,1 | -1 | 90,96 |
6 | 90,8 | -0,2 | -0,1 | 0 | 90,79 |
7 | 90,6 | -0,2 | 0 | 1 | 90,62 |
8 | 90,4 | -0,2 | 0 | 2 | 90,45 |
9 | 90,2 | -0,2 | 0 | 3 | 90,28 |
10 | 90,0 | -0,2 | 0 | 4 | 90,11 |
11 | 89,9 | -0,1 | 0,1 | 5 | 89,94 |
Итого | -17 | 0 |
-0,1-(-0,2)=0,1
Утеор = 90,79-0,17t
Месяц | Прогнозное значение | Фактическое значение | |
1 модель | 2 модель | ||
Апрель | 35400 | 36300 | 36505 |
Май | 41600 | Ещё посмотрите лекцию "34 Девиация" по этой теме. 99200 | 40524 |
Июнь | 45600 | 43100 | 45416 |