Алгоритмы прогнозирования нестационарных временных рядов (1102322), страница 22
Текст из файла (страница 22)
Набор Ф,г,в составляет исходные вводимые исследователем данные перед началом анализа временного ряда, Поскольку максимум значений статистики горизонтного ряда при этих условиях равен Н(г,с) = 2г/е, то задача может быть поставлена только прн условии Н(г,в) < Ф . Более того, т.к. для построения модели ряда х(г) требуется знание статистики горизоитного ряда по крайней мере с той же точностью в, то необходимо иметь 2г/в значений Ь(г, г„в), получаемых из выборки по скользящему окну объемом 2г/в, для чего требуется имеп не менее 4г/в значений исходного ряда. Наконец, в построении статистики Ь(~,т,в) участву|от.
ВФР, полученные сдвигом одна относительно другой па т шагов по времени, поэтому число значений ряда должно быть не меньше 4г/в+с, Следовагелыю, должно быть выполнено условие — +1 г<Ф . 4,4.2. Фо ми рвание иассивов данны и ед-лодготовха яда, Пусть условие (4.1) удовлетворено, Тогда строятся выборочные функции распределения /';-(х,/) н Гу(х,х,/) по скользящей выборке объема Т на промежутке Ьгф). Затем на предварительном этапе анализа из исходного ряда формируются выборки объемом от 1 до 2г/с и строится статистика Ь(г,г,в) согласно алгоритму, описанному в параграфе 4.1.
Если при этом оказывается, что доля 1-в значений ряда 6(г,г,в) принацлежиг промежутку О(г,в/= 12г/в — 2г, 2г/с1, то ряд х(г) считается хорошо подготовленным„не содержащим существенных детерминированных составля1ощих, Если же оказывается, что значения горизонпюго ряда размазаны по более широкой полосе„то может оказаться необходимой определенная пред-подготовка ряда х(~), поскольку указанный эффект свидетельствует о наличии детерминированной составляющей, Выделспие детерминированной составляющей не входит в комплекс строящихся в данной работе алгоритмов.
Упоминание об этом сделано лишь с тем, чтобы подчеркнуть, что излагаемый метод не заменяет собой стандартные методы исследования временных рядов, а лишь новьппает их точность. Предполагается, что какая-то часть детерминированной составляющей может быть выделена любыми доступными средствами статистического программного обеспечения (регрессионными, корреляционными, и т.п. моделями — см.
параграф 1.1). После этого повторяется аналогичное тестирование остатков ряда. Если оказывается, что горизонтиый ряд остатков почти весь находится в полосе (4.2), то это означает успешное удаление временного тренда«сезонности и т.п. явлений. В противном случае широкая полоса значений горизонтного ряда остатков может быть свидетельством либо очень сложного поведения некоторой хаотической динамической системы, либо нестацнонарности исходного ряда, не исключасмой традиционными методами.
Дальнейшие действия относятся уже к ряду остатков, который отображается на отрезок 1-1; Ц и обозначается далее через г(г). Для краткости горизонтный ряд оста гков обозначаем, как и выше, Ь(1,г,к), Сохраняем также прежние обозначения и для ИФР остатков. «Аз. ~«вью~~~~«м«м «~~додж~ «« ~«« Для каждого момента времени г создаются массивы н -несмещениых (см, определение 9 в параграфе 4.3) средних выборочных значений,ит (г) остатков г(г) по скользящей выборке объема Т, а также выборочных дисперсий: ~т(~) = —, Хг(~) 2,т(Г) = —, ХЙ~) -Ит(Г))' 1=~-т+1 к=~-т 1 Затем строятся средине по времени зависимости выборочных средних (4.3) от объема выборки: Ф М й(Т) = — ,"~" Рт(г) о 2(1 ) =- — ,'> ~2,т(г) .
12г/в1 12г/с1 с=К -~2г/а)+1 ~=Я вЂ” 12г/е)+1 Следует отметить, что усреднение может быть проведено и по другим промежуткам времени, например: Ж* «« ~ит)= . Хи (), (тг,т) = —. Хт2,т(г). Х -Т+1 „т ' И вЂ” Т+1, (4.5) «.5.«О~у д~е~ ю««««аймва.вб ди Представляется, однако, что для целей прогнозирования более корректным является способ (4.4), поскольку в пем усреднение отнесено к текущему (т.с. наиболее актуальному) моменту времени и усреднение проводится по одинаковому для всех Т количеству данных, обеспечивающих т-с-стационарпосгь ряда. На текущий момент времени строится интегральное распределение Ч' (Т) статистики А(г,г,е) остатков г(!), следуя алгоритму, описанному в параграфе 4,1. Затем численно определяется оптимальный объем выборки по формуле (3,2.9): Тг ! = шах'(Т, агй,пино(Т)~, (4.6) ф ф где Т определяется как решение уравнения Ч' .(Т )=1-а.
В этой формуле о(Т) определяется по формуле (4,4), 445. Й~д~д~м>>ФР ~>е Южааыу~ааек На основе найденного оптимального объема выборки 7"„„, по данным из временного промежутка ЛТ, (!) строится ВФР,~Т, (г,!) и совместная ВФР остатков ор! ор! ряда и их первых разностпых производных г(!) = г(!)-г(! -1), т.е. плотность распределения Гт (г,г,!), По распределениго ГГ, (г,г,!) определяется эффективная о!>! ор! скорость и(г,!) изменения ВФР /г, (г„!) согласно формуле (далее индекс Т, для ор! краткости опускаем) и(г,г)Я(г,!) = (1!'Р(г,гдйг. (4.7) Из (4.7) численно определяется скорость и(г,!)„и по выборке объема Т, на промежутке Лг, (!) находится ковариация со4и,г).
ол! Затем по выборкам того же объема на моменты времени ! н !-1 вычисляется разностная производная по времени для выборочной дисперсии (4.3): «г(!) = «!2(!) — «!2(! — 1) > после чего находится величина Я(!) = тг(е) — 2 соу(и,г) . (4.9) 4.4 б. О> >з>> >>ФР ~~~н > >. у б( д) з(!) 32у — + — — —" — =О, д! Й 2 (4 10) в дискретной схеме которого применяется центральная разность для производных по «пространственной» координате г. Прогноз ВФР ~ (г,!) на один пьзг вперед строится по уравнению Фоккера-Планка (прогноз по уравнепиго Лиувилля строится аналогично„следует только положить Я(!) =- О) Полученные при численном счете значения массива 7(г,г+1) корректируются с условием пеотрицательности ВФР.
Такую коррекцию будем проводить «отсечкой» ВФР на нулевом уровне, т.е. полагать пропюзное значение равным нулю, если расчетное значение оказалось отрицательно. После этого проводится нормирование полученной ВФР на единицу. 4.4,7. 1Х оеноэ в е.иенного яда остатков на один иае вне ед Для построения прогноза ВФР на следующем временном шаге необходимо сформировать новые начальные данные в соответствии с и. 4.4.5. Для этой цели требуется прогноз не только ВФР, но и скорости й(г,г+1), поэтому надо также спрогнозировать совместную плотность распределения Г(г,г,1+1). Вели использовать расширенное уравнение Лиувнлля с включением в него совместного распределения координат, скоростей и ускорений, то для прогнозирования потребуется прогноз ускорений, для чего нужно будет прогнозировать вторыс ускорения и т,д, При этом каждое добавление новой размерности существенно увеличивает время счета.
Следовательно, более эффективной представляется процедура прогнозирования значения собственно временного ряда г(г+1), что позволит затем по имеющемуся алгоритму повторить к новому текущему моменту времени г+1 операции пунктов 4.4.3 и 4.4.5. Объем выборки остается прежним, но сдвинутым вперед иа 1 шаг по времени. Прогнозным значением г(~+1) временного ряда считается среднее значение случайной величины по найденному прогнозному распределению верояпюстей; г(г+1) = )г/(г,г+1)сЬ, (4.12) 4 4.8!Тд*~м ВФР ~д~ з~ ~ююй юд~~л. 118 После построения прогноза значения ряда г(~+1) повторяются действия, описанные в пунктах 4.5.3 и 45,5.
Тем самым оказывается сформироваииым набор данных на следуюгцем временном шаге, что позволяет повторить алгоритм 4.5.6 и 4,5.7. После применения описанного алгоритма г раз получаем прогноз ВФР и собственно ряда па всем интервале времени ~г; ~ +т1, Для возвращения к исходным переменным делаем обратное отображение с отрезка 1-1;1) и добавляем к полученным зпачсниям вычтенную на этапе пред-подготовки детерминированную составляющую. 4.5.
Примеры прогнозирования нестационарных временных рядов н сравнительнь~Й анализ точности Различных методов В заключительном параграфе диссертации приводятся результаты расчетов по методике, описанной вьппе, для некоторых нестацнонарных временных рядов, примеры которых бьши рассмотрены в главе П. Основным примером является временной ряд, образованный ценами на электроэнергию на ХОЛУЕМ (см.
Рис. 1-4, 19, 23, 25). Возможные варианты прогноза по уравнению Лиувилля (2.8) зависят от способа определения функции и(х,~) по известным данным в предыдущие моменты времени и схемы дискретизации уравнения Лиувнлля (2.16). Рассмотрим пример построения прогноза на сутки вперед, считая, что распределение должно быть 0,05-стационарно. Для прогноза внутри промежутка 0,05-стационарности можно применить различные модели для определения функции и(х,г): ее можно определить согласно уравнению (2.9), а также иными методами, например, регрессионными или авгокорреляционными, как в примере (2.15).
Согласно анализу, проведенному в главе И, оптимальным объемом выборки для этой задачи является Т(1; 0,05) = 30 суток, а максимальный горизонт прогноза равен д(30;0,05) = 7 суток. В работе 162) был применен регрессионный метод моделирования скорости как функции времени па промежутке, предшествующем моменту начала прогноза гон равному максимальному горизонту прогнозирования при заданной точности. Итак, положим в (2.15) р = 7, т.е. при построении пропюза по 0„05-стационарной ВФ1' в качестве и(х,1) возьмем ее аппроксимацию по данным за последшою неделю, а ВФР строим по данным из скользящего окна объемом в месяц.
Тогда и(х,~) = й(х)+а(х) —, й(х) = — ,"~ и(х,г), а(х) = — ,'1 (и(х,~) — й(х)$-4). (5.1) г-4 1 1' 4 7, 1 7, 1 Далее эта зависимость и(х,г) распространяется на моменты времени за пределами пРомежУтка 1Го — б, гс1, в частности, на момент Гс + 1. Дискретный аналог уравнения (2.8) при комбинировании левой и правой разпосгных производных по х имеет вид (2.16): 7(х,г+1) =11+(1-2а)и(х,тих,г)+аа(х-1,~) г(х-1,!)-(1-и)и(х+1,г) Я(х+1,г). Как уже говорилось в п.
4.2, параметр схемы и варьируется в (10) от 0 до 1, причем схема с центральной разностью, получаемая при и = 0,5, имеет наилучшую точность. Ошибкой прогноза ВФР в момент времени ~+1 будем называть значение функционала Л(г+1) = Д(х,г+1)-~(х,г+1)~~й. (5.2) Л = 10 12,12~и -0,5)+ 5,98), (5.3) Среднеквадратичная точность приведенной оценки составила 83%, Относительная вариация функционала (11) при изменении сс составила 25%. Это показывает, что выбор оптимальной дискретной модели в (10) имеет значение для повышения точности прогноза. На Рис.