Алгоритмы прогнозирования нестационарных временных рядов, страница 5
Описание файла
PDF-файл из архива "Алгоритмы прогнозирования нестационарных временных рядов", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 5 страницы из PDF
Если имеется цикличность двинь«х, которая меняется со временем, то полностью искл«очить ее различными методами сглаживания, как правило, не удается. В этом случае автокорреляционные модели применяются на этапе качественного анализа, точность которого должна быть улучшена с использованием других подходов. Последовательное усложнение автокорреляцнонных моделей привело к появлению т.н. ада»т«ивных моделей прогнозирования, которые базируются на объединении двух схем — скользящего среднего (СС) и авторегрессии. Модель СС состоит в том, что для определения свойств временного ряда с целью краткосрочного пропюза берется выборка последних данных за некоторый промежуток времени Т. Например, среднее значение определяется по последней выборке заданного объема: Е; =а(Е„.
«+Н; «)+(1-а)х« Н,=ЬН; «+(1-~4Е; «+Ь; ») х;.»---Е~+Н; (1.12) Здесь х; - это текущее значение исходного ряда, хьь« - прогнозное значение. Постоянные а и Ь в (1.12) называются константами сглаживания, относящимся к оценкам 20 Затем применяются регрессионные или автокорреляционные модели вида (1.5) н (1.7), в которых средние величины определяются по формуле (1.11). Модификацией (!.11) является взвешенная схема СС, когда оценкой текущего уровня является взвешенное среднее всех предшествую«цих уровней, причем веса прн наблюдениях убывают по мсрс удаления от последнего уровня, т.е.
информационная ценность наблюдений признается тем большей, чем ближе находятся они к концу интервала наблюдений. Возможны также варианты, когда наибольшую ценность имеют наблюдения с определенным лагом. Другим типом адаптивных прогнозных моделей является параметрическая модель сглаживания, когда значсцие в момент г+1 определяется не только статистиками самого ряда, но и прогнозом этого ряда за несколько предшествующих моментов времени, а также оценками текущих трендов (модели Брауна, Хольта и Уинтерса 133, 48, 491), Как правило, адаптивные модели применяются для прогнозирования рхда иа один шаг вперед. Например, двухпараметрическая модель Хольта использует сглаженные значения Е ряда и значения его тренда Н: уровня и тренда соответственно.
Выбор значений этих констант является достаточно субъективным. Возможно, например, нх оценнванне посредством МНК по серии тестовых апцроксимацнй ряда путом отбора наилучших из них. Одним из методов выделения т.н. главной части илн главных компонентов времешюго ряда является метод сингулярного спектрального анализа (ССЛ) 118, 461, разработанного в теории нелинейных динамических систем и представляющего оригинальный подход к исследованию автокорреляцнонпой зависимости.
В этом подходе рассматривается выборка некоторого объема Х и выбирается скользящее вдоль нее окно некоторого объема Т, Получающиеся выборки (х1,хЗ,...,хГ),(х2,хэ,...,хк+1) и т.д. рассматриваются как векторы Т-мерного линейного пространства. Расположив эти выборки в виде матрицы размером Т'(Ф-Т+1), можно найти ранг этой матрицы и определить базис (т,е, главные компоненты ряда) в пространстве скользящих окон. Затем можно попьпаться связать значение х,+1 с базисными векторами типа у(1„Т) "—" (х~,х~ 1 ...~ху у'+1) с помогцыо некоторои подходящеи функции; х, 1 =7'(у(г,Т). Динамическая система (1.13) порождает стационарный временной ряд, называемый главной частью исходного. Для этой системы можно определить траекторию, притягивающее множество и его размерность, функцшо распределения точек траектории и другис характеристики.
Корреляционный анализ по моделям типа Бокса-Дженкинса (1.7) и их обобщениям позволяет выявить степень зависимости данных на выборках относительно небольшого объема. Если же требуется изучать выборки обьемов свыше 10, как в биржевой торговле или статистической радиофизике, более адекватным является спектральное разложение стационарного случайного процесса, т,е. представление его в виде (7, 33, 40, 711 Ф),,~,пй соь(1дА +а А~)1 г и~7 (1 14) й где а~, - некоторые вещественные коэффициенты, а (д1,,в~ - случайные равномерно распределенные величины из интервала 1-л;к1, Если существует независящее от времени среднее значение х по генеральной совокупности, то ковариация С(т) процесса (среднее значение произведения (х(г + г) --. х)(х(г) — х)) представляется в виде Введснпая в (1.15) функция Р(а) называется спектральной функцией процесса, Пусть Г(в) абсолютно непрерывна н Яе) = Р'(е) - спектральная плотность процесса.
Тогда процесс называется белым п1умом, если он имеет постоянную спектральную плотность: ~(е) = сопи, Спектральное представление корреляционной функции позволяет выявить скрытую периодичность значеннй ряда, но также может быть использовано и для оценки средних значений на основе данных выборки объема п.
Например, аснмптотика дисперсии оценки среднего значения имеет вид лВ(х)->2ф'(О), Однако оценка спектральной плотности на основе выборочной функци и /;,(о) =- — ((х1 -х)созо+(хз -х)соз2в+...+(х„-х)сояиэ) 1 2 (1,1б) хотя и является аснмптотическн несмещснной„ее диспсрсия не стремится к нулю при и -+ оо 1811, т.е. она не является состоятельной. Можно получить состоятельные оценки для некоторых функционалов от Да), по их статистическая интерпретация не вполне огевидна.
В то же время знание выборочной спектральной функции может дать дополнительную информацию о корреляционной функции, что полезно для моделирования процесса. В зтом и состоит основная ценность анализа периодограмм, т.е. фурье-образов функции ковариации. Из других — «нетрадиционных» методов анализа временных рядов — следует отметить нейросетевой метод и метод размножения выборок. Нейросетевой метод анализа случайных процессов является одним из активно разрабатываемых в последнее время 18б).
Оп, как и болынинетво описанных выше методов, направлен па отыскание корреляционной связи между элементами времещюго ряда. Целью метода является отыскание «предвестника» наступления того или иного события и определение вероятности последнего 111, 90). Главной задачей является «обучение» искусствснной нейронной сети на достаточно болыпом количестве выборок некоторого объема, после чего принятие решения о наличии «предвестиика» принимается сетью на основе эмпирической вероятности наступления похожих случаев в период «об учення». Нейросетевые методы используют математическую модель нейронных сетей', на основе которых функционирует мозг человека и других живых существ.
Основу сети составляет нейрон — устройство, имеющее вход, преобразующее полученный* сигнал и передающее его иа выход, далыле по сети, нейронам, соединенным с пим, Настройкой сети к применению служит обучение — сеть обучается на основе известных примеров (значений ряда), получая поощрения за правильный ответ (к примеру, прогноз) нлн ответ в пределах точности н наказание за ответ неправильный*. Таким образом, получающийся ответ носит вероятностный характер. Особенностью нейросети является то, что создатель не должен знать закономерностей ряда при обучении сстн, она обучается сама, па примерах, В этом же заключается и слабое место — сеть может выдавать очень точные ответы без указания, как опи получились, представляя собой «чериый ящик».
Нейросетевой подход зачастую бывает очень эффективным в случаях, когда другие методы несостоятельны, является толсраптным к приемлемому количеству ошибочных обучаю1цих примеров, однако имеет и слабые стороны. К ним относятся относительность выдаваемых ответов, высокая вычислительная стоимость обучения, отсутствис гарантий приемлемости рсзультата применения метода. Метод размножения выборки (бутстреп), предложенный в 1977 году Б, Эфроном (91~, является одним нз методов случайной обработки данных стационарных процессов. Его сущность состоит в том, что по имеющимся У наблюдениям за случайной величиной, образующим по предположению выборку из генеральной совокупности, строится выборочная функция распрсдслсния, из которой извлекаются выборки с возвращением того же объема У с равньгми вероятностями извлечения каждого значения, По каждой выборке строится оценка интересующего параметра исходной случайной величины, а затем полученные оценки усредняются, И других вариантах бугстрепа из исходной выборки исключается один из элементов, после чего строятся случайные выборки объема Ф-1, которых можно построить в количестве У (по числу исключаемых элементов), после чего провести усреднение по вссм таким выборкам.