Методы экстраполяции нерегулярных временных рядов (1103521), страница 2
Текст из файла (страница 2)
А это возможно толькопри бесконечном количестве доступных данных. Кроме того, предполагается,что наблюдения доступны с произвольной точностью. Поэтому требуютсяспециальные исследования применимости полученных теоретическихрезультатов при наличии шума и в условиях конечной длины ряда.Та же проблема возникает и при оценке количественных показателей пореальным временным рядам (в частности, показателей Ляпунова,корреляционной размерности – этим проблемам посвящено большоеколичество работ), используемых в теории детерминированного хаоса, приопределении которых используется предельный переход. При работе сконечным рядом обеспечить предельный переход невозможно.
Поэтому вомногих случаях переходят к сравнительным исследованиям показателей,полученных с помощью стандартных измерительных процедур.На основе теоретических подходов с учетом условий и ограничений работыс реальными временными рядами разработаны и представлены в литературеспособы и модели обработки нелинейных сигналов, включающие в себя методыклассификации и сравнения временных рядов, выявления свойствдинамических систем, лежащих в их основе, предсказания будущих значений –экстраполяции временных рядов.
Краткое описание основных принциповнекоторых из них так же изложено в первой главе.Описание и обзор литературы по двум основным подходам к анализу ипрогнозу нерегулярных временных рядов на основе глобальных и локальныхмоделей вынесено во вторую главу.
Деление методов на глобальные илокальные проводится по области определения параметров аппроксимирующейфункции. В глобальных методах эти параметры идентифицируются сиспользованием всех известных значений ряда. Локальная аппроксимацияпредполагает отказ от явного использования для прогнозирования всех ужеизвестных значений ряда и ограничивает количество объясняющих значенийлишь наиболее близкими в некотором смысле к стартовой точке, после которойначинается прогноз.Основное направление использования глобальных методов – это получениеглобальных характеристик системы.
Прогнозирование в этих методахиспользуется в большой степени для выяснения долгосрочной динамики, чемдля оценки ближайшего будущего. Локальные методы прогноза имеютпреимущество в задачах, связанных с прогнозированием нерегулярныхвременных рядов.5«Глобальный» метод – сингулярный спектральный анализ (SSA) и методлокальной аппроксимации (LA) детально рассмотрены во второй главе. Там жеданы подробные пошаговые описания этих методов.В основе большинства подходов, связанных с обработкой временных рядов{ x1,…, xN } , лежит построение множества векторов задержекx t = ( xtxt −1xt − p +1 ) , t = p, p + 1,…, N . Метод задержек устанавливаетTпереход от исходного одномерного (скалярного) временного ряда кмногомерному (векторному) представлению.
При этом каждый многомерныйвектор образуется из некоторого числа p следующих друг за другом значенийисходного ряда. Результат можно представить в виде набора «фотографий»ряда, сделанных через скользящее вдоль ряда окно, в которое одновременнопопадает лишь p последовательных значений ряда:x p +1X p×( N - p +1)x p+2⎛ ⎡ xp ⎤⎜⎢ ⎥=⎜⎢ ⎥⎜ ⎢ x2 ⎥⎜⎜ ⎢ ⎥⎝ ⎣ x1 ⎦⎡ xN ⎤ ⎞⎢⎥⎟⎢⎥⎟.⎢ xN − p + 2 ⎥ ⎟⎢⎥ ⎟⎟xNp−+1⎣⎦⎠xN − p⎡ x p +1 ⎤⎢⎥⎢⎥⎢ x3 ⎥⎢⎥⎣ x2 ⎦↓x1↓Принцип действия SSA во многом схож с Фурье-фильтрацией: здесьисходный ряд также представляется в виде набора составляющих, только в SSAэти составляющие не являются в общем случае гармоническими.
Особенностьюметода SSA является обработка матрицы X по алгоритму, близкому к методуглавных компонент (МГК). Использование для обработки всей матрицы Xсразу обуславливает отнесение этого метода к разряду глобальных.Выбор составляющих осуществляется из условия максимизации разбросаточек (каждый столбец матрицы X представляется в виде точки в M -мерномпространстве задержек) вдоль выбранной составляющей. Иллюстрация этогоалгоритма представлена на рис. 1, где x( ) , x( ) , x( ) – первая, вторая и третья оси1координат исходного базиса,23( y( ) , y( ) , y( ) )123– новый базис.
Осьy( )1расположена вдоль прямой максимального разброса точек на графике; по осиy(2)разброс меньше, но он максимальный из всех возможных при заданной6y ( ) ; ось y (13)(при заданных y ( ) , y (12)) определятся единственным образом и наее долю разброса почти не остается.x(3)y(y(3)y( )1P2)x(2)x( )1Рис. 1. Выбор новой системы координат методомглавных компонент ( M = 3 ).В SSA получающееся разложение используется для выделения наиболеезначимых составляющих ряда и отсева случайных возмущений.
Например, дляслучая, изображенного на рис. 1, можно ограничиться первыми двумясоставляющими, так как вдоль третьей оси разброса почти нет и все точкиможно приблизительно считать лежащими в плоскости двух первыхсоставляющих – (P). Отклонения от этой плоскости как раз могут бытьследствием случайных возмущений.Анализ полученных составляющих позволяет выделять периодические иквазипериодические составляющие временного ряда. Этот метод можетиспользоваться для улучшения соотношения сигнал/шум. Кроме того, впоследнее время появились оригинальные варианты, расширяющиевозможности SSA и позволяющее строить на его основе прогноз дальнейшейдинамики ряда.
Например, метод экстраполяции «Гусеница», в соответствии скоторым предсказание ряда на один шаг по времени вперед определяется изусловия минимизации проекции нового вектора на выбранную гиперплоскость(P).Иллюстрацией алгоритма локальной аппроксимации в простейшемодномерном случае может быть следующий способ построения прогнозатемпературы на следующий день: сначала находится день, в которыйтемпература была максимально близка к сегодняшней и затем в качестве7прогноза температуры на завтра берется ее значение в день, следующий занайденным. Аппроксимация более высокого порядка позволяет такжеучитывать влияние на прогноз отклонений «сегодняшней» температуры оттемпературы в день, наиболее похожий на сегодняшний.Построение прогноза на один шаг по времени по методу LA проводится втри этапа.
Сначала строится матрица задержек и выбирается локальноепредставление, т. е. вид функции, связывающей следующее значения ряда спредыдущими: xt +1 = f ( xt , a ) , где a – вектор параметров представления.Наиболее распространенный вариант – линейная аппроксимация(аппроксимация первого порядка), но используются еще два варианта: нулевого(аппроксимация константой) и второго порядков (аппроксимация полиномомвторого порядка).Затем производится выбор соседей – векторов, ближайших к последнемуизвестному вектору в пространстве задержек (но не во времени). После этогопроизводится оценка параметров представления исходя из известной динамикивекторов-соседей.
Оценив значения параметров аппроксимации, можнопостроить прогноз следующего значения ряда: xˆ L+1 = f ( x L , aˆ ) . Индексом Lобозначен последним известный (стартовый) вектор.Для прогноза на несколько шагов обычно используются один из двухспособов: итеративный и прямой. В работе предложен еще один способ –итеративный с пересчетом.Итеративный способ состоит в последовательном построении прогноза наодин шаг с добавлением его результата к исходным данным и повторнымприменением модели представления с параметрами, оцененными на первомшаге. Идея итеративного способа с пересчетом состоит в том, чтобы зановооценивать параметры представления на каждом шаге.
Как показано в работе,это позволяет существенно повысить эффективность метода.При прямом способе прогноза стартовый вектор и все его соседи остаютсянеизменными, а параметры представления оцениваются заново на каждом()(t )шаге: xˆL+t = f x L , aˆ . Здесь не требуется заново выбирать соседей и непроисходит накопления ошибки за счет итераций.Во второй главе на тестовых примерах дано предварительное качественноесравнение результатов получаемых при разных порядках аппроксимации припрогнозировании на один шаг вперед и разных способах аппроксимации припрогнозировании на большую длину.8Построению общей математической модели метода локальнойаппроксимации и выбору оптимального варианта метода для условийконкретного временного ряда посвящена третья глава.Предлагаемая в этой главе модель позволяет получить аналитической видрешения задачи прогноза методом LA.
Исследование свойств этого решенияпозволяет выработать рекомендации по выбору способа прогноза(итеративный, итеративный с пересчетом, прямой) без проведения численныхрасчетов. Кроме того, на основе этого решения становится возможнымизучение асимптотических свойств прогноза и критериев выбора порядкалокальной аппроксимации.Как показано в работе, уравнение LA любого порядка (локальноепредставление) может быть представлено в виде: xt +1 = a0 + xt T a , где a –обобщенный вектор коэффициентов – параметров модели.Для оценки этих коэффициентов строится система уравненийY = I a0 + Xa , где I Ξ×1 – вектор из единиц, X – матрица соседей –транспонированный фрагмент матрицы задержек, состоящий лишь из однихсоседей стартового вектора, а Y – вектор значений в которые переходят соседистартового вектора за ϒ шагов.
Требуется оценить параметры ( a0 , a ) .Решение этой системы уравнений было получено с помощью методанаименьших квадратов (МНК). В результате была определена формула дляпрогнозируемого значения ряда: xˆ L+ϒ = Y + ( xTL − X ) aˆ , где Y— среднеезначение вектора Y (вектор, совпадающий с результатом прогноза длянулевого порядка), X — вектор средних значений координат в матрице соседейX , т. е. «усредненный» сосед.Как установлено в работе, прогноз, полученный методом локальнойаппроксимации любого порядка, есть линейная комбинация прогноза нулевогопорядка и отклонений стартового вектора от «усредненного» соседа. Отсюдаможно сделать вывод, что поправка, обусловленная отклонением стартовоговектора от «усредненного» соседа, корректирует неравномерностьраспределения соседей вокруг стартового вектора.На основании общего аналитического решения были получены модельныеуравнения прогноза для каждого из рассматривавшихся способов прогноза(итеративного, итеративного с пересчетом, прямого).Было установлено, что итеративный вариант нулевого порядка даетаппроксимацию нулевого порядка, т.















