Диссертация (1152468), страница 6
Текст из файла (страница 6)
В качестве иллюстрации стоит отметитьнекоторые из них. Так, существуют работы, например [102, с. 17-34],свидетельствующие о том, что искусственные нейронные сети позволяют точнеепрогнозировать нестационарные стохастические процессы по сравнению страдиционнымилинейнымистатистическимимоделями.Однако,такжесуществуют примеры [133, с. 347-364; 157, с. 541-551], когда традиционныемодели обладали лучшими или эквивалентными прогнозными способностями посравнению с аппаратом ИНС. Потенциальное объяснение такого явления состоитв том, что нейронные сети позволяют лучше аппроксимировать процессы сприсутствием нелинейных связей. Однако в случае, если данные не содержатподобные нелинейные структуры, тогда традиционные линейные модели иискусственные нейронные сети могут прогнозировать исследуемые ряды с35одинаковой степенью точности.
Другим объяснением является тот факт, что нанастоящий момент не существует точно определенных процедур по выборуиспользуемых параметров сети, таких как время обучения, количество скрытыхслоев и узлов, которые в свою очередь зависят от поставленной задачи. Вконтексте вопроса о зависимости качества построенных сетей от методологии ихпостроения необходимо отметить работу [67, с. 414-429], в которой авторы путемаккуратного подбора входных параметров и способов обучения построилинейронную сеть, позволившую получать более точные прогнозные значения длявременных рядов обменных курсов австралийского доллара и фунта стерлингов кдоллару США AUD/USD и GBPUSD соответственно, по сравнению с моделямиARIMA , GARCHи RW (модель случайного блуждания).В качестве промежуточного итога необходимо отметить следующиесвойстваИНС,делающиеихпривлекательнымидляисследования,моделирования и прогнозирования временных рядов финансового рынка:1) ИНС по своей природе являются управляемыми данными (data-driven) исамостоятельно адаптирующимися (self-adaptive) [48, с.
132]. Для использованияИНС нет необходимости в задании спецификаций или функциональных форм.Такжеотсутствуетнеобходимостьзаданияначальныхпараметровилипредставлений о статистическом распределении данных. Искомая модельадаптивно формируется под свойства и структуру исследуемых данных. Данноесвойство ИНС является полезным при решении многих практических задач, длякоторых не существуют начальных знаний о свойствах исследуемого процесса;2) ИНС являются нелинейными, что позволяет использовать их для анализаи моделирования нелинейностей и сложных паттернов в данных, в отличие оттрадиционных моделей ARIMA;3) ИНС обладают универсальными аппроксимирующими свойствами. Какпоказано в работе [110, с.
359-366], ИНС позволяют аппроксимировать любуюнепрерывнуюфункциюслюбойстепеньюточности.Универсальностьаппроксимирующих свойств ИНС подтверждаются рядом сильных теорем, таких36как Хехт-Нильсена [108, с. 11-14] и Колмогорова-Арнольда [17, с. 953-956]. ТакжеИНС позволяют работать с данными, содержащими пропуски, ошибки и шум.Таким образом, отмеченные выше свойства и результаты прикладногопримененияИНСдемонстрируютэффективностьихиспользованиядляпрогнозирования финансовых рядов. Однако, существует альтернативныймеханизм построения описательных и прогнозных моделей финансового рынка –фильтр Калмана, позволяющий аналогично нейронным сетям аппроксимироватьнестационарные стохастические процессы. Фильтр Калмана, предложенныйКалманом в 1960 году в оригинальной работе [120, с. 35-45], как и егомодифицированная версия, разработанная Калманом и Бьюси в 1961 году [119, с.95-108], представляет собой рекурсивное решение задачи линейной фильтрациидля дискретных данных.
Начиная с 1960 года, благодаря повсеместномувнедрению компьютерных технологий, методы калмановской фильтрации нашлиширокое применение в задачах автономной и полуавтономной навигации, вчастности для самолетов, космических аппаратов и средств ПВО; в задачахпланирования и контроля в области робототехники; в задачах компьютернойвизуализации, а также в области экономических исследований. Возможностиприменения калмановской фильтрации при решении задач стохастическогоуправления и контроля подтверждается существующими по данной темеисследованиями, например [137, с. 1-15].
В области экономических исследованийфильтр Калмана, как правило, используется в теории контроля, моделированияэкономических систем [58, с. 49-74] и др. В частности, фильтр Калманапредставляет собой методологию, позволяющую строить оценку зависимых отвремени коэффициентов регрессионных моделей, в то время как в большинствеэконометрических моделей коэффициенты считаются постоянными. Другимпреимуществом использования калмановской фильтрации в экономическихисследованияхявляетсявозможностьанализасистем,содержащихненаблюдаемые переменные состояния, в то время как в большинствеэконометрических моделей все переменные состояния считаются наблюдаемыми.37Принцип работы фильтра Калмана заключается в получении прогнозазначения исследуемой переменной для следующего периода, используя еезначение в текущем периоде, и последующей корректировки прогноза вследующем периоде.
Коррекция прогноза происходит путем добавлениякоррекционной составляющей к ошибке прогноза таким образом, чтобыстатистически ее минимизировать. Как показано в работе [87, с. 1073-1083],линейный фильтр Калмана является оптимальным MSE (Mean Square Error)фильтром, позволяющим строить оценки, обладающие свойством минимальнойсреднеквадратичной ошибки MMSE (Minimum Mean Square Error), при условии,что наблюдаемые переменные и ошибки обладают Гауссовым распределением.Таким образом, фильтр Калмана является лучшим среди линейных фильтров,позволяя получать несмещенные и оптимальные оценки состояния системы вмомент времени t , используя всю доступную информацию для шага t 1 , идополнительную информацию, полученную на шаге t .Также, благодарярекурсивному способу оценки, фильтр каждый раз пересчитывает оптимальноерешение при поступлении в систему нового наблюдения.Фильтр Калмана является основным алгоритмом оценки динамическихсистем в форме пространства-состояния (state-space) [86, с.
165-169], чтопозволяет использовать его не только для аппроксимации и фильтрации, но такжедлярешениязадачпрогнозирования.Представлениемоделивформепространства-состояния является одним из основных инструментов в теорииконтроля и может быть описано с помощью следующих формул:Xt 1 Ft Xt Vt ,(1.8)Yt Gt Xt Wt ,(1.9)где {Xt } представляет -мерный стохастический процесс, описывающийсостояние определенной системы, {Vt } N (0,{Qt }) вектор независимых одинаково38распределенных ошибок процесса, {Ft } – последовательность матриц размера , {Yt } – -мерный процесс, описывающий наблюдаемое состояние системы,{Wt } N (0,{Rt }) ,{Gt }–последовательностьматрицразмера .Последовательности {Wt } и {Vt } являются некоррелированными между собой, атакже с процессом начальных состояний X1 .Формулы (1.8) и (1.9) представляют собой уравнения состояния инаблюдения соответственно.
По причине сложности исследуемых систем, векторсостояния для которых может не являться наблюдаемым, требуется составлениеуравнения наблюдения, описывающего исключительно наблюдаемые параметрысистемы и являющегося дополнением к основному уравнению состояниясистемы. Как правило, уравнение наблюдения обладает меньшей размерностью,чем уравнение состояния, т.е. . Линейная оценка Xt в терминах уравнений(1.8) и (1.9) может подразделяться на следующие задачи:1. Задача прогнозирования с использованием Y0 ,..., Yt1 .2. Задача фильтрации с использованием Y0 ,..., Yt .3. Задача аппроксимации с использованием Y0 ,..., Yn , где n t .ЗадачапрогнозированияспомощьюфильтраКалманаиспользуетпредикторы и матрицу ковариации ошибок, представляемые формулами (1.10) и(1.11) соответственно.Xt Pt 1 ( Xt ),(1.10)t E[(Xt Xt )(Xt Xt ) '],(1.11)где Pt (X) P(X Y0 ,..., Yt ) – вектор лучших линейных предикторов X1 ,..., X ,описываемыйвтерминахвсехэлементовизPt (X) A0 Y0 ...
At Yt , A0 ,..., At – матрица размера .множестваY0 ,..., Ytкак39Также задаются начальные условия (1.12) – (1.13) и условия рекурсии (1.14)– (1.15):X1 P(X1 Y0 ),(1.12)1 E[(X1 X1 )(X1 X1 ) '],(1.13)Xt 1 Ft Xt t t1 (Yt Gt Xt ),(1.14)t 1 Ft t Ft ' Qt t t1t ',(1.15)где t Gt t Gt ' Rt и t Ft t Gt ' .Выражение t t1 называется матрицей коэффициентов усиления (Kalmangain) и обозначено далее как Kt t t1 .Отклонение прогноза вектора состояния системы от наблюдаемого значенияможет быть представлено в виде:εt Yt Gt Xt .(1.16)Тогда ковариационная матрица вектора ошибки (отклонения):St Gt t Gt ' Rt .(1.17)Матрица коэффициентов усиления:Kt t Gt ' St1.(1.18)40Коррекция ранее полученного (экстраполированного) вектора состояния, сучетом рассчитанного отклонения и матрицы усиления коэффициентов:Xt Xt Kt εt .(1.19)Ковариационная матрица для скорректированного вектора состояниясистемы:t ( I Kt Gt )t .(1.20)Процедура оценки фильтром представляет собой следующий алгоритм:исследуемая модель задается в виде пространства-состояния, затем для множествавходных параметров происходит оценка ошибок прогнозов модели, которые далееиспользуютсядлярекурсивнойоценкифункцииправдоподобияиеемаксимизации.
Более детально алгоритм работы фильтра можно разложить на дваосновных этапа, описанных далее, каждый из которых содержит по несколькошагов.1. Этапэкстраполяции,подразделяющийсянаследующиешаги:экстраполяция вектора состояния системы и оценка его ковариационной матрицы(1.12) – (1.15).2. Этап коррекции, подразделяющийся на следующие шаги: оценкаотклонения наблюдаемого состояния от его прогноза (экстраполированногозначения), полученного на предыдущем шаге (1.16), оценка его ковариационнойматрицы (1.17), оценка матрицы коэффициентов усиления Калмана (1.18),внесение коррекции в полученное ранее прогнозное значение вектора состояниясистемы (1.19).Далее, на рисунке 1.2, приведена графическая иллюстрация принципаработы алгоритма.41Рисунок 1.2 – Алгоритм работы фильтра КалманаИсточник: составлено авторомДля запуска фильтра Калмана, помимо представления модели в формепространства-состояния, на начальном этапе экстраполяции необходимо заданиевектора начального состояния системы и дисперсии ошибок.
В случае еслиисследуемыйвременнойрядявляетсястационарным,классическойинициализацией является использование безусловного среднего и дисперсиивектора начального состояния [54, с. 499-502]. В случае нестационарныхвременных рядов финансового рынка данный подход не применим, так каксреднее значение и ковариация являются зависимыми от времени. Существуетмножество работ, посвященных способам решения данной проблемы. Примеромможет служить работа [156, с. 49-58], в которой дисперсии начального состоянияприсваивались большие значения. Однако, как продемонстрировано в работе [128,с.