Диссертация (1138079), страница 10
Текст из файла (страница 10)
По нашему глубокомуубеждению, крайне нереалистично разработать универсальную модель поддержки54принятия решений, которая бы одинаково хорошо работала всегда и везде. Какуже отмечалось выше, финансовые рынки крайне неоднородны и представляютсобой сложную динамическую систему, постоянно изменяющуюся во времени.Поэтому даже если нам в какой-то момент и удалось построить некую идеальнуюмодель, нет никаких гарантий, что она будет правильно прогнозировать рынок вбудущем, и её никогда не нужно будет корректировать. В этой связи мы будем,скорее, стремиться получить подтверждение принципиальной возможностипрогнозирования финансовых рынков с помощью искусственных нейронныхсетей с внедрением предварительной обработки входных данных, признаваянеобходимость адаптации модели под конкретные рыночные условия.
По этой жепричине в даннойработе будутпродемонстрированытольконаиболеепоказательные и интересные результаты прогнозирования.Как уже указывалось выше, мы использовали два входных значения дляискусственной нейронной сети, обученной по методу Левенберга-Марквардта.Оба этих значения были получены на основе скользящего эмпирического вектора,содержащего логарифмические значения доходностей финансового инструментаза пять предыдущих торговых периодов.В качестве первого входного значения в данной модели мы использовализначение доходности финансового инструмента с лагом в один торговый период.Чтобы получить второе входное значение мы использовали предварительнуюобработку данных с помощью метода главных и метода независимых компонент –второе входное значение формировалось как среднее значение вектора (8),спроецированного на одну или несколько главных компонент, либо как скаляр,полученный на основе анализа независимых компонент (17).
Конечный сигналпрогноза модели формировался как выходное значение сети.Далее необходимо сказать несколько слов о выборе длины скользящегоокна.СогласнотеоремеТакенса,дляаппроксимациивременногорядадинамической системы (к разновидности которой, безусловно, стоит отнестифинансовые рынки) можно, последовательно увеличивая длину обучающегомассива,подобратьтакойегоразмер,которыйобеспечитнадёжное55прогнозирование ряда. При этом может существовать некоторая «критическая»точка, после прохождения которой дальнейшее расширение выборки перестанетулучшать качество прогноза, или даже ухудшать его [9].На практике можно обнаружить, что искусственным нейронным сетямдостаточнокороткогоскользящего окна для достиженияграницсвоихпрогнозных возможностей [24, 189].
Мы изучили, как меняется суммарнаяквадратичная ошибка прогноза сети прямого прохода, обученной по методунаименьших квадратов, при прогнозировании американского фондового индексаS&P 500 (логарифмические приросты дневных цен закрытия за 2000-2013 гг.,всего около 3500 тысяч значений), и обнаружили лишь незначительное изменениееё величины по мере увеличения длины окна (рис. 3). По-видимому, этообъясняется тем, что информация на финансовом рынке стремительно меняется идаже достаточно новые данные быстро становятся нерелевантными.
Основываясьна этом наблюдении, в данной работе мы, как правило, использовали длинускользящего обучающего окна, равную пяти значениям, чтобы избежатьусложнения вычислений.Рис.3.Динамиказависимостисуммарнойквадратичнойошибкиискусственной нейронной сети прямого прохода, обученной по методунаименьших квадратов, от длины скользящего обучающего окна.Что касается оценки эффективности построенной модели, то обычно такимкритерием для искусственных нейронных сетей и других прогнозных моделейвыступаетзначениеошибки(суммарнойквадратичнойлибосредней56квадратичной), причём для финансовых рынков достаточно спрогнозировать знакбудущей доходности.
Однако в данной работе мы будем измерять ошибку другимпутём–черездинамикувиртуальногопортфеля,рассчитываемогопоэмпирическим данным на основе прогнозов модели. Таким образом мы сможемнетолькопредставитьинтерпретациюнагляднуюполученныхколичественнуюпрогнозныхрезультатов,инокачественнуюиоценитьинвестиционный потенциал разработанной модели. Это важно потому, что иногдамодели, демонстрирующие более низкую среднюю ошибку, могут менее точнопредсказывать знак будущей доходности по сравнению с моделями с большейошибкой [9].Оценка надёжности прогнозов построенных моделей также проводилась спомощью расчета доверительных интервалов для математического ожиданиядоходности портфеля (в процентах годовых), построенного по нейросетевоймодели с предварительной обработкой входных данных.
Это помогалоопределить диапазон, в который попадало большинство значений, и понятьявляется ли итоговая доходность виртуального портфеля закономерной (см.Приложение).Также ещё раз обратим внимание на то, что мы работали со скользящимивекторами (в данном случае – пять периодов), и по этой причине прогнозноезначение модели пересчитывалось для каждого торгового периода по новымданным. Все прогнозы делались для значения доходности финансовогоинструмента на один торговый период вперёд за границей выборки обучающего«окна», т.е. представленные результаты прогнозирования финансовых рынковносят вневыборочный характер (out-of-sample).В ходе имитационной торговли мы намеренно старались использоватьдостаточно примитивное торговое правило, для того чтобы, по возможности,минимизировать его влияние на общий результат модели. В зависимости отзначения прогноза, мы вставали в длинную, либо в короткую позицию; позицияпересматривалась для каждого торгового периода.
Формально торговое правиловыглядело следующим образом (24):57r если k TG k r иначеkk(24)где G – логарифмическая доходность виртуального инвестиционного портфеля(чтобы вернуться к обычным доходностям, мы применяли экспоненциальнуюфункцию), r – логарифмическая доходность финансового инструмента; ξ –прогнозное значение модели (сигнал прогноза), T – пороговое значение дляпрогноза, на основании которого принималось торговое решение, k – номерторгового периода.В качестве порогового значения T может выступать константа. В случаеиспользования искусственных нейронных сетей это может быть, например, числоиз области значений функции активации.
Кроме этого, Т может быть ипеременной, зависимой от времени. Например, мы можем сравнивать прогнозы,выдаваемые моделью, с теми значениями, которые она рассчитывала напредыдущихшагах, илисозначениямипрогнозируемойпеременнойсопределённым лагом.Кроме этого, в качестве бенчмаркинга в данной работе мы использовалиещё три виртуальных инвестиционных портфеля: первый формировался попрогнозам искусственной нейронной сети прямого прохода без предварительнойобработки входных данных, второй – по прогнозам авторегрессии, третийпредставлялнеобходимымсобойрыночныйориентиромрезультативностидляпортфель.того,Сетьчтобыпрямогопроходаотслеживатьпрогноза от использования предварительнойбылаприращениеобработкивходных данных. Авторегрессия помогала сопоставить сконструированнуюмодель с линейным эконометрическим построением.
Рыночный портфель,основанный на пассивной торговой стратегии «купи и держи», обеспечивал58сравнение результатов модели с реальной динамикой соответствующегофинансового рынка.Искусственная нейронная сеть прямого прохода обладала той жеархитектурой, что и сеть Левенберга-Марквардта из (23), с тем отличием, что еёобучение проводилось в соответствии с методом наименьших квадратов (МНК)(25):f ( x1, x 2, x3, x 4, x5, x6, r1, r 2) 2t 1 F r i t 5tt Min(25)где F – выходное значение искусственной нейронной сети, r – реальноеэмпирическое значение из скользящей обучающей выборки, t– номер торговогопериода.Авторегрессионная модель задавалась как (26):r * rttt t 1где rt* – прогноз модели, αt, βt –(26)коэффициенты авторегрессии, r –логарифмическое значение доходности, t – номер торгового периода.Торговые решения по портфелю «прямого прохода» и авторегрессионномупортфелю также принимались в соответствии с правилом (24).В ходе виртуальных торговых сессий мы использовали логарифмическиеприросты цен закрытия финансовых инструментов и не вводили кредитное плечо.Комиссия финансовых посредников не учитывалась.
Начальные значения всехпортфелей равнялись 1.Чтобы продемонстрировать, что превышение доходности, полученной спомощью искусственных нейронных сетей с предварительной обработкой59входных данных, неслучайно по отношению к рыночной динамике и другиммоделям, в отношении результатов, вынесенных на иллюстрации, проводилсядисперсионный t-тест на равенство следующих средних значений: виртуальногоинвестиционногопортфеляспредварительнойобработкой входных данных и нейросетевого портфеля прямогопрохода без обработки данных, виртуальногоинвестиционногопортфеляспредварительнойобработкой входных данных и авторегрессионного портфеля; виртуальногоинвестиционногопортфеляспредварительнойобработкой входных данных и пассивного рыночного портфеля.Отклонение нулевой гипотезы t-теста означало, что средние значенияуказанных портфелей не равны и существенным образом отличаются друг отдруга, что и означает неслучайность выигрыша моделей искусственных сетей спредварительнойобработкойвходныхданных.Расчетсоответствующейвыборочной t-статистики приведён в Приложении.Мы начнём обзор полученных результатов с валютного рынка.
В ходеимитационной торговли мы исследовали эффективность прогнозирования курсоввалют развитых стран на различных временных промежутках. Наилучшиерезультаты были получены для коротких временных интервалов, а именно на 15минутных ценах закрытия. Эти данные приведены в табл. 1., причём взависимости от того, какой метод (главных или независимых компонент) былприменён для предварительной обработки входных данных в искусственнойнейронной сети, обученной по методу Левенберга-Марквардта. Использовалиськотировки за январь-февраль 2012 года (всего около 3000 значений для каждойвалютной пары). В качестве дополнительной иллюстрации на рис. 4,5 приведенадинамика портфелей по валютным парам фунт/доллар и доллар/швейцарскийфранк.60Табл.
1. Сравнительные результаты прогнозирования валютных курсовразвитых стран с помощью искусственной нейронной сети, обученной по методуЛевенберга-Марквардта, и предварительной обработкой данных по методуглавных компонент и методу независимых компонент (январь-февраль 2012 года,15-минутные котировки).ВалютнаяЗначениеЗначениеЗначениеЗначениепаранейросетевогонейросетевогонейросетевогоавторегрессионного рыночногопортфеля– портфеля– портфеляпортфеляиспользование использование прямогоPCA(% ICAЗначение(%портфеляправильногопроходапрогнозазнакаправильного(%(%доходностипрогнозаправильногоправильногоследующемзнакапрогнозапрогнозаторговом периоде)доходностив знакавзнакаследующемдоходностив доходноститорговомследующемследующемпериоде)торговомторговомпериоде)периоде)вЕвро/ доллар1,01 (54%)1,02 (54%)0,97 (51%)0,94 (55%)1,00Фунт/доллар1,09 (55%)1,08 (55%)0,98 (51%)0,96 (55%)1,01Доллар/йена1,11 (59%)1,13 (59%)0,95 (55%)0,98 (58%)1,01Евро/йена1,08 (54%)1,07 (54%)0,98 (53%)0,99 (55%)1,03Евро/фунт1,09 (57%)1,09 (57%)1,01 (53%)0,95 (57%)1,00Доллар/1,08 (56%)1,08 (56%)1,02 (53%)1,00 (55%)0,971,08 (56%)1,08 (56%)0,99 (53%)0,97 (56%)1,00швейцарскийфранкСреднеезначениепортфеля(%правильногопрогнозазнака) по всем61валютнымпарамПримечание: значения портфелей указаны на конец торговой сессии(начальные значения равны 1).Здесь и далее в работе все представленные втаблицах и на графиках данные основаны на собственных расчетах автора.На основании результатов, представленных в табл.1 можно сделатьнесколько важных выводов.