Диссертация (1138079), страница 14
Текст из файла (страница 14)
Вслучае с распознаванием букв эта задача была решена относительно просто – мыдобавили латинский алфавит в библиотеку образов сети. Однако передисследователем финансовых рынков встаёт достаточно сложный вопросотносительно того, что использовать в качестве априорных знаний: какаяинформация будет максимально полно и достоверно отражать быстрый характеррыночных изменений. Более того, мы также должны учитывать необходимостьотбора наиболее существенных фактов, поскольку по объективным причинамневозможно добавить в библиотеку сети всю доступную информацию,касающуюся финансовых рынков.
Нам бы также хотелось обработать эти данныетаким образом, чтобы по возможности избежать появления ложных аттракторов.Самый простой путь в случае прогнозирования финансовых рынков –попытаться составить библиотеку априорных знаний сети Хакена на основевизуальных образов, например, широко известных фигур технического анализа(«голова и плечи», «алмаз», треугольник и др.). При этом их, скорее всего, этиграфические фигуры всё же нужно будет перекодировать в какой-либо числовойформат, и тогда при анализе рынка сеть будет пытаться распознать ужезаложенные в её память паттерны. Мы считаем, что такой способ заслуживаетрассмотрения, однако может быть недостаточно эффективен, потому чтонеизвестно, каким образом наблюдаемые на рынке «изображения» могут бытьсвязаны с истинными, глубинными процессами ценообразования.
В такойситуации присутствует риск случайности в определении библиотеки априорныхзнаний, что неприемлемо для серьёзного научного исследования. Кроме этого, не82вполне понятно, на каких условиях будет происходить обновление библиотеки –важного фактора качества обучения сети Хакена.В свете сказанного выше для формирования библиотеки априорных знанийв искусственной нейронной сети Хакена мы предлагаем вновь обратиться кметоду главных и методу независимых компонент. Как говорилось в предыдущихразделах, эти инструменты обработки данных эффективно вычленяют из общегомассиваинформациинаиболееважныесигналы.Мытакжеможеминтерпретировать вычисленные с их помощью компоненты как наиболеефундаментальныефакторы,влияющиенапроцессценообразованиянафинансовом рынке и очищенные от незначительных и случайных колебаний, атакже фонового шума. Если смотреть на PCA и ICA под таким углом, то это даётнам возможность использовать их для получения базовых, априорных знаний орынке.Важно указать также на то, что метод главных компонент уже несёт в своейоснове соотношение ортогональности (28), требуемое для расчета библиотекиаприорных знаний искусственной нейронной сети Хакена.
Метод независимыхкомпонент не содержит в себе обязательного условия ортогональности, однако унего есть другое важное преимущество для работы на финансовых рынках –использование негауссовских распределений. Кроме этого, ICA может снизитьриск возникновения ложных аттракторов. Дело в том, что одна из причин ихпоявления кроется в похожести данных в библиотеке априорных знаний.
Неисключено, что в случае с распознаванием образов в разделе проблемазаключалась в том, что многие буквы латинского алфавита попросту похожи на E.Однако отличительной особенностью метода независимых компонент являетсянахождение максимально независимых друг от друга направлений развитиянаблюдаемого процесса, так что библиотека априорных знаний, заполненная наего основе, может быть не только максимально информативной, но и будетсодержать не похожие друг на друга значения.Наконец, пожалуй, самое важное следствие применения метода главных иметода независимых компонент – неслучайность результатов анализа по83отношению к наблюдаемому процессу, потому что они напрямую зависят отобрабатываемого эмпирического массива.
Другими словами, использование PCAи ICA даёт возможность сконструировать контекстно обусловленную библиотекуаприорных знаний сети Хакена. Добавим к этому, что мы работаем соскользящими обучающими векторами и пересчитываем значения модели длякаждого торгового периода по новым данным, а это означает постоянноеобновление библиотеки априорных знаний. Мы надеемся, что это также поможетснизить риск возникновения локальных минимумов и ложных аттракторов.В этой связи мы предполагаем допустимым встраивать как PCA, так и ICA всеть Хакена для прогнозирования фондового и валютного рынка.
Для методаглавных компонент аналогом библиотеки контекстной информации ν из (27)будетвыступатьматрица,столбцыкоторойявляетсяреконструкциямиэмпирического вектора X по главным компонентам (столбцам матрицысобственных векторов Q из (8)) с определённым сдвигом в прошлое. Так, первыйстолбец библиотеки контекстной информации будет формироваться на основеэмпирического вектора Х с лагом в один торговый период, второй столбец – наоснове вектора Х с лагом в два торговых периода и т.д.
Таким образомитеративный процесс внутри сети Хакена будет сводиться к поиску тойреконструкции прошлого, которая оказала наибольшее влияние на текущийпроцесс ценообразования.В основе механизма реконструкции эмпирического вектора Х в случаеприменения PCA лежит его проецирование на меньшее число координатных осейв пространстве главных компонент: мы будем использовать только одну или двесамыеглавныекомпоненты(векторы-оси,соответствующиенаибольшимсобственным значениям ковариационной матрицы) для получения элементовбиблиотеки контекстной информации сети Хакена. Число главных компонент(одна или две), по которым осуществлялась реконструкция, мы соотносили сосложностью текущей рыночной среды, индикатором которой для нас былаволатильность, выраженная через стандартное отклонение (подразумевалось, чтодобавление большего числа главных компонент в реконструкцию помогает более84эффективно«очиститьсигнал»ценообразования факторы).ивычленитьнаиболееважныедляОсобо отметим, что мы рассматривали рынок снизкой волатильностью как ситуацию более сложную для принятия решенийагентами, нежели чем рынок с высокой волатильностью [7].
Поэтому в томслучае, когда текущая волатильность оказывалась выше средней по всей выборке,реконструкция вектора Х проводилась по одной главной компоненте, если ниже –то по двум (рис. 16,а, для пятиточечных скользящих векторов).Рис. 16, а. Схема функционирования искусственной нейронной сети Хакенапри применении методов главных компонент для формирования библиотекиконтекстной информации.В случае использования метода независимых компонент библиотекаконтекстной информации сети Хакена составлялась на основе реконструкцийэмпирического вектора Х по каждой из независимых компонент, чьё влияниеассоциировалось со столбцами демикширующей матрицы W из (12) (для расчетакаждогонаборанезависимыхкомпонентмыиспользовалискользящие85пятиточечные векторы со сдвигом на пять торговых периодов в прошлое).
Этообъяснялось тем, что, как указывалось ранее, мы не можем ранжироватьнезависимые компоненты по их важности (влиятельности) для процессаценообразования. Поэтому в данном случае мы не отдавали предпочтение какойлибо из компонент, а проводили реконструкцию по каждой из них. Сеть Хакена, всвою очередь, соотносила исходный вектор Х с полученными реконструкциями(рис.
16,б, для пятиточечных скользящих векторов).Рис. 16,б. Схема функционирования искусственной нейронной сети Хакенапри применении методов независимых компонент для формирования библиотекиконтекстной информации.Заметим, что при этом мы сознательно не ставили задачу соотнестиэлементы вышеуказанных библиотек контекстной информации, полученных поPCA и ICA, с определёнными качественными состояниями финансовых рынков(например, бычьим, медвежьим или боковым трендом), поскольку эта задачачрезвычайно сложна и может потребовать отдельного научного исследования.86Мы, скорее, предполагали, что библиотеки контекстной информации,сформированные по PCA и ICA, содержат в себе некие абстрактные, но важныефакторы (в случае PCA – ещё разнесённые по времени), влияющие надолгосрочную справедливую стоимость финансового инструмента, вокругкоторой происходят ценовые колебания. При этом принципиально невозможнодоказать, каким образом соотносятся эти фундаментальные факторы и реальнонаблюдаемые эмпирические котировки на рынке.
В этой связи доказательствомналичия и обнаружения этой связи с помощью методов главных и независимыхкомпонент, совмещённых с сетью Хакена, будет эвристическая пригодностьпостроенной модели для прогнозирования финансовых рынков.Для наглядной иллюстрации того, как выглядят и меняются отдельныеэлементы библиотеки априорных знаний, построенные с использованием методаглавных и метода независимых компонент, мы построили их распределения вовремени на примере валютной пары евро/доллар. На рис. 17 изображена фазоваядиаграмма для первого и второго элементов первого столбца библиотекиаприорных знаний сети Хакена, построенной по методу главных компонент(общая размерность библиотеки составляла 5˟5). На рис.
18 – первого и второгоэлементов второго столбца библиотеки априорных знаний, построенной пометоду независимых компонент (общая размерность библиотеки составляла 5˟5).Были использованы данные за январь 2012 года – логарифмические доходностипо 15-минутным ценам закрытия(всего около 1000 значений). Данныедиаграммы не несут в себе очевидного визуального смысла, однако такая задача ине ставилась – мы принципиально решили отойти от формирования библиотекиконтекстной информации на основе образов или паттернов, возникающих нафинансовых рынках (инструмент, часто используемый в техническом анализе).
Втоже время характер рис. 17,18, а именно неслучайная группировка иконцентрация точек в пространстве, позволяет говорить о том, что полученная спомощью PCA и ICA библиотека сети Хакена несёт в себе значимуюинформацию о рынке, которая может быть обработана и интерпретированавнутри построенной модели искусственной нейронной сети.87Рис. 17.
Фазовая диаграмма для первого и второго элементов первогостолбца библиотеки априорных знаний сети Хакена, построенной по методуглавных компонент.Примечание: данные по валютной паре евро доллар (январь 2012 года, 15минутые цены закрытия).Рис.18. Фазовая диаграмма для первого и второго элементов второгостолбца библиотеки априорных знаний сети Хакена, построенной по методунезависимых компонент.Примечание: данные по валютной паре евро доллар (январь 2012 года, 15минутые цены закрытия).Прежде чем перейти к прогнозированию финансовых рынков вкратценапомним об основных условиях нашей имитационной торговли.88Дляудобствавычисленийисходныеэмпирическиевекторыбылицентрированы. Заметим также, мы не стали их дополнительно искусственнозашумлять, потому что считаем, что наблюдаемые на рынке котировки уже несутв себе определённую шумовую составляющую, которая обуславливает ихотклонение от долгосрочной справедливой стоимости в текущем периоде.