Диссертация (1138079), страница 6
Текст из файла (страница 6)
Мы рассмотрим такой пример в Главе 3.После того, как минимально необходимая архитектура искусственнойнейронной сети (количество слоёв, количество нейронов в них, функцияактивации всех нейронов) определена, необходимо задать способ обучения сети –третий и, пожалуй, самый важный шаг построения.31Подобучениемискусственнойнейроннойсетиподразумеваетсяитеративный процесс оптимизации значений весов (вектор w на рис. 2), которыеопределяют связи между нейронами и общую эффективность работы сети(некоторые базовые принципы обучения раскрываются в работе [129]).Итеративный процесс означает, что существует определённая процедура,которая позволяет пошагово двигаться от начального (иногда случайного)значения к оптимуму.
При этом, как показывает практика, выбор начальногозначения далеко не формальный нюанс, а важный фактор, который можетсущественно повлиять на результаты работы всей нейросетевой модели. Мыболее подробно обратимся к этой проблеме в Главе 3.Принципиально искусственные нейронные сети можно разделить на дватипа: обучающиеся с учителем (supervised learning) и самообучающиеся(unsupervised learning). Обучение сети с учителем означает, что нейронной сетисначала предъявляется некоторый набор обучающих примеров, на которых онатренируется, – таким образом программируются потенциальные выходныезначения модели, которые должны быть максимально близки к эталонным. Еслиперед такой искусственной нейронной сетью ставится задача прогнозирования, тотрадиционно сеть сначала «натаскивают» на обучающем массиве (in-the-sample), апотом, на основе оптимизированных значений принимают решение уже надругом, реальном массиве данных (out-of-sample).5 К сетям, обучающимися сучителем, можно отнести сети прямого и обратного прохода, рекурретные сети идр.
Мы будем работать с такими сетями в Главе 2.Самообучающиеся искусственные нейронные сети не имеют никакихэталонных примеров и обучаются, задействуя механизмы самоорганизации иконкуренции. Это означает, что мы изначально не можем задать общеепространство выходных значений сети. К самообучающимся сетям относятся,например, сети Кохонена (самоорганизующиеся карты), сети Хопфилда, «машиныБольцмана» и др. Мы будем работать с самообучающимися сети в Главе 3.5Заметим, что при прогнозировании финансовых рынков в рамках данной работы мы в большинстве случаевбудем действовать иным образом – постоянно переучивать сеть на вновь поступающих данных.
Это связано с тем,что информация на финансовых рынках очень быстро устаревает и становится нерелевантной.32Можно задаться вопросом о том, какой тип искусственных нейронныхсетей, обучающиеся с учителем или самообучающиеся, являются наиболееэффективным, однако такой спор будет непродуктивен. Дело в том, чтоискусственные нейронные сети, в виду своей гибкости, как правило, создаютсяпод решение конкретной задачи.
Это означает, что в одних случаях эффективнееможет оказаться один тип сетей, в других – иной. Можно также утверждать, что вопределённых условиях можно соединять два типа обучения искусственныхнейронных сетей. Мы построим такую модель в Главе 3, где сначала отдельныенейронные сети прямого прохода будут обучаться на эталонной выборке, а наследующем этапе оптимизация их весов будет происходить уже путёмконкурентной самоорганизации. Рискнём также предположить, что это непротиворечит и фундаментальным законам биологии.
В действительности,человеческое мышление гармонично соединяет в себе, как механическоеобучение, основанное на подражании (обучение с учителем), так и такие сложныеи мало предсказуемые процессы, как творческая деятельность (что отсылает нас ксамоорганизации).Что касается сферы применения искусственных нейронных сетей (помимопрогнозирования финансовых рынков), то на сегодняшний день она достаточноразнообразна.
К важной области применения искусственных нейронных сетейотносится прогнозирование макроэкономических рядов. В частности, в работе[163] показана несложная нейросетевая модель для предсказания рецессии(падения ВВП) в американской экономике на основе макроэкономическихиндикаторов – процентных ставок, фондовых индексов, денежных агрегатов и др.Помимо этого, искусственные нейронные сети используются и в других отрасляхэкономического моделирования, например, в банковском деледля оценкикредитного риска, объёма возврата и просроченной задолженности по кредитам[40, 89, 217].В заключение добавим, что нейросетевые модели также часто задействуют вмоделях и механизмах, задачей которых является распознавание образов.
Кромеэтого, искусственные нейронные сети являются эффективным аналитическим33инструментомучёныхвбиологических,медицинскихиинженерныхисследованиях.Подведём итоги первой главы. Мы рассмотрели историю исследованийискусственных нейронных сетей, которые являются математическими моделями,цель которых – различные способы обработки информационных данных, а иногдадаже реконструкция деятельности головного мозга человека. Была теоретическиобоснована возможность применения моделей искусственных нейронных сетей (вт.ч.,использующихпредварительнуюобработкувходныхданных)дляпрогнозирования динамики финансовых рынков как механизма принятиярешений репрезентативным агентом, в условия, когда рынки могут отклонятьсяот информационно эффективного состояния.Былипроанализированыосновныехарактеристики,принципыинеобходимые условия построения, а также применяемые способы обученияискусственных нейронных сетей.
Кроме этого, на основе одного из главныхсвойств нейронных сетей – самоорганизации – была прослежена их взаимосвязь смногоагентными системами. При этом отмечалась возможность комбинированиядвух этих типов моделей в рамках экспериментов по имитационномувзаимодействию на финансовых рынках.34Глава 2. Инвестиционные решения на фондовом и валютномрынках на основе упрощенной картины мира и контекстнойпамяти – представление в форме искусственных нейронных сетей спредварительной обработкой входных данныхВо второй главе будут предложены способы прогнозирования финансовыхрынков на основе упрощения картины мира репрезентативным агентом ииспользования контекстной памяти при принятии решений.
В главе будетрассмотрено сравнительное применение метода главных и метода независимыхкомпонент в качестве инструментов предварительной обработки входных данныхв моделях искусственных нейронных сетей. С помощью двух этих методов мыбудем проводить два вида популярной обработки эмпирической информации –снижение размерности (упрощение картины мира) и формирование контекстнойбиблиотеки данных в искусственной нейронной сети, обученной по методуЛевенберга-Марквардта и сети Хакена.Построенные модели будет протестированы на реальных данных фондовогои валютного рынков развитых стран, в ходе чего будет сделан вывод онедостаточной эффективности этих методов и необходимости совершенствованияинструментов предварительной обработки входных данных в искусственныхнейронных сетях, рассматриваемых в качестве механизма принятия решенийагентом на рынке.2.1.
Предварительная обработка входных данных искусственныминейронными сетями при прогнозировании финансовых рынков с помощьюметода главных компонент и метода независимых компонентИскусственные нейронные сети представляют собой достаточно гибкие впостроении модели, что обуславливает различные вариативные возможности поих оптимизации под конкретную задачу. Такие модификации, ориентированныена повышение эффективности работы сети, могут, в частности, включатьэксперименты с архитектурой и типом обучения, а также обработку исходных35данных, которые предъявляются сети – именно этой теме в значительной теме ипосвящена данная работа.Вопрос обработки входных данных (не только в искусственных нейронныхсетях, но и вообще в моделях поддержки принятия решений) важен потому, чтопри составлении прогнозов финансовым аналитикам приходится работать согромными массивами информации.
Несмотря на очевидный прогресс в развитииинформационных технологий, далеко не всегда в распоряжении исследователяесть вычислительные машины, способные в сжатые временные рамки обработатьнеограниченныеобъёмыинформации.Ведьеслиподходитьканализуфинансовых рынков с максималисткой позиции, то влияние на цену актива можетоказатьвсё,чтоугодно.Приэтомуместнонапомнитьовозросшейвзаимозависимости мировых экономических процессов в эпоху глобализации иизвестный «эффект бабочки» [144], когда незначительное событие можеткоренным и непредсказуемым образом повлиять на поведение всей динамическойсистемы, к числу которых, безусловно, следует отнести финансовые рынки.
Сдругойстороны,развитиепостиндустриальногообществапорождаетинегативные эффекты: сегодня информационные потоки содержат в себезначительную шумовую компоненту, то есть многие данные нерелеванты,несущественны, а иногда и вовсе оказываются «мусором».Обнаружение важной информации в больших массивах данных активноизучается в последние годы и выделилось в отдельное научное направление –«глубинный анализ данных» (data mining) [79]. Широко используется этот подходи в нейросетевых моделях, разработанных для прогнозирования финансовыхрынков [76, 199]. Таким образом, вопрос предварительной обработки входныхданных нетривиален для финансового аналитика, и основная проблема здеськроется в необходимости ориентации и сортировки больших массивовинформации в зависимости от степени влияния на исследуемый процесс.Существует большое количество способов предварительной обработкивходных данных для модели в зависимости от стоящих перед искусственнойнейронной сетью задач, в частности, нормализация, кластеризация данных,36генетические алгоритмы, авторегрессионное тестирование, корреляционный,фрактальный анализ, разложение в ряд Фурье и другие.
Однако в рамках даннойработы мы не будем делать подробный разбор инструментов предварительнойобработки данных и их классификации, поскольку такой обзор может оказатьсяповерхностным. Напротив, мы изначально выберем общее направление обработкиданных, а потом будем последовательно усложнять модели, модифицируяметодологию и выстраивая иерархию полученных результатов для фондового ивалютного рынков развитых стран.