Круг П.Г. Моделирование искусственных нейронных сетей (1088802), страница 7
Текст из файла (страница 7)
2. Другим недостатком моделей на основе ИНС являются значительные временные затраты для достижения удовлетворительного результата.
Эта проблема не столь существенна, если исследуется небольшое число временных последовательностей, однако обычно прогнозирующая система в области управления производством включает от нескольких сотен до нескольких тысяч временных последовательностей. Отметим, что завышенные ожидания эффекта от внедрения ИНС в ряд финансовых структур в США и Великобритании не оправдались. Так, один крупный инвестиционный банк на Уолл-стрит потратил более 1,0 млн долларов на разработку такой системы для оптимизации финансовых операций, однако, спустя некоторое время вынужден был вернуться к старой системе. Основной причиной неудачи стал недостаточный по сравнению с ожидаемым уровень производительности, полученный в результате внедрения системы.
3. Обучить и эксплуатировать нейронную сеть для решения многих задач, как правило, может и не специалист, но надежно интерпретировать результаты, а также численно оценивать значимость получаемых прогнозов способны специалисты, имеющие навыки в моделировании ИНС.
Программные продукты прогнозирования на основе нейронных сетей
Импульсом для более широкого использования ИНС в финансовых прогнозах стало появление в 1990 системы моделирования ИНС Brain Maker компании Сalifornia Scientific Software. Данный программный продукт – наиболее продаваемый в своем классе – имеет следующие достоинства:
-
используемая модель нейронной сети является надежной и удобной при прогнозировании в сфере бизнеса и финансов;
-
для его освоения от аналитика не требуется углубленных знаний в области математики или программирования;
-
эффективен при работе в случаях, когда правила, по которым изменяется прогнозируемая величина, неизвестны и трудновыявляемы.
Рассмотрим также ряд особенностей и затруднений, связанных с использованием данного и других подобных программных продуктов нейросетевого моделирования:
1. На фондовом рынке лишь немногие из специалистов успешно справляются с эффективной настройкой нейросимуляторов особенно в тех случаях, когда к прогнозированию приходится привлекать малозначимые влияющие факторы и требуется правильно интерпретировать результаты настройки ИНС. Для эффективного использования нейросимуляторов необходимо также хорошо понимать сущность моделируемого процесса.
2. При использовании нейронной сети необходимо учитывать влияние детерминированной периодической функции называемой в теории временных рядов «аддитивной сезонной компонентой» и определяемой методами спектрального анализа. Период сезонной компоненты составляет от 7 до 14 дней. Она может учитывать, например, то, что в первые два–три дня каждого месяца обычно наблюдается локальный подъем котировок акций, а в середине месяца существуют дни, когда на денежный рынок оказывают влияние обязательства по контрактам на куплю–продажу валюты по заранее оговоренной цене и т. д. На этапе прогноза сезонная компонента автоматически добавляется в одну из колонок электронной таблицы с данными и, таким образом, учитываться в нейросимуляторе при оценке прогнозируемого приращения котировок.
3. Практика работы с нейросимуляторами на финансовом рынке свидетельствует о том, что создание и тщательное ведение обширной, постоянно обновляемой и хорошо структурированной базы финансовых, макроэкономических и политических данных крайне важно, поскольку они существенно влияют на ситуацию и качество прогноза. Так как ситуация на рынке непрерывно изменяется, то и набор значащих влияющих факторов (или их порядок внутри этого набора) также изменяется во времени. В связи с этим, нейронную сеть необходимо время от времени настраивать и обучать заново.
4. Наличие подробной документации крайне важно при работе с нейросимулятором.
Документация обычно включает подробное описание методов и примеров, индексный и предметный указатели, а также обучающий курс. Некоторые компании–разработчики нейросимуляторов поддерживают «горячую линию» по телефону и Интернет, а также проводят семинары пользователей по обучению приемам эффективной работы с нейросимуляторами.
Прогнозирование потребления электроэнергии
Система анализа данных о потреблении электроэнергии (компания ZSolutions) использует данные, полученные в результате обработки показаний счетчиков частных и корпоративных клиентов. Измерения проводятся каждые 15 минут, причем известно, что некоторые из них – неверные.
С помощью ИНС был построен алгоритм выявления неверных измерений, а также алгоритм прогнозирования потребления энергии в зимний период времени.
Использование данного прогноза позволило энергетической компании применить гибкую тарифную политику и сократить риск возникновения энергетического кризиса в регионе [99].
Прогнозирование свойств полимеров
Реализована технология прогнозирования свойств материалов в химических полимерных производствах с помощью ИНС (компании Aspen Technology и NeuralWare Inc., 1997 г.). Данный подход оказался более эффективным и дешевым, чем разработка теоретической модели полимеров.
Так, с помощью нейросимулятора NeuroShell разработан новый сорт безопасного стекла (компания DuPont).
В заключение отметим, что прогнозирование цены нефти – одна из наиболее интересных задач, связанная с применением ИНС для целей прогноза. В виду того, что такой прогноз имеет для России принципиальное значение: цена существенно влияет на наполнение бюджета и уровень жизни – успехи в развитии технологий прогнозирования в финансово-экономической сфере трудно переоценить.
2. МОДЕЛЬ ИСКУССТВЕННОГО НЕЙРОНА
2.1. Биологический нейрон
Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раздражений от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями – все это реализовано в живом организме как передача электрических импульсов между нейронами.
Биологический нейрон (Cell) имеет ядро (Nucleus), а также отростки нервных волокон двух типов (рис.2.1) – дендриты (Dendrites), по которым принимаются импульсы (Carries signals in), и единственный аксон (Axon), по которому нейрон может передавать импульс (Carries signals away). Аксон контактирует с дендритами других нейронов через специальные образования – синапсы (Synapses), которые влияют на силу передаваемого импульса.
Структура, состоящая из совокупности большого количества таких нейронов, получила название биологической (или естественной) нейронной сети.
Рис. 2.1. Биологический (или естественный) нейрон
2.2. Искусственный нейрон
Искусственный нейрон (далее – нейрон) является основой любой искусственной нейронной сети.
Нейроны представляют собой относительно простые, однотипные элементы, имитирующие работу нейронов мозга. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены и заторможены.
Искусственный нейрон, также как и его естественный прототип, имеет группу синапсов (входов), которые соединены с выходами других нейронов, а также аксон – выходную связь данного нейрона – откуда сигнал возбуждения или торможения поступает на синапсы других нейронов.
Общий вид искусственного нейрона представлен на рис 2.2.
Каждый синапс характеризуется величиной синаптической связи или весом wi, который по своему физическому смыслу эквивалентен электрической проводимости.
Рис.2.2. Искусственный нейрон – простейший элемент искусственной нейронной сети
yj – сигнал, поступающий от нейрона j;
sk – скалярное произведение вектора входных сигналов и вектора весов;
fk – функция возбуждения;
yk – выходной сигнал нейрона
Текущее состояние нейрона определяется как взвешенная сумма его входов:
n
s = Σ xi wi , (2.1)
i = 1
где x – вход нейрона,
w – соответствующий этому входу вес,
n – число нейронов предыдущего слоя.
2.3. Активационная функция
Выход нейрона есть функция его состояния, т.е.
y = f(s) . (2.2)
Нелинейная функция f(s) называется активационной, сжимающей функцией или функцией возбуждения нейрона.
Основные разновидности активационных функций, применяемых в ИНС, представлены на рис.2.3.
В качестве активационной функции часто используется сигмоидальная (s-образная или логистическая) функция, показанная на рис.2.3,с. Эта функция математически выражается по формуле (2.3):
S S S
a) b) c)
Рис.2.3. Активационная функция
а) пороговая; b) полулинейная; c) сигмоидальная
При уменьшении сигмоидальная функция становится более пологой, в пределе при =0 вырождаясь в горизонтальную линию на уровне 0,5; при увеличении сигмоидальная функция приближается по внешнему виду к функции единичного скачка с порогом T в точке x=0. Из выражения для сигмоидальной функции видно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из полезных свойств сигмоидальной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем:
Следует отметить, что сигмоидальная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того, сигмоидальная функция обладает свойством усиливать малые сигналы лучше, чем большие, тем самым предотвращая насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоидальная функция имеет пологий наклон.
Выбор структуры ИНС осуществляется в соответствии с особенностями и сложностью задачи. Для решения некоторых отдельных типов задач уже существуют оптимальные, на сегодняшний день конфигурации.
Если же задача не может быть сведена ни к одному из известных типов, разработчику приходится решать сложную проблему синтеза новой конфигурации.
Теоретически число слоев и число нейронов в каждом слое ИНС может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется ИНС.
3. МЕТОДЫ ОБУЧЕНИЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
Чтобы ИНС «приобрела» интеллект она должна пройти процесс обучения. Функционирование ИНС, т.е. действия, которые она способна выполнять на этапе эксплуатации, зависит от величин коэффициентов синоптических связей. Поэтому, задавшись структурой ИНС, отвечающей определенной задаче, разработчик должен найти оптимальные значения для всех весовых коэффициентов w.
Этот этап называется обучением ИНС, и от того, насколько качественно он будет выполнен, зависит способность ИНС решать поставленные перед ней проблемы во время эксплуатации. Важнейшими параметрами обучения являются: качество подбора весовых коэффициентов и время, которое необходимо затратить на обучение. Как правило, два этих параметра связаны между собой обратной зависимостью и их приходится выбирать на основе компромисса.
В настоящее время все алгоритмы обучения ИНС можно разделить на два больших класса: «с учителем» и «без учителя».
3.1. Метод обучения ИНС «без учителя»
ИНС предъявляются значения как входных, так и выходных параметров, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей.
Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются представительской или обучающей выборкой. Обычно нейронная сеть обучается на некотором числе таких выборок. Предъявляется выходной вектор, вычисляется выход ИНС и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в ИНС, и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.
3.2. Метод обучения ИНС «с учителем»
При обучении «с учителем» ИНС предъявляются только входные сигналы, а выходы сети формируются самостоятельно с учетом только входных и производных от них сигналов.
Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность. Трудно вообразить обучающий механизм в естественном человеческом интеллекте, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Если допустить подобный механизм в человеческом мозге, то откуда тогда возникают желаемые выходы? Обучение без учителя является более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами.
Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса нейронной сети так, чтобы получались согласованные выходные векторы, т. е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов.
Следовательно, выходы подобной ИНС должны трансформироваться в некоторую понятную форму, обусловленную процессом обучения. Это не является серьезной проблемой. Обычно не сложно идентифицировать связь между входом и выходом, установленную сетью.