СКИПОДы 2007 полная версия (1127795), страница 35
Текст из файла (страница 35)
Прирешении таких задач самым важным является подбор данных и их подготовка.Отличия от машин с архитектурой фон НейманаДлительный период эволюции придал мозгу человека много качеств, которые отсутствуютв машинах с архитектурой фон Неймана:массовый параллелизм, распределенное представление информации и вычисления,способность к обучению и обобщению, адаптивность, свойство контекстуальной обработкиинформации, толерантность к ошибкам, низкое энергопотребление.ПримерВходные данные — курс акций за год. Задача — определить завтрашний курс.
Проводитсяследующее преобразование — выстраивается ряд курс за сегодня, вчера, за позавчера, запозапозавчера. Следующий ряд — смещается по дате на один день и так далее. Наполученном наборе обучается сеть с 3 входами и одним выходом — то есть выход курс надату, входы курс на дату минус 1 день, минус 2 дня, минус 3 дня. Обученной сети подаем навход курс за сегодня, вчера, позавчера и получаем ответ на завтра. Нетрудно заметить, что вэтом случае сеть просто выведет зависимость одного параметра от трех предыдущих. Еслижелательно учитывать ещё какой-то параметр (например, общий индекс по отрасли), то егонадо добавить как вход (и включить в примеры), переобучить сеть и получить новыерезультаты.
Для наиболее точного обучения стоит использовать метод ОРО, как наиболеепредсказуемый и несложный в реализации.В последние десятилетия активно развиваются приложения на базе искусственныхнейронных сетей. Среди таких приложений можно отметить следующие задачи:классификация образов,кластеризация/категоризация,аппроксимацияфункций,предсказание/прогноз, оптимизация, память, адресуемая по содержимому, управление. Эти115и подобные задачи успешно решаются средствами пакета Neural Networks, который входитв состав расширенных версий системы MATLAB.Для решения задачи следует выбрать следующее: тип используемых нейронов (числовходов, передаточные функции); архитектуру сети; входные и выходные параметры.На втором этапе производится обучение созданной нейронной сети. После этогопроизводится количественный анализ полученной модели искусственной нейронной сети.Нами использовалась модель нейронной сети, основанная на радиальном базисном нейроне.При ее «обучении» использовалась встроенная функция пакета Neural Networks системыMATLAB — newrb.Результаты моделирования на наборах экспериментальных данных показали пригодностьиспользования радиальных базисных нейронных сетей для аппроксимациифункциональных зависимостей, в том числе и нелинейных.
Можно отметить высокуюскорость обучения и возможность применения результатов в реальных приложениях.ДобавлениеРассмотрим функцию Y=f(X), которая ставит в соответствие m-мерному вектору Xнекоторый p-мерный вектор Y (Рис. 1). Например, в задаче классификации вектор X- этоклассифицируемый объект, характеризуемый m признаками; вектор Y, состоящий из однойединицы и остальных нулей, является индикатором класса, к которому принадлежит векторX (позиция единицы означает номер класса).
Функция f ставит в соответствие каждомуобъекту тот класс, к которому он принадлежит.Предположим, нам нужно найти функцию f. Воспользуемся методом обучения напримерах. Предположим, что имеется репрезентативная выборка векторов Xi, для которыхизвестно значение функции Yi=f(Xi). Набор пар (Xi,Yi) будем называть обучающейвыборкой. Рассмотрим теперь нейронную сеть, называемую многослойным перцептроном,определив, как устроены элементы сети («нейроны»), какова архитектура связей междуэлементами и по каким правилам будет происходить обучение сети.Элемент сети функционирует в дискретном времени и на основании поступивших сигналовформирует результирующий сигнал.
Элемент имеет несколько входов, каждому из которыхпредписан определенный «вес». Сигналы, поступающие по входам, суммируются с учетомсоответствующих весов, и суммарный сигнал сравнивается с порогом срабатывания. Еслисуммарный сигнал меньше порога, то сигнал на выходе элемента близок или равен нулю, впротивном случае сигнал близок к единице.Каждый элемент входного слоя имеет один вход (с весом 1), по которому поступаетсоответствующая компонента вектора X. Каждый элемент скрытого слоя получает сигналыото всех элементов входного слоя.
Тем самым, элемент скрытого слоя имеет m входов,связывающих его с элементами входного слоя. Связи от элементов входного слоя кэлементам скрытого слоя характеризуются матрицей «весов» связей w1, компонентыкоторой определяют величину эффективности связи. Каждый элемент выходного слояполучает сигналы ото всех элементов скрытого слоя. Таким образом, подавая на входнойслой сети вектор X, мы получаем вектор активности элементов скрытого слоя и затемвектор Y на элементах выходного слоя. Результат работы сети зависит от числовыхзначений весов связей между элементами.Обучение сети состоит в правильном выборе весов связей между элементами.
Выбираютсятакие веса связей, чтобы суммарная среднеквадратичная ошибка для элементов обучающей116выборки была минимальной. Достичь этого можно разными методами . После обученияперцептрона проводится процедура тестирования, позволяющая оценить результатыработы. Для этого обучающую выборку обычно делят на две части. Одна частьиспользуется для обучения, а другая, для которой известен результат, задействована впроцессе тестирования. Процент правильных результатов работы сети на этапетестирования является показателем качества работы перцептрона.Надо сказать, что для очень многих практических задач удается достичь на удивлениевысокого качества работы сети (порядка 95% и выше).
Существует ряд математическихтеорем, обосновывающих возможность применения многослойных перцептронов дляаппроксимации достаточно широкого класса функций f.Области применения нейронных сетей.Области применения нейронных сетей весьма разнообразны — это распознавание текста иречи, семантический поиск, экспертные системы и системы поддержки принятия решений,предсказание курсов акций, системы безопасности, анализ текстов.
Рассмотрим несколькоособенно ярких и интересных примеров использования нейронных сетей в разных областях.Необходимо отметить, что мы старались по возможности выбирать наиболее ранние случаиприменения нейронных сетей при решении соответствующей задачи.Техника и телекоммуникацииВ 1996 году фирмой Accurate Automation Corp(http://www.accurate-automation.com),Chattanooga, TN по заказу NASA и Air Force был разработан экспериментальныйавтопилотируемый гиперзвуковой самолет-разведчик LoFLYTE (Low-Observable Flight TestExperiment — рис. 4). Самолет имел длину всего 2,5 м и вес 32 кг и был предназначен дляисследования новых принципов пилотирования. LoFLYTE использовал нейронные сети,позволяющие автопилоту обучаться, копируя приемы пилотирования летчика. Посколькусамолет был предназначен для полетов со скоростью 4-5 махов, то быстрота реакциипилота-человека могла быть недостаточной для адекватного отклика на изменение режимаполета.
В этом случае на помощь приходили нейронные сети, которые перенимали опытуправления у летчика и за счет высокой скорости обработки информации позволяли быстронаходить выход в аварийных и экстремальных ситуациях (см. также http://www.accurateautomation.com/Technology/Loflyte/loflyte.htmlиhttp://www.designationsystems.net/dusrm/app4/loflyte.html).Одна из важнейших задач в области телекоммуникаций, которая заключается внахождении оптимального пути пересылки трафика между узлами, может быть успешнорешена с помощью нейронных сетей.
В данном случае необходимо принимать во вниманието, что, во-первых, предложенное решение должно учитывать текущее состояние сети,качество связи и наличие сбойных участков, а во-вторых, поиск оптимального решениядолжен осуществляться в реальном времени. Нейронные сети хорошо подходят длярешения задач такого рода. Кроме управления маршрутизацией потоков, нейронные сетимогут использоваться и при проектировании новых телекоммуникационных сетей, позволяяполучать весьма эффективные решения.Информационные технологииОпределение тематики текстовых сообщений — еще один пример успешногоиспользования искусственных нейронных сетей.
Так, сервер новостей Convectis (продукткомпании Aptex Software, Inc.) был выбран в 1997 году компанией PointCast, Inc.,являвшейся лидером персонализированной доставки новостей в Интернете, для117автоматической рубрикации сообщений по категориям. Определяя значения ключевых словпо контексту, сервер Convectis был способен в реальном времени распознавать тематику иавтоматически рубрицировать огромные потоки текстовых сообщений, передаваемых потаким информационным сетям, как Reuters, NBC и CBS.Нейросетевой продукт SelectCast от Aptex Software, Inc. позволял определять областьинтересов пользователей Интернета и предлагал им рекламу соответствующей тематики.Летом 1997 года компания Excite, Inc.
лицензировала эту разработку для использования насвоих поисковых серверах. После установки на серверах Excite и Infoseek нейросетевойрекламой было охвачено около трети всех пользователей сети на тот момент. Проведенныеисследования установили, что отклик на такую тематическую рекламу была в среднем в двараза выше, чем на обычную, а для отдельных ее видов эффективность увеличивалась допяти раз.Распознавание речи является весьма популярным применением нейронных сетей,реализованным в ряде программных продуктов. В компании «НейроПроект» несколько летназад была создана демонстрационная система для речевого управления встроенным вWindows калькулятором.