Хайкин С. - Нейронные сети (778923), страница 64

Файл №778923 Хайкин С. - Нейронные сети (Хайкин С. - Нейронные сети) 64 страницаХайкин С. - Нейронные сети (778923) страница 642017-12-212017-12-21СтудИзба

Хайкин С. - Нейронные сети

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 64)

115) На основе идеи предиката в (1050) предложен эмпирический алгоритм обучения многослойного персептрона вычислению функции четности на основе метода обратного распространения. Функция четности (рагйу бзпсг(оп) является булевым предикатом, определяемым выражением ) 1, если ~Х~ вЂ” четное число, '1 0 вЂ” в остальных случаях, (4.116) порядок которого равен количеству входов. Эксперименты показали, что время, необходимое сети для обучения вычислению функции четности, растет экспоненциально в зависимости от количества входов (т.е.

порядка предиката) и что планы использования алгоритма обратного распространения для обучения произвольным сложным функциям чересчур оптимистичны. Общеизвестно, что для многослойного персептрона нежелательно, чтобы сеть была полносвязной. В этом контексте можно поставить следующий вопрос как лучше разместить сннаптические связи сети неполносвязного многослойного персептрона? Этот вопрос не играет особой роли в небольших приложениях, но является жизненно важным при решении масштабных реальных задач на основе обучения методом обратного распространения. Одним из эффективных методов ослабления проблемы масштабирования является взгляд в корень задачи (нногда с помощью аналогий из области нейробиологии) и внесение в архитектуру многослойного персептрона правдоподобных конструктивных решений.

В частности, архитектура сети и ограничения, реализуемые синаптическими весами, должны задаваться с учетом априорной информации об объекте моделирования. Эта стратегия описывается в разделе 4.19 на примере решения задачи оптического распознавания символов. 4.17. Ускорение сходимости процесса обучения методом обратною распространения 316 4.17. Ускорение сходимости процесса обучения методом обратного распространения В предыдущих разделах описывались основные причины, вызывающие низкую скорость сходимости алгоритма обратного распространения. В этом разделе будут предложены некоторые эвристические наработки, которые позволяют ускорить сходимость алгоритма с помощью настройки параметра скорости обучения.

Приведем зти эвристики [505). Эвристика 1. Любой настраиваемый параметр сети, входящий в функцию стоимости, должен иметь свое значение коэффициента скорости обучения. Отсюда можно заключить, что алгоритм обратного распространения может иметь низкую скорость сходимости из-за того, что фиксированный параметр скорости обучения подходит ие для всех областей поверхности ошибок. Другими словами, если параметр интенсивности обучения подходит для корректировки одного сииаптического веса, то это совсем ие означает, что ои подойдет для настройки другого. Эвристика 1 учитывает этот факт и предлагает назначать каждому настраиваемому сииаптическому весу (параметру) сети отдельное значение коэффициента скорости обучения.

Эвристика 2. Любой параметр скорости обучения должен варьироваться для различных итераций. Поверхность ошибок в разных областях имеет разную динамику даже в направлении одного весового коэффициента. Для того чтобы учесть эти изменения, согласно эвристике 2, параметры обучения должны варьироваться иа разных итерациях. Интересно, что эта эвристика хорошо обоснована для случая линейных процессорных элементов 1684). Эвристика 3.

Если производная функции стоимости по отдельному сииаптическому весу иа нескольких последовательных итерациях имеет один и тот же знак, то значение параметра скорости обучения для данного веса должно увеличиваться. Текущая точка в пространстве весов может лежать иа относительно пологом участке вдоль некоторого направления весовых коэффициентов. Это, в свою очередь, может отразиться иа производной функции стоимости (т.е.

иа градиенте поверхности ошибки)по данному направлению, которая в течение нескольких последовательных итераций будет иметь один и тот же алгебраический знак и, таким образом, указывать иа одно и то же направление. Эвристика 3 утверждает, что в такой ситуации количество итераций, необходимое для прохождения пологой части поверхности ошибок, может быть уменьшено за счет соответствующего увеличения значения параметра скорости обучения.

Эвристика 4. Если производная функции стоимости по отдельному синаптическому весу иа нескольких последовательных итерациях имеет разные знаки, то значение параметра скорости обучения для данного веса лолжно уменьшаться. Зт6 Глава 4. Многослойный персептрон Текущая точка в пространстве весов может лежать на участке поверхности ошибок, содержащем множество выпуклостей и впадин (т.е. на достаточно искривленном участке), что может привести к изменению знака производной по некоторому весу на последовательных итерациях. Согласно эвристике 4, во избежание осцилляции параметр скорости обучения для данного веса следует уменьшить. Естественно, введение зависимости параметра обучения от времени и конкретного синаптического веса, следующее из этих эвристик, приводит к фундаментальному изменению апгоритма обратного распространения.

В частности, модифицированный таким образом алгоритм уже не будет осуществлять поиск методом наискорейшего спуска. Корректировка конкретных синаптических весов будет основываться на частных производных поверхности ошибок по конкретным весам и на оценке кривизны поверхности ошибок в текущей точке относительно конкретных измерений пространства весов. Более того, все четыре эвристики удовлетворяют ограничению локальности, являющемуся встроенной характеристикой алгоритма обратного распространения. К сожалению, наличие ограничения локальности сужает область применения этих эвристик, так как могут существовать такие поверхности, где они просто не будут работать.

Тем не менее модификации алгоритма обратного распространения, разработанные в соответствии с этими эвристиками, имеют большое практическое значение' . 4.18. Обучение с учителем как задача оптимизации В этом разделе обучение с учителем рассматривается с позиций, в корне отличающихся от точки зрения, изложенной во всех предыдущих разделах.

В частности, обучение с учителем многослойного персептрона будет рассмотрено как задача численной оптимизации (пшпепса! оргишх[пд). В этом контексте в первую очередь следует отметить, что поверхность ошибок многослойного персептрона является в высшей степени нелинейной функцией, зависящей от вектора синаптических весов и'.

Пусть Е,„(и ) вЂ” функция стоимости, усредненная на множестве примеров обучения. Используя ряд Тейлора, функцию Е„(зг) можно экстраполировать в окрестности текущей точки на поверхности ошибок зу(л), например в соответствии с выражением (4.100). 'а Модификация алгоритма обратного распространения, основанная на эвристиках 1-4, получила название правила обучения оегга-Ьагкуегга [505Р Реализация этого правила обучения может быть упрощена с помошью идеи, аналогичной методу повторного использования градиента (йгыйепг геоле шлягера) [439), [496р В [925) описана процедура динамической самоалаптации для ускорения процесса обучения методом обратного распространения.

В этой процедуре реализована следующая идея; значение коэффициента скорости обучения для предыдушего шага немного уменьшается и увеличивается; для обоих новых значений оценивается функция стоимости, после нею выбирается то значение коэффициента, для которого функция стоимости имеет меньшую величину. 4.18. Обучение с учителем как задача оптимизации 317 Перепишем зто выражение, вводя явную зависимость от и: Е„(и(п) + Ьтт(п)) =Еач(тг(п)) + Е~(п)Ьтт(п)+ т з (4 117) + вЂ” Ьтт~ (п)Н(п)Ьтт(п) + О(!!Ьтт/! ), где й(п) вЂ” вектор локального градиента; дЕ„(зт) дтт и = тт(п) ' (4.

118) Н(п) вЂ” матрица Гессе в данной точке: д Еи (тт) дттз зт = тг(п) (4.119) Ьтт(п) = -т)й(п), (4.120) где з) вЂ” параметр скорости обучения. В результате метод наискорейшего спуска работает на основе линейной аппроксимации функции стоимости в окрестности текущей точки зт(п), при которой единственным источником информации о поверхности ошибок является градиент я(п).

Такое ограничение обеспечивает значительное преимущество: простоту реализации. К сожалению, оно приносит и нежелательный результат вЂ” низкую скорость сходимостн, которая может оказаться камнем преткновения, особенно в задачах большого объема.

Включение слагаемого момента в уравнение корректировки вектора синаптических весов было грубой попыткой использования информации второго порядка о поверхности ошибок, что привнесло некоторое преимущество. Тем не менее его использование сделало процесс обучения более чувствительным к настройке, поскольку у разработчиков появляется еще один регулируемый параметр. Для того чтобы существенно улучшить скорость сходимости многослойного персептрона (по сравнению с алгоритмом обратного распространения), в процессе обучения приходится использовать информацию более высокого лорлдка.

Характеристики

Тип файла

DJVU-файл

Размер

10,59 Mb

Материал

Хайкин С. - Нейронные сети

Тип материала

Книга

Предмет

Нейросетевое моделирование сложных технических систем

Высшее учебное заведение

МГТУ им. Н.Э.Баумана

Список файлов книги

haykin-s.-neyronnye-seti-2084812924-1513866974.rar

Хайкин С. - Нейронные сети.djvu

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.