Круглов В.В., Борисов В.В. - Искусственные нейронные сети (ИНС) Теория и практика (778918), страница 15
Текст из файла (страница 15)
в=~к о)Ч =з о~1 1 Лю9оЧ' 1+оЧ' 2о ~ 2 Значение выхода нейрона изменяется по закону ВебераФехнера, используемого в нейрофизиологии для аппроксимации нелинейных соотношений значений на входах/выходах сенсорных нейронов. При использовании этого соотношения нейрон когнитрона достаточно точно моделирует поведение биологического прототипа. Тормозящие нейроны. Тормозящий нейрон соответствует области связи возбуждающего нейрона.
Веса тормозящих нейронов устанавливаются заранее таким образом, чтобы их сумма была равна единице. Кроме того, они не изменяются в процессе обучения Значение на выходе тормозящего нейрона представляет собой среднее арифметическое значений выходов возбуждающих нейронов из соответствующей области связи. =Хо у, где Х с, = 1, с, — вес г-го возбуждающего входа. / 81 Обласн!ь конкуренции '! !-го нейрона 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Рис 244 Нейрон когнитрона с ускоренным торможением Лвтеральное торможение. на каждый нейрон 2-го слоя оказывают латеральное торможение нейроны из области его конкуренции (рис.
2.13). Соответствующий тормозящий нейрон суммирует выходы всех нейронов из этой области и вырабатывает сигнал, тормозящий воздействие на целевой нейрон. Данный подход эффективен для нейрофизиологического моделирования, однако требует существенных вычислительных затрат из-за возможного большего числа итераций при стабилизации состояния нейрона. Для реализации ускоренного латерального торможения может быть предложено решение (рис. 2.14), позволяющее выполнить все вычисления за одну итерацию. На выходе дополнительного нейрона латерального торможения формируется сигнал: = Хд,у,, где у, — выход рго нейрона в области конкуренции; д, — вес связи от Рго нейрона к нейрону латерального торможения; 2.д, =1. 82 Обучение когнитрона.
Процесс обучения когнитрона представпяет собой обучение беэ учителя, в результате которого при получении обучающего набора входных образов сеть самоорганизуется за счет изменения весовых коэффициентов. При инициализации значения на всех выходах нейронов идентичны. Соседние нейроны слоя (из обпасти конкуренции) конкурируют между собой. Это обеспечивается за счет значительного перекрытия областей связей соседних нейронов. В резупьтате обучения в заданной области слоя возбуждается только один нейрон, который будет оказывать патерапьнотормозящее воздействие на соседние нейроны из области его конкуренции.
В результате обучения синапсы возбужденного нейрона будут усиливаться, а синапсы соседних нейронов останутся неизменными. Возбуждающие веса данного нейрона изменяются следующим образом: ба, =Чс,и,, где с, — вес тормозящей связи!-го нейрона с тормозящим нейроном ~; и, — выход у-го нейрона; а, — вес Рго возбуждающего входа; ив коэффициент скорости обучения.
Изменение же значений тормозящих весов этого нейрона вычисляется по формуле: ггпу а, и, бЬ,= 2 у~ В случае, когда отсутствуют возбужденные нейроны в облас- ти конкуренции (например, на этапе инициализации процесса обу- чения), изменения весов вычисляются следующим образом; б а, = Ч'с, и,, б Ь, = г)' у, . где г)' — положительный коэффициент скорости обучения (гг' < гг). Благодаря рассмотренной процедуре обучения у активизи- рованных нейронов возбуждающие веса увеличиваются сильнее, чем тормозящие И наоборот, у нейронов, которые проиграли кон- куренцию, возбуждающие веса возрастают незначительно, а тор- мозящие — сильнее. При обучении веса нейронов 2-го (и последующих) слоев на- страиваются так, чтобы активные сигналы на их выходах соответ- ствапи векторам, которые предъявлялись в процессе обучения.
83 2.8. Неокогнитрон Развитием когнитрона является неокогнитрон, представляющий собой многоуровневую иерархическую нейронную сеть органиэация и принципы функционирования которой наиболее соответствуют модели зрительной коры головного мозга Неокогнитрон достаточно универсален и находит широкое применение не только для обработки визуальных данных, но и в качестве обобщенной системы распознавания образов Он имеет иерархическую структуру, состоящую из последовательности слоев нейронов (рис 2 15) Входной образ подается на первый слой и передается далее до достижения выходного слоя, в котором он распознается Входной слой неокогнитрона распознает линии и углы определенной ориентации Каждый нейрон в слое, близком к входному, реагирует на определенные образы в определенном месте с определенной ориентацией Каждый последующий слой имеет более абстрактную, менее специфическую реакцию по сравнению с предыдущим В последующих слоях распознаются все более сложные образы независимо от их положения, размера, ориентации и искажений Каждый слой неокогнитрона состоит из двух плоскостей, разделенных на двумерные массивы нейронов Первая плоскость, содержащая простые нейроны, получает сигналы с выходов сложных нейронов предыдущего слоя, выделяет определенные образы и затем передает их во вторую плоскость данного слоя, содержащую сложные нейроны, где образы обрабатываются таким образом, чтобы обеспечить их меньшую позиционную зависимость Внутри отдельного слоя массивы простых и сложных нейронов соответствуют друг другу Рецептивное поле каждого нейрона от слоя к слою возрастает, количество же нейронов в слое при этом уменьшается Наконец, в каждом массиве выходного слоя имеется только один сложный нейрон, который реагирует на определенный входной образ.
В процессе распознавания входной образ подается на вход неокогнитрона, а вычисления осуществляются слой за слоем Так как только небольшая часть входного образа подается на вход каждого простого нейрона входного слоя, некоторые простые нейроны реагируют на наличие характеристик, которым они обучены, и возбуждаются В следующих слоях выделяются более сложные характеристики как определенные комбинации выходов сложных нейронов, и уменьшается позиционная зависимость.
84 Слой 0-1 Слой Я Лоос»палы сполык нейронов Пло с»осте просты» нейрона Плоснхтн слепы» нейронов Рис 2 15 Структура иеокогиитрона Если используется латеральное торможение, то возбуждается только один нейрон выходного слоя с максимальным значением выхода Однако это часто является не лучшим вариантом Обычно используется подход, при котором будут активизироваться несколько нейронов с различной степенью возбуждения, и входной образ должен быть определен с учетом соотношения их выходов Это позволяет улучшить точность распознавания Простыв неороны.
Отдельный массив плоскости простых нейронов настраивается на один специфический входной образ Каждый простой нейрон массива реагирует на ограниченную область входного образа, называемую его рецептивной областью Нейрон реагирует, если часть образа, на которую он настроен, встречается во входном образе и обнаружена в его рецептивной области. Другие массивы простых нейронов первой плоскости в этом слое могут быть настроены, например, на повороты образов Причем для выделения каждого дополнительного образа (или его версии) требуется дополнительная плоскость.
Рецептивные области простых нейронов в каждом массиве первой плоскости перекрываются дпя покрытия всего входного поля этого слоя. Каждый такой нейрон получает сигналы от соответствующих рецептивных областей всех массивов второй плоскости из предыдущего слоя. Следовательно, простой нейрон реагирует на появление своего образа в любой сложной плоскости предыдущего слоя, если он окажется внутри его рецептивной области Простые нейроны неокогнитрона имеют такие же свойства, что и в когнитроне, и для определения их выхода используются те же формулы. Простые нейроны в отличие от сложных имеют настраиваемые веса связей, соединяющих простой нейрон со сложными нейронами в предыдущем слое, настраиваемые таким образом, чтобы выработать максимальную реакцию на определенные образы Помимо возбуждающих синапсов, к простому нейрону подключены тормозящие, стремящиеся уменьшить значение на его выходе.
Сложные нейроны. Сложные нейроны решают задачу уменьшения позиционной зависимости реакции неокогнитрона на образы. Для этого на входы каждого сложного нейрона подаются выходные сигналы с набора простых нейронов из соответствующего множества первой плоскости того же слоя.
Активизация любого простого нейрона из рецептивной области сложного нейрона является достаточным условием для возбуждения данного сложного нейрона. Таким образом, сложный нейрон реагирует на тот же образ, что и простые нейроны в соответствующем ему массиве, но он менее чувствителен к позиции образа, чем любой иэ них. Каждый слой сложных нейронов реагирует на все большую область входного образа, по сравнению с предшествующими слоями, что приводит к требуемому уменьшению позиционной зависимости реакции неокогнитрона на образы в целом.