neironne_seti_i_neirokompjuter (1085713), страница 19
Текст из файла (страница 19)
На кристалле реализован 1Кбайт памяти дляхранения 1024 8-разрядных или 512 16-разрядных весов. Гибкаякаскадируемая структура нейрочипа позволяет использовать его дляразличных нейросетевых парадигм. При реализации 64 восьмиразрядныхпроцессорных элементов средняя производительность составляет 26 MCPS(32 MCUPS).107PDF created with pdfFactory trial version www.pdffactory.comНейрочип NLX-420 компании NeuroLogixКаждый из 16 процессорных элементов нейрочипа содержит 32разрядный сумматор, логику параллельного выполнения 16 умножений.Средняя производительность 300 MCPS. Также имеется возможностькаскадирования и мультиразрядных вычислений.Нейрочип ETANN 80170NX компании INTELАналоговая СБИС ETANN 80170NX содержит 64 входа, 16внутренних уровней и 64 нейрона (пороговый усилитель с сигмоидальнойпередаточной функцией). Каждый вход соединен с 64 синапсами.Передаточная функция нейрона близка к сигмоидальной функции.Усиление передаточной функции определяет чувствительностьнейрона.
Низкое значение усиления позволяет интерпретировать выходнейрона как аналоговый, а высокое – как цифровой.Нейрочип имеет следующие параметры:§ максимальное значение выхода нейрона определяется напряжениемVrefo;§ веса ограничены интервалом [-2,5, 2,5];§ скорость прохождения сигнала по одному слою зависит от усиления ипримерно равна 1,5 мкс, что и определяет быстродействие;§ точность выполнения операций примерно эквивалентна 6 битам,быстродействие – 1,3 – 109 переключений/с.Обучение выполняется методом обратного распространения спомощью INNTS.
Применяемое системное окружение – специальная версияпакета DynaMind. Обучение выполняется до получения приемлемого уровняошибки выхода сети, и после достижения удовлетворительной работы весазагружаются в СБИС. Для реальной работы такого обучения недостаточно,так как программа симуляции не может точно смоделировать аналоговуюработу СБИС и, например, не отслеживает флуктуации в передаточнойфункции каждого нейрона.
Поэтому следующий этап обучения представляетсобой так называемый CIL Training, когда после каждого цикла весазаписываются в СБИС, и выход сети непосредственно используется впроцессе обучения.Точность ETANN 5 – 6 разрядов для весов и выходов.Поскольку ETANN представляет собой аналоговую СБИС, то для еенадежной работы важны стабильные внешние условия. Специальносконструированный для этого модуль обеспечивает:§ низкую пульсацию источника питания (до 5 мВ при напряжениипитания 5 В);§ температурную стабильность до 1°С при 18°С (потребляемаямощность ETANN 5 Вт).108PDF created with pdfFactory trial version www.pdffactory.comНейрочип CLNN32/CLNN64 компании BellcoreГибридный нейрочип CLNN32 состоит из 32 нейронов и 496двунаправленных адаптивных синапсов.
CLNN64 содержит только 1024адаптивных синапса. В наборе CLNN32/CLNN64 все нейронывзаимосвязаны, так что любая топология сети отображается подборомсинапсов. Динамика нейронной сети полностью аналоговая, но значениясинапсов хранятся/обновляются в цифровом виде с точностью 5 бит. Нааппаратном уровне реализовано обучение сети – подбор весов происходитпо алгоритму обучения машины Больцмана или Mean Field. Внутри такжеимеется некоррелированный генератор шума (32 канала), используемый приобучении по методу машины Больцмана. CLNN32 может быть использованнезависимо или совместно с CLNN64 для построения более сложнойархитектуры нейронной сети.Производительность СБИС достигает 108 переключений/с (при работес CLNN64 удваивается).
Для CLNN32 это означает, что примерно 105 32битовых образцов/с или 32 аналоговых канала (с полосой пропускания 50кГц) могут быть использованы для быстрого распознавания/обучения. Времяраспространения для одного слоя нейронов до 1 мкс. «Охлаждение» (пометоду Больцмана) или MF обучении требует 10 – 20 мкс. По сравнению сETANN СБИС CLNN32 имеет следующие преимущества:§ быстрое обучение (микросекунды по сравнению с часами при C1Lпроцессе);§ эффективный алгоритм обучения Больцмана, обеспечивающийбыстрое нахождение "почти оптимального" решения;§ простые и быстрые процедуры чтения/записи весов, выполняемые вцифровом виде, что значительно увеличивает скорость обмена междусетевым сервером и клиентами в сети;§ легкая каскадируемостъ.Нейрочип ANNA компании AT&TДругим примером реализации гибридного нейрочипа является СБИСANNA.
Логика нейрочипа – цифровая, хранение весов – аналоговое (наэлементах динамической (конденсаторной) памяти). Нейрочип имеетследующие характеристики:§ содержит 4096 весов;§ максимальное число нейронов 256;§ точность весов – 6 разрядов§ для однослойной сети 64 × 64 производительность нейрочипадостигает 2,1 GCPS.Нейрочип NeuroClassifierАналоговая СБИС NeuroClassifier создана в университете Твентесовместно с компанией DESY. Архитектура нейрочипа состоит из входного109PDF created with pdfFactory trial version www.pdffactory.comслоя (70 входов, полоса пропускания до 4 Гбайт/с), шести внутренних слоеви одного выходного нейрона.
Точность аналогового умножения – 5 бит,время решения – 20 нс, что позволяет использовать NeuroClassifier втриггере первого уровня.Нейрочип SAND/1 компании DatafactoryКомпания Datafactory (бывшая INCO) предложила на рынок нейрочипSAND/1 (Simple Applicable Neural Device). SAND/1 представляет собойкаскадно-соединенные систолические процессоры, оптимизированные длябыстрого решения задач в нейросетевом базисе. Производительность одногопроцессора составляет 200 MCPS (миллионов связей в секунду).
Процессоримеет четыре 16-битных потока и 40-битный сумматор.Нейрочип разработан Исследовательским центром в Карлсруе иИнститутом микроэлектроники г. Штутгарта.Нейрочип N64000 компании InovaОтносится к классу систолических нейропроцессоров. Содержит 80процессорных элементов, из которых 64 образуют основную матрицу, а 16являются резервом, 4 Кбайт памяти весов и 32 регистра общего назначения.Арифметический модуль нейрочипа имеет девять параллельных 16разрядных умножителя и один 32-разрядный сумматор.Нейрочип 100 NAP компании Hecht-Nielson ComputersСодержит четыре 32-разрядных процессорных элемента с плавающейточкой.
Средняя производительность около 150 MFLOPS, адресуемоеадресное пространство внекристалльной памяти 512 Кбайт.Нейрочип MT19003 компании Micro Circuit EngineeringОтносится к классу систолических нейропроцессоров. Основойархитектуры является RISC-ядро с семью специальными командами, 16разрядныйвекторныйумножительи32-разрядныйсумматор.Внутрикристалльная память для хранения весов отсутствует.
Точностьвходов и весов 13 разрядов. Средняя производительность 50 MCPS.Нейрочип NEURON компании EchelonОриентирован на создание кластерно-параллельных вычислительныхсистем. Программно-алгоритмическое обеспечение по управлениюкластерной структурой реализовано внутри кристалла.
Предложеннаяархитектура кристалла стала в настоящее время основой стандарта ANSI/EIA709.1-1999 построения различных АСУ технологическими процессами [2].В семействе нейрочипов NEURON выделяют: NEURON 3120 иNEURON 3150 (рис.
4.3).Кристаллы содержат:110PDF created with pdfFactory trial version www.pdffactory.com§ 2К динамической памяти для хранения весов и данных,§ 512 байт (EEPROM), для размещения управляющих программ.Рис. 4.3. Структурная схема нейрочипа NEURON 3150 компании EchelonДля выполнения специализированных сетевых и управляющихопераций в структуре кристалла имеется два спецвычислителя: ApplicationsCPU, Network CPU.
Также следует отметить широкие коммуникационныевозможности, реализованные на кристалле.111PDF created with pdfFactory trial version www.pdffactory.comНейрочип ZISC036 компании IBMНейрочип ZISC036 (Zero Instructions Set Computer) относится кнейрочипам векторно-прототипной архитектуры, т.е. алгоритм обучениястроится на соотношении входного вектора и запомненных прототипнымивекторами весов входов нейронов. Ориентирован на решение широкогокруга задач распознавания образов и классификации.
Каждый нейронпредставляет собой независимый процессор (рис. 4.4).Рис. 4.4. Функциональная схема нейрочипа ZISC компании IBM§§§§Характеристики нейрочипа ZISC036:36 нейронов;возможность соединения нескольких процессоров (каскадирования);от 1 до 64 компонент во входном векторе;напряжение питания 5V;112PDF created with pdfFactory trial version www.pdffactory.com§§§§потребляемая мощность – 1 W при 16 MHz;частота – 0 – 20 MHz;CMOS-технология;входной вектор загружается через 3,5 мкс, результат появляется через0,5 мкс.Для увеличения производительности фирма IBM разработала ISA иPCI модули, включающие параллельно работающие ZISC-процессоры.4.4.
Нейропроцессоры на основе ПЦОС и ПЛИС4.4.1. Основные понятияСтремительный переход современных систем управления на цифровыестандарты привел к необходимости обрабатывать с высокой скоростьюдостаточно большие объемы информации. Сложная обработка и фильтрациясигналов, например распаковка сжатых аудио- и видеоданных,маршрутизация информационных потоков, требует применения достаточнопроизводительных вычислительных систем. Подобные системы могут бытьреализованы на различной элементной базе, но наибольшее распространениеполучили устройства с применением цифровых сигнальных процессоров иПЛИС [10].Программируемая логика способна работать на более высокихчастотах, но поскольку управление реализовано аппаратно, то изменениеалгоритмов работы требует перепрограммирования интегральной схемы.Низкая тактовая частота ПЦОС пока ограничивает максимальную частотуобрабатываемого аналогового сигнала до уровня в 10 – 20 МГц, нопрограммное управление позволяет достаточно легко изменять не толькорежимы обработки, но и функции, выполняемые ПЦОС.