neironne_seti_i_neirokompjuter (1085713), страница 18
Текст из файла (страница 18)
Производительность специализированных нейрочипов*НаименованиенейрочипаКонфигурацияCPSCPSPWCPPSCUPSNLX42032-16, 8 bit mode10M20K640M-100 NAP4 chips, 2 M wts, 16 bit mantissa250M125256G64MWSI (Hitachi)576 neuron Hopfield138M3.710G-N64000 (Inova)64-64-1, 8 bit mode871M128K56G220MMA161 chip, 25 MHz400M15M103G-ZISC03664 8 bit element inp. Vector----MT190034-4-1-, 32 MHz32M32M6.8G-MD12208-89M1M142M-NI 1000256 5 bit element inp. Vector40 000 vec in sec.---L-neuro-11-chip, 8 bit mode26M26K1.6G32MNM64038 bit mode, 50 MHz1200M150M77G-* В таблице приведены средние округленные показатели производительностиВнешний вид нейрочипа представлен на рис.
П.1 приложений.Основные характеристики:102PDF created with pdfFactory trial version www.pdffactory.com§ тактовая частота – 50 МГц (20 нс – время выполнения всехинструкций);§ технология – КМОП 0,5 мкм;§ корпус – 256BGA;§ напряжение питания от 2,7 до 3,6 В;§ потребляемая мощность при 50 MHz около 1,3 Вт.RISC-ядро:§ 5-ступенчатый 32-разрядный конвейер;§ 32- и 64-разрядные команды (обычно выполняется две операции водной команде);§ два адресных генератора, адресное пространство – 16 Гбайт;§ два 64-разрядных программируемых интерфейса с SRAM/DRAMразделяемой памятью;§ формат данных – 32-разрядные целые.§ восемь 32-разрядных регистров общего назначения;§ восемь 32-разрядных адресных регистров;§ специальные регистры управления и состояния;§ два высокоскоростных коммуникационных порта ввода/вывода,аппаратно-совместимых с портами TMS320C4x.Векторный сопроцессор:§ переменная 1–64-разрядная длина векторных операндов и результатов;§ формат данных – целые числа, упакованные в 64-разрядные блоки, вформе слов переменной длины от 1 до 64 разрядов каждое;§ поддержка как векторно-матричных, так и матрично-матричныхопераций;§ два типа функций насыщения на кристалле;§ три внутренних 32 × 64-разрядных блока ОЗУ.Производительность скалярных операций:§ 50 MIPS;§ 200 MOPS для 32-разрядных данных.Производительность векторных операций:§ от 50 до 50000 MMAC.I/O и интерфейсы с памятью:§ пропускная способность двух 64-разрядных интерфейсов с памятью –до 800 Мбайт/сек;§ I/O коммуникационные порты – до 20 Мбайт/сек каждый.Базовыми для кристалла являются вычисления вида:Zi = f(Yi) = f (Ui+е(XjWij)) ,(i = 1, ..
, M; j = 1, .., N) ,(4.2)где Zi – выходной сигнал i-ro нейрона, Xj – j-й входной сигнал слоя, Ui –смещение i-ro нейрона, Wij – весовой коэффициент j-го входа 1-го103PDF created with pdfFactory trial version www.pdffactory.comнейрона, Yi – сумма взвешенных входов i-го нейрона, f – функцияактивации, N – количество входных сигналов слоя, М – количествонейронов в слое.Операнды Zi, Xi, Ui и Wij представлены в дополнительномпараллельном коде и могут иметь произвольную разрядность.Особенностями данного кристалла являются:§ возможность работы с входными сигналами (синапсами) и весамипеременной разрядности (от 1 до 64 бит), задаваемой программно, чтообеспечивает уникальную способность нейрокристалла увеличиватьпроизводительность с уменьшением разрядности операндов;§ быстрая подкачка новых весов на фоне вычислений (24 операцииумножения с накоплением за один такт при длине операндов 8 бит);§ V-аппаратная поддержка эмуляции нейронных сетей большойразмерности;§ реализация функции активации в виде пороговой функции илифункции ограничения;§ наличие двух широких шин (по 64 разряда) для работы с внешнейпамятью любого типа: до 4Мб SRAM и до 16 Гб DRAM;§ наличие двух байтовых коммуникационных портов ввода/вывода,аппаратно совместимых с коммуникационными портами TMS320C4xдля реализации параллельных ВСМП большой производительности;§ возможность работы с данными переменной разрядности поразличным алгоритмам, реализуемым программами, хранящимися вовнешнем ОЗУ.Технические характеристики:§ число вентилей на кристалле – 100000;§ размер кристалла – 10 мм × 10,5 мм при технологии 0,7 мкм;§ потребляемая мощность – не более 3 Вт;§ пиковая производительность для байтных операндов – 720 MCPS притактовой частоте 30 МГц; для бинарных операций – 8640 MCPS.Кристалл может применяться как базовый элемент нейрокомпьютеров,реализованных в виде карт и модулей для ПК (нейроускорителей), а также вконструктивно-автономных нейрокомпьютерах.
Внешний вид нейрочипапредставлен на рис. П.1 Приложений. Используется в нейрокомпьютерахкомпании «Модуль» [15].Нейросигнальный процессор NeuroMatrixR NM6404NeuroMatrixR NM6404 представляет собой высокопроизводительныйПЦОС-образный RISC-процессор. В его состав входят два основных блока:32-разрядное RISC-ядро и 64-разрядный векторный сопроцессор дляподдержки операций над векторами с элементами переменной разрядности.NM6404 по системе команд совместим с предыдущей версией NM6403.Имеются два программируемых интерфейса для работы с внешней памятью104PDF created with pdfFactory trial version www.pdffactory.comразличного типа и два коммуникационных порта, аппаратно совместимых спортамиПЦОСTMS320C4x,длявозможностипостроениямногопроцессорных систем.Технические параметры [15]:§ тактовая частота – 133 МГц (8 нс – время выполнения любойкоманды);§ технология КМОП 0,25 мкм;§ корпус PQFP256;§ напряжение питания 2,5 В; 3,3 В; 5 В;§ потребляемая мощность – около 1,0 Вт;§ условия эксплуатации: –40...+80 C.RISC-ядро:§ 5-ступенчатый 32-разрядный конвейер;§ 32- и 64-битовые команды (обычно выполняется две операции в однойкоманде);§ 2 Мбита внутреннее ОЗУ;§ доступ к внутренней памяти соседей;§ два адресных генератора с адресуемым пространством – 16 Гбайт;§ два 64-разрядных программируемых интерфейса сSDRAM/SRAM/DRAM/Flash разделяемой ПЗУ;§ четыреодновременныхдоступаквнутреннейпамяти;широковещательный режим доступа к внешней памяти;§ 64 К загружаемого ПЗУ;§ формат данных – 32-разрядные целые;§ четыре канала ПДП;§ два коммуникационных порта ввода/вывода, аппаратно совместимых спортами TMS320C4x; JTAG-совместимый отладочный интерфейс;система управления потребляемой мощностью;Векторный сопроцессор:§ от 1 до 64-разрядная длина векторных операндов и результатов;§ формат данных – целые числа, упакованные в 64-разрядные блоки, вформе слов переменной длины от 1 до 64 разрядов каждое;§ поддержка векторно-матричных и матрично-матричных операций; 16тактов на перезагрузку матрицы коэффициентов;§ реализация на кристалле двух типов активационной функции.Производительность скалярных операций:§ 133 MIPS;§ 399 MOPS для 32-разрядных данных.Производительность векторных операций – от 133 до 38000 MMAC.I/O и интерфейсы с памятью:§ пропускная способность двух 64-разрядных интерфейсов с памятью –2128 Мбайт/сек;§ I/O коммуникационные порты – до 20 Мбайт/сек каждый.105PDF created with pdfFactory trial version www.pdffactory.comВнешний вид нейрочипа представлен на рис.
П.2 Приложений.Нейрочип NNP компании Accurate Automation Corp.Состоит из нескольких миниатюрных процессоров, работающихпараллельно. Каждый из них представляет собой быстрый 16-разрядныйвычислитель с памятью для хранения синаптических весов. Процессориспользует всего 9 команд. Процессоры на кристалле связаны друг с другомлокальной шиной. NNP создан в коммерческих целях и доступен на рынке.В комплект поставки процессора включены средства разработкипрограмм, а также библиотека подпрограмм с реализованныминейросетевыми алгоритмами, такими как сети Хопфилда, сети Кохонена идругими.
Нейрочип поставляется на платах под шины ISA, VME.Производительность – 140 MCPS для однопроцессорной системы и 1,4 GCPSдля 10-процессорной системы.Нейрочип МА16 компании SiemensИзготовлен по технологии КМОП (1 мкм), состоит из 610 тыс.транзисторов и выполняет до 400 млн операций умножения и сложения всекунду. Используется в качестве элементной базы нейрокомпьютераSynapse 1 и нейроускорителей Synapse 2 и Synapse 3 (распространяемыхсегодня на рынке французской фирмой Tiga Technologies).Рис. 4.2. Функциональная схема нейрочипа МА16106PDF created with pdfFactory trial version www.pdffactory.comМА16 представляет собой программируемый каскадируемыйпроцессор для векторных и матричных операций, поддерживающий нааппаратном уровне следующие операции:§ матричное умножение;§ матричное сложение/вычитание;§ нормировка результата;§ вычисление векторной нормы (метрики L1 и L2);§ вычисление векторного расстояния (мера Манхэттена, геометрическоерасстояние).Нейрочип содержит четыре идентичных процессорных элемента,работающих параллельно (рис.
4.2). Входные данные имеют точность 16 бит,тактовая частота 50 МГц. Для операций матричного умножения/сложенияскорость вычислений достигает 8 × 108 операций/с. Программноеобеспечение работает в среде UNIX/XWIND и реализовано на C++.Нейронная сеть тоже описывается на С++ или может вводится интерактивнос помощью графического интерфейса типа OSF/Motif, что позволяетвизуализировать конфигурацию чипа после отображения на него структурысети. Хорошо развиты средства тестирования и эмуляции.
С 1995 года МА16является коммерчески доступным.Внешний вид нейрочипа представлен на рис. П.3 Приложений.Нейрочип MD1220 компании MicroDevicesСодержит восемь нейронов с 8 связями и 16-разрядные сумматоры. Вовнутрикристалльной памяти хранятся 16-разрядные веса. Входы имеютпоследовательные одноразрядные умножители с продолжительностью такта7,2 мкс. Средняя производительность около 9 MCPS.Нейрочип L-Neuro компании PhilipsОдин из первых нейрочипов. На сегодня широко известны две егомодификации L-Neuro 1.0 и L-Neuro 2.3. Вторая версия имеет 12 слоев, апервая один слой из шестнадцати одноразрядных, или двухвосьмиразрядных, или четырех 4-разрядных, или двух восьмиразрядныхпроцессорных элементов,т.е.имеет возможность работать вмультиразрядном режиме.