neironne_seti_i_neirokompjuter (1085713), страница 23
Текст из файла (страница 23)
Подобно другим процессорам с RISC-архитектурой ЦПиспользует команды загрузки/сохранения для доступа к данным в памяти, а125PDF created with pdfFactory trial version www.pdffactory.comтакже выполняет большинство целочисленных, битовых и логическихкоманд над операндами в регистрах в течение одного такта.Вычислительсплавающейточкой(Floating-PointUnit)конвейеризирован и позволяет одновременно выполнять операции надданными как с одинарной, так и с двойной точностью. Производительностьустройства составляет около 100 MFLOPS при внутренней тактовой частоте50 МГц. FPU использует тот же регистровый файл, что и устройствоцелочисленной и логической обработки. Специальный механизм отметок(Scoreboard) фиксирует занятость регистров и обеспечивает ихбесконфликтное использование.Основными компонентами ЦП являются:§ регистровый файл, состоящий из 31 32-разрядного регистра;§ барабанное устройство сдвига (Barrel Rotator);§ генератор маски;§ таймер;§ целочисленное АЛУ;§ управляющий регистр;§ 4 аккумулятора с плавающей точкой двойной точности;§ умножитель с плавающей точкой;§ сумматор с плавающей точкой;§ контроллер кэш-памяти.Архитектура ADSP-процессоров ПЦОС серии TMS320C8ХАрхитектура ADSP-процессоров TMS320C80 ориентирована дляприменений, связанных с графикой и обработкой изображений (гдеиспользование нейропарадигм дает наибольший эффект).
Она обеспечиваетэффективноевыполнениеоперацийфильтрацииичастотногопреобразования, типичных для данных приложений. ADSP может выполнятьза один такт одновременно операцию умножения, арифметико-логическуюоперацию (например, сдвиг-суммирование) и два обращения к памяти.Внутренний параллелизм ADSP позволяет обеспечить быстродействиесвыше 500 млн операций в секунду на некоторых алгоритмах.ADSP манипулирует 32-разрядными словами, а разрядность командсоставляет 64 бита. ПЦОС использует прямую, непосредственную и 12видов косвенной адресации.Архитектура ADSP характеризуется следующими параметрами:§ 3-этапный конвейер;§ 44 доступных пользователю регистра (10 - адресных, 6 - индекса, 8 данных, 20 - прочих);§ 32-разрядное 3-входовое АЛУ;§ репликатор битов;§ два адресных устройства;§ 32-разрядное устройство барабанного сдвига;126PDF created with pdfFactory trial version www.pdffactory.com§ генератор масок;§ блок условных операций для сокращения времени выполненияпереходов.Контроллер обмена управляет операциями обмена процессоров ипамяти как внутри кристалла (через коммутатор), так и вне кристалла сиспользованиемвходящихвегосоставинтерфейсных схем,поддерживающих все распространенные стандарты памяти (DRAM, VRAM,SRAM) и обеспечивающих возможность динамического измененияразрядности шины от 8 до 64.
Используя приоритетную дисциплинуобслуживания запросов к памяти в режиме ПДП, контроллер обменапозволяет выполнить обмен данными, не прерывая вычислений соскоростью до 400 Мбайт/c. Контроллер обмена поддерживает линейную икоординатную адресацию памяти для эффективного выполнения обмена приработе с 2- и 3-мерными графическими изображениями.ПЦОС серии TMS320C4хМногие нейрокомпьютеры проектируются на основе ПЦОС серииTMS320C4х. Благодаря своей уникальной структуре эти ПЦОС получилиширокое распространение в мультипроцессорных системах и практическивытеснили ранее господствующие в этой области транспьютеры. ПЦОСTMS320C4x совместимы по системе команд с TMS320C3x, однако обладаютбольшейпроизводительностьюилучшимикоммуникационнымивозможностями.ЦП ПЦОС TMS320C4x имеет конвейерную регистро-ориентированную архитектуру.
Компонентами ЦП являются:§ умножитель данных в формате с фиксированной и плавающей точкой;§ арифметико-логический модуль;§ 32-разрядное барабанное устройство сдвига;§ внутренние шины;§ дополнительные модули регистровой арифметики;§ регистровый файл ЦП.Умножитель выполняет операции над 32-разрядными данными вформате с фиксированной точкой и 40-разрядными данными в формате сплавающей точкой, причем умножение производится за один такт (25 нс),независимо от типа данных и параллельно с обработкой данных в другихфункциональных блоках микропроцессора (например, АЛУ).АЛУ выполняет за один такт операции над 32-разрядными целыми илогическими и 40-разрядными данными в формате с плавающей точкой, втом числе и операции преобразования форматов представления данных.ПЦОС аппаратно поддерживает операции деления и извлечения квадратногокорня.
Устройство барабанного сдвига за один такт выполняет сдвиг данныхвлево или вправо на число позиций от 1 до 32. Два дополнительных модулярегистровой арифметики (Address Generation 0 и Address Generation 1)127PDF created with pdfFactory trial version www.pdffactory.comфункционируют параллельно с умножителем и АЛУ и могут генерироватьдва адреса в одном такте. В ПЦОС поддерживается относительная базовая,базово-индексная, циклическая и бит-реверсная адресации.Первичный регистровый файл представляет собой многовходовыйфайл из 32 регистров.
Все регистры первичного регистрового файла могутиспользоваться умножителем, АЛУ и в качестве регистров общегоназначения. Регистры имеют некоторые специальные функции; восемьдополнительных регистров могут использоваться для некоторых косвенныхспособов адресации, а также как целочисленные и логические регистрыобщего назначения. Остальные регистры обеспечивают функции системытакие, как адресация, управление стеком, прерывания, отображение статусапроцессора, блочные повторы.Регистры повышенной точности предназначены для хранения иобработки 32-разрядных целых чисел и 40-разрядных чисел с плавающейточкой.
Дополнительные регистры доступны как для АЛУ, так и для двухмодулей регистровой арифметики. Основная функция этих регистров –генерация 32-разрядных адресов. Они также могут использоваться каксчетчик циклов или как регистры общего назначения.Адресуемое пространство ПЦОС составляет 4Г 32-разрядных слов. Накристалле расположены два двухвходовых блока оперативной памяти RAM0и RAM1, размером 4 Кбайт каждый, а также двухвходовой блок ROM,содержащий программу начальной загрузки.Кэш команд процессора емкостью 128 32-разрядных слов содержитнаиболее часто используемые участки кода, что позволяет сократить среднеевремя выборки команд. Высокая производительность ПЦОС TMS320C40достигается благодаря внутреннему параллелизму процессов и многошиннойорганизации процессора.
Раздельные шины позволяют одновременновыполнять выборку команды, данных и прямой доступ в память.4.4.5. ПЦОС компании MotorolaПЦОС компании Motorola в меньшей степени, чем рассмотренныевыше, используются для реализации нейропарадигм. Они подразделяются насемейства 16- и 24-разрядных ПЦОС с фиксированной точкой – DSP560xx,DSP561xx, DSP563xx, DSP566xx, DSP568xx и ПЦОС с плавающей точкой –DSP960xx. Линия 24-разрядных ПЦОС компании Motorola включает двасемейства: DSP560xx и DSP563xx. Основные принципы, положенные воснову их архитектуры, были разработаны и воплощены в семействеDSP560xx. Дальнейшие работы по совершенствованию сигнальныхпроцессоров проводились по трем направлениям:§ наращивание производительности 24-разрядных процессоров за счетконвейеризации функциональных модулей и повышения тактовойчастоты;128PDF created with pdfFactory trial version www.pdffactory.com§ создание дешевых 16-разрядных микропроцессоров с расширеннымисредствами взаимодействия с периферией;§ разработка высокопроизводительных процессоров, включающих блоквычислений с плавающей точкой.Компания Motorola является лидером по объему производствасигнальных микропроцессоров, большую часть которых составляютдешевые и достаточно высокопроизводительные 16- и 24-разрядныемикропроцессорысфиксированнойточкой.Расширенныекоммуникационныевозможности,наличиедостаточныхобъемоввнутрикристалльной памяти для данных и программы, возможности защитыпрограммы от несанкционированного доступа, поддержка режимаэнергосбережения делают эти микропроцессоры привлекательными дляиспользования, в основном, в качестве специализированных вычислителей,контроллеров в промышленных роботах, бытовых электронных приборах,системах управления оружием, средствах беспроводной связи и др.Примеры построения нейрокомпьютеров на основе ПЦОС компанииMotorola довольно редки.4.4.6.
Нейропроцессоры, реализованные на основе ПЛИСОтдельно следует рассмотреть возможность создания параллельныхвычислителей (в том числе и нейропроцессоров) на базе ПЛИС(программируемых логических интегральных схем). На ПЛИС можнореализовывать распространенные в последнее время гибридныенейропроцессоры, когда блок обработки данных реализуется на ПЦОС, алогика управления на ПЛИС. В настоящее время множество фирм в мирезанимается разработкой и выпуском различных ПЛИС, однако лидерстводелят две фирмы Xilinx и ALTERA. Выделить продукцию какой-либо однойиз этих фирм невозможно, так как по техническим характеристикам ониразличаются очень мало.В настоящее время фирма ALTERA выпускает семь серий СБИСПЛИС.