neironne_seti_i_neirokompjuter (1085713), страница 20
Текст из файла (страница 20)
Помимо обработкии фильтрации данных ПЦОС могут осуществлять маршрутизацию цифровыхпотоков, выработку управляющих сигналов и даже формирование сигналовсистемных шин ISA, PCI и др.ПЛИС и ПЦОС получили значительное распространение и в качественейропроцессоров.Особенностью использования ПЦОС и ПЛИС в качестве элементнойбазы нейрокомпьютеров является то, что ориентация в выполнениинейросетевых операций обуславливает с одной стороны повышениескоростей обмена между памятью и параллельными арифметическимиустройствами, а с другой стороны уменьшение времени весовогосуммирования (умножения и накопления) за счет примененияфиксированного набора команд типа регистр – регистр.4.4.2.
Нейропроцессоры, реализованные на основе ПЦОСПЦОС, обладая мощной вычислительной структурой, позволяютреализовать различные алгоритмы обработки информационных потоков.113PDF created with pdfFactory trial version www.pdffactory.comСравнительно невысокая цена, а также развитые средства разработкипрограммного обеспечения позволяют легко применять их при построениивычислительных систем с массовым параллелизмом.ПЦОС вот уже на протяжении двух десятилетий являются элементнойбазой нейрокомпьютеров, реализованных как в виде карт и модулей, так и ввиде конструктивно-автономных систем.Анализ сложившегося рынка показывает, что доминирующие позициив ближайшем будущем будут занимать крупные компании-производителиПЦОС, такие как Texas Instruments Inc., Analog Devices, Motorola и ряддругих, которые способны создавать не только ПЦОС низкойсебестоимости, но и ежегодно инвестировать новые разработки и ноу-хау,создавать принципиально новые модели и платформы.
Например, компанияTexas Instruments Inc. только в 1998 году выделила на исследования иразработки ноу-хау для ПЦОС – 1,2 млрд долларов – величину, близкую кгодовому обороту некоторых конкурентов в области производства ПЦОС.Выбор процессоров той или иной компании для реализацииконкретного проекта — многокритериальная задача, и сформулироватьболее или менее четкую методику выбора практически невозможно. Неотдавая предпочтение ПЦОС той или иной компании, отметим, что изделияAnalog Devices и Texas Instruments Inc.
годятся для приложений, требующихвыполнения больших объемов математических вычислений (таких какцифровая фильтрация сигнала, вычисление корреляционных функций и т.п.).Между тем, для задач, требующих наряду с вычислениями выполнятьинтенсивный обмен с внешними устройствами (многопроцессорныесистемы, различного рода контроллеры), чаще используются ПЦОС TexasInstruments Inc. [16, 17], обладающие высокоскоростными интерфейснымиподсистемами. Компания Motorola является лидером по объемупроизводства дешевых и достаточно производительных контроллеров наоснове 16- и 24-разрядных ПЦОС с фиксированной точкой. Расширенныекоммуникационныевозможности,наличиедостаточныхобъемоввнутрикристалльной памяти для данных и программы, возможность защитыпрограммы от несанкционированного доступа, поддержка режимаэнергосбережения делают эти микропроцессоры привлекательными дляиспользования не только в качестве специализированных вычислителей, нои в качестве контроллеров, в бытовых электронных приборах, в системахадаптивной фильтрации и т.д.Высокая производительность, необходимая при обработке сигналов вреальномвремени,обусловилаширокоераспространениитранспьютероподобных ПЦОС серий TMS320C4x (компания TexasInstruments Inc.) и ADSP2106x (компания Analog Devices), ориентированныхна использование в мультипроцессорных системах (потребительские ифункциональные характеристики приведены в табл.
4.3).114PDF created with pdfFactory trial version www.pdffactory.comОценка производительности ряда процессоров при выполнениинекоторых популярных алгоритмов ЦОС приведена в табл. 4.4.Таблица 4.3. Сравнительные характеристики ПЦОС ADSP21061 и TMS320C40Характеристика/процессорTMS320C40/TMS320C44ADSP21061Производительность20,033,0150,060,0Цена, $49176 (‘C44 – 99)Соотношение производительность - цена, MFLOPS/$3,10,34 (‘C44 – 0,6)0,370,97Количество регистров данных3212Циклические буфера321 (Fixed Length)Каналы ПДП, шт66Последовательные порты2-Максимальная пропускная способность, МБайт/сек30060Внутрикристалльная память, 32-разрядных слов32K2KОбщая внутрикристалльная память, Кбит102464Поддержка мультипроцессорных операций66Параллельный-Время выполнения команд, нсПиковое значение MFLOPSСтоимостьСкорость выполнения типовых алгоритмовКомплексное БПФ для 1024 выборок, мсХарактеристики ЦПВозможности ввода-выводаИнтерфейс115PDF created with pdfFactory trial version www.pdffactory.comТаблица 4.4.
Производительность процессоровпри выполнении ряда известных алгоритмовIntelPentiumMMX,200 МГцTexasInstrumentsTMS320C40,50 МГцНТЦ"Модуль"NM6403,40 МГц-216,868Быстрое преобразование Фурье(256 точек, 32 разр.), мкс (тактов)200-464 (11588)102 (4070)Преобразование Уолша-Адамара(21 шаг, входные данные – 5 бит), с2,582,80-0,45Наименование тестаIntelPentiumII,300 МГцФильтр Собеля (размер кадра384 × 288 байт), кадров/с.При создании нейрокомпьютеров на базе ПЦОС необходимо помнить,что они обладают высокой степенью специализации.
В ПЦОС широкоиспользуются методы сокращения длительности командного цикла,характерныедляуниверсальныхRISC-процессоров,такиекакконвейеризация на уровне отдельных микроинструкций и инструкций,размещение операндов большинства команд в регистрах, использованиетеневых регистров для сохранения состояния вычислений при переключенииконтекста, разделение шин команд и данных (гарвардская архитектура).В то же время для сигнальных процессоров характерным являетсяналичие аппаратного умножителя, позволяющего выполнять умножение какминимум двух чисел за один командный такт. Другой особенностьюсигнальных процессоров является включение в систему команд такихопераций, как умножение с накоплением MAC (c = a x b + c) с указанным вкоманде числом выполнений в цикле и с правилом изменения индексовиспользуемых элементов массивов A и B, т.е. уже реализованы прообразыбазовых нейроопераций – взвешенное суммирование с накоплением),инверсия бит адреса, разнообразные битовые операции.
В ПЦОСреализуется аппаратная поддержка программных циклов, кольцевыхбуферов. Один или несколько операндов извлекаются из памяти в циклеисполнения команды.Реализация однотактного умножения и команд, использующих вкачестве операндов содержимое ячеек памяти, обуславливает сравнительнонизкие тактовые частоты работы сигнальных процессоров. Специализацияне позволяет поднимать производительность за счет быстрого выполнениякоротких команд типа R,RèR, как это делается в универсальныхпроцессорах.
Этих команд просто нет в программах ЦОС.116PDF created with pdfFactory trial version www.pdffactory.comВедущиекомпании-производителивыпускаютПЦОСдвухразновидностей, существенно отличающихся по точности вычислений и поцене: более дешевые процессоры для обработки данных в формате сфиксированной точкой и процессоры, аппаратно поддерживающие операциинад данными в формате с плавающей точкой.Типичные ЦОС-операции требуют выполнения множества простыхсложений и умножений.Сложение и умножение требуют:§ произвести выборку двух операндов;§ выполнить сложение или умножение (обычно и то и другое);§ сохранить результат или удерживать его до повторения.Для выборки двух операндов за один командный цикл необходимоосуществить два доступа к памяти одновременно. Но в действительностикроме выборки двух операндов необходимо еще сохранить результат ипрочитать саму команду.
Поэтому число доступов в память за одинкомандный цикл будет больше двух и, следовательно, ПЦОС процессорыподдерживают множественный доступ к памяти за один и тот же командныйцикл. Но невозможно осуществить доступ к двум различным адресам впамяти одновременно, используя для этого одну шину памяти. Существуетдва вида архитектур ПЦОС процессоров, позволяющих реализоватьмеханизм множественного доступа к памяти:§ гарвардская архитектура;§ модифицированная архитектура фон Неймана.Гарвардская архитектура подразумевает две физически разделенныешины данных.