neironne_seti_i_neirokompjuter (1085713), страница 21
Текст из файла (страница 21)
Это позволяет осуществить два доступа к памятиодновременно: гарвардская архитектура выделяет одну шину для выборкиинструкций (шина адреса), а другую – для выборки операндов (шинаданных). Но для выполнения ПЦОС операций этого недостаточно, так как восновном все они используют по два операнда. Поэтому гарвардскаяархитектура применительно к цифровой обработке сигналов используетшину адреса и для доступа к данным. Важно отметить, что частонеобходимо произвести выборку трех компонентов – инструкции с двумяоперандами, на что собственно гарвардская архитектура неспособна. Втаком случае данная архитектура включает в себя кэш-память.
Она можетбыть использована для хранения тех инструкций, которые будутиспользоваться вновь. При использовании кэш-памяти шина адреса и шинаданных остаются свободными, что делает возможным выборку двухоперандов. Такое расширение – гарвардская архитектура плюс кэш –называютрасширеннойгарвардскойархитектуройилиSHARC(аббревиатура введена компанией Analog Devices).Гарвардская архитектура требует наличия двух шин памяти. Этозначительно повышает стоимость производства чипа.
Так, например, ПЦОСработающий с 32-битными словами и в 32-битном адресном пространстве117PDF created with pdfFactory trial version www.pdffactory.comтребует наличия, по крайней мере, 64 выводов для каждой шины памяти, а всумме получается 128 выводов. Это приводит к увеличению размеров чипа ик трудностям при проектировании схемы.Архитектура фон Неймана использует только одну шину памяти. В тоже время, она обладает и рядом положительных черт:§ более дешевая при реализации;§ требует меньшего количества выводов шины;§ является более простой в использовании, так как программист можетразмещать и команды и данные в любом месте свободной памяти.Рассмотрим некоторые наиболее перспективные ПЦОС с точки зренияреализации нейрокомпьютеров.4.4.3. ПЦОС компании Analog DevicesРеализациянейровычислителейвысокойпространственнойразмерности требует все более производительной элементной базы.
Дляпреодоления возникающих трудностей разработчики используют дваподхода: улучшение характеристик уже имеющихся процессоров иувеличение производительности путем разработки новых архитектур.Первый способ ограничен увеличением производительности в 5 – 8 раз.Второй способ предполагает разработку архитектур, которые были бынаиболее удобны в конечном приложении и оптимизированы дляконкретного языка программирования.Компания Analog Devices ведет разработки в обоих направлениях. Так,ядро первого 32-разрядного процессора ADSP-21020 производительностью30 MFLOPS было усовершенствовано, что привело к созданию новогопроцессора ADSP-21065L с максимальной производительностью 198MFLOPS, что соответствует ускорению в 6,6 раз. Работая над дальнейшимувеличением производительности, оптимизируя архитектуру существующихпроцессоров, был разработан новый сигнальный микропроцессор ADSP2116x с тактовой частотой 100 МГц производительностью 600 MFLOPS.Среди особенностей ПЦОС семейства ADSP-2116x можно отметить:§ Быстрые и гибкие модули арифметики.
Все команды выполняются заодин такт. Набор команд микропроцессора наряду с традиционнымиарифметическими операциями включает такие, как 1/x, 1/R(x),команды сдвига, циклического сдвига, комбинации операцийсложения/вычитания с умножением.§ Независимые потоки данных в (из) вычислительные (х) модули (ей). Заодин такт процессор может одновременно считать (записать) дваоперанда в регистровый файл, загрузить два операнда в АЛУ, принятьдва операнда в умножитель, АЛУ и умножитель могут вырабатыватьдва результата (или три, если АЛУ выполняет операцию совместно сосложением/вычитанием).
48-битовое командное слово позволяет118PDF created with pdfFactory trial version www.pdffactory.comзадаватьводнойинструкциипараллельноевыполнениеарифметических операций и обмен данными.§ Повышенную точность и расширенный динамический диапазонвыполняемых операций. Все представители микропроцессорногосемейства оперируют с данными в 32-битовом формате с плавающейточкой, 32-битовыми целочисленными данными (в дополнительномкоде и беззнаковыми) и 40-битовыми данными расширенной точностис плавающей точкой. Повышенная точность вычислений достигаетсяблагодаряуменьшениюошибкиокруглениярезультатаввычислительных модулях.
Аккумулятор для 32-разрядных данных сфиксированной точкой имеет 80 разрядов.§ Наличие двух генераторов адреса. Генераторы адреса обеспечиваютпред- или постформирование прямого или косвенного адреса данных,выполняют над адресами модульные и бит-реверсные операции.§ Эффективные средства формирования последовательности команд имеханизм организации программных циклов. Инициализация, возвратна начало и выход из программного цикла выполняется за одинпроцессорный цикл для уровня вложенности до шести. Процессораппаратно поддерживает выполнение команд перехода и перехода сзадержкой.Универсальное АЛУ ПЦОС, устройство барабанного сдвига иуниверсальный умножитель функционируют независимо, обеспечиваявысокую степень внутреннего параллелизма операций.
Регистровый файлобщего назначения служит для обмена данными между вычислительнымимодулями и внутренней шиной, а также для запоминания промежуточныхрезультатов. Регистровый файл содержит 32 регистра (16 – первичных и 16 –вторичных), имеет 10 портов и, совместно с гарвардской архитектурой,позволяет организовывать эффективный обмен между вычислительнымимодулями и памятью. Расширенная гарвардская архитектура процессорапозволяет выбирать до двух операндов и команду из кэш-памяти команд заодин цикл.ПЦОС ADSP-210xx содержат высокопроизводительную кэш-памятькоманд. Кэш-память работает избирательно: кэшируются только те команды,выборка которых конфликтует с выборкой данных из памяти программ.Адресные генераторы (DAG1 и DAG2) обеспечивают аппаратнуюреализацию циклических (кольцевых) буферов, позволяющих эффективновыполнять фильтрацию и Фурье-преобразование, для которых требуетсяциклическое изменение адресов обрабатываемых данных.
Физическициклический буфер может быть расположен, начиная с любого адресапамяти, а для ссылки на его содержимое используются регистровыеуказатели. Два DAG содержат 16 первичных и 16 вторичных регистров, чтопозволяет работать одновременно с 32 циклическими буферами.119PDF created with pdfFactory trial version www.pdffactory.com4.4.4. ПЦОС компании Texas Instruments Inc.Компания Texas Instruments Inc. на рубеже столетий оказалась взаметно обновленном виде [17].
Руководство компании принялостратегическое решение сконцентрировать силы на упрочении лидирующегоположения на рынке ПЦОС, а также других изделий, в первую очередьаналоговых, необходимых для системной интеграции процессоров вприкладные системы.В период с 1998 по 2000 г. компанией Texas Instruments Inc. былипроданы подразделения по производству компьютеров-ноутбуков, схемпамяти, оборонной электроники и были приобретены известные фирмы,занимающиеся разработкой прикладного программного обеспечения дляПЦОС (GO DSP, TARTAN, AMATI, Spectron Microsystems). В результате в1998 году доля Texas Instruments Inc. на рынке ПЦОС вплотнуюприблизилась к 50% (по результатам 1997 года – 45%).
Кроме того,компания Texas Instruments Inc. вышла на первое место в мире по продажаманалоговых и аналого-цифровых схем. Этому способствовало такжесостоявшееся в 2001 году слияние с компанией Burr-Brown.В области технических решений в компании Texas Instruments Inc.также произошел ряд существенных изменений. В 1999 году начатомассовое производство кремния по запатентованной технологии TimeLine сразрешением 0,18 мкм.ПЦОС с фиксированной точкой компании Texas Instruments Inc.представлены сериями (рис. 4.5) [16, 17]: TMS320C1x, TMS320C2x,TMS320C2xx, TMS320C5x и TMS320C62x.
Класс ПЦОС с плавающейточкой включает ПЦОС TMS320C3x, TMS320C4x и TMS320C67x.ГодыРис 4.5. Серии ПЦОС TMS320 компании Texas Instruments Inc.120PDF created with pdfFactory trial version www.pdffactory.comПЦОС TMS320C8x также поддерживает операции с плавающейточкой и представляет собой мультипроцессорную систему, выполненную водном кристалле.Три серии – TMS320С2000, TMS320С5000 и TMS320С6000, помнению экспертов компании, в ближайшем будущем должны покрыть весьдиапазон возможных применений ПЦОС, предоставляя потребителю выборПЦОС по критерию "производительность / стоимость / потребляемаямощность".ПЦОС серии TMS320С2000 предназначены для решения задачвстроенных применений и управления; процессоры отличаются развитойпериферией и невысокой стоимостью.Данную серию представляют универсальные ПЦОС подсерииTMS320C20x и подсерии TMS320C24x для цифрового управленияэлектродвигателями.ПЦОСсерииTMS320С5000ориентированынарынокмалопотребляемых портативных устройств и мобильной связи.