ЦСП Analog Devices и Texas Instruments (1015495), страница 7
Текст из файла (страница 7)
Производительность обновленного микропроцессорасоставила 150 Mflops.32Сигнальные микропроцессоры компаний ADI и TIОсновными областями применения микропроцессоров семейства СЗх являются: цифровоеаудио, ЗD-графика, видеоконференцсвязь, промышленные роботы, копировальномножительная техника, телекоммуникационные системы.2.8 Микропроцессоры семейства TMS320C4XСледующими представителями сигнальных процессоров с плавающей точкой явилисьпроцессоры семейства TMS320C4x.Благодаря своей уникальной архитектуре микропроцессоры TMS320C4x получили широкоераспространение в мультипроцессорных системах и практически вытеснили ранеегосподствующее в этой технологической нише семейства транспьютеров компании Inmos.Процессоры TMS320C4x совместимы по системе команд с TMS320C3x, однако обладаютбольшей производительностью и лучшими коммуникационными возможностями.В семейство TMS320C4x входят процессоры TMS320C40, TMS320C44, TMS320LC40.TMS320C40 - имеет производительность 30 MIPS/60 Mflops и максимальную пропускнуюспособность подсистемы ввода/вывода 384 Мбайт/с.
С40 содержит на кристалле 6высокоскоростных (20 Мбайт/с) коммуникационных портов и 6 каналов ПДП, 2 Ксловпамяти, 128 слов кэш-памяти программ и начальный загрузчик. Две внешних шиныобеспечивают работу с 4 Гслов объединенного адресного пространства.Процессор TMS320C44 - более дешевый вариант, имеющий 4 коммуникационных порта иадресуемое пространство 32 Мслов.
Однако значения показателей производительности ипропускной способности процессора те же, что и у С40.TMS320LC40 - архитектурный аналог TMS320C40, отличающийся низкимэнергопотреблением, повышенной производительностью (40 MIPS/80 Mflops) и большейпропускной способностью (488 Мбайт/с).Структура микропроцессора TMS320C40 приведена на рисунке 2.8.33Сигнальные микропроцессоры компаний ADI и TIРис. 2.8. Структура микропроцессора TMS320C40Центральный процессор TMS320C4x имеет конвейерную регистро-ориентированнуюархитектуру. Компонентами ЦП являются:••••••умножитель;арифметико-логический модуль;32-разрядное барабанное устройство сдвига;внутренние шины;дополнительные модули регистровой арифметики;регистровый файл.Умножитель выполняет операции над 32-разрядными данными в формате с фиксированнойточкой и 40-разрядными данными в формате с плавающей точкой, причем умножениепроизводится за один такт (25 нч) для данных любого типа и параллельно с обработкойданных в других функциональных блоках микропроцессора (например, АЛУ).АЛУ выполняет за один такт операции над 32-разрядными целыми и логическими данными и40-разрядными числами в формате с плавающей точкой, в том числе и операции34Сигнальные микропроцессоры компаний ADI и TIпреобразования форматов представления данных.
Микропроцессор аппаратно поддерживаетоперации деления и извлечения квадратного корня. Устройство барабанного сдвига позволяетза один такт выполнить сдвиг данных влево или вправо на число позиций от 1 до 32.Два дополнительных модуля регистровой арифметики (генераторы адреса) функционируютпараллельно с умножителем и АЛУ и могут генерировать два адреса в одном такте. Впроцессоре поддерживается относительная базовая, базово-индексная, циклическая и битреверсивная адресации.Первичный регистровый файл центрального процессорного устройства (ЦПУ) представляетсобой многовходовый файл из 32 регистров. Все регистры первичного регистрового файламогут использоваться умножителем, АЛУ и в качестве регистров общего назначения.Регистры имеют некоторые специальные функции.
Например, 12 регистров повышеннойточности могут использоваться для размещения результатов операций с плавающей точкой, 8дополнительных регистров - для некоторых косвенных способов адресации, а также какцелочисленные и логические регистры общего назначения. Остальные регистрыобеспечивают функции системы такие, как адресация, управление стеком, прерывания,отображение статуса процессора, повторы блоков команд.Регистры повышенной точности предназначены для хранения и обработки 32-разрядныхцелых чисел и 40-разрядных чисел с плавающей точкой.
Дополнительные регистры доступныкак для АЛУ, так и для двух модулей адресной арифметики. Основная функция этихрегистров - генерация 32-разрядных адресов. Они также могут использоваться как счетчикициклов или как регистры общего назначения.Адресуемое микропроцессором пространство составляет 4 Гслов 32-разрядных. На кристаллерасположены два двухвходовых блока оперативной памяти RAM0 и RAM1 размером 4 Кбайткаждый, а также двухвходовый блок ROM, содержащий программу начальной загрузки.Кэш-память команд процессора емкостью 128 слов (32-разрядных) содержит наиболее частоиспользуемые участки кода, что позволяет сократить среднее время выборки команд.Высокая производительность TMS320C4x достигается благодаря внутреннему параллелизмупроцессов и многошинной организации процессора.
Раздельные шины позволяютодновременно выполнять выборку команды, данных и прямой доступ в память.Шесть (С44 четыре) высокоскоростных (160 Мбит/с) коммуникационных портовобеспечивают эффективный обмен данными между процессорами. В ходе передачиосуществляется буферизация передаваемых и принимаемых данных и автоматическийконтроль за синхронизацией всех обменных операций между каналами, центральнымпроцессором и сопроцессором ПДП. Шесть каналов сопроцессора ПДП содержатсобственные генераторы адресов, счетчики, входные и выходные регистры и обеспечиваютвозможность одновременного бесконфликтного обращения к памяти, обмена данными смедленными модулями памяти и внешними устройствами, без снижения производительностипроцессора.
Особенностью сопроцессора ПДП является способность автоматическойинициализации каналов после выполнения обмена.Линк Ly, у = 0, ..., 5, состоит из 8-разрядной двунаправленной линии данных Dу (7-0) идвунаправленных одноразрядных управляющих линий для передачи сигналов:••REQy - запрос коммуникационным портом маркера, разрешающего передачу полинку;АСКу - подтверждение предоставления линка для передачи данных;35Сигнальные микропроцессоры компаний ADI и TI••STRy - строб коммуникационного порта, сопровождающий выдачу данных на линииданных;CRDYy - сигнал готовности коммутационного порта к приему, выдаваемыйпринимающим С4х по завершении приема предыдущей порции данных.Линии данных и управляющие линии реализованы как двунаправленные, что приводит кнеобходимости согласования состояний портов линков, соединяющих два микропроцессора:один порт обязательно передающий, другой - принимающий, либо оба порта находятся втретьем состоянии, исключающем передачу электрических сигналов между ними.
Приначальной установке обязательно выполнение этого требования, которое дальшеподдерживается протоколом функционирования линка. Передающий порт отмечаетсямаркером, который передается другому порту при смене направления передачи по линку.Передача маркера происходит за 4 такта.Очереди портовКаждый порт имеет входную и выходную FIFO-очереди. Процессор или канал ПДПпересылают данные в конец выходной FIFO-очереди порта для передачи их по линку.Выборка принятых данных выполняется из начала входной FIFO-очереди. Обе очередиимеют по 8 элементов, каждый из которых предназначен для хранения 32-битного слова. Присоединении двух С4х в каждом линке образуется очередь в 16 элементов: 8 элементов наодном конце линка и 8 элементов на другом конце линка.Интерфейс линковПрограммное управление передачами данных по линкам выполняется путем записисоответствующих кодов в регистры состояния и управления линков.
Для каждого линка в С4хвыделена часть адресного пространства размером 16 слов:••••первое слово содержит управляющий регистр порта;второе слово является элементом 0 входной FIFO-очереди;третье слово служит элементом 7 выходной FIFO-очереди;остальные слова резервные.Поля и отдельные биты управляющего регистра определяют:•••••направление передачи порта: входной или выходной;прекращение функционирования порта как входного и переключение нафункционирование как выходного;прекращение функционирования порта как выходного и готовность переключиться врежим входного порта;указатель заполненности выходной очереди;указатель заполненности входной очереди.Функционирование линковКогда функционирование порта как входного прекращено, он не дает сигнала готовности кприему после получения первого байта. Передача данных останавливается до моментапереключения порта в режим входного порта или до поступления сигнала сброса. При этомпередача данных после возобновления идет без потери байтов.Коммуникационный порт не выдает подтверждения на запрос маркера в следующих случаях:36Сигнальные микропроцессоры компаний ADI и TI••его функционирование как входного порта прекращено;порт имеет заполненную входную FIFO-очередь.При этом порт, сохранив маркер, может функционировать как выходной.Если коммуникационный порт прекращает функционировать в качестве входного порта вмомент приема запроса маркера, то подтверждение на запрос маркера выдается до остановки.Прекращение функционирования порта как выходного приводит к следующим последствиям:••••если выходной порт не имеет маркера и его функционирование как выходного портапрекращено, то запрос на маркер не высылается;если выходной порт имеет маркер и идет передача, то после выдачи передаваемогослова следующее слово не передается;если выходной порт имеет маркер и его функционирование как входного порта непрекращено, а функционирование как выходного порта прекращено, то при запросемаркера он должен быть передан;при установке функционирования порта как выходного при наличии маркера передачавозобновляется; при отсутствии маркера она должна быть запрошена в обычномпорядке.Основной механизм синхронизации базируется на сигналах "готов/не готов".
Если каналпрямого доступа в память или центральный процессор пытаются прочитать из пустойвходной очереди или записать в полную выходную очередь, выдается сигнал "не готов" иканалы ПДП или ЦП продолжат чтение или запись после получения сигнала "готов".Сигналом готовности для выходного канала является OCRDY (Output Channel Ready),который также является сигналом прерывания. Сигналом готовности для входного каналаявляется ICRDY (Input Channel Ready), который также является сигналом прерывания.Каждый порт способен генерировать четыре различных сигнала прерывания:••••входная очередь полна (input channel full);входной канал готов (input channel ready);выходной канал готов (output channel ready);выходная очередь пуста (output channel empty).ЦП может обрабатывать все 4 сигнала, а канал ПДП только сигналы готовности.Два 32-разрядных таймера могут работать как с внутренней, так и с внешней синхронизацией,осуществлять подсчет временных интервалов и внешних событий, выдавая сигналыпроцессору или во внешнюю среду.2.9 Микропроцессоры семейства TMS320C8XМикропроцессор TMS320C80, выпущенный в конце 1994 года, имеет второе название - MVP(Multimedia Video Processor - мультимедийный видеопроцессор), что обусловлено еговысокой эффективностью на задачах обработки изображений, в системах виртуальнойреальности, компрессии и декомпрессии видео- и аудиоданных, обработки связнойинформации.37Сигнальные микропроцессоры компаний ADI и TITMS320C80 представляет собой новый подход к повышению производительности ифункциональности цифровых сигнальных процессоров: в одной микросхеме объединеночетыре усовершенствованных цифровых процессора обработки сигналов (ADSP - AdvancedDigital Signal Processor), каждый из которых выполняет за такт несколько RISC-операций, ипятый процессор, называемый главным процессором (Master Processor - МР), - 32-разрядныйпроцессор с высокопроизводительным устройством обработки чисел в формате с плавающейточкой.