Э. Таненбаум - Архитектура компьютера (1127755), страница 56
Текст из файла (страница 56)
Группа сигналов управления температурой позволяет процессору оповещать окружающие устройства об опасности перегрева. Сюда относится, например, сигнал, который выдается центральным процессором, если его внутренняя температура превышает 130'С (266'Р). Хотя если температура центрального процессора превышает 130'С, он уже, вероятно, мечтает о выходе на пенсию и добросовестной службе в качестве нагревателя.
Группа сигналов тактовой частоты отвечает за определение частоты системной шины. Группа диагностических сигналов предназначена для тестирования и отладки систем согласно стандарту 1ЕЕЕ 1149.1 1ТАС. Группа сигналов инициализации обслуживает загрузку (запуск) системы. Наконец, существует группа разнородных сигналов, в числе которых, помимо прочих, есть сигнал, указывающий на то, что гнездо ЦП занято, сигнал, обслуживающий режим эмуляции 8088, и некоторые другие. Конвейерный режим шины памяти процессора Репбигп 4 Современные процессоры, такие как Репгшш 4, работают гораздо быстрее современных динамических ОЗУ. Чтобы процессор не простаивал, необходима максимально возможная производительность памяти. По этой причине шина памяти процессора Реп1шш 4 работает в конвейерном режиме, когда в шине происходят одновременно 8 операций.
Понятие конвейера мы рассматривали Примеры центральных процессоров 223 в главе 2, когда говорили о конвейерных процессорах. Отметим, что память тоже может быть конвейерной. Обращения процессора к памяти, которые называются транзакциями, состоят из шести фаз: 1. Арбитраж шины. 2. Запрос. 3. Сообщение об ошибке. 4.
Слежение. 5. Ответ. 6. Передача данных. Наличие всех шести фаз необязательно. В фазе арбитража шины определяется, какое из задающих устройств будет следующим. В фазе запроса на шину передается адрес. В фазе сообщения об ошибке подчиненное устройство передает сигнал об ошибке четности в адресе или о наличии каких-либо других неполадок. В фазе слежения центральный процессор проверяет, нет ли нужного ему слова в кэше другого процессора.
Эта фаза нужна только в многопроцессорных системах. В следующей фазе задающее устройство узнает, где взять необходимые данные. В последней фазе осуществляется передача данных. В системе с процессором Репьшш 4 в каждой фазе используются определенные сигналы, отличные от сигналов других фаз, поэтому каждая из них не зависит от остальных. Шесть групп этих сигналов показаны в левой части рис.
3.42'. Например, один из процессоров может пытаться получить доступ к шине, используя сигналы арбитража. Как только процессор получает право доступа к шине, он освобождает эти линии шины и занимает линии запроса. Тем временем другой процессор или какое-нибудь устройство ввода-вывода может войти в фазу арбитража шины и т.
д. Рисунок 3.43 иллюстрирует ситуацию одновременного выполнения нескольких транзакций. Фаза арбитража шины на рис. ЗАЗ не показана, поскольку она не всегда нужна. Например, если устройство, обладающее в данный момент шиной (часто это центральный процессор), захочет произвести еще одну транзакцию, ему не понадобится заново получать доступ к шине.
Запрашивать шину заново нужно только в том случае, если оно уступило ее другому устройству. Транзакции 1 и 2 обычные: пять фаз за пять циклов шины. Во время транзакции 3 вводится более длительная фаза передачи данных (когда, например, требуется передать целый блок или ввести режим ожидания). Вследствие этого транзакция 4 не может начать фазу передачи данных сразу после фазы ответа. Фаза передачи данных начинается только после того, как будет сброшен сигнал ОВ5'т'й. Фаза ответа в транзакции 5 также может занимать несколько циклов шины, что задерживает транзакцию 6. Наконец, мы видим, что в транзакции 7 также происходит задержка. В действительности же маловероятно, что центральный процессор будет пытаться начать новую транзакцию на каждом цикле шины, поэтому простои не такие уж длительные.
' В левой части рисунка показано только 3 групп. Сигналы епге одной фазы 1фазы слежения) почеыу-та оказались а прааой части рисунка. — Примеч. ред. Цнтп вины в Рис. 3.43. Конвейерный режим шины памяти в системе с процессором Репйигп 4 224 Глава 3. Цифровой логический уровень Г~1 Примеры центральных процессоров 225 ОЫГВВРАВС Ш В качестве второго примера процессора возьмем семейство ИггаБРАКС (производитель — компания 8пп).
Семейство ПКгаЯРАКС вЂ” это линейка 64-разрядных процессоров 8РАКС. Зги процессоры полностью соответствуют архитектуре Ъ"еггйоп 9 БРАКС, также 64-разрядной. Они используются в рабочих станциях и серверах Впп и во многих других системах. Семейство включает в себя процессоры П)ггаЯРАКС 1, Игга8РАКС П и Исга8РАКС П1, которые имеют сходную архитектуру, но различаются датой выпуска и тактовой частотой. Далее мы будем говорить о процессоре Игга8РАКС П1, поскольку нам нужен конкретный пример, но архитектурные (то есть не зависягдие от конкретной реализации) характеристики по большей части имеет силу и для других типов Исга8РАКС.
ИггаЗРАКС П1 представляет собой традиционную К1БС-машину. Он полностью совместим с 32-разрядным процессором БРАКС У8. Единственное, чем Игга8РАКС П1 отличается от 5РАКС Ч9, — это поддержка команд У18 2.0, которые разработаны для трехмерных графических приложений, декодирования формата МРЕО в реальном времени, сжатия данных, обработки сигналов, выполнения Дача-программ и передачи данных в сетях.
Процессор ИггаЯРАКС П1 часто устанавливается в рабочих станциях, но изначально он разрабатывался в расчете на мультипроцессорные серверы с разделяемой памятью, применяемые в Интернете и корпоративных сетях. Иными словами, в каждую микросхему Исга8РАКС П1 включены связующие элементы, необходимые для построения мультипроцессора. Первая модель ПНта8РАКС 1П, появившаяся в 2000 году, работала на частоте 600 МГц и имела строки шириной 0,18 мкм на основе алюминия. В микросхемах содержалось 29 млн транзисторов. У компании 8пп нет собственного производства процессоров, отвечающего новейшим технологическим требованиям, поэтому, сосредоточившись на проектировании микросхем и разработке программного обеспечения, она пользуется услугами подрядчиков, занимающихся непосредственно производством.
В случае с Игга8РАКС 1П таким подрядчиком выступает компания Техаз 1пзггшпепгз (Т1). В 2001 году, после модернизации технологической базы Т1, началось производство микросхем с тактовой частотой 900 МГц и шириной строки 0,15 мкм; при этом алюминиевые проводники были заменены медными.
К 2002 году ширина строки сократилась до 0,13 мкм, а тактовая частота увеличилась до 1,2 ГГц. Все эти микросхемы требуют входной мощности 50 Вт, поэтому проблемы с рассеиванием тепла для них актуальны в не меньшей степени, чем для Репг1цш 4. Микросхемы С1ЯС (наподобие Репгшш 4) и К18С (как 1ЛггаЯРАКС П1) неверно сравнивать только по тактовой частоте.
Скажем, процессор ИггаЯРАКС способен запускать по четыре команды за цикл, а это означает, что его скорость выполнения практически соответствует аналогичному параметру процессора, работающего на частоте 4,8 1Тц, но способного выполнять лишь по одной команде за цикл. Кроме того, в П1сга5РАКС имеется шесть внутренних конвейеров, из которых два — по 14 ступеней каждый, предназначены для выполнения целочисленных операций, два — для операций с плавающей точкой, один — для операций загрузки/сохранения и еще один для ветвления.
Далее, в ИггаБРАКС реализована оригинальная технология кэширования, присутствуют более широкие 226 Глава 3. Цифровой логический уровень шины, не говоря уже о других факторах, повышающих производительность. Свои преимущества есть и у Репгшш 4. То есть сравнение двух совершенно разных микросхем на основании их тактовых частот не дает сколько-нибудь точных результатов применительно к той или иной конкретной задаче. Микросхема 111гга8РАКС П1 содержит 1368 выводов в корпусе 1.СА (1лпс1 СгЫ Апау), как показано на рис.
3.44. Выводы расположены в нижней части микросхемы в виде квадратной матрицы размером 37 х 37 (итого 1369), в которой отсутствует один вывод в нижнем левом углу. Разъем полностью соответствует расположению выводов на микросхеме, что исключает возможность некорректного монтажа. Рис. 3.44. Микросхема процессора цюаЗРАНС Ш Процессор 1Лсга5РАКС П1 содержит 2 внутренних блока кэш-памяти первого уровня: 32 Кбайт для команд и 64 Кбайт для данных.