work out (Процессоры), страница 7

2016-07-31СтудИзба

Описание файла

Документ из архива "Процессоры", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "информатика, программирование" в общих файлах.

Онлайн просмотр документа "work out"

Текст 7 страницы из документа "work out"

В 21164 работает четыре исполнительных блока (два для целых и два для чисел с плавающей точкой) и может обрабатывать по две ко­манды каждого типа за такт. Он имеет четырехступенчатый конвейер ко­манд, который "питает" отдельные конвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. По сравнению с прочими RISC-про­цессорами нового поколения чип 21164 имеет относительно глубокие и простые конвейеры, что позволяет запускать их с более высокой такто­вой частотой.

Конвейер команд вообще не заботится о их зависимости по дан­ным (в отличие от pentium Pro, который является ярким примером маши­ны данных), он выдает команды в порядке их поступления на свой вход (в порядке следования по программе). Если текущие четыре команды не­возможно послать сразу все на различные исполнительные блоки, то конвейер команд останавливается до тех пор, пока это не станет воз­можным. В отличие от конкурентов 21164 также не использует технику переименования регистров, вместо нее он непосредственно обновляет содержимое своих архитектурных регистров, когда результат достигает финальной ступени конвейера – write – back. Для борьбы с задержками и зависимостью команд по данным в процессоре активно ис­пользуются маршруты для обхода регистров, поэтому совместно ис­пользуемые операнды становятся доступными до стадии write - back.

Компания Digital продвигает Альфу как платформу для серве­ров Windows NT, а не как традиционный UNIX-сервер.

4.7. Процессоры Mips.

Mips процессор R1000 унаследовал свой суперскалярный дизайн от R8000, который предназначался для рынка суперкомпьютеров научно­го назначения. Но R1000 ориентирован на массовые задачи. Использова­ние в R1000 динамического планирования команд, которое ослабляет за­висимость от перекомпиляции ПО, написанного для более старых процес­соров, стало возможным благодаря тесным связям Mips со своим партне­ром Silicon Graphics, имеющим богатейший тыл в виде сложных графи­ческих приложений.

R1000 первый однокристальный процессор от Mips. Для предот­вращения остановок конвейера в нем использовано динамическое пред­сказание переходов, с четырьмя уровнями условного исполнения, с ис­пользованием переименования регистров, гарантирующего, что результа­ты не будут передаваться в реальные регистры до тех пор, пока неяс­ность по команде перехода не будет снята. Процессор поддерживает "теневую карту" отображения своих регистров переименования. В слу­чае неверного предсказания адреса перехода он просто восстанавли­вает эту карту отображения, но не выполняет фактической очистки ре­гистров и "промывки" буферов, экономя таким образом один такт.

R1000 отличается также радикальной схемой внеочеред­ной обработки. Порядок следования команд в точном соответствии с программой сохраняется на трех первых ступенях конвейера, но затем поток разветвляется на три очереди (где команды дожидаются обработ­ки на целочисленном АЛУ, блоке вычислений с плавающей точкой и бло­ке загрузки/записи). Эти очереди уже обслуживаются по мере освобож­дения того или иного ресурса.

Предполагаемая производительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрон должна достичь 300 по SPECint92 и по SPECfp92.

Программный порядок в конце концов восстанавливается так, что самая "старая" команда покидает обработку первой. Аппаратная поддержка исполнения в стиле out – of – order дает большие преимущества конечному пользователю, так как коды, написанные под старые скаляр­ные процессоры Mips (например, R4000), начинают работать на полной скорости и не требуют перекомпиляции. Хотя потенциально процессор R1000 способен выдавать по пять команд на исполнение в каждом такте, он выбирает и возвращает только четыре, не успевая закончить пятую в том же такте.

Одно из двух устройств для вычисления двойной точности с плавающей точкой занято сложениями, а другое умножениями/делениями и извлечением квадратного корня. Hа кристалле R1000 реализован также интерфейс внешней шины, позволяющий связывать в кластер до четырех процессоров без дополнительной логики обрамления.

4.8. Процессоры Hewlett – Packard

Hewlett – Packard процессор PA-8000. Компания Hewlett – Packard одной из первых освоила RISC-технологию, выйдя еще в 1986 году со своим первым 32-разрядным процессором PA-RISC. Практически все вы­пускаемые процессоры PA-RISC используются в рабочих станциях HP се­рии 9000. В период с 1991 по 1993 (перед появлением систем на базе PowerPC) HP отгрузила достаточно много таких машин, став крупнейшим продавцом RISC-чипов в долларовом выражении.

С целью пропаганды своих микропроцессоров среди других производителей систем компания HP стала организатором организации Precision RISC Organization (PRO). А в 1994 году компания взорвала бомбу, объединившись с Intel для создания новой архитектуры. Это поставило под сомнение будущее PRO.

PA-8000 это 64-разрядный, четырехканальный суперскалярный процессор с радикальной схемой неупорядоченного исполнения программ. В составе кристалла десять функциональных блоков, включая два цело­численных АЛУ, два блока для сдвига целых чисел, два блока multiply/accumulate (MAC) для чисел с плавающей запятой, два блока деления/извлечения квадратного корня для чисел с плавающей запятой и два блока загрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузке конвейера на обработке одинарной точности обес­печивают производительность 4 FLOPS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы, но они могут работать одновременно с блоками МАС.

В PA-8000 использован буфер переупорядочивания команд (IRB) глубиной 56 команд, позволяющий "просматривать" программу на следую­щие 56 команд вперед в поисках таких четырех команд, которые можно выполнить параллельно. IRB фактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды для целочисленного блока и бло­ка плавающей точки, а буфер памяти - команды загрузки/записи.

Как только команда попадает в слот IRB, аппаратура просмат­ривает все команды, отправленные на функциональные блоки, чтобы най­ти среди них такую, которая является источником операндов для коман­ды, находящейся в слоте. Команда в слоте запускается только после того, как будет распределена на исполнение последняя команда, кото­рая сдерживала ее. Каждый из буферов IRB может выдавать по две ко­манды в каждом такте, и в любом случае выдается самая "старая" ко­манда в буфере. Поскольку PA-8000 использует переименование регис­тров и возвращает результаты выполнения команд из IRB в порядке их следования по программе, тем самым поддерживается точная модель об­работки исключительных ситуаций.

HP проектировала РА-8000 специально для задач коммерческой обработки данных и сложных вычислений, типа генной инженерии, в ко­торых объем данных настолько велик, что они не умещаются ни в один из мыслимых внутрикристалльных КЭШей. Вот почему, РА-8000 полагается на внешние первичные КЭШи команд и данных. Слоты в третьем 28-слото­вом буфере, который называется буфером переупорядочивания адресов (Adress – Recorder Buffer - ARB), один к одному ассоциированы со сло­тами в буфере памяти IRB. В АРВ содержатся виртуальные и физические адреса всех выданных команд загрузки/записи. Кроме того, АРВ допус­кает выполнение загрузок и записей в произвольном порядке, но с сох­ранением согласованности и сглаживанием влияния задержки, связанной с адресацией внешних КЭШей.

4.9. Процессоры Motorola.

Motorola/IBM процессор PowerPC620 это первая 64-битовая реа­лизация архитектуры PowerPC. Имея 64-битовые регистры и внутренние магистрали данных и семь миллионов транзисторов, новому процессору требуется почти вдвое больший и сложный кристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейерную схему с шестью исполнительными устройствами: три целочисленных АЛУ, блок плавающей точки, блок загрузки/записи и блок переходов. Последний способен на четырехуровневое предсказание ветвлений в программе и условное ис­полнение с использованием схемы переименования регистров.

ПО микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистров и магистралей данных, а так­же к увеличенному числу станций резервирования для условного испол­нения команд. Прибавка производительности достигнута за счет улуч­шенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс к памяти, по которому за один цикл обращения можно выбрать два 64-би­товых длинных слова, и 40-битовая шина адреса, по которой можно ад­ресовать до одного терабайта физической памяти.

В состав шинного интерфейса входить также поддержка кэш-па­мяти второго уровня объемом до 128 Мбайт, которая может работать на четверти, половине или на полной скорости ЦПУ.



5. Лабораторные испытания и тестирование микропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

В 1992 году на рынке появилось три новых МП, способных за­местить существующие 386DX и обеспечить повышение характеристик сис­тем на основе i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, и Cyrix 486DLC. В настоящий момент предлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить в начале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставить работать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любой момент машина может зависнуть. Intel RapidCAD распространяется, как про­дукт для конечных пользователей, т.е. в машину его устанавливают именно они. Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrix также производит процессор 486SLC, заменяющий Intel/AMD 386SX. C&T объявил о создании процессора 38600SX, но в продаже он появится только в 1993 году, если вообще появится.

RapidCAD, грубо говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с цоколевкой процессора 386. Для прог­рамм он соответствует 386 с сопроцессором, так как все специфичные команды i486 удалены из набора команд. Рекламируется этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены процессора 386DX в существующих системах и резкого повышения производительности операций с плавающей точкой, таких, как CAD, электронные таблицы, математические программные па­кеты (SPSS, Mathematica и т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132 вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов), устанавливающийся в гнез­до для сопроцессора i387, включает в себя ПЛМ, подающий сигнал на схемы системной платы для правильной обработки особых ситуаций при операциях с плавающей точкой. Большинство операций исполняется в те­чение одного цикла, как и в i486. Однако узким местом является ин­терфейс шины 386, так как каждый цикл шины равен двум циклам процес­сора. Это значит, что команды выполняются быстрее, чем считываются из памяти. Поскольку операции с плавающей точкой выполняются медлен­нее обычных команд, то замедление на них не сказывается, и они вы­полняются с такой же скоростью, как и на i486DX. Именно поэтому RapidCAD позволяет получить более высокие характеристики с плаваю­щей точкой, чем любая комбинация 386/387. Результаты теста SPEC, стандартного теста для машин под UNIX, показывают, что RapidCAD ус­коряет операции с плавающей точкой на 85%, а с целыми числами - на 15% по сравнению с любой комбинацией 386/387 при одинаковой такто­вой частоте. Потребляемая мощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГц составляет 300$.

Предполагается, что процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от процессора Am386 фирмы AMD, кото­рый использует микрокод, идентичный микрокоду Intel 386, в процессо­ре 38600DX использован патентно чистый микрокод, для обеспечения полной совместимости в набор команд даже включена недокументирован­ная команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт, что еще более повысит его производительность. К сожалению, 38605DX выпускается в корпусе PGA (144 вывода) и не мо­жет быть установлен непосредственно в разъем i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные проблемы коммуни­кации ЦПУ- сопроцессор, и из-за этого скорость выполнения в большин­стве программ операций с плавающей точкой у него падает ниже уровня i386/i387. Эта проблема существует для всех производимых на настоя­щий момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводил такие тесты с 38700DX и пришел к ана­логичным выводам. Он связался с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц - 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц - 80$.

Процессор Cyrix 486DLC - последняя новинка на рынке заме­нителей i386DX. Набор его команд совместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16 бит умножитель. Испол­нительное устройство 486DLC, созданное с использованием некоторых принципов RISC, выполняет большинство команд за один цикл. Аппарат­ный умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно удобно при вычислении адресов (код, генерируемый некоторыми неоптимизирующими компиляторами, мо­жет содержать много команд MUL для доступа к массивам) и для прог­раммных вычислений с плавающей точкой (напр., при эмуляции сопроцес­сора). Внутренняя кэш-память представляет собой объединенную память команд и данных сквозной записи, и может быть конфигурирована, как память с прямым отображением, или как 2-канальная ассоциативная. Из-за необходимости обеспечения полной совместимости после перезаг­рузки процессора кэш-память отключается, и должна быть включена с по­мощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при загрузке, (напр., при "горячей" перезагруз­ке, Ctrl – Alt – Del) , BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна из причин того, что после запуска процессора кэш-память отключается. Я уверен, что в следующих вер­сиях BIOS фирмы AMI это будет учтено и встроенная кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC преодолеть ог­раничения интерфейса шины 386, хотя процент попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые возможности управле­ния кэш-памятью процессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают эти управляющие сигналы, не имеющие значения для i386DX, но в дальней­шем системы, разработанные с учетом этих возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируе­мых областей памяти, что может быть очень полезно в том случае, ес­ли ваша система использует периферийные устройства, отображаемые в память (напр., сопроцессор Weitek). В существующих системах 386 пе­ресылки DMA (напр., SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не существует других способов обеспечить соответствие кэш-памяти и основной памяти, что, конечно, снижает ха­рактеристики 486DLC. Потребляемая мощность 486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц по текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во всех об­стоятельствах, особенно критичен в этом отношении многозадачный за­щищенный режим (улучшенный режим MS- Windows). При использовании 486DLC совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при переключении задач. Лучше всего использовать 486DLC с Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992, являющий­ся наиболее мощным сопроцессором среди совместимых сопроцессоров 486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST, распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi или другие ftp-серверы. Если программа сообщит о соп­роцессоре 387+, то у вас установлен либо 387+, либо аналогичная но­вая версия 83D87 и проблем с совместимостью не будет.

При испытаниях использовалась система:

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее