Тема 7_2010 Конвейерная организация. Конфликты (Лекции (ещё одни))
Описание файла
PDF-файл из архива "Лекции (ещё одни)", который расположен в категории "". Всё это находится в предмете "вычислительные машины, системы и сети (вмсис)" из 7 семестр, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "вмсс" в общих файлах.
Просмотр PDF-файла онлайн
Текст из PDF
Лекции 9-10Тема: Конвейерная организация••••••1.Что такое конвейерная обработка2.Уровни конвейеризации3.Простейшая организация конвейера и оценка егопроизводительности4.Структурные конфликты и способы их минимизации5.Конфликты по данным, остановы конвейера и реализациямеханизма обходов 5.1. Классификация конфликтов по данным 5.2.Конфликты по данным, приводящие к приостановкеконвейера 5.3. Методика планирования компилятора для устраненияконфликтов по данным6.Конфликты по управлению. Сокращение потерь на выполнениекоманд перехода и минимизация конфликтов по управлению• 6.1. Снижение потерь на выполнение команд условногоперехода•••7. Проблемы реализации точного прерывания в конвейере8.Обработка многотактных операций и механизмы обходов вдлинных конвейерах9.Конфликты и ускоренные пересылки в длинных конвейерах1. Что такое конвейерная обработкаРазработчики архитектуры компьютеров издавна прибегали к методампроектирования, известным под общим названием "совмещение операций", прикотором аппаратура компьютера в любой момент времени выполняетодновременно более одной базовой операции.
Этот общий метод включает двапонятия: параллелизм и конвейеризацию. Хотя у них много общего и ихзачастую трудно различать на практике, эти термины отражают два совершенноразличных подхода. При параллелизме совмещение операций достигаетсяпутем воспроизведения в нескольких копиях аппаратной структуры. Высокаяпроизводительность достигается за счет одновременной работы всех элементовструктур, осуществляющих решение различных частей задачи.Конвейеризация (или конвейерная обработка) в общем случае основанана разделении подлежащей исполнению функции на более мелкие части,называемые ступенями, и выделении для каждой из них отдельного блокааппаратуры.
Так обработку любой машинной команды можно разделить нанесколько этапов (несколько ступеней), организовав передачу данных от одногоэтапа к следующему. При этом конвейерную обработку можно использовать длясовмещения этапов выполнения разных команд. Производительность при этомвозрастает благодаря тому, что одновременно на различных ступенях конвейеравыполняются несколько команд. Конвейерная обработка такого рода широкоприменяется во всех современных быстродействующих процессорах.2.Уровни конвейеризации• Макроконвейер – конвейеризация на уровне процессоров• Конвейер команд - конвейеризация команд процессора• Конвейер арифметический - конвейеризация на уровне выполнениякоманд процессора3.
Простейшая организация конвейера и оценка его производительностиДля иллюстрации основных принципов построения процессоров мы будемиспользовать простейшую архитектуру, содержащую 32 целочисленных регистраобщего назначения (R0,...,R31), 32 регистра плавающей точки (F0,...,F31) и счетчиккоманд PC. Будем считать, что набор команд нашего процессора включаеттипичные арифметические и логические операции, операции с плавающей точкой,операции пересылки данных, операции управления потоком команд и системныеоперации. В арифметических командах используется трехадресный формат,типичный для RISC-процессоров, а для обращения к памяти используютсяоперации загрузки и записи содержимого регистров в память.Выполнение типичной команды можно разделить на следующие этапы:•••••выборка команды - IF (по адресу, заданному счетчиком команд, из памятиизвлекается команда);декодирование команды / выборка операндов из регистров - ID;выполнение операции / вычисление эффективного адреса памяти - EX;обращение к памяти - MEM;запоминание результата - WB.Чтобы конвейеризовать выполнение команд можно просто разбить выполнениекаждой команды на указанные выше этапы, отведя для выполнения каждого этапаодин такт синхронизации, и начинать в каждом такте выполнение новой команды.Для хранения промежуточных результатов каждого этапа необходимоиспользовать регистровую станцию (память).
Промежуточные регистровыестанции обеспечивают передачу данных и управляющих сигналов с одной ступениконвейера на следующую. Хотя общее время выполнения одной команды в такомконвейере будет составлять пять тактов, в каждом такте аппаратура будетвыполнять в совмещенном режиме пять различных команд.Работу конвейера можно условно представить в виде сдвинутых во временисхем процессора (рис. 1). Этот рисунок хорошо отражает совмещение во временивыполнения различных этапов команд.
Однако чаще для представления работыконвейера используются временные диаграммы (рис. 2), на которых обычноизображаются выполняемые команды, номера тактов и этапы выполнения команд.Рис. 1. Представление о работе конвейераНомер командыКоманда iКоманда i+1Команда i+2Команда i+3Команда i+41IFНомер такта234ID EXMEMIF IDEXIFIDIF56WBMEMEXIDIFWBMEMEXID7WBMEMEX8WBMEM9WBРис. 2.
Представление о работе конвейераКонвейеризация увеличивает пропускную способность процессора(количество команд, завершающихся в единицу времени), но она не сокращаетвремя выполнения отдельной команды. В действительности, она даженесколько увеличивает время выполнения каждой команды из-за накладныхрасходов, связанных с управлением регистровыми станциями. Однако увеличениепропускной способности означает, что программа будет выполняться быстрее посравнению с простой не конвейерной схемой.Тот факт, что время выполнения каждой команды в конвейере неуменьшается, накладывает некоторые ограничения на практическую длинуконвейера. Кроме ограничений, связанных с задержкой конвейера, имеются такжеограничения, возникающие в результате несбалансированности задержки накаждой его ступени и из-за накладных расходов на конвейеризацию.
Частотасинхронизации не может быть выше, а, следовательно, такт синхронизации неможет быть меньше, чем время, необходимое для работы наиболее медленнойступени конвейера.Накладные расходы на организацию конвейера возникают из-за• задержки сигналов в конвейерных регистрах (защелках) и• из-за перекосов сигналов синхронизации.Конвейерные регистры к длительности такта добавляют время установки изадержку распространения сигналов.
В предельном случае длительность тактаможно уменьшить до суммы накладных расходов и перекоса сигналовсинхронизации, однако при этом в такте не останется времени для выполненияполезной работы по преобразованию информации.В качестве примера рассмотрим не конвейерную машину с пятью этапамивыполнения операций, которые имеют длительность 50, 50, 60, 50 и 50 нссоответственно (рис. 3). Пусть накладные расходы на организацию конвейернойобработки составляют 5 нс. Тогда среднее время выполнения команды в неконвейерной машине будет равно 260 нс. Если же используется конвейернаяорганизация, длительность такта будет равна длительности самого медленногоэтапа обработки плюс накладные расходы, т.е.
65 нс. Это время соответствуетсреднему времени выполнения команды в конвейере. Таким образом, ускорение,полученное в результате конвейеризации, будет равно отношению 260/65=4:Среднее время выполнения команды в неконвейерном режиме = 260= 65Среднее время выполнения команды в конвейерном режимеУскорение от конвейеризации команды= Ср. время выполнениякоманды в неконвейерном режиме/ Ср. время выполнения команды вконвейерном режимеУскорение от конвейеризации = 260/65=4Общая формула для арифметического конвейераУскорения от конвейеризации операции имеет вид:ξ = n*k/(n+k),где k – число ступеней конвейера, а n – длина одной последовательностиисходных данных (команд) (вывод см. на примере сложении двух векторов длиныn с плавающей запятой)Рис. 3.
Эффект конвейеризации при выполнении 3-х команд - четырехкратноеускорениеКонвейеризация эффективна только тогда, когда загрузка конвейера близка кполной, а скорость подачи новых команд и операндов соответствует максимальнойпроизводительности конвейера. Если произойдет задержка, то параллельно будетвыполняться меньше операций и суммарная производительность снизится. Такиезадержки могут возникать в результате возникновения конфликтных ситуаций.При реализации конвейерной обработки возникают ситуации, которыепрепятствуют выполнению очередной команды из потока команд впредназначенном для нее такте. Такие ситуации называются конфликтами.Конфликты снижают реальную производительность конвейера, котораямогла бы быть достигнута в идеальном случае.Рассмотрим различные типы конфликтов, возникающие при выполнениикоманд в конвейере, и способы их разрешения.Существуют три класса конфликтов:1.
Структурные конфликты, которые возникают из-за конфликтов поресурсам, когда аппаратные средства не могут поддерживать все возможныекомбинации команд в режиме одновременного выполнения с совмещением.2. Конфликты по данным, возникающие в случае, когда выполнение однойкоманды зависит от результата выполнения предыдущей команды.3. Конфликты по управлению, которые возникают при конвейеризациикоманд переходов и других команд, которые изменяют значение счетчикакоманд.Конфликты в конвейере приводят к необходимости приостановки выполнениякоманд (pipeline stall).
Обычно в простейших конвейерах, если приостанавливаетсякакая-либо команда, то все следующие за ней команды также приостанавливаются.Команды, предшествующие приостановленной, могут продолжать выполняться, ново время приостановки не выбирается ни одна новая команда.4. Структурные конфликты и способы их минимизацииСовмещенный режим выполнения команд в общем случае требуетконвейеризации функциональных устройств и дублирования ресурсов дляразрешения всех возможных комбинаций команд в конвейере. Если какая-нибудькомбинация команд не может быть принята из-за конфликта по ресурсам, тоговорят, что в машине имеется структурный конфликт.Примерыконфликтов:архитектур,вкоторыхвозможнопоявлениеструктурных• Машины с не полностью конвейерными функциональными устройствами.Время работы такого устройства может составлять несколько тактовсинхронизации конвейера.