Максимов Н.В., Партыка Т.Л., Попов И.И. Архитектура ЭВМ и вычислительных систем (2005) (1186253), страница 48
Текст из файла (страница 48)
Кришнамарфи построена только на четырех признаках, она позволяет выделить и описать3.1. Основные определения. Классы архитектур ВС243такие «нетрадиционные» параллельные системы, как систолическиемассивы, машины типа dataflow и wave/гол А Однако эта же простотаявляется и основной причиной ее недостатков: некоторые архитектуры нельзя однозначно отнести к тому или иному классу, например, компьютеры с архитектурой гиперкуба и ассоциативные процессоры.
Для более точного описания таких машин потребуетсяввести еще целый ряд характеристик, таких, как размещение задачпо процессорам, способ маршрутизации сообщений, возможностьреконфигурации, аппаратная поддержка языков программированияи другие. Вместе с тем ясно, что эти признаки формализовать гораздо труднее, поэтому есть опасность вместо ясности внести в описание лишь дополнительные трудности.Классификация Скилликорна. Д. Скилликорн разработал подход,ориентированный как на описание свойств многопроцессорныхсистем, так и некоторых нетрадиционных архитектур, в частностиdataflow и га/ис/гол-машины.Предлагается рассматривать архитектуру любого компьютера,как абстрактную структуру, состоящую из четырех компонент:• процессор команд (IP — Instruction Processor) — функциональное устройство, работающее, как интерпретатор команд; всистеме, вообще говоря, может отсутствовать;• процессор данных (DP — Data Processor) — функциональноеустройство, работающее как преобразователь данных, в соответствии с арифметическими операциями;• иерархия памяти (IM — Instruction Memory, DM — DataMemory) — запоминающее устройство, в котором хранятсяданные и команды, пересылаемые между процессорами;• переключатель — абстрактное устройство, обеспечивающеесвязь между процессорами и памятью.Функции процессора команд во многом схожи с функциями устройств управления последовательных машин и, согласно Д.
Скилликорну, сводятся к следующим:• на основе своего состояния и полученной от DP информацииIP определяет адрес команды, которая будет выполняться следующей;• осуществляет доступ к IM для выборки команды;• получает и декодирует выбранную команду;• сообщает DP команду, которую надо выполнить;• определяет адреса операндов и посылает их в DP;• получает от DP информацию о результате выполнениякоманды.244Глава 3.
Вычислительные системыФункции процессора данных делают его во многом похожим наарифметическое устройство традиционных процессоров:• DP получает от IP команду, которую надо выполнить;• получает от IP адреса операндов;• выбирает операнды из DM,• выполняет команду;• запоминает результат в DM;• возвращает в IP информацию о состоянии после выполнениякоманды.В терминах таким образом определенных основных частей компьютера структуру традиционной фон-неймановской архитектурыможно представить в следующем виде (рис. 3.8).«Операнды ^DPMDPwkms5DО)Q. DirПамятьданных5Информацияо состоянии>k3ro5roQ.>rПамятькомандРис. 3.8.
Представление фон-неймановской архитектуры по СкилликорнуЭто один из самых простых видов архитектуры, не содержащихпереключателей. Для описания параллельных вычислительных систем автор зафиксировал четыре типа переключателей, без какой-либо явной связи с типом устройств, которые они соединяют:• 1-1 — переключатель такого типа связывает пару функциональных устройств;• п-п — переключатель связывает /-е устройство из одного множества устройств с /-м устройством из другого множества, т. е.фиксирует попарную связь;• \-п — переключатель соединяет одно выделенное устройствосо всеми функциональными устройствами из некоторого набора;• п х п — каждое функциональное устройство одного множестваможет быть связано с любым устройством другого множества,и наоборот.Примеров подобных переключателей можно привести оченьмного. Так, все матричные процессоры имеют переключатель типа3.1.
Основные определения. Классы архитектур ВС2451-я для связи единственного процессора команд со всеми процессорами данных. В компьютерах семейства Connection Machine каждыйпроцессор данных имеет свою локальную память, следовательно,связь будет описываться как п-п. В то же время, каждый процессоркоманд может связаться с любым другим процессором, поэтомуданная связь будет описана как п х п.Классификация Д. Скилликорна состоит из двух уровней. Напервом уровне она проводится на основе восьми характеристик:• количества процессоров команд (IP);• числа запоминающих устройств (модулей памяти) команд(IM);• типа переключателя между IP и IM;• количества процессоров данных (DP);• числа запоминающих устройств (модулей памяти) данных(DM);• типа переключателя между DP и DM;• типа переключателя между IP и DP;• типа переключателя между DP и DP.Используя введенные характеристики и предполагая, что рассмотрение количественных характеристик можно ограничить толькотремя возможными вариантами значений: О, 1 и п (т.
е. больше одного), можно получить 28 классов архитектур.В классах 1—5 находятся компьютеры типа dataflow и reduction,не имеющие процессоров команд в обычном понимании этого слова. Класс 6 — это классическая фон-неймановская последовательная машина. Все разновидности матричных процессоров содержатсяв классах 7—10. Классы 11 и 12 отвечают компьютерам типа MISDклассификации Флинна и на настоящий момент, по мнению автора, пусты.
Классы с 13-го по 28-й занимают всесозможные варианты мультипроцессоров, причем в 13—20 классах находятся машиныс достаточно привычной архитектурой, в то время, как архитектураклассов 21—28 пока выглядит экзотично.На втором уровне классификации Д. Скилликорн уточняет описание, сделанное на первом уровне, добавляя возможность конвейерной обработки в процессорах команд и данных.Классификация Хендлера. В основу классификации В Хендлерзакладывает явное описание возможностей параллельной и конвейерной обработки информации вычислительной системой.
При этомон намеренно не рассматривает различные способы связи междупроцессорами и блоками памяти и считает, что коммуникационнаясеть может быть нужным образом сконфигурирована и будет способна выдержать предполагаемую нагрузку (рис. 3.9).246Глава 3. Вычислительные системыНа каждой ступенислово из w битw' ступенейконвейераd' ФУ могутбыть сцепленыП из /смогутработать в макроконвейереРис. 3.9. Классификация ХендлераПредложенная классификация базируется на различии междутремя уровнями обработки данных в процессе выполнения программ:• уровень выполнения программы: опираясь на счетчик команди некоторые другие регистры, устройство управления (УУ)производит выборку и дешифрацию команд программы;• уровень выполнения команд: арифметико-логическое устройство компьютера (АЛУ) исполняет команду, выданную емуустройством управления;• уровень битовой обработки: все элементарные логические схемы процессора (ЭЛС) разбиваются на группы, необходимыедля выполнения операций над одним двоичным разрядом.Таким образом, подобная схема выделения уровней предполагает, что вычислительная система включает какое-то число процессоров, каждый со своим устройством управления.
Каждое устройствоуправления связано с несколькими арифметико-логическими устройствами, исполняющими одну и ту же операцию в каждый конкретный момент времени. Наконец, каждое АЛУ объединяет несколько элементарных логических схем, ассоциированных с обработкой одного двоичного разряда (число ЭЛС есть не что иное, какдлина машинного слова). Если на какое-то время не рассматриватьвозможность конвейеризации, то число устройств управления k,число арифметико-логических устройств d в каждом устройствеуправления и число элементарных логических схем w в каждом АЛУсоставят тройку для описания данной вычислительной системы С:3.1.
Основные определения. Классы архитектур ЕС247Классификация Хокни. Р Хокни (английский специалист в области параллельных вычислительных систем) разработал свой подход к классификации, введенной им для систематизации компьютеров, попадающих в класс MIMD.Как отмечалось ранее (см. классификацию Флинна), классMIMD чрезвычайно широк, причем наряду с большим числом компьютеров он объединяет и целое множество различных типов архитектур.
Хокни, пытаясь систематизировать архитектуры внутри этого класса, получил иерархическую структуру, представленную нарис. 3.10.Основная идея классификации состоит в следующем. Множественный поток команд может быть обработан двумя способами: либоодним конвейерным устройством обработки, работающем в режимеразделения времени для отдельных потоков, либо каждый поток обрабатывается своим собственным устройством. Первая возможностьиспользуется в MIMD-компьютерах, которые автор называет конвейерными (например, процессорные модули в Denelcor HEP). Архитектуры, использующие вторую возможность, в свою очередь опятьделятся на два класса:• MIMD-компьютеры, в которых возможна прямая связь каждой пары процессоров, которая реализуется с помощью переключателя;• MIMD-компьютеры, в которых прямая связь каждого процессора возможна только с ближайшими соседями по сети, аMIMD1очаемые1СетКонвейерныеС общей памятьюРегулярныерешеткиС распределеннойпамятьюГиперкубыИерархическиеструктуры_|ИзменяющиеконфигурациюРис.
3.10. Системы архитектуры MIMD (Флинн) в интерпретации Хокни248Глава 3. Вычислительные системывзаимодействие удаленных процессоров поддерживается специальной системой маршрутизации через процессоры-посредники.Далее, среди MIMD-машин с переключателем Хокни выделяетте, в которых вся память распределена среди процессоров как ихлокальная память (например, PASM, PR1NGLE). В этом случае общение самих процессоров реализуется с помощью очень сложногопереключателя, составляющего значительную часть компьютера.
Такие машины носят название MIMD-машин с распределенной памятью. Если память — это разделяемый ресурс, доступный всем процессорам через переключатель, то такие MIMD-машины являютсясистемами с общей памятью (CRAY X-MP, BBN Butterfly).
В соответствии с типом переключателей можно проводить классификациюи далее: простой переключатель, многокаскадный переключатель,общая шина.Многие современные вычислительные системы имеют как общую разделяемую память, так и распределенную локальную. Такиесистемы являются гибридными MIMD с переключателем.При рассмотрении MIMD-машин с сетевой структурой считается, что все они имеют распределенную память, а дальнейшаяклассификация проводится в соответствии с топологией сети: звездообразная сеть (1САР), регулярные решетки разной размерности(Intel Paragon, CRAY T3D), гиперкубы (NCube, Intel iPCS), сети сиерархической структурой, такой, как деревья, пирамиды, кластеры(Cm, CEDAR) и, наконец, сети, изменяющие свою конфигурацию.Заметим, что если архитектура компьютера спроектирована сиспользованием нескольких сетей с различной топологией, то поаналогии с гибридными MIMD с переключателями их стоит назватьгибридными сетевыми M1MD, а использующие идеи разных классов — просто гибридными MIMD.