Попов И.И., Матвеев А.А., Максимов Н.В. Архитектура электронно-вычислительных машин и систем (2004) (1186255), страница 24
Текст из файла (страница 24)
Для описания параллельных вычислительных системавтор зафиксировал четыре типа переключателей, без какой-либо явнойсвязи с типом устройств, которые они соединяют:1-1 - переключатель такого типа связывает пару функциональныхустройств;n-n - переключатель связывает i-е устройство из одного множестваустройств с i-м устройством из другого множества, т.е. фиксируетпопарную связь;1-n - переключатель соединяет одно выделенное устройство совсеми функциональными устройствами из некоторого набора;nxn - каждое функциональное устройство одного множества можетбыть связано с любым устройством другого множества, и наоборот.Примеров подобных переключателей можно привести оченьмного. Так, все матричные процессоры имеют переключатель типа 1-nдля связи единственного процессора команд со всеми процессорамиданных. В компьютерах семейства Connection Machine каждыйпроцессор данных имеет свою локальную память, следовательно, связьбудет описываться как n-n.
В тоже время, каждый процессор командможет связаться с любым другим процессором, поэтому данная связьбудет описана как nxn.Классификация Д.Скилликорна состоит из двух уровней. Напервом уровне она проводится на основе восьми характеристик:— количество процессоров команд (IP);— число запоминающих устройств (модулей памяти) команд (IM);140— тип переключателя между IP и IM;— количество процессоров данных (DP);— число запоминающих устройств (модулей памяти) данных (DM);— тип переключателя между DP и DM;— тип переключателя между IP и DP;— тип переключателя между DP и DP.Используя введенные характеристики и предполагая, чторассмотрение количественных характеристик можно ограничить толькотремя возможными вариантами значений: 0, 1 и n (т.е. больше одного),можно получить 28 классов архитектур.В классах 1-5 находятся компьютеры типа dataflow и reduction, неимеющие процессоров команд в обычном понимании этого слова.
Класс6 это классическая фон-неймановская последовательная машина. Всеразновидности матричных процессоров содержатся в классах 7-10.Классы 11 и 12 отвечают компьютерам типа MISD классификацииФлинна и на настоящий момент, по мнению автора, пусты. Классы с 13го по 28-й занимают всесозможные варианты мультипроцессоров,причем в 13-20 классах находятся машины с достаточно привычнойархитектурой, в то время, как архитектура классов 21-28 пока выглядитэкзотично.На втором уровне классификации Д.Скилликорн просто уточняетописание, сделанное на первом уровне, добавляя возможностьконвейерной обработки в процессорах команд и данных.Цели, которым должна служить хорошо построеннаяклассификация по мнению Скилликорна):— облегчать понимание того, что достигнуто на сегодняшний день вобласти архитектур вычислительных систем, и какие архитектурыимеют лучшие перспективы в будущем;— подсказывать новые пути организации архитектур - речь идет о техклассах, которые в настоящее время по разным причинам пусты;— показывать, за счет каких структурных особенностей достигаетсяувеличение производительности различных вычислительных систем;с этой точки зрения, классификация может служить моделью дляанализа производительности.141Классификация ХендлераВ основу классификации В.Хендлер закладывает явное описаниевозможностей параллельной и конвейерной обработки информациивычислительной системой.
При этом он намеренно не рассматриваетразличные способы связи между процессорами и блоками памяти исчитает, что коммуникационная сеть может быть нужным образомсконфигурирована и будет способна выдержать предполагаемуюнагрузку.Предложенная классификация базируется на различии междутремя уровнями обработки данных в процессе выполнения программ:— уровень выполнения программы - опираясь на счетчик команд инекоторые другие регистры, устройство управления (УУ) производитвыборку и дешифрацию команд программы;— уровень выполнения команд - арифметико-логическое устройствокомпьютера (АЛУ) исполняет команду, выданную ему устройствомуправления;— уровень битовой обработки - все элементарные логические схемыпроцессора (ЭЛС) разбиваются на группы, необходимые длявыполнения операций над одним двоичным разрядом.Таким образом, подобная схема выделения уровней предполагает,что вычислительная система включает какое-то число процессоровкаждый со своим устройством управления.
Каждое устройствоуправлениясвязаноснесколькимиарифметико-логическимиустройствами, исполняющими одну и ту же операцию в каждыйконкретный момент времени. Наконец, каждое АЛУ объединяетнесколько элементарных логических схем, ассоциированных собработкой одного двоичного разряда (число ЭЛС есть ничто иное, какдлина машинного слова). Если на какое-то время не рассматриватьвозможность конвейеризации, то число устройств управления k , числоарифметико-логических устройств d в каждом устройстве управления и142число элементарных логических схем w в каждом АЛУ составят тройкудля описания данной вычислительной системы C:t(C) = (k, d, w).Классификация ХокниР.
Хокни - известный английский специалист в областипараллельных вычислительных систем, разработал свой подход кклассификации, введенной им для систематизации компьютеров,попадающих в класс MIMD по систематике Флинна.Как отмечалось выше (см. классификацию Флинна), класс MIMDчрезвычайно широк, причем наряду с большим числом компьютеров онобъединяет и целое множество различных типов архитектур. Хокни,пытаясь систематизировать архитектуры внутри этого класса, получилиерархическую структуру.Основная идея классификации состоит в следующем.Множественный поток команд может быть обработан двумя способами:либо одним конвейерным устройством обработки, работающем врежиме разделения времени для отдельных потоков, либо каждый потокобрабатывается своим собственным устройством.
Первая возможностьиспользуется в MIMD компьютерах, которые автор называетконвейерными (например, процессорные модули в Denelcor HEP).Архитектуры, использующие вторую возможность, в свою очередьопять делятся на два класса:— MIMD компьютеры, в которых возможна прямая связь каждогопроцессора с каждым, реализуемая с помощью переключателя;— MIMD компьютеры, в которых прямая связь каждого процессоравозможна только с ближайшими соседями по сети, а взаимодействиеудаленных процессоров поддерживается специальной системоймаршрутизации через процессоры-посредники.Далее, среди MIMD машин с переключателем Хокни выделяет те,в которых вся память распределена среди процессоров как их локальнаяпамять (например, PASM, PRINGLE). В этом случае общение самихпроцессоров реализуется с помощью очень сложного переключателя,составляющего значительную часть компьютера. Такие машины носятназвание MIMD машин с распределенной памятью.
Если память эторазделяемый ресурс, доступный всем процессорам через переключатель,то такие MIMD являются системами с общей памятью (CRAY X-MP,BBN Butterfly). В соответствии с типом переключателей можнопроводить классификацию и далее: простой переключатель,многокаскадный переключатель, общая шина.Многие современные вычислительные системы имеют как общуюразделяемую память, так и распределенную локальную. Такие системыавтор рассматривает как гибридные MIMD c переключателем.143При рассмотрении MIMD машин с сетевой структурой считается,что все они имеют распределенную память, а дальнейшаяклассификация проводится в соответствии с топологией сети:звездообразная сеть (lCAP), регулярные решетки разной размерности(Intel Paragon, CRAY T3D), гиперкубы (NCube, Intel iPCS), сети сиерархической структурой, такой, как деревья, пирамиды, кластеры(Cm* , CEDAR) и, наконец, сети, изменяющие свою конфигурацию.Заметим, что если архитектура компьютера спроектирована сиспользованием нескольких сетей с различной топологией, то, по всейвидимости, по аналогии с гибридными MIMD с переключателями, ихстоит назвать гибридными сетевыми MIMD, а использующие идеиразных классов - просто гибридными MIMD.
Типичным представителемпоследней группы, в частности, является компьютер Connection Machine2, имеющим на внешнем уровне топологию гиперкуба, каждый узелкоторого является кластером.Классификация ШораКлассификация Дж. Шора, появившаяся в начале 70-х годов,интересна тем, что представляет собой попытку выделения типичныхспособовкомпоновкивычислительныхсистемнаосновефиксированного числа базисных блоков: устройства управления,арифметико-логического устройства, памяти команд и памяти данных.Дополнительно предполагается, что выборка из памяти данных можетосуществляться словами, то есть выбираются все разряды одного слова,и/или битовым слоем - по одному разряду из одной и той же позициикаждого слова (иногда эти два способа называют горизонтальной ивертикальной выборками соответственно).
Конечно же, при анализеданной классификации надо делать скидку на время ее появления, таккак предусмотреть невероятное разнообразие параллельных системнастоящего времени было в принципе невозможно. Итак, согласноклассификации Шора все компьютеры разбиваются на шесть классов,которые он так и называет: машина типа I, II и т.д.а)б)Рис.
10. Машины типов I (а) и II (б) по классификации Шора144Машина I - это вычислительная система, которая содержитустройство управления, арифметико-логическое устройство, памятькоманд и память данных с пословной выборкой. Считывание данныхосуществляется выборкой всех разрядов некоторого слова для ихпараллельной обработки в арифметико-логическом устройстве. СоставАЛУ специально не оговаривается, что допускает наличие несколькихфункциональных устройств, быть может конвейерного типа.