Максимов Н.В., Партыка Т.Л., Попов И.И. Архитектура ЭВМ и вычислительных систем (2005) (1186253), страница 65
Текст из файла (страница 65)
NUMAflex появилась в1996 г. и с тех пор использовалась в известной серии серверов и суперкомпьютеров SGI Origin, основанных на процессорах MIPS и64-разрядной операционной системе IRIX. Дизайн NUMAflex позволяет помещать процессор, память, систему ввода/вывода, соединительные провода, графическую подсистему в модульные компоненты, иначе называемые блоками или кирпичиками. Эти кирпичикимогут комбинироваться и конфигурироваться с большой гибкостью,чтобы удовлетворять потребности клиента в ресурсах и рабочей нагрузке.
Используя этот дизайн третьего поколения, компания SGIсмогла создать систему SGI Altix 3000 на основе традиционных блоков ввода/вывода (IX- и РХ-блоки), хранения данных (D-блоки) исоединительных компонентов (маршрутизирующие блоки/К-бло-3.8. Кластерные и массивно-параллельные системы...329и). Основным отличием этой новой системы является процессорный блок (С-блок), который содержит процессоры Itanium 2.Ключевой особенностью системы является использование каскадируемых коммутаторов в маршрутизирующих элементах. Каскадируемые коммутаторы обеспечивают системе малые времена задержки или замедление доступа к памяти, несмотря на модульнуюконструкцию. Это критично для машин, использующих архитектурунеоднородного доступа к памяти (NUMA).
Задержки всегда былипроблемой в архитектуре NUMA, так как память распределяетсямежду узлами, а не сосредоточена в одном месте. Каскадируемыекоммутаторы используют каталогизируемую схему памяти для отслеживания данных, находящихся в разных кэшах. В результатеменьшие объемы данных пересылаются между частями памяти, чтовыливается в понижение задержек по сравнению с традиционнымисистемами, основанными на шинах.В недавних тестах SPECfp_rate_base2000 система SGI Altix 3000(1 ГГц) показала мировой рекорд производительности в операцияхс плавающей точкой для 64-процессорного сервера со значением862.
Наиболее близкий результат для 64-процессорных систем сединым образом операционной системы показал сервер HPSuperdome (875 МГц) со значением 267 — меньше трети производительности системы SGI. По сравнению с 32-процессорными системами SGI Altix 3000 показал производительность в 1,8 раз большую, чем IBM eServer p690 (1,3 ГГц) и в 3,5 раза большую, чем HPSuperdome (750 МГц). 32-процессорная система SGI получила443 очка, IBM eServer p690 — 251, HP Superdome — 128. Результаты32-процессорного сервера SGI Altix 3000 демонстрируют превосходство на 300 % по критерию цена/производительность по сравнениюс IBM eServer p690.Разработка процессора R10000 позволила компании перейти кобъединению своих серверов Challenge (на базе процессора R4000) иPowerChallenge (на базе процессора R8000) в единую линию изделий.
Благодаря повышенной производительности этого процессорана целочисленных операциях и плавающей точке, обе линии продуктов могут быть объединены без потери производительности.Серверы Silicon Graphics работают под управлением операционной системы IRIX (ОС UNIX реального времени), построенной всоответствии с требованиями стандартов SVID (System V InterfaceDefinition) и XPG4. Она поддерживает возможность работы нескольких машин на одном шлейфе SCSI (multi-hosted SCSI), 4-кратное зеркалирование и 128-кратное расщепление дисковых накопик330Глава 3. Вычислительные системытелей.
На платформе поддерживаются многие продукты компанийOracle, Informix и Sybase.Компьютеры Challenge DM/L/XL ориентированы в первую очередь на коммерческие применения, a Power Challenge L/XL — наработу с плавающей запятой. Системы Challenge DM относятся ксреднему классу.Power Challenge относится к классу симметричных мультипроцессорных ЭВМ (SMP-системы), базирующихся на поколении суперскалярных процессоров MIPS R8000 фирмы Silicon Graphics.Отличительными особенностями этих систем являются:• масштабируемость суперкомпьютинга;• использование большой динамической памяти (адресация уPOWER CHALLENGE до 16 Гбайт - в 2 раза выше, чем уCray T90/C90/J90);• 64-разрядная архитектура (в отличие от машин фирм IBM,HP, Sun и Thinking Machines), как у машин Cray и Convex;• бинарная совместимость со всем семейством компьютеровSGI, включая рабочие станции Indy.В заключение главы приведем сведения о некоторых отечественных и зарубежных суперкомпьютерах.В табл.
3.8 приводится список, в который включены вычислительные центры (ВЦ) РФ, работающие в научно-технической области и имеющие суперкомпьютерные ресурсы.Таблица 3.8. Суперкомпьютерные центры РоссииКомпьютерыОП, МбайтЛреак, МфлопсРейтинг, МфлопсГидрометеоцентр РФ (Москва)SGI/Cray Y-MP, 8 процессоров204826648 х 161 = 1288Институт высокопроизводительных систем и баз данных (С.-Петербург)-19208 х 65 = 520Parsytec CC, 16 процессоров (Power PC 604/133 МГц)512427216x28 = 448HP/Convex C3820, 2 процессора10244802 х 44 = 88HP/Convex С3440, 4 процессора5128004 х 19 = 76HP/Convex SPP1 000 SCPUИнститут физики высоких энергий (Протвино)DEC/Alpha Server 8200 5/300, 6 процессоров102436006х 140 = 840Институт органической химии РАН (Москва)SGI/Power Challenge L (90 МГц), 6 процессоров51221606 х 128 = 7583.8.
Кластерные и массивно-параллельные системы...331Окончание табл. 3 8КомпьютерыОП, МбайтЯреак. МФЛ°ПСРейтинг, МфлопсВНИИ неорганических материалов (Москва)SGI/Power Challenge L (90 МГц), 2 процессора1287202 х 126 = 2527202 х 126 = 252НИКИ энергетической техники (Москва)SGI/Power Challenge L (90 МГц), 2 процессора128Институт прикладной математики РАН (Москва)HP/Convex SPP 1000/CD, 4 процессора5128004x48=192Институт математического моделирования РАН (Москва)Parsytec CC, 12 процессоров (РРС 601/100 МГц)96240016х 12=192Рейтинг ВЦ рассчитывается как сумма рейтингов, инсталлированных на этом ВЦ суперкомпьютерных систем. В табл. 3.9 приводятся данные по наиболее мощным суперкомпьютерам. Рейтинг каждого суперкомпьютера рассчитывается как произведение числа егопроцессоров на производительность процессора на тестах LinPackпри 7V (размерности системы линейных уравнений), равном 100.ПК, однопроцессорные рабочие станции и серверы, а также вычислительные системы, имеющие пиковую производительность невыше 200 Мфлопс или рейтинг не выше 62 Мфлопс (производительность Intel Pentium Pro с тактовой частотой 200 МГц), не учитываются.Таблица 3 9 Рейтинг суперкомпьютеров (по состоянию на 2004 г.)nРейтингПроизводитель системы/количествопроцессоров1NEC SX-8 / 4096 / ОЗУ - 64 Гбайт2Silicon Graphic Columbia/ 20 х 512 = 10240 IntelItanium 2*3лтахpреаюлТфлопсРасположение инсталляции,страна/год65,000NEC, Japan /21 10.200442,753,0NASA, USA /27.
10 2004IBM BLUE GENE/ L/ 16 00036,010IBM, USA /30 09 20044NEC Earth-Simulator /51 2035,86040,960Earth Simulator Center,Japan / 20025Hewlett-Packard ASCI Q - AlphaServerSCES45/ 1,25 ГГц /40967,72710,240Los Alamos National Laboratory,USA /2002332Глава 3. Вычислительные системыОкончание табл 3 9РейтингПроизводитель системы/количествопроцессоров*чпа\^рсак)ТфлопсРасположение инсталляции,страна/год6IBM ASCI White, SP Power, 375 МГц/ 81927,22612,288Lawrence bvermore NationalLaboratory, USA/20007Linux NetworX MCR Linux Cluster Xeon 2,4 ГГц Quadncs/23045,69411,060Lawrence Uvermore NationalLaboratory, USA/20028Hewlett-Packard AlphaServer5СЕ845/1ГГц/30164,4636,032Pittsburgh SupercomputmgCenter, USA/20019Hewlett-Packard AlphaServerSCES45/1 ГГц /25603,9805,120Commissariat a I'EnergieAtomique (CEA), France/200110HPTi Dual Xeon 2,2 ГГц - Mynnet2000 / 15363,3376,758Forecast Systems Laboratory NOAA, USA/200211IBM pSenes 690 Turbo 1 ,3 ГГц/ 12803,2416,656HPCx UK/200212IBM pSenes 690 Turbo 1 ,3 ГГц / 1 21 63,16463,23NCAR (National Center forAtmospheric Research) USA/200274Self-made MVS1000M EV67 667 МГц / 7680,7341,024Joint Supercomputer CenterRussian Federation/2002* Система Columbia представляет собой кластер 20 машин SGI Altix, содержащих по 512 процессоров Intel Itanium 2 (см табл 4 2) Каждая машина работает под управлением экземпляра ОС LinuxКонтрольные вопросы1.
Охарактеризуйте одиночный поток команд — одиночный поток данных (ОКОД).2. Охарактеризуйте одиночный поток команд — множественный потокданных (ОКМД).3. Охарактеризуйте множественный поток команд — одиночный потокданных (МКОД).4. Охарактеризуйте множественный поток команд — множественныйпоток данных (МКМД).5.
Чем многомашинные ВС отличаются от многопроцессорных?6. Приведите характеристику каждого из четырех классов архитектурыВС согласно классификации по режиму выполнения?3.8. Кластерные и массивно-параллельные системы...3337 Какие уровни комплексирования ЭВМ вам известны?8. Чем отличаются многомашинные ВС от многопроцессорных ВС.9. На какие классы подразделяются многопроцессорные параллельные ВС?10. Что такое кластеры и какими преимуществами они обладают'11.
Что такое коммутационные среды' Приведите примеры коммутаторов.12. Охарактеризуйте стратегии управления иерархической памятью.13. Что такое вычислительные системы и каковы их разновидности?14. Охарактеризуйте принципы функционирования машин типа wavefrontи reduction.15. Назовите основные классы и подклассы вычислительных машин и дайте их сравнительную характеристику.16. Дайте общую характеристику и определите область использованиясуперЭВМ и мэйнфреймов.Глава 4ПЕРСОНАЛЬНЫЕ КОМПЬЮТЕРЫИстория персональных компьютеров (ПК) началась в 80-е гг.XX в., когда практически одновременно компании Motorola, Zilog иIntel выпустили на рынок достаточно мощные микропроцессорыМ68000, Z80 и Intel 8086.На этих микропроцессорах были построены первые микрокомпьютеры (ПК):• Каурго II (Zilog);• Macintosh 128K (Motorola);• IBM PC XT (Intel — INTegrated ELectronics).Поскольку в дальнейшем основное внимание будет уделеноIBM/PC-совместимым ПК и их «потомкам», вначале вкратце остановимся на параллельных ветвях развития ПК.Каурго II был представлен публике в августе 1982 г.
(рис. 4.1, а).Несмотря на название, это была первая модель компании Э. Кея(Andrew F. Kay) Non-Linear Systems, Inc., позже переименованной вКаурго Corporation.При весе более десяти килограмм, Каурго II позиционировалсякак переносная система. Возможность работы в полевых условияхРис. 4.1. Первые ПКа — Каурго II, б — Macintosh 128KГлава 4.
Персональные компьютеры335была подтверждена во время ралли Париж-Дакар в 1984 г , на котором организаторами использовалось десять компьютеров Каурго II.Технические характеристики этой модели близки к системеOsborne 1, выпускаемой фирмой А Осборна, и НР-85 (HewlettPackard) Следует, однако, отметить, что при близости возможностей Каурго II был почти вдвое легче Osborne 1, что для переноснойсистемы имеет первоочередную важность, и на два года «моложе»НР-85.Каурго II оснащался процессором Zilog Z80 с тактовой частотой2,5 МГц.