Э. Таненбаум - Архитектура компьютера (1127755), страница 174
Текст из файла (страница 174)
(у)ультикомпьютеры 679 В дополнение к 108 вычислительным стойкам в системе имеется 16 стоек для процессоров ввода-вывода и обслуживания. В каждом из них установлено 32 процессора Оргегоп. Из этих 512 процессоров 256 отвечают за ввод-вывод и 256 — за обслуживание. Остальное место занимают диски, организованные в КА10-массивы уровня 3 и 5, каждый с диском четности и диском «горячей» замены. Общий объем дискового пространства составляет 240 Тбайт. Объединенная производительность дисковой системы равна 50 Гбайтггс. Система при помощи механических переключателей разбивается на две части, секретную и несекретную, которые при необходимости можно разъединять.
Из общего числа процессоров 2688 всегда находятся в секретной секции, еще 2688 — всегда в несекретной. Остальные 4992 вычислительных процессора можно переключать между секциями, как показано на рис. 8.35. Все процессоры Ортегов из секретной секции имеют по 4 Гбайт памяти, все остальные — по 2 Гбайт. Процессоры ввода-вывода и обслуживания поделены между секциями. Узел вводе-вывода и обслухгиввния Переключатель Вычислительный узел ппппппп пппаппп ппппппп ппппппп пппаппппппп ппппппппппп ппппппппппп ппппппппппп ппппппп ппппппп ппппппп ппппппп пп ап пп пп 28 секретных 62 переключаемые стойки 28 несекретных стоек(2688 процессоров ар(егоп) Дисковая память не (20 Тбвйт Дисковая стоек(2688 память процессоров нв 120 Тбейт Ор(егоп) Рис. 6.38.
Система пег) Втопп, вид сверху Вся система располагается в отдельном здании площадью 2000 м', спроектированном и построенном так, чтобы в будущем при необходимости можно было бы расширить систему до 30 000 процессоров. Энергопотребление вычислительных узлов составляет 1,6 МВт, еще 1 МВт потребляют диски. Вместе с системой вентиляции и кондиционирования воздуха общее энергопотребление равно 3,5 МВт. Стоимость аппаратного и программного обеспечения компьютера равна 90 млн долларов, здание и вентиляция стоят еще 9 млн, что в общем дает немногим меньше 100 млн. долларов, хотя часть этих денег составляют единовременные расходы на саму разработку.
То есть если вы хотите получить точную копию, приготовьте порядка 60 млн. долларов. К тому же в Сгау рассчитывают продавать уменыпенные версии этой системы для правительственных и частных организаций под названием ХЗТ. Вычислительные узлы работают под управлением облегченного ядра, названного СасашоппФ (едикая кошкаь). Узлы ввода-вывода управляются обычной ОС Гзппх с небольшими дополнениями, связанными с поддержкой интерфейса МР1 (см. далее в этой главе). В КА5-узлах работает урезанная версия 1лппх. На Гтег) 680 Глава 8.
Параллельные компьютерные архитектуры Сравнение систем В!Меоепе/э. и Веб 81опп Системы В!цеСепе/!. и ттег! Бгогш, будучи схожими во многих отношениях, име- ют немало отличий, поэтому сравнить их друг с другом достаточно интересно. В табл. 8.6 приведены значения некоторых их ключевых параметров. Таблица 8.6. Сравнение систем В1цейепе/7 и йед 81оггп Ией 61опп Параметр В! оепепе/1.
Центральный процессор Частота 32-разрядный РоигегРС 700 МГц 65 536 64-разрядный ОР1егоп г ггц 1О 368 Количество вычислительных процессоров Количество процессоров на плате 32 Количество процессоров в стойке 1024 96 !08 Количество вычислительных стоек 41 Производительность терафлоп/с 71 512 Мбайт 2-4 Гбайт Объем памяти на одном процессоре 10 Тбайт Яеазгаг 10 368 Общий объем памяти Маршрутизатор Количество маршрутизаторов Топология дополнительные сети 32 Тбайт РоигегРС 65 536 Тор размером 64 х 32 х 32 Тор размером 27 х 16 х 24 Раз1 Ешегпе1 Сгпащ1 Егйегпег Есть Возможность деления на секции Нет Специализированная Цпцх Специализированная Цпцх Сгау Яезеагсэ Высокая ОС для вычислительных узлов ОС ввода-вывода Производитель Стоимость 1ВМ Высокая 5сопп можно запускать имеющиеся в изобилии программы для АБС! Кег1, среди которых есть программы выделения процессоров, планировщики, МР1-библиотеки, математические библиотеки, прикладные программы.
Для такой болыпой системы вопросы надежности выходят на первый план. На каждой плате имеется КАБ-процессор, предназначенный для обслуживания системы, а также специализированные аппаратные средства. Целью разработчиков было обеспечить показатель МТВР (Меап Тгше Веьтуееп Ра11цгеэ — среднее время наработки на отказ), равный 50 часам. У аппаратного обеспечения АБС! ттег! этот показатель был равен 900 часам, но все портила операционная система — полный отказ системы случался каждые 40 часов. И хотя новая аппаратура намного надежнее старой, слабым местом по-прежнему остаются программы.
Более подробные сведения о Бег! Яогш можно найти в 1301. Мультикомпьютеры 881 Эти две машины построены примерно в одно и то же время, поэтому различия мезкду ними определяются не технологией, а склонностями разработчиков, а также, в некоторой степени, различиями между компаниями 1ВМ и Сгау. Система В1пеОепе/1. с самого начала была спроектирована как коммерческая машина, ориентированная на продажу биотехнологическим, фармацевтическим и другим компаниям. В противоположность этому, система Кед 81огш была построена по индивидуальному заказу лаборатории Бапйа, к тому же компания Сгау планирует выставлять на продажу уменьшенные версии системы.
Подход 1ВМ очень прост: из существующих ядер построить, хотя и специализированную, но низкоскоростную и дешевую в массовом производстве микросхему, а затем очень большое количество этих микросхем объединить не слишком скоростной сетью. Другой, но столь же понятный подход выбрали в Запйа: взять наиболее мощный из имеющихся в продаже 64-разрядный процессор, снабдить его высокоскоростным специализированным маршрутизатором и большим объемом памяти, получив гораздо более мощные вычислительные узлы, чем узлы В!пебепе/1.. Таких узлов потребуется гораздо меньше, поэтому и обмен информацией между ними будет происходить, соответственно, быстрее. Каждое решение повлияло на размещение элементов по-своему.
Благодаря тому, что в 1ВМ разработали специализированную микросхему, объединившую процессор и маршрутизатор, удалось добиться более высокой плотности упаковки — 1024 процессора в стойке. В Яапейа на каждый узел установили обычный массовый процессор и память объемом 2 — 4 Гбайт, поэтому в стойке удалось разместить только 96 вычислительных процессоров.
Как следствие, Кей 8гогш занимает больше места и потребляет больше энергии, чем В1пеСепе/1.. В экзотическом мире национальных исследовательских лабораторий главным критерием является производительность. По этому параметру В1пебепе/1. выигрывает, так как производительность этой системы составляет 71 терафлоп/с против 41 терафлоп/с у Кеп Вгогш. Но нельзя забывать, что конструкция Кеб Бгогш расширяема, поэтому, «бросив в бой» еще 10 368 процессоров Оргегоп (например, перейдя к двухъядерной технологии), Бапп1а, вероятно, сможет поднять производительность до 82 терафлоп/с. Однако и 1ВМ в состоянии ответить на это некоторым увеличением тактовой частоты (действительно, частота 700 МГц не слишком впечатляет).
Другими словами, МРР-суперкомпьютеры еще не подошли к физическому пределу своей мощности, и будут развиваться еще долгие годы. Кластерные вычисления Другой вариант мультикомпьютера — кластерный компьютер [12, 1371. Как правило, кластер состоит из нескольких сотен или тысяч связанных сетью персональных компьютеров или рабочих станций, причем к сети они подключаются через обычную сетевую плату. Различие между МРР и кластером такое же, как между мэйнфреймом и персональным компьютером. У обоих есть процессор, ОЗУ, диски, операционная система и т. д. Но в мэйнфрейме все это (за исключением, может быть, операционной системы) работает гораздо быстрее, и из-за этого применяются и управляются они совершенно по-разному. То же самое можно сказать о МРР и кластерах.
682 Глава 8. Параллельные компьютерные архитектуры Еще несколько лет назад взаимодействие между элементами, образующими МРР, происходило гораздо быстрее, чем между машинами, составляющими кластер. Однако с появлением на рынке высокоскоростных сетей этот разрыв стал сходить «на нет». Вероятно, кластеры постепенно вытеснят ММР-машины, подобно тому как персональные компьютеры вытеснили мэйнфреймы, которые применяются теперь только в узкоспециализированных областях. Основной нишей для систем ММР останутся дорогостоящие суперкомпьютеры, в которых главное— производительность, а вопросы стоимости не имеют решающего значения.
Существует множество видов кластеров, два из которых доминируют: централизованные и децентрализованные. Централизованным называют кластер рабочих станций или персональных компьютеров, смонтированных в большую конструкцию в пределах одной комнаты. Иногда они располагаются более компактно, чем обычно, чтобы сократить физические размеры и длину кабеля. Как правило, все входящие в кластер машины гомогенны и не имеют никаких периферийных устройств, кроме сетевых плат и, возможно, дисководов. Гордон Белл (Согбен Ве11), разработчик РОР-11 и Ъ'АХ, назвал их безголовыми рабочими станциями, намекая на то, что у этих машин нет владельцев.
Децентрализованные кластеры состоят из рабочих станций или персональных компьютеров, разбросанных в пределах здания или кампуса. Большинство из них простаивают много часов в день, особенно ночью. Обычно они связаны локальной сетью. Они гетерогенны и имеют полный набор периферийных устройств, хотя кластер с тысячью мышей ничем не лучше кластера вообще без мышей. Самое важное то, что многие входящие в кластер машины имеют владельцев, каждый из которых души не чает в своей машине и не слишком лояльно относится к тому, что какой-то астроном пытается вовлечь ее в вычисления, связанные с теорией большого взрыва. Если же использовать для организации кластера только бездействующие на данный момент машины, обязательно нужен какой-то механизм миграции заданий, чтобы освободить машину, когда она понадобится своему владельцу.
Хотя проблема миграции заданий вполне решаема, решение требует дополнительного усложнения программного обеспечения. Кластеры зачастую невелики — в пределах от дюжины до, возможно, 500 компьютеров. Тем не менее, можно построить очень большой кластер из обычных ПК. Компания Сооя1е предложила для этого интересный способ, который мы здесь рассмотрим. Ооод1е Соей!е — популярная система поиска информации в Интернете. Своей популярностью она обязана простоте интерфейса и малому времени отклика, хотя внутреннее устройство Соо81е можно назвать каким угодно, но только не простым. С точки зрения поисковой системы задача состоит в том, чтобы проиндексировать и сохранить всю Всемирную Паутину (а это более 8 миллиардов страниц и одного миллиарда изображений), а затем находить среди сохраненной информации нужную страницу за 0,5 секунды, обслуживая по тысяче запросов в секунду, круглосуточно приходящих со всех концов света.
В дополнение к этому, система никогда не должна отключаться, даже в случае природных катаклизмов, перебоев в электропитании и работе сети, аппаратных и программных сбоев. Разработка клона Сооя1е — определенно не упражнение для читателя. вдультикомпьютеры 683 Как же Ооо81е все это делает? Функционирование Ооой!е обеспечивают множество информационных центров по всему миру.