Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » А.Н. Томилин - Вычислительные системы (2006)

А.Н. Томилин - Вычислительные системы (2006), страница 12

Описание файла

PDF-файл из архива "А.Н. Томилин - Вычислительные системы (2006)", который расположен в категории "лекции и семинары". Всё это находится в предмете "вычислительные системы" из седьмого семестра, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 12 страницы из PDF

В данном случае было 7 команд, ивсе эти 7 команд одновременно бросались на эти ФУ. Через такт приходит следующая команда — хоп! И так далее. Если нужно работать с вектором — просто циклом. Получится тоже самое. Главное что устройства загружены.длинная командаОПоперанды↓↓... ↓7 ФУИтак, всё загружено, векторных операций нет, циклом будут подаваться вот такие операции. И эта машина была сделана, но в виде стенда.Всё бы хорошо, но в статистике говорится, что в нормальной последовательности команд 2, 3 — максимум, операции в среднем могут параллелиться.

Не будет так, чтобы 7 операций, не будут они пригодны для одновременного выполнения. Это же совершенно не ре33ально, т.е. у вас будет простаивать всё это дело. Ответ Бабаяна: «Параллелизм безграничен.Чудодейственный транслятор найдёт мириады команд (независимых), найдёт и вставит».

Насамом деле, это вряд ли реально, но вот такая идея длинного командного слова появилась ивот так была реализована.Дело в том, что поработав над Эльбрусом 1 и Эльбрусом 2, где программное обеспечение целиком делал Бабаян, затем отработав вариант машины Эльбрус 3, затем объединившись с Sun, к 2000 году был разработан Эльбрус 2000 (Э2К).Как видите, на какой-то момент времени это был самый совершенный процессор с точки зрения параллелизма в мире, и возникли дебаты, которые в американской печати оченьосновательно проходили. Что писали в этих журналах: «Да, это самый совершенный. Ностоит ли нам покупать эту разработку у Бабаяна? Если мы её купим, то тем самым, мы в определённой степени объединим свои интеллектуальные рабочие ресурсы.

Мы сумеем достичь этого? Сумеем, потому что прогресс развивается. Есть опасность, что русские это сделают без нас (возьмут и завалят мир этими процессорами)? Нет такой опасности, потому чтодля того, чтобы поставить на производство 200 миллионов долларов хватит.

Но само производство — это чистые материалы, чистое производство — оно стоит 4 миллиарда. Вот такоеони не потянут. А у нас все уже почти есть, поэтому не будем покупать у них разработку».Бабаяновцы на этот счёт обиделись, поехали в Америку, поднялись на гору Мак-Кинли и поставили там флаг Эльбруса. Так всё ничем и кончилось.Стало возможным при увеличении интерливинга памяти подключать не один процессор со всеми его потребностями (считывание команд, операндов, записи результатов), а уженесколько процессоров.

И раз уж мы не полностью отошли от Cray’я, тот же Cray стал создаваться из двух машин, под названиями Cray X-MP и Cray Y-MP. Это были несколькопроцессорные машины с общей памятью. Т.е. была память, и были процессоры. Внутрикаждого из них были регистры и ФУ. Было по 4, по 8 и даже по 16. Здесь довольноэффективно можно решать одну задачу, распараллеливать на несколько ветвей, потому чтоодна ветвь работает с памятью, другая — с другим участком памяти и т.д. Потоместественно, это одна задача, результат подхватывается другой программой другогопроцесса и наоборот.

Тут уже можно хорошо параллелить решение одной задачи нанесколько параллельных ветвей. Или решать их параллельно как независимые задачи.ОПрегистрыФУрегистрыФУ...регистрыФУВот возникли такие решения, и собственно говоря, все 80-е годы шли на создание этихмашин по линии векторно-конвейерных машин Cray, ну и соответственно программноеобеспечение и т.д. И, собственно говоря, может быть, даже именно Cray и был ближе к этойконфигурации многопроцессорных комплексов, которая называется SMP (symmetricmultiprocessor).

Вот, это одно из подмножеств многопроцессорных комплексов, в которомстало очень удобно разбить задачу на параллельные ветви, очень удобно передавать отодной ветви к другой полученные на предыдущем шаге обработки результаты ииспользовать их дальше. Писались в языках программирования операции синхронизациитаких ветвей. Но есть некое затруднение: обращений много к памяти. Оказалось, что всётаки больше, чем 4, 8, в крайнем случае, 16, подключение такого количества процессоровнеэффективно (сразу возникают задержки в работе с оперативной памятью). И вот так на34возникают задержки в работе с оперативной памятью). И вот так на этом эти комплексыSMP стали останавливаться.Ясное дело, что если у вас имеется необходимость существенно большего параллелизма, для многих задач это требуется, недаром делают комплексы десятки тысяч процессоров,то стала относительно ограниченная, но довольно активно используемая (до сих пор такиекомплексы SMP делают).Был реализован комплекс Эльбрус 2: какое-то количество блоков ОП, до 10 процессоров.

Сейчас работает в системе противоракетной обороны Москвы. Процессоры через некийматричный коммутатор имеют доступ к этим многочисленным блокам памяти. И вот этотвот Эльбрус 2 — типичный пример SMP-шного решения. Кстати, этот коммутатор былочень удачный.ОПпроцессоры...производительностьПВВВУПВВВУматричныйкоммутаторлеадиьнореал95%10число процессоровРис. 5Идеальной является прямая пропорциональность, но это не достигается. Так вот у Эльбруса 2 при 10 процессорах был достигнут почти линейный рост на некоторых очень важныхзадачах. Это было достигнуто совсем не просто. Семь месяцев эта задача обрабатываласьсистемщиками и разработчиками самих алгоритмов счёта, пока им удалось получить 95%при 10 процессорах.

И вот Михаил Сергеевич Горбачёв на съезде комсомола поставил главное решение науки и промышленности и наградил молодежь премией за 95%.Теперь смотрите внимательно: очень интересная вещь, которую можно обсудить. Вотдва примера вычислительных комплексов: Cray и Эльбрус 2 — вполне достаточно. Вотсмотрите: память общая. Вообще говоря, здесь можно реализовать и многомашинный комплекс. Представить себе, что вот здесь под управлением некоторой операционной системырешается задача Иванова и Петрова. А здесь — Сидорова. Если это объекты с разными операционными системами, то это многомашинный комплекс — это взаимодействие операционных систем между собой через общую память.

Т.е. это многомашинный комплекс, поскольку у каждого объекта какие процессоры, несколько процессоров, следующий объект —тоже несколько процессоров (например, 2 по 5 — две многопроцессорных машины по 5процессоров). Т.е. если есть некая сущность, управляемая собственной операционной системой, объединяется несколько, то это есть многомашинный комплекс. Если одна операционная система, то это одна многопроцессорная машина. А то, что комплекс и Cray, и Эльбрус влюбом случае многомашинный, доказывает следующее: к Эльбрусу подсоединяют, так называемый, процессор ввода-вывода (ПВВ), для которого были внешние устройства (ВУ), которые обеспечивали работу с внешними устройствами (см. Рис.

5).Вот на данном оборудовании получился трёхмашинный комплекс: один — многопроцессорный Эльбрус 2, второй — процессор ввода-вывода (ПВВ) как отдельная машина сосвоей операционной системой (2 штуки).Действительно, многоэлементный многопроцессорный комплекс не может жить безпомощи и поддержки дополнительных машин.35Электроника СС БИС («Красный Крей»)Машина, созданная параллельно с МКП, назвалась Электроника СС БИС («КрасныйКрей»). Она представляла собой вариант SMP — Cray SMP, только нашими сделано, поэтому я ничего дополнительно не буду.

Ну, там были улучшены устройства выполненияопераций чисто логически. Всё было сделано, конечно, на своей элементной базе, в этомвесь смысл: она по своей архитектуре относилась к системе Cray. Но что в ней было сделанодополнительно, что потом появилось во многих машинах, в том числе и в Cray’е, не потомучто «ах, русские сделали, давайте и мы сделаем». Нет. Естественно возникла потребность —это, так называемая, массовая память.Итак, у вас есть оперативная память (ОП), процессор, и некое устройство обмена (УО).Вот здесь некоторое количество каналов, к которым могут подсоединяться внешняя машина(ВМ), другая внешняя машина.

Кстати, как и у Cray’я, так и у Электроники СС БИС отдельно были магнитные диски (МД). Ничего другого, правда, не было, а магнитные диски были.Всё остальное через внешние машины. Был некий коммутатор, и вот здесь была массоваяпамять (МП).Основная машинаОПФ1КоммутаторУстройство обменаФ1МД4-6 Мб/сПроцессоруправленияМПУстройство обмена200 Мб/с1 Мб/сВМОПМассоваяпамятьВМРис. 6ОП, процессор и УО называлось основной машинной, в отличие от внешней машины(ВМ).Что же это такой за фокус с массовой памятью? А дело вот в чём, что даже, несмотряна диски высокой пропускной способности, всё равно возникает для ряда задач такая ситуация, что данные не успевают поступать в процессор, и процессор простаивает из-за отсутствия данных (из-за дисбаланса скорости работы машины и диска). Как быть? И вот введёнпромежуточный уровень памяти, вы берёте активный файл (Ф1) и перекачиваете его черезОП в массовую память (МП) (см. Рис.

6). ОП — память на интегральных схемах, но и МП наинтегральных схемах. Но она больше (скажем в 10 раз), в 10 раз медленнее, но в 10 раз быстрее и 10 раз меньше, чем память на магнитном диске. Скорость обмена между УО и коммутатором — 200 Мб/с. Что сделал Крэй? Центральная часть — «подкова» — тут и память ивсё прочие (для обслуживания, для всего прочего), снаружи источники питания, внизу залхолодильных установок. У Cray’я это было полукольцо, а у Электроники это было как «самолётик»:36CrayЭлектроника СС БИСУс-воОПпит.ОПУс-вопит.Проц.1000 Мб/сУс-вопит.Ус-воохл.Вот эта подкова (её содержание) то же самое, что центральная часть Электроники.Крэй интегральную панель поставил здесь же и соединил её, только «труба у него была повыше, и дым стал погуще», он стал 1000 Мб/с.

И тоже самое несколько таких Cray’евскихподков — стало массовой памятью. Т.е. это было сделано совершенно независимо — это реальная потребность в повышении эффективности обработки информации. Вот это массоваяпамять. Крэй свою идею опубликовал к 90-му году, а наши идеи возникли раньше (года на 34).Вот эта память управлялась неким процессором массовой памяти. Вот это очень интересная вещь. Этот процессор к многомашинности никакого отношения не имеет.Кстати, у Крэя был процессор управления магнитными дисками. Что это такое? Это вотчто такое: имеется готовый заряд, подготовленный операционной системой основной машины (того же Cray’я), заряд, подготовленный для обмена.

Свежие статьи
Популярно сейчас