А.Н. Томилин - Вычислительные системы (2006), страница 15
Описание файла
PDF-файл из архива "А.Н. Томилин - Вычислительные системы (2006)", который расположен в категории "". Всё это находится в предмете "вычислительные сети и системы" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 15 страницы из PDF
Вот такие арифметические процессоры. Словоне очень удачное, потому что здесь арифметические и логические операции. Но назвали так,в отличие от некоторых «логических процессоров». Название не потому, что здесь алгебралогики. Иногда названия не очень удачные, например «рекурсивная ЭВМ». И всё это вместеобъединялось некоторыми связями через некоторые шины, которые объединялись «коммутационными процессорами». Логические процессоры были придуманы со специальной системой команд, на которой на специальном языке (язык МАЯК) писались управляющие частипрограммного комплекса.
А части счётные писались на обычном Fortran’е. Т.е. писалась задача на двух языках: управляющая писалась на МАЯКе, и писались трансляторы, транслирующие в систему команд этих оригинальных логических процессоров, а штатные (массовые) — транслировались штатными трансляторами Fortran’а. Смысл тут какой? Допустим,что всё загружено, и работает система. Естественно, что логические процессоры отслеживают прохождение вычислительных ветвей, и снова передаю по этой коммутационной сети сообщения. Это была типичная MPP-шная система передачи сообщений: заканчивалась работаарифметического процессора, передавалось сообщение другому процессору и т.д.
Кроме того, вот что-то сломалось. Естественно эту ситуацию отслеживал логический процессор (сломалось — не выполнялась во время обработка, таймер, всё прочее), передавал эту часть обработки другому арифметическому процессору. Связи позволяли выход из строя логического процессора тоже компенсировать. Т.е. система была нацелена на достижение максимальной живучести. Как они тогда говорили: «Мы такую систему сделали — рекурсивную».
Почему «рекурсивную»? Что же дальше получилось на практике, чем закончилось это всё? Закончилось, к сожалению, тоже двумя экземплярами. В данном случае не из-за того, что обслуживать было сложно (может быть и это тоже). Была конкуренция на использование заводских мощностей в Советском Союзе. Им с этой системой не повезло: больше двух экземпляров не сделали.А что же ещё подключалось к коммутационным процессорам? А подключалось следующее: машина ЕС-1060 или 1061. Вот он — front-end компьютер. Всё вместе — многомашинный комплекс.
Здесь работала своя операционная система. В каждом из вычислительныхузлов (процессоров) работала какая-то часть общей операционной системы. Кроме того, была подсоединена машина СМ-2М, которая была управляющей машиной (УМ). Её операционная система контактировала с распределённой операционной системой многоэлементногокомплекса (сказать «многомашинный» нельзя, «многопроцессорный» — ближе).43логическиепроцессоры...арифметическиепроцессорыОПУУАЛУОПУУАЛУ...ОПУУАЛУкоммутационныепроцессоры(ВМ) ЕС-1060СМ-2М(УМ)Я сам поработал на этой системе, было очень интересно. Вот сейчас у нас решается задача с алгоритмами линейной алгебры, что-то связанное с обращением матриц.
Мы вам разрешаем поупражняться. Там было 48 процессоров — логических было штук 8, остальноебыли арифметические и несколько коммутационных. И вот я, передавая операционной системе управляющие воздействия с терминала, говорю: отключить процессоры с 11-го по 18-йи с 30-го по 35-й. А где-то была индикация скорости выполнения задачи — решение задачизамедлилось.
Я довёл до двух процессоров — задача продолжала решаться. Потом я всю этумощность другими кусками снова дал указание на включение. Вот это была очень интересная вещь.Надо сказать, что многие у нас решения были передовые в то время, хотя, конечно, этотребовало огромного зала, всего.Мы рассматривали конвейер в микро масштабе — одного ФУ. Но мы можем рассматривать, и мы будем это делать, конвейер в макро масштабе.ЭВМ1ЭВМ21-я частьобработки2-я частьобработкиЭВМ3Какая-то реальная информация (обычно в системах реального времени) попадает напервую часть обработки на ЭВМ1.
Вторая часть обработки на ЭВМ2. Для чего так делают?А для того, что во-первых, ЭВМ1 успевает выполнить первую часть обработки за то время,через которое надо уже заниматься первой частью обработки следующей порции информации. Всю обработку она не успевает сделать в реальном времени. Стало быть, надо передатьвторую часть обработки второй ступени этого конвейера ЭВМ. А первую часть обработкивести на этой ЭВМ1 параллельно со второй частью обработки первой порции информации.А это будет первая часть обработки второй порции информации. Будет работать конвейерЭВМ. Это с одной стороны. С другой стороны, у вас может быть такое вычисление, что первую часть обработки выгодно проводить на машине с одной системой команд.
Следующуючасть обработки выгодно проводить на машине другого типа. Т.е. можно много выиграть,если организовать вот такую конвейерность обработки. Естественно, речь идёт в основном опостоянно наступающей и требующей в определённое время обработки информации. Такчто действительно, это конвейер ЭВМ.Это было одно из решений в MPP организации. Теперь я приведу ещё пару решений.Есть очень хороший комплекс, на котором очень большие деньги заработала себе фирма IBM.
Она реализовала комплекс под названием SP2 вот каким образом:44ВУWorkStationмногомашинныйкомплексRS-6000вычислительныйузел128128многопроцессорныйкомплексWorkStationВУWorkStationВУпроцессорныйкомплектРис. 7 Комплекс SP2Вычислительные узлы были на базе RS-6000 (это для конкретизации, какая нам разница). Таких узлов было много. Эти узлы, поскольку это MPP-шная конфигурация (передачасообщений), объединяют через некоторый коммутатор на 128 входов/выходов. Были системы, в которых не хватало одного коммутатора, значит, делали ещё один коммутатор.
Большедвух не делали.Казалось бы, вот такая топология, так в чём же выигрыш? А выигрыш был очень интересный и вот в чём. Они брали реальную рабочую станцию (Work Station) на базе RS-6000или закупали у производителя, и ставили не полную рабочую станцию, а знаменитый процессорный комплект. Куда-то ставили ещё, а в другое место ставили полностью рабочуюстанцию со всеми внешними устройствами и т.д. (см.
Рис. 7). Тем самым получался чистомногопроцессорный MPP-шный подкомплекс (всегда только 2 плеча связь). И здесь же можно делать многомашинный комплекс. Т.е. на одном и том же оборудовании можно делатьмногомашинный, многопроцессорный или совместно работающий многопроцессорный имногомашинный комплекс.Вот такие комплексы (SP2) являются примером многопроцессорных комплексов с объединением через центральный коммутатор. Кстати, вот это не является тем, что называется«звезда». «Звезда» — это совсем другое дело.А что такое «звезда»?ЭВМЭВМЭВМЭВМЭВМЭВМЭВМВот такой комплекс: есть центральная ЭВМ, как правило (даже из этого рисунка видно), она более мощная, остальные ЭВМ в неё передают информацию или от неё принимаютинформацию.
Практически, это тоже разбивается на некоторую центральную обработку иобработку front-end. Вот это — многомашинный комплекс типа «звезда».45Вот другой пример с другой топологией. Вот я имею вычислительные узлы, которыеобъединяются в двойной тор:Так тор (по вертикали) и так тор (по горизонтали).
Отсюда название — «двойной тор».Вот такая система SPP-1200 (2000). Эти узлы на самом деле были SMP-кирпичами. Называли их «гиперузел» из 8 или 16. А уже дальше эти SMP конфигурации обменивались (оченьинтересный момент) либо сообщениями (тогда это была MPP конфигурация), либо одиночными обращениями к памяти других гиперузлов (тогда это была NUMA конфигурация). Иможно было комбинировать и такой и такой вариант работы.
Так что это очень интересныйгибридный комплекс MPP (NUMA). Вот такая топология связи получилась.Варианты Cray тоже менялись. И он тоже перешёл на MPP-шную конфигурацию, сохраняя векторно-конвейерный подход в том смысле, что он производил процессоры векторно-конвейерного плана и непрерывно это делал, тем не менее, объединяясь с фирмой SiliconGraphics, он уже переходил на многоэлементные системы, уже не связанные с векторноконвейерностью. Так вот, Cray T3-E(D) — это был трёхмерный тор. Конечно, система коммутации очень не простая. Раз сейчас делаются разные топологии, в том числе и такие комплексы из сотен и тысяч процессоров, значит это кому-то нужно для решения крупных задач,для параллелизма.
Конечно, нужно уметь всё это загрузить, уметь достаточно быстро передавать сообщения по довольно непростой коммутационной системе. Но всё это относится ккомплексу MPP, а это вот такой вот симбиоз.Я хочу сказать, что бывают довольно разные топологии: решётки, кольца, торы (двумерный, трёхмерный).Что касается связи процессоров, то мы рассмотрим понятия «гиперкуб» и «полныйграф». Что касается комплексов MPP-шных, то есть некий прародитель «Макро конвейер»,затем мы смотрим SP2, затем SPP-1200, Cray T3-E, и мы рассмотрим наши комплексыМВС 100 и МВС 1000. А дальше мы перейдём к МВС 1000М — это уже кластер.Итак, мы рассмотрели примеры многопроцессорных комплексов (MPP), в которыхпроцессорный узел соединяется некоторой топологией с другими узлами, при этом прямоеобращение возможно только к своей памяти, а передача данных в другую память происходитгрупповым обменом через посредства операционной системы (т.е.
передача сообщений). Мырассмотрели некоторые топологии, а именно: топологию с центральным коммутатором —SP2, рассмотрели возможность соединения процессоров топологией двойного, тройного тора,при этом рассмотрели даже такой симбиозный вариант SPP-1200, где в топологии двойноготора узлы являются SMP подсистемами (или SMP-кирпичами) и возможна как передача сообщений, так и непосредственное обращение, т.е. вариант существования NUMA.Мы хотели рассмотреть ещё две структуры, которые работают у нас. МВС 100 илиМВС 1000 — это то, что разработано у нас, и то, что меняло друг друга в компьютерномцентре.