В.А. Фисун - Параллельная обработка данных (2005) (1127758), страница 6
Текст из файла (страница 6)
Локальные сети отличаются от кластеров тем,что узлы локальной сети используются индивидуально, в соответствии со своимназначением. В свою очередь кластеры разделяются на Высокоскоростные (HighPerformance, HP) и Системы Высокой Готовности (High Availability, HA), атакже Смешанные Системы.Высокоскоростные системы предназначены для задач, которые требуютбольших вычислительных мощностей: обработка изображений, научныеисследования, математическое моделирование и т.
д.Кластеры высокой готовности используются в банковских операциях,электронной коммерции и т д.Супер ЭВМ – МИМД вычислители Флинну разделяются на ЭВМ с общейпамятью (SMP) и с распределенной памятью (МРР).Вычислительные системы архитектуры: МРР (Massively Parallel Processor,Massive Parallel Processing) - массив (матрица), состоящая из некоторогоколичества процессорных элементов с локальной памятью (микропроцессоров).Это самые мощные ЭВМ.
Сети обмена между процессорными элементами длясупер ЭВМ такие же как и для кластеров.Сети обмена делятся на три типа: шины, статические сети, динамическиесети.Быстродействие сети обмена определяется быстродействием узлов и связеймежду ними, параметры последних определяются: пропускной способностьюнепрерывного потока данных и максимальным количеством самых маленькихпакетов, которые можно передать за единицу времени (время передачи пакетанулевой длины, задержка).Некоторые сетевые интерфейсыТехнологияMbyte/s Задержка млсек21Fast Ethernet12.5156Gigabit Ethernet12533Myrinet2456SCI4001.5Сети обмена делятся на три типа: шины, статические сети, динамическиесети.ШиныСистема связи ПЭ через коммутирующую общую шину отличаются от другихсхем простотой, однако ее производительность ограничивается необходимостьюобеспечивать в любой момент времени не более одного запроса на передачуинформации.
Общая шина с центральным коммутатором обеспечиваетарбитраж запросов процессоров на передачу информации - выделение один иззапросов на доступ к шине и обеспечение монопольного права на владенияшиной на все время требуемого обмена. Шины - пропускная способность 100Мбайт/с для 2 -20 ПЭ (Multimax). Число процессоров в таких системах всегдаограничено.Статические сетиСтатические сети имеют жестко фиксированные соединения, вход и выходзафиксированы без возможности переключения. Наиболее простой топологиейсети является линейка – одномерная сетка. Для обеспечения передачиинформации между несмежными узлам используются транзитные пересылки.Для цепочки из М узлов наиболее медленная пересылка есть пересылка междуконечными ПЭ линейки и она потребует (М-1) транзитных пересылок.
Числотаких пересылок для любой статической топологии сети считается ее параметроми называется – диаметром сети. Если связать конечные ПЭ линейки, то такаятопология - кольцо будет иметь меньший диаметр. Сети могут иметь вид:одномерный линейный массив, двумерное кольцо, звезда, сетка игексагональный массив, дерево, трехмерное полностью связанное хордовоекольцо, 3 -мерный куб, сети из циклически связанных 3-мерных кубов, D мерный массив с топологией гиперкуба, тасовка (совершенная, обменная).Недостаток - необходимость маршрутизации транзитных сообщений. Потопологии гиперкуба, каждое ПЭ связывается со своим ближайшем соседом в nмерном пространстве. У каждого узла в двумерном гиперкубе имеются дваближайших соседа, в трехмерном - три, в четырехмерном - четыре.Динамические сетиДинамическиесетисетисвозможностьюдинамического(коммутируемого) соединения узлов сети друг с другом.
Особое место занимаетполный коммутатор.Полный коммутатор обеспечивает полную связность каждого узла в сети,причем, обеспечивает независимость (не блокируемость) пересылок.22Недостаток: высокая стоимость аппаратуры и ограниченная размерность.Перечисленные выше однокаскадные сети обмена содержат фиксированноечисло каскадов или один каскад переключателей.
Многокаскадные сети могутбыть получены комбинацией некоторых однокаскадных сетей и могут составитьконкуренцию полному коммутатору. Например, стандартная сеть Клоша можетиметь нечетное число каскадов и строится из сетей меньших размеров.Трехкаскадная сеть Клоша имеет с Н входами и Н выходами имеет р модулей23. Симметричные мультипроцессорыСистемы данного класса: SMP (Scalable Parallel Processor) состоят из несколькиходнородных процессоров и массива общей памяти (разделяемой памяти – sharedmemory): любой процессор может обращаться к любому элементу памяти. По этойсхеме построены 2,4 процессорные SMP сервера на базе процессоров Intel, НР и т.д., причем процессоры подключены к памяти с помощью общей шины.
Системы сбольшим числом процессоров (но не более 32) подключаются к общей памяти,разделенной на блоки, через не блокирующийся полный коммутатор: crossbar.Любой процессор системы получает данное по произвольному адресу памяти заодинаковое время, такая структура памяти называется: UMA - Uniform MemoryAccess (Architecture). Пример:НР-9000. Дальнейшее масштабирование (увеличениечисла процессоров системы) SMP систем обеспечивается переходом к архитектурепамяти: NUMA - Nоn Uniform Memory Access. По схеме, называемой, этой иногда,кластеризацией SMP, соответствующие блоки памяти двух (или более) серверовсоединяются кольцевой связью, обычно по GCI интерфейсу.
При запросе данного,расположенноговне локального с сервере диапазона адресов, это данное покольцевой связи переписывается дублируется в соответствующий блок локальнойпамяти, ту часть его, которая специально отводится для буферизации глобальныхданных и из этого буфера поставляется потребителю. Эта буферизация прозрачна(невидима) пользователю, для которого вся память кластера имеет сквознуюнумерацию, и время выборки данных, не локальных в сервере, будет равно временивыборки локальных данных при повторных обращениях к глобальному данному,когда оно уже переписано в буфер. Данный аппарат буферизации есть типичнаясхема кэш памяти. Так как к данным возможно обращение из любого процессоракластера, то буферизация, размножениеданных требует обеспечение ихкогерентности.
Когерентность данных состоит в том, что при изменении данного всеего потребители должны получать это значение. Проблема когерентностиусложняется дублированием данных еще и в процессорных кэшах системы.Системы, в которых обеспечена когерентность данных, буферизуемых в кэшах,называются кэш когерентными(cc-cache coherent), аархитектура памятиописываемого кластера: cc- NUMA (cache coherent Nоn Uniform Memory Access).Классической архитектурой принято считать систему SPP1000.24. Статический и динамический способы образования параллельных процессов.23"Процесс - группа ячеек памяти, содержимое которых меняется по определеннымправилам.
Эти правила описываются программой, которую интерпретируетпроцессор." /Цикритзис Д./.Вычислительный процесс можно рассматривать как последовательность командЭВМ, которая работает с данными ей ресурсами. (Задача, задание, процесс, нить,TASK). Так, на микропроцессоре могут работать одновременно нескольконезависимых процессов: счет вычислительной задачи, редактирование текстов и т.д.Далее рассматриваются вычислительные процессы, одновременно выполняющиеся нанескольких процессорах для решения общей задачи. Работа такой задачи можетначинаться с порождения главного процесса, который при работе может порождатьдругие процессы динамически.
Эти процессы могут работать параллельно с главной итакже порождать другие процессы.Другим способом порождения процессов является статический способ, когдапроизводится одновременная инициализация на всех процессорах одинаковыхпроцессов (SPMD – Single Program Multiple Data). Эти процессы опрашиваютсостояние решающего поля и настраиваются на выполнение своей частивычислений.(Они могут узнать: сколько их порождено, свои уникальные, внутренниеимена, и т.д.)Процессы, работающие на равных правах (не вызовы процедур и не процессы,связанные понятиями "главная-подчиненная"), иногда называемые сопроцессами,могут выполняться параллельно и при этом общаться друг с другом - не часто (слабосвязанные процессы).25.
Двоичные и общие семафорыПроцессы для своей работы могут использовать логические и физическиересурсы вычислительной системы и ее окружения, причем ресурсы могут быть:поделены между процессами и закреплены постоянно (на все время работы процесса)или использованы всеми или некоторыми процессами по-очереди. Некоторые ресурсымогут быть общими и допускать параллельное обслуживание процессов. Ресурс,который допускает обслуживание только одного процесса в текущее время,называется критическим ресурсом.Участки программы процесса, в которых происходит обращение к критическимресурсам, называются критическими участками.