Курс лекций - конспект от Томилина в PDF, страница 3
Описание файла
PDF-файл из архива "Курс лекций - конспект от Томилина в PDF", который расположен в категории "". Всё это находится в предмете "вычислительные сети и системы" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Поэтому во многих случаях реальные MPP –системы строились по топологии гиперкуба.Примерами MPP–систем являются системы IBM RS/6000 SP2, Intel PARAGON/ASCIRed, CRAY T3E, Hitachi SR8000.67Успешным оказалось построение фирмой IBM MPP–системы с использованиемцентрального коммутатора (система IBM RS/6000 SP2). К нему подсоединяются до 128вычислительных узлов, в качестве которых использовались рабочие станции RS6000 (безвнешних устройств и, соответственно, оборудования связи с ними или с полным комплектомоборудования для обеспечения ввода информации в систему и вывода результатоввычислений).
Такое гибкое решение позволяло также реализовать в системе с однимкоммутатором как многопроцессорные, так и многомашинные подсистемы.Другим интересным примером организации MPP – системы являются созданные подруководством академика Левина Владимира Константиновича отечественные системы МВС100 и МВС-1000 (различаются лишь типом используемого процессора), вычислительныемодули которых состоят из 16 узлов, соединяемых по топологии “решетка” сдополнительными двумя связями между противоположными “угловыми” узлами.
Каждый узелсодержит основной вычислительный процессор и его оперативную память, а также “связной”процессор с собственной памятью, обеспечивающий в узле прием-передачу данных.Свободные связи узлов используются для соединения вычислительных модулей друг с другоми подключения к системе «внешних» компьютеров.Решение проблемы ввода-вывода информации в многопроцессорных вычислительныхсистемах любого типа (SMP, NUMA, MPP) осуществляется за счет подключения к системевнешних (дополнительных) компьютеров, обеспечивающих выполнение этой функции, ссоответствующим согласованием работы их системного программного обеспечения ссистемным программным обеспечением мультипроцессора.Следует отметить, что одной из первых в мире MPP–систем была разработанная вКиеве в Институте кибернетики им. В.М.Глушкова “макроконвейерная ЭВМ” (ЕС-2701), вкоторой вычислительные узлы на базе стандартных процессоров ЕС ЭВМ (на нихвыполнялись основные вычисления) объединялись через систему коммутаторов с такназываемыми специальными “логическими” узлами, в которых выполнялись части программырешения задачи, обеспечивающие управление процессом ее решения.В MPP-системах Cray T3E и Cray T3D процессорные узлы объединены в топологиитрехмерного тора.
Каждая элементарная связь между двумя узлами - это дваоднонаправленных канала передачи данных, что допускает одновременный обмен данными впротивоположных направлениях.MPP-системы строятся и на базе векторно-конвейерных процессоров (параллельныевекторные системы - PVP). К этому подклассу относится линия векторно-конвейерныхкомпьютеров CRAY: CRAY J90/T90, CRAY SV1, CRAY X1, системы NEC SX-4/SX-5, серияFujitsu VPP.В некоторых MPP–системах виртуальная память, предоставляемая задачеииспользуемая процессором вычислительного узла лишь в физической памяти этого узла,может быть отражена в оперативных памятях многих узлов. При возникновении в каком-либоузле потребности в конкретной части виртуальной памяти задачи эта часть передается повнутрисистемным коммуникациям в физическую оперативную память данного узла.Кластерные вычислительные системы.Стремление обеспечить высокую величину отношения производительностивычислительной системы к ее стоимости сделало актуальной задачу осуществления MPP –подхода с использованием более дешевого серийного вычислительного и коммуникационногооборудования.
При этом вычислительным оборудованием узла может быть и обычныйперсональный компьютер, а коммуникационным оборудованием широко выпускаемыепромышленностью сети Fast/Gigabit Ethernet, Myrinet, InfinyBand, SCI и др. Вместе с наборомпрограммного обеспечения параллельной работы узлов такие системы стали называть«кластерными».
Стремление получить большой экономический эффект привело к созданиюмногих типов кластеров и их широкому распространению. В то же время эффективное78решение появляющихся новых типов задач, в том числе задач с нерегулярным обращением кячейкам памяти очень большого объема, требует появления новых архитектурных иструктурных решений в построении вычислительных систем и их реализации в разработкахновых “заказных” систем.Организация памяти вычислительных систем.Совершенствование организации памяти вычислительных систем всегда было связано сдостижением более высокой производительности работы системы, развитием параллелизмаобработки данных.Основными проблемами в организации памяти являются организация иерархии ееуровней и предоставление для задачи виртуальной памяти, отображающейся на различныекомпоненты и уровни физической памяти.Иерархия памятиИерархия уровней памяти используется для размещения часто используемойинформации (программ и данных) в более быстродействующих (“верхних”) уровнях памяти свозможностью в случае необходимости передачи в них информации из менеебыстродействующих уровней существенно большего объема.
Результаты обработкиинформации, которые подлежат хранению на более длительный срок, также размещаютсяменее быстродействующей (“нижних”) уровнях.При длительной обработке информации и, естественно, ее изменении в верхнихуровнях памяти (в которых она не сохраняется при отключении электропитания) желательнымявляется ее периодическое сохранение в нижних уровнях (в которых осуществляется запись намагнитные носители).
Наличие одинаковой информации на различных уровнях памятиназывается “когерентностью” памяти.Основными уровнями в иерархии памяти являются:- уровни быстродействующей памяти относительно небольшого объема посравнению с объемом следующего основного уровня – оперативной памяти. Как правило,используются наборы “сверхбыстродействующих регистров” для выбора данных из них (длявыполнения операций в процессорах) и записи данных в них (результатов выполненияопераций в процессорах) практически без задержки.
Информация на эти уровни принеобходимости передается из следующего основного уровня существенно большего объема –оперативной памяти (или передается в обратном направлении). Сверхбыстродействующиепамяти и оперативная память физически реализуются на интегральных схемах, нобыстродействие этих схем разное. Объемы указанных уровней памяти изменяются в обратнойпропорциональности по отношению к изменению их быстродействия.- уровень оперативной памяти физически эффективно используется при разделенииее на набор параллельно работающих блоков (“расслоение ” памяти).Эффективное использование оперативной памяти для информации нескольких задач,выполняемых в многозадачном (многопрограммном) режиме реализуется за счет отображенияна нее “виртуальных” памятей этих задач.
При этом при отсутствии места в оперативнойпамяти для такого отображения приходится использовать для размещения виртуальной памятизадач и “нижний” уровень иерархии памяти (магнитные диски).- уровень памяти на магнитных дисках может иметь несколько каналов(“направлений”) считывания/записи информации и по несколько устройств, подключаемых ккаждому из этих каналов.В ряде случаев вводится промежуточный уровень “массовой” памяти, располагаемыймежду оперативной памятью и памятью на магнитных дисках, для размещения в нем“активных” файлов, используемых в задачах, требующих большого числа передач данных изэтих файлов (и записи в них) и осуществляющих относительно небольшой объем их обработкипроцессором. Массовая память большого объема реализуется, естественно, на более89медленных интегральных схемах, чем оперативная память. Уровень массовой памяти помогаетсгладить дисбаланс между высоким быстродействием процессора и относительно небольшойскоростью работы магнитных дисков.
Естественно при этом стремиться к обеспечениюкогерентности массовой памяти и памяти на магнитных дисках.В связи с существенным увеличением объема памяти на магнитных дискахиспользование памяти на магнитных лентах резко сократилось. В некоторых вычислительныхцентрах осуществляется периодическое (например, один раз в сутки) сохранениеизменившихся файлов с магнитных дисков на “магнитные катушки”.Сверхоперативная памятьНаборы регистров, образующих такую память, бывают двух назначений:- программируемые в командах “прямоадресуемые” регистры (регистры “общегоназначения”), предназначенныедля размещения в них данных, часто используемыхпроцессором;- группы регистров, в которых автоматически (аппаратно) сохраняются частоиспользуемые данные (“кэш (cache) - памяти”).Использование одного типа регистров в процессоре не исключает использованиядругого типа регистров.Кэш-памятьВ кэш-памяти могут размещаться команды и обрабатываемые данные.
Информациярасполагается в кэш-памяти блоками одинаковой длины. Этими же блоками происходитперемещение данных между оперативной и кэш-памятью.В командах, выполняемых процессором, указываются лишь адреса данных пооперативной памяти. Преобразование этих адресов в адреса кэш-памяти происходитаппаратно (определяются номер блока кэш-памяти и место расположения в нем требуемыхданных). Основными аспектами организации кэш-памяти являются:- способ доступа к кэш-памяти при обращении к находящимся в ней данным изпроцессора и при перемещении данных в кэш-память из оперативной памяти;- способ выполнения записи данных в кэш-память из процессора.По способу доступа к кэш-памяти различаются следующие организации кэш-памяти:- полностью ассоциативная кэш-память;- кэш-память с “прямой” адресацией;- частично ассоциативная кэш-память.В случае полностью ассоциативной кэш-памяти требуемые данные могут располагатьсяв любом ее блоке.