Контрольная работа №3 (1184240)
Текст из файла
Контрольная работа №3.
1. Реализация условных операторов в архитектуре EPIC (IA64).
Парадигма EPIC (Explicitly Parallel Instruction Computing, вычисления с заданным параллелизмом команд) подразумевает, что управление параллельным вычислением команд производится еще на этапе компиляции. Тем самым, отпадает необходимость в размещении на чипе специальной логики для управления параллельными вычислениями, что позволяет разместить на чипе того же размера больше вычислительной логики. Кроме того, компилятор может находить и использовать дополнительные возможности по увеличению параллелизма. Однако, при подобной организации параллельных вычислений возникает ряд проблем, среди которых выполнение условных операторов.
П
Неиспользуемые
вычислительные
слоты
Используемые
вычислительные
слоты
Одним из возможных решений данной проблемы является предсказание переходов, когда предсказывается значения условного выражения, и конвейер выполняет соответствующую ветвь условного блока. Однако, неправильные предсказания, согласно данным Intel, приводят к падению производительности процессора на 20-30%. Кроме того, выполнение таких предсказаний весьма проблематично для EPIC-архитектур, когда управление параллельными вычислениями происходит статически на этапе компиляции.
Поэтому в Intel Itanium (IA-64) был применен иной подход. При появлении условного оператора одновременно производится вычисление условия, а также выполнение обеих ветвей вычисления. При этом каждая инструкция помечается однобитовым флагом-предикатом, два значения которого соответствуют двум возможным ветвям вычислений. После вычисления условия выставляется соответствующее значения предиката, и ненужная ветвь вычислений отбрасывается. Данный процесс проиллюстрирован на рисунке:
Предикация – пример того, как связаны компилятор и процессор в архитектуре IA-64. Компилятор еще на этапе компиляции присваивает флаги-предикаты инструкциям ветвей, а процессор выставляет нужный флаг после вычисления условия. Архитектура IA-64 подразумевает наличие 64-х однобитовых предикатных регистров для хранения флагов. Согласно исследованиям, проведенным в Университете Иллинойса, использование предикации в процессоре с 8-ю конвейерами позволяет более чем на 50% уменьшить количество условных операторов.
2. Коммуникационные сети вычислительных кластеров.
Производительность кластерной системы в большей степени определяется ее архитектурой (способом соединения процессоров друг с другом), чем типом используемых в ней процессоров. Критическим параметром, влияющим на величину производительности такой системы, является расстояние между процессорами.
Рассмотрим для примера задачу построения симметричной 16-ти процессорной системы, в которой все процессоры были бы равноправны. Наиболее естественным представляется соединение в виде плоской решетки, где внешние концы используются для подсоединения внешних устройств.
При таком типе соединения максимальное расстояние между процессорами окажется равным 6 (количество связей между процессорами, отделяющих самый ближний процессор от самого дальнего). Теория же показывает, что если в системе максимальное расстояние между процессорами больше 4, то такая система не может работать эффективно. Поэтому, при соединении 16 процессоров друг с другом плоская схема является не эффективной. Для получения более компактной конфигурации необходимо решить задачу о нахождении фигуры, имеющей максимальный объем при минимальной площади поверхности. В трехмерном пространстве таким свойством обладает шар. Но поскольку необходимо построить узловую систему, то вместо шара приходится использовать куб (если число процессоров равно 8) или гиперкуб, если число процессоров больше 8. Размерность гиперкуба будет определяться в зависимости от числа процессоров, которые необходимо соединить.
Используются и другие топологии сетей связи: трехмерный тор, "кольцо", "звезда" и другие:
Архитектура кольца с полной связью по хордам (Chordal Ring)
Наиболее эффективной является архитектура с топологией "толстого дерева"
(fat tree). Архитектура "fat tree" (hypertree) предложена Лейзерсоном (Charles E. Leiserson) в 1985 году. Процессоры локализованы в листьях дерева, в то время как внутренние узлы дерева скомпонованы во внутреннюю сеть. Поддеревья могут общаться между собой, не затрагивая более высоких уровней сети. При этом каналы, соединяющие поддеревья обладают большей пропускной способностью, чем каналы, соединяющие листья (поэтому такое дерево и называют “толстым”). За счет подобной гибкости построения толстое дерево может быть эффективно адаптировано под конкретную задачу.
Кластерная архитектура "Fat-tree"
Кластерная архитектура "Fat-tree" (вид сверху на предыдущую схему)
Для соединения узлов в кластерах могут использоваться различные коммуникационные сети.
Ethernet по популярности является фактическим лидером среди сетевых технологий на протяжении многих лет. Способный объединить многие сотни систем, расположенных как в одном монтажном шкафу, так и за сотни километров друг от друга, Ethernet играет роль универсального стандарта. Но именно универсальность создает основные проблемы при его использовании в качестве коммуникационной сети в кластерах. Значительные задержки в передаче данных вносит исполнение алгоритмов по обработке таблиц маршрутизации. А реализация стека TCP/IP, включая копирование передаваемой информации через промежуточный буфер ОС, расходует помимо того еще и процессорные ресурсы. При этом интенсивный трафик способен значительно загрузить процессор, что может замедлить работу основного приложения. С другой стороны, занятость процессоров обработкой задач приложения вносит дополнительные задержки в процесс приема/передачи информации. Задержки при использовании массовой на данный момент технологии Gigabit Ethernet (пропускная способность 1 Гбит/с) достаточно высоки, зависят от аппаратной реализации сетевого интерфейса и варьируются от 30 до 90 мкс; топология – различные разновидности топологии звезда. Кроме невысокой стоимости технология Ethernet благодаря своему широкому распространению имеет обширную поддержку среди производителей ПО, и это можно отметить как одно из ее главных достоинств.
SCI (Scalable Coherent Interface) принят как стандарт в 1992 (ANSI/IEEE Std 1596-1992). Предназначен для достижения высоких скоростей передачи с малым временем задержки, при этом обеспечивая масштабируемую архитектуру, позволяющую строить системы, состоящие из множества блоков. Представляет собой комбинацию шины и локальной сети, обеспечивает реализацию когерентности кэш-памяти, размещаемой в узле SCI, посредством механизма распределенных директорий, который улучшает производительность, скрывая затраты на доступ к удаленным данным в модели с распределенной разделяемой памятью. Производительность передачи данных обычно находится в пределах от 200 Мбайт/с до 1000 Мбайт/с на расстояниях десятков метров с использованием электрических кабелей и километров с использованием оптоволокна. Для продуктов Dolphin пиковая пропускная способность – 667 MB/sec, аппаратная латентность – 1.46 мксек. SCI уменьшает время межузловых коммуникаций по сравнению с традиционными схемами передачи данных в сетях путем устранения обращений к программным уровням – операционной системе и библиотекам времени выполнения; коммуникации представляются как часть простой операции загрузки данных процессором (командами load или store). Обычно обращение к данным, физически расположенным в памяти другого вычислительного узла и не находящимся в кэше, приводит к формированию запроса на удаленный узел для получения необходимых данных, которые в течение нескольких микросекунд доставляются в локальный кэш, и выполнение программы продолжается. Старый подход требовал формирования пакетов на программном уровне с последующей передачей их аппаратному обеспечению. Точно также происходил и прием, в результате чего задержки были в сотни раз больше, чем у SCI. Однако, для совместимости SCI имеет возможность переносить пакеты других протоколов. Другое преимущество SCI – использование простых протоколов типа RISC, которые обеспечивают большую пропускную способность. Узлы с адаптерами SCI могут использовать для соединения коммутаторы или же соединяться в кольцо. Обычно каждый узел оказывается включенным в два кольца:
Матрица узлов кластера на основе сети SCI
Данная технология оптимизирована для работы с динамическим трафиком, однако может быть менее эффективна при работе с большими блоками данных. Протокол передачи данных обеспечивает гарантированную доставку и отсутствие дедлоков. Протокол SCI достаточно сложен, он содержит большие возможности по управлению трафиком, но использование этих возможностей предполагает наличие развитого программного обеспечения. На коммуникационной технологии SCI основана система связи гиперузлов CTI (Convex Torroidal Interconnect) в системах HP/Convex Exemplar X-class, кроме того на ней построены кластерные системы SCALI Computer, системы семейства hpcLine компании Siemens, а также cc-NUMA сервера Data General и Sequent. Традиционная область применения SCI – это коммуникационные среды многопроцессорных систем. На основе этой технологии построены, в частности, компьютеры серии hpcLine от Siemens или модульные серверы NUMA-Q от IBM, ранее известные как Sequent. Модульные SCI коммутаторы Dolphin позволяют потребителям строить масштабируемые, кластерные решения класса предприятия на платформах Windows NT/2000/XP, Linux, Solaris, VxWorks, LynuxWorks и NetWare с использованием стандартизованного оборудования и программного обеспечения.
Сетевую технологию Myrinet представляет компания Myricom, которая впервые предложила свою коммуникационную технологию в 1994 году, а на данный момент имеет уже тысячи инсталляций по всему миру. Топология: коммутируемая, элементом коммутации является матрица 8х8. Для построения больших сетей используются различные варианты топологии fat tree. Технология Myrinet основана на использовании многопортовых коммутаторов (до 128 портов) при ограниченных несколькими метрами длинах связей узлов с портами коммутатора. Максимальная длина линий связи варьируется в зависимости от конкретной реализации. Как коммутируемая сеть, аналогичная по структуре сегментам Ethernet, соединенным с помощью коммутаторов, Myrinet может одновременно передавать несколько пакетов, каждый из которых идет со скоростью, близкой к 2 Гбит/с, полный дуплекс. Латентность – порядка 4 мксек. В отличие от некоммутированных Ethernet и FDDI сетей, которые разделяют общую среду передачи, совокупная пропускная способность сети Myrinet возрастает с увеличением количества машин. На сегодняшний день Myrinet чаще всего используют как локальную сеть (LAN) сравнительно небольшого физического размера, связывая вместе компьютеры внутри комнаты или здания. Из-за своей высокой скорости, малого времени задержки, прямой коммутации и умеренной стоимости, Myrinet особенно популярен для объединения компьютеров в кластеры. Myrinet также используется как системная сеть (System Area Network, SAN), которая может объединять компьютеры в кластер внутри стойки с той же производительностью, но с более низкой стоимостью, чем Myrinet LAN. Пакеты Myrinet могут иметь любую длину. Таким образом, они могут включать в себя другие типы пакетов, включая IP пакеты. В коммутаторах используется передача пакетов путем установления соединения на время передачи, для маршрутизации сообщений используется алгоритм прокладки пути. Коммутаторы, как и сетевые адаптеры, построены на специализированных микропроцессорах LANai фирмы Myricom. На физическом уровне линки Myrinet состоят из 9 проводников: 8 битов предназначены для передачи информации, интерпретируемой в зависимости от состояния девятого бита как байт данных или управляющий символ; при этом на каждом линке обеспечивается управление потоком и контроль ошибок. Среда Myrinet выгодно отличается от многих других сред передачи, в частности SCI, простотой концепции и аппаратной реализации протоколов. Она содержит ограниченный набор средств управления трафиком, использующих приливно-отливный буфер, управляющие символы и таймерные интервалы. Myrinet является открытым стандартом, компания Myricom предлагает широкий выбор сетевого оборудования по сравнительно невысоким ценам.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.