ПОД конспект (1184369), страница 11
Текст из файла (страница 11)
Естественно, в ситуации,когда два процессора захотят работать с одним модулем памяти, один из них будет заблокирован. Напересечении линий располагаются элементарные точечные переключатели, которые разрешают илизапрещают передачу информации. Недостаток - большой объем необходимого оборудования и, какследствие, ограниченная масштабируемость системы.
Для связи n процессоров с n модулями памятинеобходимо n*2 элементарных переключателей.42. Пиковая производительность.Оценка производительности вычислительных систем имеет два аспекта: оценка пиковойпроизводительности – номинального быстродействия системы и получение оценок максимальной ―реальной‖ производительности. Если номинальная(пиковая, предельная) оценка однозначно определяетсятехническими параметрами оборудования, то вторая характеристика указывает производительность системыв реальной среде применения.
Для оценки производительности вычислительных систем в ТОР500используются обозначения Rpeak – пиковая, предельная производительность и Rmax – максимальнаяпроизводительность при решении задачи Linpack.Наиболее абстрактной единицей измерения производительности микропроцессоров является тактоваячастота ПК, частота тактового генератора (clock rate,). Любая операция в процессоре не может бытьвыполнена быстрее, чем за один такт (период) генератора. Итак, минимальное время исполнения однойлогической операции (переключение транзистора) - один такт. Тактовая частота измеряется в Герцах –число тактов в секунду.Другой обобщенной мерой производительности ПК может служить число команд, выполняемые вединицу времени. Для вычислителей фон-Нейманновской архитектуры скорость выполнения команд ужеможет быть параметром, который может быть использован для оценки времени выполнения программы.Этот параметр - MIPS (Million Instruction Per Second)- миллион операций (команд, инструкций ЭВМ)/сек.Так как время выполнения различных команд может различаться, то данных параметр сопровождалсяразного вида уточнениями (логических команд, заданной смеси команд и т.д.), а также наиболее известнойздесь мерой в 1 MIPS – это производительность вычислителя VAX 11/780.
Итак, данный параметр такжедостаточно условен.Так как для большинства вычислительных алгоритмов существуют оценки числа арифметических операций,необходимых для выполнения расчетов, данная мера и может служить тем показателем, который иинтересует пользователей в первую очередь. Это – MFLPOPS (Million of Floating point Operation Per Second– Мегафлопс)- миллион операций на данных с плавающей запятой/сек, единица быстродействия ЭВМ воперациях с плавающей запятой, есть также единицы - GFLPOPS и ТFLPOPS (терафлопс = 10**12 оп./сек.).43. Методы оценки производительности.Обычно, рассматриваются три подхода к оценке производительности:- на базе аналитических модели (системами массового обслуживания);- имитационное моделирование;- измерения.Первый подход обеспечивает наиболее общие и наименее точные результаты, последние, наоборот, наименее общие и наиболее точные.
Измерения проводятся контрольными (тестовыми) программами.Бенч-марк (Benchmark) - эталон:- стандарт, по которому могут быть сделаны измерения или сравнения;- процедура, задача или тест, которые могут быть использованы для сравнения систем иликомпонентов друг с другом или со стандартом как в п.1.Для повышения общности и представительности оценки производительности контрольныепрограммы можно разделить на:- программы нижнего уровня. Эти программы тестируют основные машинные операции - +,/,* , сучетом времени доступа к памяти, работу кэша, характеристики ввода/вывода.- ядра программ. Ядра программ - короткие характерные участки программ, например, Ливерморскиефортрановские ядра (24 ядра) , Эймсовские ядра НАСА, синтетический тест Ветстоун (Whetstone).- основные подпрограммы и типовые процедуры; Примером основных подпрограмм могут бытьпрограммы Линпак (Linpack) , программы типа быстрого преобразования Фурье.
Программа Линпак- процедура решения системы линейных уравнений методом исключения Гаусса. В этой схемевычислений точно известно число операций с плавающей точкой, которое зависит от размерностимассивов – параметров. Стандартные значения размерностей 100 или 1000. Для параллельных ЭВМимеется соответствующая версия теста.25--полные основные прикладные программы; В качестве примеров программ этого уровня приводятсяЛос-Аламосские тестовые программы моделирования поведения плазмы и программыгидродинамики.перспективные прикладные программы.44. Закон Амдала.Закон Амдала показывает коэффициент ускорения выполнения программы на параллельных системах взависимости от степени распараллеливания программы.
Пусть: N - число процессоров системы, P - доляраспараллеливаемой части программы, а S = 1-P - доля скалярных операций программы, выполняемых безсовмещения по времени.( S+P = 1 , S,P >= 0). Тогда, по Амдалу, общее время выполнения программы наоднопроцессорном вычислителе S+P, на мультипроцессоре: S+P/N, а ускорение при этом есть функция от P:Sp = (S+P)/(S+P/N) = 1/(S+P/N).Из формулы закона Амдала следует,что при:P = 0 S = 1 - ускорения вычисления нет, аP = 1 S = 0 - ускорение вычислений в N разЕсли P = S = 0.5, то даже при бесконечном числе процессоров ускорение не может быть более чем в 2 раза.45. Принципы потоковой обработки информации.Потоковая архитектура (data-flow) вычислительных систем обеспечивает интерпретацию алгоритмов награфах, управляемых данными.
Идеи потоковой обработки информации, организации вычислений,управляемых потоками данных можно рассмотреть на примере организации ввода и суммирования трехчисел. Традиционная схема вычислений может быть представлена так: ввод (а); ввод (в); ввод (с); s = a+b; s= s+c. Если ввод данных может производиться асинхронно, то организовать параллельноепрограммирования данного алгоритма не просто. Параллельный алгоритм может быть записан в виде потокаданных на графе:ввод (а)ввод (в)ввод (с)а+ва+св+с(в+с)+а(а+с)+в(а+в)+сЗдесь, начальные вершины - ввод, затем каждое введенное данное размножается на три и они передаются навершины, обеспечивающие суммирование.
Теперь, в любом порядке поступления данных отсутствуютзадержки вычислений для получения результата. Data-flow программы записываются в терминах графов. Ввершинах графа находятся команды, состоящие, например, из оператора, двух операндов (для двуместныхопераций), возможно, литеральных, или шаблонов для заранее неизвестных данных и ссылки,определяющей команду - наследника и позицию аргумента в ней для результата.46. Схемы потоковых вычислителей.Основными компонентами потоковой ВС являются:- память команд (ПК),- селекторная (арбитражная) сеть,- множество исполнительных (функциональных) устройств (ФУ),- распределительная сеть._______________|--------------->| ФУ|-----------------|||______________||||селекторная сетьраспределительная сеть|______________||<---------------| ПК|-----------------||______________|Память команд состоит из "ячеек" активной памяти, каждая из которых может содержать одну команду вида<метка>: <операция>,<операнд1>,..,<операндК>,<адр_рез1>,..,<адр.
_рез.М>, где адреса результатовявляются адресами ячеек памяти. С каждой командой связан подсчитывающий элемент, непрерывноожидающий прибытие аргументов, который пересылает команду на выполнение при наличии полногокомплекта аргументов. Активный характер памяти заключается в том, что ячейка, обладающая полнымнабором операндов, переходит в возбужденное состояние и передает в селекторную сеть информационныйпакет, содержащий необходимую числовую и связующую информацию о команде.Селекторная сеть обеспечивает маршрут от каждой командной ячейки к выбранному, в соответствии скодом операции, исполнительному (функциональному) устройству из множества устройств.
Пакет26поступает на одно из исполнительных устройств, где соответствующая операция выполняется и результатподается в распределительную сеть.Распределительная сеть обрабатывает результирующий пакет, состоящий из результатов вычислений иадресов назначения. В зависимости от содержимого пакета, результат вычислений поступает всоответствующие ячейки памяти команд, создавая, тем самым, условия возможности их активизации.Потоковая архитектура (data-flow), как одна из альтернатив фон-Нейманновской, обладает следующимихарактерными чертами:- отсутствие памяти как пассивного устройства, хранящего потребляемую информацию,- отсутствие счетчика команд (и, следовательно, последовательной обработки команд программы,разветвлений по условию и т.д.).Потоковые вычислительные системы позволяют использовать параллелизм вычислительных алгоритмовразличных уровней, потенциально достигать производительность, недоступную традиционнымвычислительным системам.