В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (pdf) (1127762), страница 18
Текст из файла (страница 18)
Эти параметры будут грубо определять пиковую производительность ЭВМ. Итак,наиболее абстрактной единицей измерения производительности процессоров является тактовая частота, частота тактового генератора (clock rate).Частота генератора задает цикл (cycle), наименьшую единицу времени, распознаваемая устройством. Минимальное время исполнения любой логической операции (переключение транзистора) - один такт, никакая операция впроцессоре не может быть выполнена быстрее, чем за один период генератора. Тактовая частота измеряется в “Герцах” – число тактов в секунду.Один МГц - это миллион тактов в секунду, ГГц – миллиард тактов в секунду и т.д.
С частотой тактового генератора работают элементы процессора,интегрированные на чипе – АЛУ, кэш-память, дешифратор команд, регистры. Тактовая частота системной шины меньше частоты процессора (в 2,5– 10 раз, Alpha 21064), поэтому другие параметры шины также влияют напроизводительность процессора. Поскольку любая операция, в том числе ипересылка данных, не может происходить быстрее, чем за такт, то желательно передавать как можно больше информации за один такт. Обычно,системная шина для данных обеспечивает полосу пропускания в 32, 64,128 бит. Поэтому, тактовая частота и разрядность шины является существенным параметром процессора. Так, для Intel Pentium 64-разрядная шинаданных обеспечивает обмен с ОЗУ со скоростью 528 Мбайт/с.
Для оценкихарактеристики системной шины часто используется только интегральныйпоказатель – пропускная способность шины. Процессоры Xeon имеет шиныс производительностью в 6,2 Гбайт/c, процессоры AMD Opteron – в 5,3Гбайт/с.Архитектура процессора, также как и тактовая частота, влияет на работу процессора, поэтому два процессора с одинаковой тактовой частотой необязательно будут иметь одинаковую производительность.
Например, микропроцессоры с суперскалярной архитектурой могут выполнять более одной операции за тактовый цикл. Данных параметр оценки производительности процессора удобен для сравнительной оценки ЭВМ одного семейства, для процессоров с одинаковой архитектурой. Итак, тактовая частота вычислителя, даже с уточнениями частоты шины, может быть оценкой лишьноминальной производительности процессора.Другой обобщенной мерой производительности процессоров можетслужить число команд, выполняемые в единицу времени.
Для вычислителей фон-неймановской архитектуры скорость выполнения команд можетбыть параметром, который может быть использован для оценки общеговремени выполнения программы. Этот параметр - одна операция (команда,инструкция ЭВМ) в секунду. Обычно эта единица используется в номинации: “Мипс” - MIPS (Million Instruction Per Second) - миллион операций(команд, инструкций ЭВМ) в секунду. Так как время выполнения различных команд может различаться, то данный параметр при использовании со-Пособие 17.09.0964провождается разного вида уточнениями: время выполнения только логических команд ЭВМ, производительность на заданной смеси команд и т.д.Например, тестовая смесь для определения производительности ЭВМ вMIPSах Dhrystone состоит из 100 команд, 53% которых есть операторыприсваивания, 32% – операторы управления и 15% - вызовы функций. Другим способом нормирования данного параметра является сравнение производительность исследуемого процессора с производительностью эталоннойЭВМ.
Эталонной ЭВМ принято считать ЭВМ VAX 11/780, производительность которой считается равной одному MIPSу. Фирма IBM предложилаиспользовать в качестве эталона производительности свою ЭВМ - RS/6000.Считается, что 1 RS/6000 MIPS примерно равен 1,6 VAX 11/780 MIPS.Достоинством данного рейтинга является его наглядность: более быстрые машины имеют более высокий рейтинг MIPS.
Однако проведение сравнения ЭВМ с различными системами команд при использовании MIPS в качестве метрики вызывает затруднения. Рейтинг MIPS для процессоров с сопроцессорами плавающей точкой будет явно занижен при выполнении векторных работ. Итак, и второй рейтинг оценки производительности ЭВМимеет очевидные недостатки.Корпорацией SPEC (Standard Performance Evaluation Corporation) в 1992г. для измерения производительности ПК был предложен рейтинг SPEC.Корпорация разработала два базовых набора тестов CIN92 и CFP92, ориентированные на интенсивные расчеты, для измерения производительностьпроцессора и системы памяти, а также эффективности оптимизирующихблоков компиляторов ПК.Первый набор тестов измеряет производительность процессора при обработке целых чисел.
Он состоит из 6 Си-программ: интерпретатор Лиспа,упаковка текстовых файлов, и т.д.Второй пакет цикла служит для измерения скорости процессора приобработке чисел с плавающей точкой. Он состоит из 14 программ на Си иФортране из различных прикладных областей: квантовая химия, оптика,робототехника, квантовая физика и т.д.
Результаты измерений производительности тестируемой ЭВМ на каждом тесте этих пакетах нормируется спроизводительностью эталонной ЭВМ (эталонная ЭВМ – все та же ЭВМVAX 11/780), они называются SPECint92 и SPECfp92. Эти безразмерныерейтинги есть среднее геометрическое 6 (14) результатов отношений производительности для каждого теста наборов, они характеризуют быстродействие ЭВМ при обработке целочисленных и вещественных данных.
Более поздние версии этих тестов называются SPECint95 и SPECfp95,SPECint2000 и SPECfp2000. Корпорация SPEC проводит работу по обеспечению тестирования многопроцессорных ЭВМ. Для широкого круга научных и инженерных расчетов данный рейтинг производительности признаннаиболее показательным, он является непременным параметром любогопроцессора.Пособие 17.09.0965Внедрение конвейерной обработки данных, позволившее получать результаты вычислений арифметических операций с плавающей точкой закаждый такт, выпуск многоядерных процессоров и мультипроцессорныхЭВМ, привели в настоящее время к использованию в качестве меры производительности ЭВМ скорость вычислений чисел с плавающей точкой. Сдругой стороны, так как для большинства вычислительных алгоритмов существуют оценки числа арифметических операций, необходимых для выполнения расчетов, данная мера и может служить тем показателем, которыйинтересует пользователей в первую очередь.
Такие измерения производятсямерой “Мегафлопс” – MFLPOPS (Million of Floating point Operation PerSecond) - миллион операций в секунду на данных с плавающей запятой,единица быстродействия ЭВМ на операциях с плавающей запятой. Соответственно, существуют единицы GFLPOPS (Гигафлопс) и ТFLPOPS (Терафлопс) т.д. Данный рейтинг широко используется для оценки пиковой иреальной производительности вычислительных систем.Примеры оценки производительности некоторых процессоров по тремописанным показателям.Процессор Itanium 2 с тактовой частотой в 1,3 – 1.5 ГГц может вырабатывать 4 флопа за такт, производительность по SPECint - 1322 и по SPECfp-2119.Процессор Alpha 21364 с тактовой частотой в 1,15 – 1.77 ГГц можетвырабатывать 4 флопа за такт, производительность по SPECint - 877 и поSPECfp -1482.Процессор AMD Opteron с тактовой частотой в 1,4 – 2 ГГц может вырабатывать 2 флопа за такт, производительность по SPECint - 1335 и поSPECfp -1339.Существуют и другие подходы к оценке производительности ЭВМ.
Помнению некоторых инженеров (фирма Sun) производительность процессоров следует оценивать в единицах количества выполняемых инструкций наодин ватт или на одну монтажную единицу (rack unit) стойки сервера.6.3. Измерение реальной производительностиИзмерения для получения реальной производительности вычислительных систем проводятся контрольными (тестовыми) программами при помощи эталона. Эталон - бенч-марк (Benchmark) это: стандарт, по которомумогут быть сделаны измерения или сравнения; или процедура, задача илитест, которые могут быть использованы для сравнения систем между собойили со стандартом, как в предыдущем пункте.Для повышения общности и представительности оценки производительности вычислительных систем контрольные, тестовые программы можно разделить на следующие группы.- Программы нижнего уровня.Эти программы тестируют основные машинные операции - +,/,* с учетом времени доступа к памяти, работы кэша, характеристик ввода/вывода.Пособие 17.09.0966- Ядра программ.Ядра программ - короткие характерные участки программ, например,Эймсовские ядра НАСА, синтетический тест Ветстоун (Whetstone), Ливерморские фортрановские циклы.Тексты Ливерморских циклов представляют собой 14 (малый пакет)или 24 (большой пакет) фрагментов реальных программ, эксплуатируемыхв Ливерморской Национальной Лаборатории им.