В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (pdf) (1127762), страница 17
Текст из файла (страница 17)
Поэтому, для многоядерных процессоров удвоение числа логических процессоров и, соответсвенно, увеличение пропускной способности процессора становится нормой. Многоядерные кристаллы и мультитредовые процессоры могут значительно увеличить производительность приложений, если последние были написаны с учетом особенностей их архитектуры.5.5. Поставщики микропроцессоровГлавным поставщиком микропроцессоров на рынок многие годы былакомпания Intel c моделями х86, процессорами классической CISC архитектуры.
Начиная с микропроцессора Pentium, который пришел на сменуIntel486, данная архитектура приобрела имя IA32 (Intel Architectura 32разрядная) и все черты современного вычислителя: суперскалярную архитектуру, раздельные кэш-памяти команд и данных, механизмы предсказания переходов.
Однако эта классическая архитектура процессора с полнымнабором команд CISC служила тормозом для повышения производительности вычислений и фирма делает поворот при реализации микропроцессораPentium шестого поколения - P6. Этот вычислитель Pentium Pro - процессорс подлинной RISC организацией, допускающий обработку программ IA32.Программа, состоящая из команд микропроцессоров IA32 архитектуры,поступает на один из трех параллельных декодеров ID микропроцессора иперекодируется в наборы внутренних микроопераций, команд RISC архитектуры. Далее, состав оборудования может использовать все достоинстваработы с сокращенным набором команд. Эти работы обеспечивают возможность использования накопленного фонда программ для IA32. Для написания новых программ используются системы команд современных машин.
Современные процессоры фирмы поддерживают архитектуру IA64 иимеют высокую производительность. Так процессор Pentium 4 (Xeon) работает на частоте 3,06 ГГц. Аналогичный эволюционный процесс происходилс фирмой конкурентом – с компанией AMD. Процессоры AMD Opteron сархитектурой IA64 также выходят на частоту в 3 ГГц.Далее рассматриваются только две архитектуры из типовых архитектур RISC микропроцессоров (МП): SPARC, MIPS, PowerPC, PA-RISC,Alpha.Фирма IBM разрабатывает семейство микропроцессоров Power РC(Performance Optimization With Enhanced Risc).
МП семейства RS/600 использовались для комплектации супер-ЭВМ семейства PS. Суперкомпьютер Blue Gene/L, которой в ноябре 2006 года занимал в TОР 500 первую позицию, был укомплектован двухъядерными процессорами PowerРC 440.Данная супер-ЭВМ после модернизации остается самой мощной в мире, покрайней мере, до 2008 г.Пособие 17.09.0960Современный двухъядерный процессор POWER5 реализуется на кристалле площадью 389 кв. мм, он содержит 276 млн транзисторов.
На кристалле размещается также общие для обоих ядер кэши 2 и 3 уровней объемом 1,874 и 36 Мбайт.О проекте Alpha фирма DEC (Digital Equipment Corporation) объявила в1989 г. Ранее фирма разработала и выпускала ЭВМ серии PDP (модель PDP11 копировалась в СССР под именем СМ-1600), затем VAX. Первый процессор Alpha-21064 (21 – ХХI век, 0 – процессорное поколение, 64 - разрядность в битах) имел также кодовое имя EV-4 (EV - Extended VAX, 4 –поколение техпроцесса).
Он состоял из 1.58 млн транзисторов, размещенных на 3-слойных платах толщиной 0.75 мкм. Тактовая частота – 200 МГц.Далее были реализации EV5, EV56, EV6, EV67, EV7, EV79, выполненныефирмой совместно, (а затем в роли филиала) с фирмами Mitsubishi,Samsung, Compad, Нewlett-Рackard (HP). Соответствующие архитектуры Alpha-21164, Alpha-21264, Alpha-21364 имели наилучшие характеристики среди аналогов по времени выпуска и технологического уровня производства.Процессоры Alpha считаются наиболее мощными. Так процессор Alpha21164 (1994 г.) с тактовой частотой 300 МГц обеспечивал рекордную в товремя производительность в 1200 MIPS, в 1999 г. процессор первым достигчастоты 1 ГГц. Фирма НР, последний приобретатель фирмы DEC и ее чипаAlpha, заявила, что EV7z (1.3 ГГц) будет последним в этом семействе.
Однако фирма Compad собирается продолжить линию Alpha, в долгосрочныхпланах выпуск в 2012 г. кристалла EV12 по 0.03 мкм технологии, состоящего из 15 миллиардов транзисторов. Процессоры серии Alpha используются вкачестве процессорных узлов фирмой Cray Research при создании своих супер-ЭВМ.6. Глава 6Производительность ЭВМ6.1. Оценка вычислительных системПри оценке вычислительных систем характеристики их производительности принято считать параметрами первого порядка. Одним из двуххарактеристических параметров первого порядка оценки производительности служит Rpeak – пиковая, предельная производительность вычислительной системы. Далее, по Р.Хокни, следует параметр N/2 (Nhalf), определяемый как длина вектора, при вычислении которого достигается половинапредельной производительности. Однако, в настоящее время, в качествевторого характеристического параметра первого порядка принято считатьRmax – максимальная производительность вычислителя при решении задачи Linpack, более того, по этому параметру ранжируются рейтинги производительности высокопроизводительных вычислительных систем.Данная оценка вычислительных систем показательна для использования ЭВМ в научных, инженерных расчетах и она имеет исторические корни.
В те времена, когда ЭВМ были “большими” (БЭСМ-6), стационарными,Пособие 17.09.0961они тиражировались малыми сериями и размещались в специальных помещениях, называемых Вычислительными Центрами (ВЦ). А в каждом ВЦимелось подразделение, которое занималось распределением “машинноговремени” между пользователями ЭВМ. Одним из стимулов развития методов дистанционного доступа в ЭВМ в США была необходимость оптимального использования вычислительных ресурсов с учетом часовых поясов страны.
Главным, а часто и единственным, параметром оценки ЭВМ вте времена было число операций, команд, выполняемых в секунду машинного времени. Но и эти времена счета на оплату услуг ВЦ, учитывали, кроме ресурсов вычислителя (времени счета задачи в часах, минутах), другиеуслуги ВЦ: предоставление прикладного программного обеспечения, архивное хранение программ и данных и т.д. Некоторые задачи нуждались вгарантиях абсолютной надежности вычислений, другие – в выполнении вреальном времени. Производительность была главным, но не единственным, параметром оценки ЭВМ.С появлением Персональных Компьютеров (ПК) области примененияЭВМ стали такими, что потребовалось изменить критерии оценки вычислительных систем. В самом деле, так ли необходимо пользователю (покупателю) ПК знать производительность оборудования при арифметическихвычислениях или время счета одной из задач линейной алгебры.
Ему сообщается в качестве главных параметров ПК тактовую частоту процессора,объем оперативной памяти, емкость диска, характеристики сопроцессоров.При детализации запросов учитывается возможность апгрейда, масштабирования, повышения производительности ПК путем замены отдельных блоков системы. Учитывается состав программного обеспечения, версия ОС, ит.д.Поэтому, для оценки вычислительных систем, кроме оценки по производительности, разрабатываются методы оценки, интегрирующие также другие критерии оценки.
Одним из таких подходов является метод экспертныхоценок. Для класса вычислительного оборудования составляется списоккритериев оценки с их весовыми коэффициентами. Критериями оценки могут быть производительность, масштабируемость, цена, качество и составкомплектации, системное и прикладное программное обеспечение, сервисное обслуживание, надежность (отказоустойчивость) и т.д. Затем экспертыдают свою оценку по каждому критерию каждому из исследуемых вычислителей.
Сумма экспертных баллов, умноженных на весовые коэффициенты,дает итоговую оценку вычислителя, по которой можно сравнивать оборудование данного класса. Данный метод используется в коммерческих проектах, однако широкому распространению таких методик препятствуют следующие обстоятельства. Список критериев и весовые коэффициенты существенно зависят от предметной области и пристрастия составителей методики.
Трудно обеспечить также подбор объективных экспертов. Методы оценки производительности вычислительных систем разработаны детально и онидают такие объективные оценки, что общая оценка вычислителей только поПособие 17.09.0962этому критерию может быть достаточно презентативной для широких областей применения вычислителей.6.2. Производительность вычислительных системОценка производительности вычислительных систем имеет два аспекта: оценка пиковой производительности – номинального быстродействиясистемы, и получение оценок “реальной” производительности. Если номинальная (пиковая, предельная) оценка однозначно определяется техническими параметрами оборудования, то вторая характеристика указываетпроизводительность системы в реальной среде применения. Такими средами могут быть конкретная задача (задачи), набор типовых задач, предметная область и т.д.
Так, номинальные характеристики грузовика: максимальная скорость и грузоподъемность должны корректироваться при использовании грузовика в среде песчаных карьеров. Обычно рассматриваются триподхода к оценке производительности вычислительных систем: методамиимитационного моделирования; на базе исследований аналитических моделей; эталонными измерениями.Имитационное моделирование используется для оценки производительности систем, когда невозможно проведение натурных испытаний оборудования, а погрешности аналитических моделей при учете архитектурных особенностей оборудования не устраивают исследователей. Применяется для оценки производительности проектируемых систем. Чаще всего,имитационная модель с нужной степенью детализации создается для проверки архитектурных решений и логических схем проектируемых систем иоценка производительности при этом может быть не главной целью создания модели.Особым случаем имитационного моделирования является “эмуляция”,это процесс обеспечения точного воспроизведения работы одного вычислителя на другом вычислительном оборудовании.
Служит для обеспеченияэксплуатации накопленного фонда алгоритмов и программ ЭВМ при сменепоколений вычислителей.Аналитические методы исследования производительности ЭВМ рассматриваются на примере измерения производительности микропроцессоров. На основании данных о технических параметрах вычислителя, и егоподсистем можно составить модель виртуального вычислителя и по нейоценить производительность исследуемого вычислителя.
Пусть известнатолько тактовая частота ЭВМ. Тогда, учитывая тот факт, что ни одно вычислительное действие не может быть выполнено быстрее, чем за времятактового цикла, то по значению тактовой частоты можно оценивать предельную производительность этого вычислителя. Если ЭВМ - скалярныймикропроцессор и о нем известно, что каждый конвейерный этап УУ иАЛУ выполняется за один такт, а тактовая частота составляет 100 МГц, томожно предположить, что результаты выполнения последовательностиарифметических операций будут вырабатываться каждые 10 нс, а скоростьПособие 17.09.0963выполнения команд будет равна миллиону команд в секунду.