Главная » Просмотр файлов » В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (doc)

В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (doc) (1127760), страница 11

Файл №1127760 В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (doc) (В.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (doc)) 11 страницаВ.А. Фисун - Прикладное программирование в задачах математической физики. Архитектурные принципы построения ЭВМ (doc) (1127760) страница 112019-05-11СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 11)

В архитектуре ЕРIC, в отличие от RISC архитектуры, задача возможного статического распараллеливания программ возложена на компилятор. Компилятор оптимизирует выполнение программы целиком, а не отдельного ее фрагмента, который доступен процессору в случае аппаратного распараллеливания. Это позволяет упростить структуру процессора и, как следствие, добиться более высокой его производительности при меньшей степени сложности. Архитектура VLIW, подобно ЕРIC, представляет собой крайний случай использования статического параллелизма. Это эффективный способ поднять производительность, особенно если к ней добавить технологию суперскалярной организации вычислений, что и сделано в архитектуре ЕРIC.

5.4. Современные микропроцессоры.

Микропроцессор - производное от слов "микросхема" (“microchip”) и процессор ("processor"), это кремниевый кристалл - “чип”, на котором размещен центральный процессор (ЦПУ, CPU - Central Processor Unit). Его две основные компоненты: арифметико-логическое устройство (АЛУ, ALU – Arithmetic and Logic Unit), которое выполняет логические и арифметические операции, и устройство управления (УУ, CU – Control Unit). УУ извлекает команды из памяти, декодирует их и исполняет. На кристалле размещаются также регистры и кэш-память, а, иногда, и другие элементы оперативной памяти. Развитие технологии конструирования и производства элементов ЭВМ позволяет размещать на кристалле все больше и больше элементов, в частности, кэш память второго уровня.

Оперативное запоминающее устройство (ОЗУ, MM – Main Memory) – место хранения программ и данных размещается на другом кристалле, которое связано с микропроцессором “системной шиной”. Микропроцессор обычно называют просто “процессор”, а вместе с ОЗУ называют, иногда, “процессорным элементом”. Процессор в комплекте с внешними устройствами (массовая память, монитор, и т.д.) называется персональным компьютером (ПК).

Показано, что даже при предельной, пиковой работе микропроцессора задействуется не более 25% транзисторов на кристалле. Так на чипе EV78 процессора Alpha 21364 размещено 100 млн транзисторов, из которых 92 млн – кэш-память. Для увеличения нагрузки оборудованию на кристалле в микропроцессоры добавляют дополнительно отдельные процессоры для обработки данных. Наверное, первыми такими элементами стали сопроцессоры. Это арифметические конвейерные устройства для быстрой обработки векторных операндов (техника ММХ и SSE).

Развитие технологии обработки видеоинформации привело к появлению в составе оборудования микропроцессоров видеокарт, вычислительная мощность которых превосходит на векторной обработке производительность самого процессора.

В настоящее время активно реализуется многоядерная архитектура микропроцессоров, клонирование процессоров на одном кристалле. Многопроцессорные кристаллы (Chip MultiProcessor, CMP), двух-, четырех-ядерные процессоры позволяют значительно увеличить вычислительную производительность микропроцессоров, их используют в качестве процессорных элементов в современных мультисистемах. Двухъядерный (dial-core) процессор POWER4 корпорации IBM – это два микропроцессора с с индивидуальными кэшами первого уровня 2*64 Кбайт. На кристалле размещается также общая кеш-память второго уровня емкостью 1.4 Мбайт. Стоимость такого процессора значительно ниже, чем у двух процессоров, имеющих по одному ядру. Двухъядерные процессоры занимают меньше места, потребляют меньше энергии и рассеивают меньше тепла. Все ведущие разработчики микропроцессоров клонируют свои процессоры.

Другой тенденцией развития микропроцессорной архитектуры является стремление к достижению максимальной загрузки оборудования при мультипрограммной работе. Технология Hyper-Threading – (HT технология), разработанная корпорацией Intel, дает возможность одновременного выполнения сразу двух последовательностей команд или “потоков” на одном ядре, что повышает производительность микропроцессоров; в одной машине появляются два логических процессора. При одновременном выполнении двух потоков большую долю времени обычно занимает работа операционной системы для переключения задач. Разместив на кристалле механизмы аппаратной реализации алгоритмов ОС, которые в некоторых реализациях занимают всего 2% оборудования, можно получить ускорение счета на классе задач до 20%. Но следует иметь в виду, что выполняемые потоки – это разные задачи, для получения реального ускорения работы одного приложения необходимо распараллеливать исполняемую программу.

Обобщением такой схемы являются мультитредовые процессоры (MTA – MultiThrading Architecture). Грубая схема мультитредовых машин такова: размножаются только конвейеры команд, а остальные ресурсы машины (операционные устройства) предоставляются тредам по-очереди. В них допускается выполнение одновременно несколько тредов (потоков) – вычислительных процессов, называемых легковесными процессами. Треды, в отличие от настоящих вычислительных процессов (задач), выполняются в одном виртуальном адресном пространстве, поэтому переключение вычислений между тредами очень просто. Каждому треду выделяется собственный набор регистров, благодаря чему в процессе переключения между потоками команд не приходится тратить время на сохранение и восстановление состояния служебной информации.

Ресурсы машины выделяются динамически и они будут использоваться с полной загрузкой, если выполнение медленных инструкций потока будет прикрыто обслуживанием других потоков. Считается, что при такой организации вычислений все ресурсы машины будут работать с предельной производительностью. Здесь имеется полная аналогия с работой многозадачной ОС. Мультитредовая архитектура процессоров с одновременным выполнением тредов называется SMT (Simultaneous Mulni-Threading). Одной из первых разработок в этой области была машина МТА фирмы Tera. Имеются сообщения, что фирма Sun представит новую модификацию мультитредового процессора Niagara во второй половине 2008 г. Это процессор Rock, состоящий из четырех блоков, по четыре процессорных ядра в каждом. Каждое ядро Rock способно поддерживать одновременную работу двух потоков (всего 32 потока на процессор), кроме того, каждое ядро имеет собственный модуль для работы с вещественной арифметикой и графическими инструкциями. Каждая группа из четырех ядер будет обладать собственным кэшем первого уровня, 32 Кбайт для инструкций и 32 Кбайт для данных. Каждый из четырех кэшей второго уровня будет иметь емкость в 512 Кбайт.

Так как все современные суперскалярные процессоры содержат развитые механизмы обеспечения “параллелизма на уровне команд”, то оказалось, что реализация МТА, особенно в рамках технологии НТ, требует лишь относительно небольших аппаратных доработок. Поэтому, для многоядерных процессоров удвоение числа логических процессоров и, соответсвенно, увеличение пропускной способности процессора становится нормой. Многоядерные кристаллы и мультитредовые процессоры могут значительно увеличить производительность приложений, если последние были написаны с учетом особенностей их архитектуры.

5.5. Поставщики микропроцессоров

Главным поставщиком микропроцессоров на рынок многие годы была компания Intel c моделями х86, процессорами классической CISC архитектуры. Начиная с микропроцессора Pentium, который пришел на смену Intel486, данная архитектура приобрела имя IA32 (Intel Architectura 32-разрядная) и все черты современного вычислителя: суперскалярную архитектуру, раздельные кэш-памяти команд и данных, механизмы предсказания переходов. Однако эта классическая архитектура процессора с полным набором команд CISC служила тормозом для повышения производительности вычислений и фирма делает поворот при реализации микропроцессора Pentium шестого поколения - P6. Этот вычислитель Pentium Pro - процессор с подлинной RISC организацией, допускающий обработку программ IA32. Программа, состоящая из команд микропроцессоров IA32 архитектуры, поступает на один из трех параллельных декодеров ID микропроцессора и перекодируется в наборы внутренних микроопераций, команд RISC архитектуры. Далее, состав оборудования может использовать все достоинства работы с сокращенным набором команд. Эти работы обеспечивают возможность использования накопленного фонда программ для IA32. Для написания новых программ используются системы команд современных машин. Современные процессоры фирмы поддерживают архитектуру IA64 и имеют высокую производительность. Так процессор Pentium 4 (Xeon) работает на частоте 3,06 ГГц. Аналогичный эволюционный процесс происходил с фирмой конкурентом – с компанией AMD. Процессоры AMD Opteron с архитектурой IA64 также выходят на частоту в 3 ГГц.

Далее рассматриваются только две архитектуры из типовых архитектур RISC микропроцессоров (МП): SPARC, MIPS, PowerPC, PA-RISC, Alpha.

Фирма IBM разрабатывает семейство микропроцессоров Power РC (Performance Optimization With Enhanced Risc). МП семейства RS/600 использовались для комплектации супер-ЭВМ семейства PS. Суперкомпьютер Blue Gene/L, которой в ноябре 2006 года занимал в TОР 500 первую позицию, был укомплектован двухъядерными процессорами PowerРC 440. Данная супер-ЭВМ после модернизации остается самой мощной в мире, по крайней мере, до 2008 г.

Современный двухъядерный процессор POWER5 реализуется на кристалле площадью 389 кв. мм, он содержит 276 млн транзисторов. На кристалле размещается также общие для обоих ядер кэши 2 и 3 уровней объемом 1,874 и 36 Мбайт.

О проекте Alpha фирма DEC (Digital Equipment Corporation) объявила в 1989 г. Ранее фирма разработала и выпускала ЭВМ серии PDP (модель PDP-11 копировалась в СССР под именем СМ-1600), затем VAX. Первый процессор Alpha-21064 (21 – ХХI век, 0 – процессорное поколение, 64 - разрядность в битах) имел также кодовое имя EV-4 (EV - Extended VAX, 4 – поколение техпроцесса). Он состоял из 1.58 млн транзисторов, размещенных на 3-слойных платах толщиной 0.75 мкм. Тактовая частота – 200 МГц. Далее были реализации EV5, EV56, EV6, EV67, EV7, EV79, выполненные фирмой совместно, (а затем в роли филиала) с фирмами Mitsubishi, Samsung, Compad, Нewlett-Рackard (HP). Соответствующие архитектуры Alpha-21164, Alpha-21264, Alpha-21364 имели наилучшие характеристики среди аналогов по времени выпуска и технологического уровня производства. Процессоры Alpha считаются наиболее мощными. Так процессор Alpha 21164 (1994 г.) с тактовой частотой 300 МГц обеспечивал рекордную в то время производительность в 1200 MIPS, в 1999 г. процессор первым достиг частоты 1 ГГц. Фирма НР, последний приобретатель фирмы DEC и ее чипа Alpha, заявила, что EV7z (1.3 ГГц) будет последним в этом семействе. Однако фирма Compad собирается продолжить линию Alpha, в долгосрочных планах выпуск в 2012 г. кристалла EV12 по 0.03 мкм технологии, состоящего из 15 миллиардов транзисторов. Процессоры серии Alpha используются в качестве процессорных узлов фирмой Cray Research при создании своих супер-ЭВМ.

6. Глава 6

Производительность ЭВМ

6.1. Оценка вычислительных систем

При оценке вычислительных систем характеристики их производительности принято считать параметрами первого порядка. Одним из двух характеристических параметров первого порядка оценки производительности служит Rpeak – пиковая, предельная производительность вычислительной системы. Далее, по Р.Хокни, следует параметр N/2 (Nhalf), определяемый как длина вектора, при вычислении которого достигается половина предельной производительности. Однако, в настоящее время, в качестве второго характеристического параметра первого порядка принято считать Rmax – максимальная производительность вычислителя при решении задачи Linpack, более того, по этому параметру ранжируются рейтинги производительности высокопроизводительных вычислительных систем.

Данная оценка вычислительных систем показательна для использования ЭВМ в научных, инженерных расчетах и она имеет исторические корни. В те времена, когда ЭВМ были “большими” (БЭСМ-6), стационарными, они тиражировались малыми сериями и размещались в специальных помещениях, называемых Вычислительными Центрами (ВЦ). А в каждом ВЦ имелось подразделение, которое занималось распределением “машинного времени” между пользователями ЭВМ. Одним из стимулов развития методов дистанционного доступа в ЭВМ в США была необходимость оптимального использования вычислительных ресурсов с учетом часовых поясов страны. Главным, а часто и единственным, параметром оценки ЭВМ в те времена было число операций, команд, выполняемых в секунду машинного времени. Но и эти времена счета на оплату услуг ВЦ, учитывали, кроме ресурсов вычислителя (времени счета задачи в часах, минутах), другие услуги ВЦ: предоставление прикладного программного обеспечения, архивное хранение программ и данных и т.д. Некоторые задачи нуждались в гарантиях абсолютной надежности вычислений, другие – в выполнении в реальном времени. Производительность была главным, но не единственным, параметром оценки ЭВМ.

С появлением Персональных Компьютеров (ПК) области применения ЭВМ стали такими, что потребовалось изменить критерии оценки вычислительных систем. В самом деле, так ли необходимо пользователю (покупателю) ПК знать производительность оборудования при арифметических вычислениях или время счета одной из задач линейной алгебры. Ему сообщается в качестве главных параметров ПК тактовую частоту процессора, объем оперативной памяти, емкость диска, характеристики сопроцессоров. При детализации запросов учитывается возможность апгрейда, масштабирования, повышения производительности ПК путем замены отдельных блоков системы. Учитывается состав программного обеспечения, версия ОС, и т.д.

Поэтому, для оценки вычислительных систем, кроме оценки по производительности, разрабатываются методы оценки, интегрирующие также другие критерии оценки. Одним из таких подходов является метод экспертных оценок. Для класса вычислительного оборудования составляется список критериев оценки с их весовыми коэффициентами. Критериями оценки могут быть производительность, масштабируемость, цена, качество и состав комплектации, системное и прикладное программное обеспечение, сервисное обслуживание, надежность (отказоустойчивость) и т.д. Затем эксперты дают свою оценку по каждому критерию каждому из исследуемых вычислителей. Сумма экспертных баллов, умноженных на весовые коэффициенты, дает итоговую оценку вычислителя, по которой можно сравнивать оборудование данного класса. Данный метод используется в коммерческих проектах, однако широкому распространению таких методик препятствуют следующие обстоятельства. Список критериев и весовые коэффициенты существенно зависят от предметной области и пристрастия составителей методики. Трудно обеспечить также подбор объективных экспертов. Методы оценки производительности вычислительных систем разработаны детально и они дают такие объективные оценки, что общая оценка вычислителей только по этому критерию может быть достаточно презентативной для широких областей применения вычислителей.

6.2. Производительность вычислительных систем

Оценка производительности вычислительных систем имеет два аспекта: оценка пиковой производительности – номинального быстродействия системы, и получение оценок “реальной” производительности. Если номинальная (пиковая, предельная) оценка однозначно определяется техническими параметрами оборудования, то вторая характеристика указывает производительность системы в реальной среде применения. Такими средами могут быть конкретная задача (задачи), набор типовых задач, предметная область и т.д. Так, номинальные характеристики грузовика: максимальная скорость и грузоподъемность должны корректироваться при использовании грузовика в среде песчаных карьеров. Обычно рассматриваются три подхода к оценке производительности вычислительных систем: методами имитационного моделирования; на базе исследований аналитических моделей; эталонными измерениями.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6309
Авторов
на СтудИзбе
313
Средний доход
с одного платного файла
Обучение Подробнее