Курс лекций (Аппаратное обеспечение)
Описание файла
Документ из архива "Курс лекций (Аппаратное обеспечение)", который расположен в категории "". Всё это находится в предмете "аппаратное обеспечение" из 8 семестр, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "аппаратное обеспечение" в общих файлах.
Онлайн просмотр документа "Курс лекций (Аппаратное обеспечение)"
Текст из документа "Курс лекций (Аппаратное обеспечение)"
11.02.05. Ошибка! Закладка не определена.
Назначение области применения. Способы оценки производительности МПС. 2
Отличительные особенности МПВС. 2
Единицы оценки производительности: 2
Условия предъявляемые к памяти. 2
Иерархия памяти. 2
Классификация многопроцессорных с-м. 2
Мультипроцессоры. 3
Мультикомпьютеры. 3
25.02.05. 2 лекция. 3
Примеры. 3
Массивно-параллельные процессоры класса SIMD (см 1 лекцию). 3
Разница между ILLIAC IV и СМ – 2, 3. 3
Построение с-мы связи между элементами. 3
С-ма с векторными процессорами класса SIMD. 4
С-ма MIMD. 4
Gray T3E (продавались в 90-х годах). 4
Кластерные с-мы. 4
Некоторые принципы построения коммуникационных сетей. 5
Мультипроцессоры. 5
Типовые решение для разгрузки памяти. 5
Протокол MESI. 5
Лекция 4. 6
Оценка производительности и зависимость производительности от числа процессоров. 6
Концепция GRID вычислений. 6
Обзор технологий //-го программирования. 6
Технология //-го программирования OpenMp. 7
Другая с-ма MPI (Message Passing Interface) – интерфейс и с-ма обмена сообщениями. 7
Лекция 5. 7
Расчёты надёжности аппаратных и программных средств. 7
Характеристики восстанавливаемых изделий. 8
Типовые способы повышения надёжности. 8
Информационное резервирование. 8
Временное резервирование. 8
Расчёт надёжности невосстанавливаемой аппаратуры. 8
Надёжностные схемы. 9
Расчёт надёжности восстанавливаемых с-м. 9
Методика расчёта надёжности восстанавливаемых систем. 9
Надёжность программного обеспечения. 10
Статистика причин обуславливающая ошибки ПО. 10
Расчёт надёжности ПО. 10
Модель Джелинского – Моранды. 10
Назначение области применения. Способы оценки производительности МПС.
1950 год, 1-я машина: производительность = 200 опер/сек. Задача обеспечить скорость расчёта: на уровне предприятия; ПЭВМ; сети, которые развиваются в сетевые технологии. Далее объединение в глобальные и корпоративные. Компьютерные технологии электронного товарооборота – хранение в сетевых хранилищах данных. Системы корпоративных глобальных отделений – общие хранилища данных, поддержка в постоянном рабочем состоянии, требовали мощных вычислительных машин (серверов), имели нес-ко процессоров.
Два направления высокопроизводительных систем:
1) Научные задачи с использованием сверх мощных ресурсов (Grant challenger) решаемых супер ЭВМ – многопроцессорный комплекс, для решения высокопроизводительных задач. 2) Распределённые вычисления (GRID) – большую вычислительную мощность обеспечивает большое число компьютеров, объединённых глобальной сетью.
Проблемы глобальных задач решений:
- предсказание погоды, климата, глобальных изменений в атмосфере;
- область структурной биологии и генетики (область, где моделируют цепочку генов);
- разработка фармацевтических препаратов;
- астрономия;
- управляемый термоядерный синтез;
- разведка недров на нефть и газ и т.д.
Отличительные особенности МПВС.
1) Высокая производительность – кол-во операций в единицу времени;
2) Это с-мы высокой надёжности (отказоустойчивые с-мы). Отказоустойчивость – это возможность функционирования ВС при отказе её отдельных компонентов (например, процессора).
Единицы оценки производительности:
Пиковая производительность; реальная производительность. Пиковая – величина равная произведению max производительности 1-го процессора на число процессоров в с-ме. Пример: дано 16 процессоров, за один такт выполняется одна операция, f = 1Ггц. Пиковая производительность? Решение: 1 такт: T = 1/f = 10-9c = 1нс. За секунду процессор совершает 109 операций. Если процессоры (16 шт) работают параллельно, то пиковая производительность = 16*109 опер/сек = MIPS (Million Instructions Per Second) = 16000 MIPS. Пиковая производительность современных высокопроизводительных ВС описывается тера MIPS. Тера = 1012 опер/сек. Но при выполнении операций происходит обращение к памяти и не могут работать все 16 процессоров. Здесь это не учтено, т.о. в действительности этого достичь нельзя.
Условия предъявляемые к памяти.
Память оказывает большое влияние на производительность. Условия предъявляемые к памяти:
- условие по быстродействию (чтобы память работала в те… в таком же процессоре) = 10Ггц;
- условие по объему памяти (ОС и оболочка должна содержаться и набор прикладных программ) = 10Гб.
- условия стоимости.
Иерархия памяти.
1. КЭШ – память: п/п память, обычно на статических триггерах. SRAM. Обеспечивает характеристики быстродействия f = 0,5 ÷ 2Ггц – дорогая (10$ за 1 Мб, примерно 1 – 4Мб делают её дорогой).
2. Оперативная (основная) память – п/п, на динамических элементах (отличие от статической – для 1 бита один интегральный тр-р, а в статической 1 упрощённый тригер), память весьма компактная и более дешёвая (от 0,1 – 1$ pf 1Мб), но медленнее чем КЭШ. Недостаток – после выключения ни чего не сохраняется. Рабочая частота – 0,1Ггц.
3. Внешняя память – винчестер – с использованием магнитных принципов данные сохраняются (энергонезависимая), дешевая (0,001$ - за 1 Мб), медленная (время доступа 10 мс).
Более реальные оценки производительности получают не умножая, а пропуская через с-му стандартные тесты (наборы задач). Прежде всего это наборы математических задач. Самые известные тесты – LINPACK – набор программ, предназначенных для решения с-м линейных алгебраических ур-ний. По тестам LINPACK создаётся список самых производительных компьютеров (Top 500) (сайт: www.parallel.ru – сайт МГУ). LINPACK имеет особенность разделения работы на все процессоры.
Тест Ливерморские циклы – набор задач, где чередуются и математические задачи и мультимедийные задачи.
Пакет NAS Parallel Benchmark.
Результаты: Flops – число операций с плавающей точкой, производимых компьютером за 1 сек. Flops – floating point per second. Производительность оценивается в MFlop, FFlop, а лучше всего TopsFlop.
Классификация многопроцессорных с-м.
Классификация предложена Флинном. Классифицировать в зависимости от того, как организованы потоки данных и команд. Выделяют всего 4 Флинн с-м.
1. SISD (Single Instruction Single Date) – имеет один поток команд и один поток данных.
Поток команд дешифрируется и разбивается на части.
2. SIMD (Single Instruction Multiple Date) – с-мы, в которых один поток инструкций управляет несколькими потоками данных (рис*). Здесь удобно обрабатывать данные типа векторов.
3. MISD (Multiple Instruction Single Date) – множество потоков команд обрабатывает один поток данных (такие с-мы сейчас не известны).
4. MIMD – много потоков команд обрабатывает много потоков данных.
Память может быть разделена каким-то образом.
Классы | SISD | SIMD | MISD | MIMD | ||
Подклассы | ПЭВМ, не расширяется | С-мы с векторными процессорами (для решения задач линейной алгебры) | Массивно-параллельный процессор (множество АЛУ работают под управлением одного УУ) МРР | Не расширяется, пустой класс | Подкласс мультипроцессоров (т.е. с-ма, где обмен данными между процессорами в основном идёт через память) | Мульти - компьютеры – нет общей памяти, есть локальная память |
Мульти - компьютеры – имеют с-му связи и связные процессоры. Подклассы делятся на некоторые типы с-м.
Мультипроцессоры.
И меют строго общую память и строго общие шины. Все обмены между процессорами идут через память SMP (Segmenting Multi Processor) – с-мы с единым доступом к памяти (UMA – Unifom Memory Access).
Мультипроцессор с локальной памятью (ЛП). ЛП содержит оттиски общей памяти (копии страниц). В ЛП должны быть те же данные, что и в ОП. Память с быстрым доступом. NUMA с-мы – с неоднородным доступом к памяти.
Мультикомпьютеры.
Существуют две подгруппы – кластеры; массивно-параллельные процессоры (МРР). МРР с-мы состоят из массивов одинаковых обрабатывающих элементов (процессор плюс память), работающий каждый по своей программе и объединённых сетью связей. Это однородная с-ма (много процессоров и одна сеть связи). Кластеры – с-ма многоуровневая, на каждом уровне есть набор обрабатывающих устройств и своя сеть связи.
Пример: Симметричные вычисления и общая сеть связи. 1 уровень кластера (SRM с-ма); 2 уровень – сеть связи; 3 уровень – сеть общая. Сетевые средства на каждом уровне выбирают свои, с-ма неоднородная, но более распространённая (кластеры).
25.02.05. 2 лекция.
Если необходимо достичь производительности в 1000 ГГц, а текущие процессоры имеют производительность 3 ГГц. света в вакууме = 30 см/нс. В медных проводах 20 см/нс. При 3 ГГц, то свет может пробежать 6 см за один такт. Если будет 100 ГГц, то расстояние, которое электромагнитная волна пробежит за 1 такт 2 мм (характерный размер проца).
М ногопроцессорная с-ма подразумевает // - ную работу нес-ких процессоров. (на персоналке) однопроцессорная с-ма.
ИГ (информационный граф).
Тs – последовательное; Тр – параллельное; S + P = 1. (S, P - доли). Тогда общее время на // - ой машине Т=Тs+Тр = (S + P/N)T0 (N - кол-во процессоров). Пусть на обычном последовательном компьютере операция выполняется за время Т0. k – коэффициент ускорения вычислений. , при увеличении N, коэффициент ускорения не может быть больше S, т.е. при N k = S (S – доля операций) – закон Амдала.
Примеры.
Массивно-параллельные процессоры класса SIMD (см 1 лекцию).
И меет одно управляющее устройство и много исполняющих.
Т.к. данные между исполнительными элементами нужно передавать….
Идея таких с-м родилась давно. И первая с-ма, построенная по этому принципу 30 лет назад. Пример: ILLIAC IV – для космических исследований в США, СМ – 2, 3 (коммерческие проекты). Предназначена для узкого круга задач, связанных с физическим моделированием полей. ПЭ – процессорный элемент, МП – модуль памяти.
Разница между ILLIAC IV и СМ – 2, 3.
В СМ – 2, 3 использовался более простой ПЭ. ПЭ – АЛУ для обработки одного двоичного разряда. В ILLIAC IV в качестве ПЭ использовался 16-ти разрядный процессор с большим кол-вом команд.
Построение с-мы связи между элементами.
1. Связь по кольцу плюс одномерная с-ма связи. Если передач данных не много, то данный вариант удовлетворяет запросы.
2. Решетка – двумерная с-ма. Больше связей, чем у кольца, но и связываться становится легче, т.к. число процессоров которое придётся потревожить пропорционально N (а у кольца N).
3. Гипер куб. Одноименные вершины объединяются связями между собой. Характеризуется характерным соотношением числа связей Log2N.
С-ма с векторными процессорами класса SIMD.
Вектор длинный набор данных, состоящий из отдельных координат. Все составляющие вектора обрабатываются одинаково по одной команде. Представители Gray – 1 (1976г) (Семуэль Крэй). Японцы в 2003 г. закончили работу над с-мой «The Earth Simulator» он состоял из 640 вычислительных узлов, в каждом из которых по 8 процессоров.
G ray C90 (эталон построения векторных с-м) выпускалась на рубеже 80х – 90х годов. Все процессоры объединяются ОП. Секция ввода/вывода отвечает за взаимодействие с внешними устройствами. Память делят на отдельные секции и отдельные банки. В ОП всего выделяют 1024 банка и последовательные слова размещают по банкам с чередованием банков. При считывании возможно обращение к банкам т.е. ко второй, до завершения работы с первой. Данный процесс приводит к ускорению ОП. Все взаимодействия с данными замыкается на ОП. Все взаимодействия с командами замыкается на секции процессорного взаимодействия.