Chapter_15 (1110567), страница 8
Текст из файла (страница 8)
Подчеркнём, что это именно операции не над целыми, а над вещественными числами, которые для компьютера значительно более трудоёмкие. Таким образом, для расчётанашего очень простого прогноза погоды необходима производительность компьютера в 100 Gflops(100 Гигафлоп). Заметим, что производительность мощных современных супер-ЭВМ составляет порядка десятков и сотен Терафлоп (1 Tflps = 1000 Gflps = 1012 flps).Например, производительность уже несколько устаревших суперкомпьютеров серии IBM BlueGene/L выпуска 2005 года оценивается примерно в 138 Tflps.
Это мощная вычислительная система,имеющая в своём составе 216 процессоров, которые, в принципе, могут параллельно решать одну иту же задачу. По состоянию на июнь 2008 года самым мощным суперкомпьютером считался гетерогенный (неоднородный) кластер Roadrunner фирмы IBM с производительностью 1026 Tflps. Этоткомпьютер состоит из 122400 ядер на базе процессоров PowerXCell 8i 3.2 Ghz, которые, собственно, ипроизводят вычисления, и 6562 двухядерных процессоров AMD Opteron DC 1.8 GHz, которые управ-1Данная классификация компьютеров предложена в 1966 году Майклом Флинном, мы привели её в несколько урезанном виде. У самого Флинна эта классификация более разветвлённая, в каждом классе выделяются свои подклассы по способам связи между собой элементов вычислительной системы и единицам обрабатываемых данных.18ляют всей работой и обеспечивают ввод/вывод.1 На конец 2009 года самым мощным суперкомпьютером считался Jaguar-Cray XT5-HE на базе микропроцессора Opteron Six Core 2.6GHz с общим количеством ядер 224162 и производительностью 1759 Tflps.Разумеется, ЭВМ этого класса выпускаются в единичных экземплярах по специальному заказу.Необходимо также учитывать, что такая высокая производительность достигается суперкомпьютерами только на специальных задачах, допускающих глубокое распараллеливание вычислений.
Привыполнении "обычных" программ производительность суперкомпьютеров может упасть в несколькотысяч и даже десятков тысяч раз.Вопросы и упражнения1.2.Что такое расслоение оперативной памяти и для чего оно нужно?Что такое память типа кэш и для чего она необходима? Почему эта память строится на схемахстатической, а не динамической памяти?Что такое конвейер центрального процессора и как он работает?Как будет работать конвейер, если в потоке выполняемых команд есть зависимость по данным?Нарисуйте новую схему работы конвейера (см. таблицу 15.1) для оптимизированного фрагмента этой программы (без зависимостей по данным) и убедитесь, что нам не будет пустых мест.Как обрабатываются на конвейере команды условных переходов?Почему работа конвейерной ЭВМ сильно замедляется при частых сигналах прерывания?Что представляет собой шина?Для чего нужен арбитр общей шины и как он работает?Какие достоинства и недостатки имеет архитектура связи центрального процессора с устройствами ввода/вывода при помощи общей шины?Что такое канал ввода/вывода?Что такое блокирующий и не блокирующий ввод/вывод?Для чего нужна многовходовая оперативная память?В чём главная идея архитектуры компьютеров с каналами ввода/вывода?За счёт чего достигается параллельная работа центрального процессора и устройств ввода/вывода?Когда может понадобиться синхронизовать работу центрального процессора и устройства ввода/вывода?Что означает, что в компьютере реализована схема МКМД обработки данных?Что такое векторная ЭВМ?3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.1Производительность ЭВМ часто оценивается с помощью так называемых тестов LINPACK.
Данные о500 самых мощных компьютерах по этой системе тестирования приведены, например, на сайтеhttp://www.top500.org..