Lect1_7_October_2011 (Лекции), страница 2
Описание файла
PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "суперкомпьютерные технологии" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Связан с 10-гигабитной сетью (в том случае, еслина карте имеется узел ввода-вывода)Double Hammer FPU SIMD инструкции могут выполнятьсяодновременно на двух FPU Параллельные операции load/store Данные должны быть выровнены по16-байтовой границе– Иначе производительность будетзначительно снижена– Даже хуже, чем при использованиитолько одного FPU Компилятор сможет сгенерироватьSIMD инструкции, только если данныев памяти расположены подряд (strideone access)– Хотя при более высоких (-O4, -O5)уровнях оптимизации компиляторпопытается сгенерировать SIMDинструкции и для данных,расположенных не подряд– -O3 –qarch=450d –qtune=45050BlueGene/P ПО (1) Linux® на узлах ввода\вывода MPI (MPICH2) и OpenMP (2.5) Стандартное семейство компиляторов IBMXL: XLC/C++, XLF Компиляторы GNU Система управления заданиямиLoadLeveler Файловая система GPFS Инженерная и научная библиотекаподпрограмм (ESSL)BlueGene/P ПО (2)• Compute Node Kernel (CNK)– Минимальное ядро – обработкасигналов, передача системныхвызовов к узлам ввода-вывода,старт-завершение задач, поддержканитей– “linux-подобная” ОС• Нет некоторых системных вызово (fork()в основном)– Ограниченная поддержка mmap(), execve()• Однако, большинство приложений,которые работают под Linux, портируютсяна BG/PКомпиляторы Blue Gene• IBM XL компиляторы (xlc, xlf77, xlf90)• работают на front end узлах– Fortran: mpixlf, mpixlf90, mpixlf95– C: mpixlc– C++: mpixlcxx• обычно являются скриптами• GNU компиляторы существуют, номалоэффективны: mpiccРежимы выполнения процессов всистеме Blue Gene/PSymmetrical Multiprocessing (SMP) Node Mode.Физический узел выполняет 1 MPI-процесс, внутрикоторого выполняются максимум 4 нити.mpirun ...
-mode smp ...Режимы выполнения процессов всистеме Blue Gene/PVirtual Node Mode (VN).На каждом физическом узле выполняются 4 MPI-процесса.Устанавливается по умолчанию в mpirunРежимы выполнения процессов всистеме Blue Gene/PDual Node Mode (DUAL).На одном физическом узле выполняются 2 MPI-процесса, у каждогоиз которых максимум по 2 нити (всего на одном узле выполняется неболее 4 нитей).mpirun ... -mode DUAL ...Mapping(распределение процессов по процессорам)По умолчанию распределение MPIпроцессов в системе Blue Gene/Pпроисходит в порядке XYZT,где <X, Y, Z> - координаты процессора вторе,T – номер ядра внутри процессора.Сначала увеличивается X-координата,затем Y, затем Z, затем T.Mappingmpirun в системе Blue Gene/P позволяет распределятьпроцессы двумя способами:с помощью аргумента командной строки–mapfile TXYZ (задаем порядок TXYZперестановки XYZT).илидругиесоздать свой map файл, указать в командной строке–mapfile my.map, где my.map – имя файла.Синтаксис файла распределения очень прост – четыре целыхчисла в каждой строке задают координаты для каждого MPIпроцесса (первая строка задает координаты для процесса сномером 0, вторая строка – для процесса с номером 1 и т.д.).Очень важно, чтобы этот файл задавал корректноераспределение, с однозначным соответствием между номеромпроцесса и координатами <X, Y, Z, T>.http://www.hpcwire.com/hpcwire/2011-1006/russia_seeks_rocket_simulation_system.htmlNews•••October 06, 2011Russia Seeks Rocket Simulation SystemThe business of testing rockets isn’t a cheap one, and Russian scientists are looking for lessexpensive, quicker ways to analyze new designs as they race toward space exploration goals.Modeling and simulation, which is used to model everything from car crashes to morestreamlined beer cans, is on the agenda as Russia looks to speed time to rocketdevelopment.Roscocosmos, the Russian state space organization, has published a tender for developmentof “manufacturing technology of a cluster compute system with hybrid architecture forimitational modeling of rocket and launchers’ real flight conditions,” reports CNews.According to the proposal, Russia is prepared to set aside around $1.74 million for the rockettesting cluster.Russian space officials claim they require a system to be capable of providing peakperformance of up to 10 teraflops, hold 20 GB RAM and offer 4000 GB of disk space.The tender goes on to note that the agency is looking for a contractor that can not onlydeliver this “manufacturing technology” but that can also provide a sample of such computesystem (with CPU, GPU architecture), which will be installed at other sites in the spaceagency’s network of research and development centers.Ссылки• http://www.ibm.com/servers/deepcomputing/bluegene.html• http://www3.ibm.com/systems/deepcomputing/bluegene/• IBM System Blue Gene Solution: BlueGene/P Application Development, SG247287-00http://www.research.ibm.com/journal/rd/521/tocpdf.html.