Параллельное программирование с использованием OpenMP. Антонов (2009) (Параллельное программирование с использованием OpenMP. Антонов (2009).pdf), страница 7
Описание файла
PDF-файл из архива "Параллельное программирование с использованием OpenMP. Антонов (2009).pdf", который расположен в категории "". Всё это находится в предмете "суперкомпьютерное моделирование и технологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
После завершения цикла значение итеративной переменной цикла не определено, если она не указана в опцииlastprivate.39Пример 18 демонстрирует использование директивы for (do). В последовательной области инициализируются три исходных массива A, B, C. В параллельной области данные массивы объявлены общими. Вспомогательные переменные i и n объявлены локальными.
Каждая нить присвоит переменной nсвой порядковый номер. Далее с помощью директивы for (do) определяетсяцикл, итерации которого будут распределены между существующими нитями. На каждой i-ой итерации данный цикл сложит i-ые элементы массивов Aи B и результат запишет в i-ый элемент массива C. Также на каждой итерации будет напечатан номер нити, выполнившей данную итерацию.#include <stdio.h>#include <omp.h>int main(int argc, char *argv[]){int A[10], B[10], C[10], i, n;/* Заполним исходные массивы */for (i=0; i<10; i++){ A[i]=i; B[i]=2*i; C[i]=0; }#pragma omp parallel shared(A, B, C) private(i, n){/* Получим номер текущей нити */n=omp_get_thread_num();#pragma omp forfor (i=0; i<10; i++){C[i]=A[i]+B[i];printf("Нить %d сложила элементы с номером %d\n",n, i);}}}Пример 18a.
Директива for на языке Си.40program example18binclude "omp_lib.h"integer A(10), B(10), C(10), i, nC Заполним исходные массивыdo i=1, 10A(i)=iB(i)=2*iC(i)=0end do!$omp parallel shared(A, B, C) private(i, n)C Получим номер текущей нитиn=omp_get_thread_num()!$omp dodo i=1, 10C(i)=A(i)+B(i)print *, "Нить ", n, " сложила элементы с номером ", iend do!$omp end parallelendПример 18b. Директива do на языке Фортран.В опции schedule параметр type задаёт следующий тип распределения итераций:• static – блочно-циклическое распределение итераций цикла; размерблока – chunk.
Первый блок из chunk итераций выполняет нулеваянить, второй блок — следующая и т.д. до последней нити, затем распределение снова начинается с нулевой нити. Если значение chunk неуказано, то всё множество итераций делится на непрерывные кускипримерно одинакового размера (конкретный способ зависит от реализации), и полученные порции итераций распределяются между нитями.• dynamic – динамическое распределение итераций с фиксированнымразмером блока: сначала каждая нить получает chunk итераций (поумолчанию chunk=1), та нить, которая заканчивает выполнение своейпорции итераций, получает первую свободную порцию из chunk итераций. Освободившиеся нити получают новые порции итераций до техпор, пока все порции не будут исчерпаны.
Последняя порция можетсодержать меньше итераций, чем все остальные.• guided – динамическое распределение итераций, при котором размерпорции уменьшается с некоторого начального значения до величиныchunk (по умолчанию chunk=1) пропорционально количеству ещё нераспределённых итераций, делённому на количество нитей, выполняющих цикл.
Размер первоначально выделяемого блока зависит отреализации. В ряде случаев такое распределение позволяет аккуратнее41разделить работу и сбалансировать загрузку нитей. Количество итераций в последней порции может оказаться меньше значения chunk.• auto – способ распределения итераций выбирается компилятороми/или системой выполнения. Параметр chunk при этом не задаётся.• runtime – способ распределения итераций выбирается во время работыпрограммы по значению переменной среды OMP_SCHEDULE. Параметрchunk при этом не задаётся.Пример 19 демонстрирует использование опции schedule с параметрами(static), (static, 1), (static, 2), (dynamic), (dynamic, 2), (guided),(guided, 2).
В параллельной области выполняется цикл, итерации которогобудут распределены между существующими нитями. На каждой итерациибудет напечатано, какая нить выполнила данную итерацию. В тело циклавставлена также задержка, имитирующая некоторые вычисления.#include <stdio.h>#include <omp.h>int main(int argc, char *argv[]){int i;#pragma omp parallel private(i){#pragma omp for schedule (static)//#pragma omp for schedule (static, 1)//#pragma omp for schedule (static, 2)//#pragma omp for schedule (dynamic)//#pragma omp for schedule (dynamic, 2)//#pragma omp for schedule (guided)//#pragma omp for schedule (guided, 2)for (i=0; i<10; i++){printf("Нить %d выполнила итерацию %d\n",omp_get_thread_num(), i);sleep(1);}}}Пример 19a. Опция schedule на языке Си.42program example19binclude "omp_lib.h"integer i!$omp parallel private(i)!$omp do schedule (static)C!$omp do schedule (static, 1)C!$omp do schedule (static, 2)C!$omp do schedule (dynamic)C!$omp do schedule (dynamic, 2)C!$omp do for schedule (guided)C!$omp do for schedule (guided, 2)do i=0, 9print *, "Нить ", omp_get_thread_num(),&" выполнила итерацию", icall sleep(1)end do!$omp end parallelendПример 19b.
Опция schedule на языке Фортран.Результаты выполнения примера 19 с различными типами распределенияитераций приведены в таблице 1. Столбцы соответствуют различным типамраспределений, а строки – номеру итерации. В ячейках таблицы указаны номера нити, выполнявшей соответствующую итерацию. Во всех случаях длявыполнения параллельного цикла использовалось 4 нити.
Для динамическихспособов распределения итераций (dynamic, guided) конкретное распределение между нитями может отличаться от запуска к запуску.static,1static,2dynamicdynamic,2guidedguided,20 00000001 01010202 02121113 13131314 10212125 11232226 22323337 23303038 30013009 3100330istaticТаблица 1. Распределение итераций по нитям.43В таблице 1 видна разница между распределением итераций при использовании различных вариантов. К наибольшему дисбалансу привели вариантыраспределения (static, 2), (dynamic, 2) и (guided, 2). Во всех этихслучаях одной из нитей достаётся на две итерации больше, чем остальным.
Вдругих случаях эта разница несколько сглаживается.Пример 20 демонстрирует использование опции schedule с параметрами(static, 6), (dynamic, 6), (guided, 6). В параллельной области выполняется цикл, итерации которого будут распределены между существующиминитями. На каждой итерации будет напечатано, какая нить выполнила данную итерацию. В тело цикла вставлена также задержка, имитирующая некоторые вычисления.#include <stdio.h>#include <omp.h>int main(int argc, char *argv[]){int i;#pragma omp parallel private(i){#pragma omp for schedule (static, 6)//#pragma omp for schedule (dynamic, 6)//#pragma omp for schedule (guided, 6)for (i=0; i<200; i++){printf("Нить %d выполнила итерацию %d\n",omp_get_thread_num(), i);sleep(1);}}}Пример 20a.
Опция schedule на языке Си.program example20binclude "omp_lib.h"integer i!$omp parallel private(i)!$omp do schedule (static, 6)C!$omp do schedule (dynamic, 6)C!$omp do schedule (guided, 6)do i=0, 200print *, "Нить ", omp_get_thread_num(),&" выполнила итерацию ", icall sleep(1)end do!$omp end parallelendПример 20b. Опция schedule на языке Фортран.44В результате выполнения примера 20 с тремя разными вариантами директивы for получаются следующие распределения итераций (рис. 1a – рис. 1c).Рис.1a.
Распределение итераций по нитям для (static, 6)Рис.1b. Распределение итераций по нитям для (dynamic, 6)45Рис.1c. Распределение итераций по нитям для (guided, 6)На рисунках видна регулярность распределения порций по 6 итераций приуказании (static, 6), более динамичная картина распределения таких жепорций при указании (dynamic, 6) и распределение уменьшающимися порциями при указании (guided, 6). В последнем случае размер порцийуменьшался с 24 в самом начале цикла до 6 в конце.Значение по умолчанию переменной OMP_SCHEDULE зависит от реализации.Если переменная задана неправильно, то поведение программы при заданииопции runtime также зависит от реализации.Задать значение переменной OMP_SCHEDULE в Linux в командной оболочкеbash можно при помощи команды следующего вида:export OMP_SCHEDULE="dynamic,1"Изменить значение переменной OMP_SCHEDULE из программы можно с помощью вызова функции omp_set_schedule().Си:void omp_set_schedule(omp_sched_t type, int chunk);46Фортран:subroutine omp_set_schedule(type, chunk)integer (kind=omp_sched_kind) typeinteger chunkДопустимые значения констант описаны в файле omp.h (omp_lib.h).
Какминимум, они должны включать для языка Си следующие варианты:typedef enum omp_sched_t {omp_sched_static = 1,omp_sched_dynamic = 2,omp_sched_guided = 3,omp_sched_auto = 4} omp_sched_t;Для языка Фортран должны быть заданы как минимум следующие варианты:integer(kind=omp_sched_kind),integer(kind=omp_sched_kind),integer(kind=omp_sched_kind),integer(kind=omp_sched_kind),parameterparameterparameterparameter::::::::omp_sched_static = 1omp_sched_dynamic = 2omp_sched_guided = 3omp_sched_auto = 4При помощи вызова функции omp_get_schedule() пользователь может узнать текущее значение переменной OMP_SCHEDULE.Си:void omp_get_schedule(omp_sched_t* type, int* chunk);Фортран:subroutine omp_get_schedule(type, chunk);integer (kind=omp_sched_kind) typeinteger chunkПри распараллеливании цикла программист должен убедиться в том, чтоитерации данного цикла не имеют информационных зависимостей [5].
Еслицикл не содержит зависимостей, его итерации можно выполнять в любом порядке, в том числе параллельно. Соблюдение этого важного требования компилятор не проверяет, вся ответственность лежит на программисте. Если датьуказание компилятору распараллелить цикл, содержащий зависимости, компилятор это сделает, но результат работы программы может оказаться некорректным.Параллельные секцииДиректива sections (sections ...