Спец часть (часть 3) (3 поток) (2015) (by Кибитова) (1161603), страница 46
Текст из файла (страница 46)
l. 120Если один из потоков параллельной области встречает другую директиву parallel, то он создаетновую группу потоков, согласно правилам, и становится основной нитью новой группы. l. 122Если выполнение потока аварийно прерывается внутри параллельной области, то такжепрерывается выполнение всех потоков во всех группах.
Порядок прерывания работы потоков неопределен. Вся работа, проделанная группой до последней барьерной синхронизации,гарантированно будет выполнена. Объем выполненной работы, проделанной каждым потокомпосле последней барьерной синхронизации, до аварийного завершения работы потоков неопределен. l.
124Все порождённые нити исполняют один и тот же код, соответствующий параллельной области.Предполагается, что в SMP-системе нити будут распределены по различным процессорам (однакоэто, как правило, находится в ведении операционной системы). l. 126Во время исполнения любой поток может приостоновить выполнение своей неявной задачи в точкепланирования задач (task scheduling point) и переключиться на выполнение любой явносгенерированной задачи прежде чем возобновить выполнение неявной задачи. l. 128Нить может узнать свой номер с помощью вызова библиотечной функцииomp_get_thread_num.
l. 130Очень часто параллельная область не содержит ничего, кроме конструкции разделения работы (т.е.конструкция разделения работы тесно вложена в параллельную область). В этом случае можноуказывать не две директивы, а указать одну комбинированную. l. 132Например, если внутри параллельной области содержится только один параллельный цикл илиодна конструкция sections, то можно использовать укороченную запись: parallel for или parallelsections. При этом допустимо указание всех опций этих директив, за исключением опции nowait.
l.134Ограничения для директивы parallel следующие:• Программа не должна зависеть от какого-либо порядка определения опций параллельнойдирективы, или от каких-либо побочных эффектов определения опций;• Только одна опция if может присутствовать в директиве;• Только одна опция num_threads может присутствовать в директиве. Выражение в опцииnum_threads должно быть целочисленным;• Бросок исключения выполненный внутри параллельной области должен вызывать обработкуисключения в рамках одной параллельной области, и той же нити, которая бросилаисключение.l.
143Директива forl. 145Если в параллельной области встретился оператор цикла, то, согласно общему правилу, он будетвыполнен всеми нитями текущей группы, то есть каждая нить выполнит все итерации данногоцикла. Для распределения итераций цикла между различными нитями можно использоватьдирективу for. l.
147#pragma omp for опция[[[,] опция] ... ]циклforl. 152Эта директива относится к идущему следом за данной директивой блоку, включающему операторfor. l. 154Возможные опции:• private (список) – задаёт список переменных, для которых порождается локальная копия вкаждой нити; начальное значение локальных копий переменных из списка не определено;• firstprivate (список) – задаёт список переменных, для которых порождается локальнаякопия в каждой нити; локальные копии переменных инициализируются значениями этихпеременных в нити-мастере;• lastprivate (список) – переменным, перечисленным в списке, присваивается результат споследнего витка цикла;• reduction (оператор:список) – задаёт оператор и список общих переменных; для каждойпеременной создаются локальные копии в каждой нити; локальные копииинициализируются соответственно типу оператора (для аддитивных операций – 0 или егоаналоги, для мультипликативных операций – 1 или её аналоги); над локальными копиямипеременных после завершения всех итераций цикла выполняется заданный оператор;оператор это: +, *, -, &, |, ^, &&, ||; порядок выполнения операторов неопределён, поэтому результат может отличаться от запуска к запуску;• schedule(type[, chunk]) – опция задаёт, каким образом итерации цикла распределяютсямежду нитями;• collapse(n) – опция указывает, что n последовательных тесновложенных цикловассоциируется с данной директивой; для циклов образуется общее пространство итераций,которое делится между нитями; если опция collapse не задана, то директива относитсятолько к одному непосредственно следующему за ней циклу;• ordered – опция, говорящая о том, что в цикле могут встречаться директивы ordered; в этомслучае определяется блок внутри тела цикла, который должен выполняться в том порядке, вкотором итерации идут в последовательном цикле;• nowait – в конце параллельного цикла происходит неявная барьерная синхронизацияпараллельно работающих нитей: их дальнейшее выполнение происходит только тогда, когдавсе они достигнут данной точки; если в подобной задержке нет необходимости, опцияnowait позволяет нитям, уже дошедшим до конца цикла, продолжить выполнение безсинхронизации с остальными.l.
167На вид параллельных циклов накладываются достаточно жёсткие ограничения. В частности,предполагается, что корректная программа не должна зависеть от того, какая именно нить какуюитерацию параллельного цикла выполнит. Нельзя использовать побочный выход из параллельногоцикла. Размер блока итераций, указанный в опции schedule, не должен изменяться в рамках цикла. l.169Эти требования введены для того, чтобы OpenMP мог при входе в цикл точно определить числоитераций.
Если директива параллельного выполнения стоит перед гнездом циклов, завершающихсяодним оператором, то директива действует только на самый внешний цикл. Итеративнаяпеременная распределяемого цикла по смыслу должна быть локальной, поэтому в случае, если онаспецифицирована общей, то она неявно делается локальной при входе в цикл.
После завершенияцикла значение итеративной переменной цикла не определено, если она не указана в опцииlastprivate. l. 171Следующий пример демонстрирует использование директивы for. В последовательной областиинициализируются три исходных массива A, B, C. В параллельной области данные массивыобъявлены общими. Вспомогательные переменные i и n объявлены локальными. Каждая нитьприсвоит переменной n свой порядковый номер. Далее с помощью директивы for определяетсяцикл, итерации которого будут распределены между существующими нитями. На каждой i-ойитерации данный цикл сложит i-ые элементы массивов A и B и результат запишет в i-ый элементмассива C.
Также на каждой итерации будет напечатан номер нити, выполнившей даннуюитерацию. l. 173#include <stdio.h>#include <omp.h>int main(int argc, char *argv[]){int A[10], B[10], C[10], i, n;// Заполним исходные массивыfor (i = 0; i < 10; i++){A[i] = i;B[i] = 2 * i;C[i] = 0;}#pragma omp parallel shared(A, B, C) private(i, n){// Получим номер текущей нитиn = omp_get_thread_num();#pragma omp forfor (i = 0; i < 10; i++){C[i] = A[i] + B[i];printf("Нить \%d сложила элементы с номером %d\n", n, i);}}}l.
203Директива singlel. 205Если в параллельной области какой-либо участок кода должен быть выполнен лишь один раз, тоего нужно выделить директивой single. l. 207#pragma omp single опция[ [[,] опция]...]структурированныйблокl. 212Возможные опции:• private (список) – задаёт список переменных, для которых порождается локальная копия вкаждой нити; начальное значение локальных копий переменных из списка не определено;• firstprivate (список) – задаёт список переменных, для которых порождается локальнаякопия в каждой нити; локальные копии переменных инициализируются значениями этихпеременных в нити-мастере;• copyprivate (список) – после выполнения нити, содержащей конструкцию single, новыезначения переменных списка будут доступны всем одноименным частным переменным(private и firstprivate), описанным в начале параллельной области и используемым всеми еёнитями; опция не может использоваться совместно с опцией nowait; переменные списка недолжны быть перечислены в опциях private и firstprivate данной директивы single;• nowait – после выполнения выделенного участка происходит неявная барьерная синхронизацияпараллельно работающих нитей: их дальнейшее выполнение происходит только тогда, когдавсе они достигнут данной точки; если в подобной задержке нет необходимости, опцияnowait позволяет нитям, уже дошедшим до конца участка, продолжить выполнение безсинхронизации с остальными.l.