rtsIDr (1158449), страница 13
Текст из файла (страница 13)
*RedGroupRefPtr ссылка на редукционную группу.
Функция delrg_ уничтожает созданную функцией crtrg_ редукционную группу. После уничтожения группы ссылка на неё может использоваться по усмотрению пользовательской программы.
Редукционная группа может быть уничтожена функцией delrg_ только в том случае, если она была создана в текущей подзадаче и в текущем программном блоке (или его подблоке) (см. п. 8 и п. 10). Уничтожение группы, редукционные операции которой не завершены с помощью функции waitrd_, не допускается.
Если редукционная группа была создана функцией crtrg_ с ненулевым значением параметра *DelRedSignPtr, то при её уничтожении будут уничтожены и все включённые в неё редукционные переменные.
Редукционная группа может быть уничтожена также с помощью функции delobj_ (см.п.17.5).
Возвращается нулевое значение.
11.9Уничтожение редукционной переменной
long delred_ (RedRef *RedRefPtr);
*RedRefPtr ссылка на редукционную переменную.
Функция delred_ уничтожает созданную функцией crtred_ редукционную переменную (точнее, описывающий её объект). После уничтожения переменной ссылка на неё может использоваться по усмотрению пользовательской программы.
Редукционная переменная может быть уничтожена функцией delred_ только в том случае, если она была создана в текущей подзадаче и в текущем программном блоке (или его подблоке) (см. п. 8 и п. 10). Не допускается уничтожение переменной, принадлежащей редукционной группе, операции которой не завершены с помощью функции waitrd_.
Если уничтожаемая редукционная переменная включена в какую-либо редукционную группу, то она из состава этой группы исключается.
Редукционная переменная может быть уничтожена также с помощью функции delobj_ (см.п.17.5).
Возвращается нулевое значение.
11.10Поддержка асинхронной редукции при выполнении параллельного цикла
Выполнение всех редукционных операций редукционной группы осуществляется центральным процессором процессорной системы группы при вызове им функции waitrd_: центральный процессор дожидается поступления исходных значений редукционных переменных от всех других процессоров процессорной системы группы и, выполнив требуемые операции, отсылает им результирующие значения редукционных переменных.
Исходные значения редукционных переменных могут поступить на центральный процессор значительно раньше вызова им функции waitrd_. Поэтому в целях более полного совмещения обмена сообщениями с вычислениями система поддержки осуществляет попытки выполнения редукционных операций при обращении центрального процессора к функции dopl_ (до вызова им функции waitrd_).
Выполнение редукционных операций, опережающее обращение центрального процессора к функции waitrd_, организовано следующим образом.
Внутренние витки параллельного цикла разбиваются на порции (внутренние витки это витки, соответствующие внутренним элементам локальной части распределённого массива, по которому отображён цикл, см. п. 9.3). Число порций определяется значением параметра запуска системы поддержки InPLQNumber (целое число, большее единицы). Разбиение внутренних витков на порции достигается делением на min(InPLQNumber, PLAxisSize) частей измерения цикла с наименьшим номером, число координат витков в котором больше единицы (PLAxisSize число координат витков в таком измерении).
При выполнении центральным процессором функции dopl_, осуществляющей переход от одной порции витков к другой, система поддержки проверяет завершение приёма сообщений с исходными значениями редукционных переменных от всех остальных процессоров процессорной системы редукционной группы. Если все сообщения поступили, то выполняются все операции редукционной группы, а результирующие значения редукционных переменных записываются в память центрального процессора и рассылаются всем нецентральным.
Опережающее выполнение редукционных операций управляется параметром запуска системы поддержки dopl_WaitRD, которому могут быть присвоены значения:
| 0 | | не производить опережающего выполнения редукционных операций; |
| 1 | | осуществлять попытки опережающего выполнения редукционных операций при переходе от одной порции внутренних витков цикла к другой; |
| 2 | | осуществлять дополнительные попытки опережающего выполнения редукционных операций при переходе от вычисления экспортируемых элементов к первой порции внутренних витков или при переходе от последней порции внутренних витков к вычислению экспортируемых элементов (см. п. 9.3). |
Опережающее выполнение редукционных операций осуществляется для всех запущенных функцией strtrd_ редукционных групп.
Замечание. Разбиение внутренних витков параллельного цикла на порции осуществляется также с целью опроса завершения всех приёмов и передач сообщений при работе с системой передачи сообщений MPI: при ненулевом значении параметра запуска системы поддержки dopl_MPI_Test каждый вызов функции dopl_ сопровождается обращением к функции MPI_Test для каждого незавершённого обмена сообщением. Обращение к функции MPI_Test применяется для "подталкивания" асинхронной передачи сообщений, т. е. с целью лучшего совмещения обменов сообщениями с вычислениями (специфика MPI).
Если оба параметра dopl_WaitRD и dopl_MPI_Test равны нулю, то внутренние витки параллельных циклов на порции не разбиваются.
12Обмен границами распределенных массивов
Пусть локальная часть распределённого массива представлена совокупностью его элементов, определённой множеством индексных кортежей
{I1 M1: I1,нач ≤ I1 ≤ I1,кон } . . . {Im Mm: Im,нач ≤ Im ≤ Im,кон} . . .
{In Mn: In,нач ≤ In ≤ In,кон} ,
где:
| | | символ операции прямого произведения множеств; |
| n | | размерность массива; |
| Im | | индексная переменная по m-му измерению (1 ≤ m ≤ n); |
| Im,нач | | начальное значение индексной переменной по m-му измерению; |
| Im,кон | | конечное значение индексной переменной по m-му измерению; |
| Mm | | множество значений индексной переменной по измерению m. |
Будем предполагать, что локальная часть расположена полностью внутри массива (простоты ради). Тогда нижней границей локальной части распределённого массива по измерению k называется совокупность его элементов, определённая множеством индексных кортежей
LSBk =
| { I1 | M1 | : I1,нач | FS*LW1 | ≤ I1 | ≤ I1,кон | + FS*HW1 | } |
| Здесь: | LWi | | ширина нижней части границы по измерению i; |
| HWi | | ширина верхней части границы по измерению i (параметры LowShdWidthArray и HiShdWidthArray функций crtda_ , п.6, и inssh_ , п.12.2); | |
| FS | | признак полной границы (параметр *FullShdSignPtr функции inssh_, п.12.2). |
Аналогично, верхняя граница локальной части распределённого массива по измерению k определяется множеством индексных кортежей
HSBk =
| { I1 | M1 | : I1,нач | FS*LW1 | ≤ I1 | ≤ I1,кон | + FS*HW1 | } |
Нижняя (верхняя) граница по измерению k называется полной, если FS=1, или нижней (верхней) теневой гранью по измерению k, если FS=0. Объединение полных границ всех измерений называется полной границей локальной части распределённого массива:
|
| n | |















