cdvmLDr (1158335), страница 5
Текст из файла (страница 5)
DVM(ALIGN[I] WITH A[ I] ; SHADOW [1:2]) float B[100];
. . .
DVM(PARALLEL[I] ON A[I]; SHADOW_RENEW B)
DO(I,1, 97,1)
A[I] = (B[I-1] + B[I+1] + B[I+2]) / 3.;
При обновлении значений в теневых гранях используются максимальные размеры 1:2, заданные в директиве SHADOW.
Распределение и схема обновления теневых граней показана на рис.6.1.
P-1 | P | P+1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
V | V | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Рис.6.1. Распределение массива с теневыми гранями.
На каждом процессоре распределяются два буфера, которые являются непрерывным продолжением локальной секции массива. Левая теневая грань имеет размер в 1 элемент (для B[I-1]), правая теневая грань имеет размер в 2 элемента (для B[I+1] и B[I+2]). Если перед выполнением цикла произвести обмен между процессорами по схеме на рис.6.1, то цикл может выполняться на каждом процессоре без замены ссылок на массивы ссылками на буфер.
Для многомерных распределенных массивов теневые грани могут распределяться по каждому измерению. Особая ситуация возникает, когда необходимо обновлять "угол" теневых граней. В этом случае требуется указать дополнительный параметр CORNER.
Пример 6.2. Спецификация SHADOW-ссылок с угловыми элементами
DVM(DISTRIBUTE [BLOCK][BLOCK]) float A[100][100];
DVM(ALIGN [i][j] WITH A[i][j]) float B[100][100];
. . .
DVM(PARALLEL[I][J] ON A[I][J]; SHADOW_RENEW B CORNER)
DO( I, 1, 98, 1)
DO( J, 1, 98, 1)
A[I][J] = (B[I][J+1] + B[I+1][J] + B[I+1][J+1]) / 3.;
Теневые грани для массива В распределяются по умолчанию размером в 1 элемент по каждому измерению. Т.к. имеется удаленная "угловая" ссылка B[I+1][J+1], то указывается параметр CORNER.
| теневые грани | |||||||||
| пересылаемые значения | |||||||||
| внутренняя область | |||||||||
| угловые элементы |
Рис. 6.2. Схема локальной секции массива с теневыми гранями.
6.2.3Спецификация ACROSS зависимых ссылок типа SHADOW для одного цикла
Рассмотрим следующий цикл
DO(i, 1, N-2,1)
DO(j, 1, N-2,1)
A[i][j] =(A[i][j-1]+A[i][j+1]+A[i-1][j]+A[i+1][j])/4.;
Между витками цикла с индексами i1 и i2 ( i1<i2 ) существует зависимость по данным (информационная связь) массива A, если оба эти витка осуществляют обращение к одному элементу массива по схеме запись‑чтение или чтение‑запись.
Если виток i1 записывает значение, а виток i2 читает это значение, то между этими витками существует потоковая зависимость или просто зависимость i1 i2.
Если виток i1 читает “старое” значение, а виток i2 записывает “новое” значение, то между этими витками существует обратная зависимость i1 i2.
В обоих случаях виток i2 может выполняться только после витка i1.
Значение i2 - i1 называется диапазоном или длиной зависимости. Если для любого витка i существует зависимый виток i + d (d - константа), тогда зависимость называется регулярной или зависимостью с постоянной длиной.
Цикл с регулярными вычислениями, в котором существуют регулярные зависимости по распределенным массивам, можно распределять с помощью директивы PARALLEL, указывая спецификацию ACROSS.
across-clause | ::= ACROSS dependent-array... | |
dependent-array | ::= dist-array-name dependence... | |
dependence | ::= [ flow-dep-length : anti-dep-length ] | |
flow-dep-length | ::= int-constant | |
anti-dep-length | ::= int-constant |
В спецификации ACROSS перечисляются все распределенные массивы, по которым существует регулярная зависимость по данным. Для каждого измерения массива указывается длина прямой зависимости (flow-dep-length) и длина обратной зависимости (anti-dep-length). Нулевое значение длины зависимости означает отсутствие зависимости по данным.
Пример 6.3. Спецификация цикла с регулярной зависимостью по данным.
DVM(PARALLEL [i][j] ON A[i][j]; ACROSS A[1:1][1:1])
DO(i, 1, N-2, 1)
DO(j, 1, N-2, 1)
A[i][j]=(A[i][j-1]+A[i][j+1]+A[i-1][j]+A[i+1][j])/4.;
По каждому измерению массива А существует прямая и обратная зависимость длиной 1.
Спецификация ACROSS реализуется через теневые грани. Длина обратной зависимости определяет ширину обновления правой грани, а длина прямой зависимости – ширину обновления левой грани. Обновление значений правых граней производится перед выполнением цикла (как для директивы SHADOW_RENEW). Обновление левых граней производится во время выполнения цикла по мере вычисления значений удаленных данных. Это позволяет организовать так называемые волновые вычисления для многомерных массивов. Фактически, ACROSS-ссылки являются подмножеством SHADOW–ссылок, между которыми существует зависимость по данным.
6.2.4Асинхронная cпецификация независимых ссылок типа SHADOW
Обновление значений в теневых гранях, описанное в разделе 6.2.2, является неделимой (синхронной) операцией обмена для неименованной группы распределенных массивов. Эту операцию можно разделить на две операции:
-
запуск обмена,
-
ожидание значений.
На фоне ожидания значений теневых граней можно выполнять вычисления, в частности, вычисления на внутренней области локальной секции массива.
Асинхронное обновление теневых граней для именованной группы распределенных массивов описывается следующими директивами.
Создание группы.
shadow-group-directive | ::= CREATE_SHADOW_GROUP |
Запуск обновления теневых граней.
shadow-start-directive | ::= SHADOW_START shadow-group-name |
Ожидание значений теневых граней.
shadow-wait-directive | ::= SHADOW_WAIT shadow-group-name |
Директива SHADOW_START должна выполняться после директивы CREARE_SHADOW_GROUP. После выполнения директивы CREATE_SHADOW_GROUP директивы SHADOW_START и SHADOW_WAIT могут выполняться многократно. Новые значения в теневых гранях могут использоваться только после выполнения директивы SHADOW_WAIT.
Особым вариантом является использование директив SHADOW_START и SHADOW_WAIT в спецификации shadow-renew-clause параллельного цикла.
shadow-renew-clause | ::= . . . |
| shadow-start-directive | |
| shadow-wait-directive |
Если в спецификации указана директива SHADOW_START, то на каждом процессоре производится опережающее вычисление значений, пересылаемых в теневые грани других процессоров. После этого запускается обновление теневых граней и продолжается вычисление на внутренней области локальной секции массива (см. рис.6.2.).
Если в спецификации указана директива SHADOW_WAIT, то производится опережающее вычисление значений, не использующих значений из теневых граней. Остальные значения вычисляются только после завершения ожидания новых значений теневых граней.
Пример 6.4. Совмещение счета и обновления теневых граней.
DVM(DISTRIBUTE [BLOCK][BLOCK]) float C[100][100];
DVM(ALIGN[I][J] WITH C[I][J]) float A[100][100], B[100][100],
D[100][100];
DVM(SHADOW_GROUP) void *AB;
. . .
DVM(CREATE_SHADOW_GROUP AB: A B);
. . .
DVM(SHADOW_START AB);
. . .
DVM(PARALLEL[I][J] ON C[I][J]; SHADOW_WAIT AB)
DO( I, 1, 98, 1)
DO( J, 1, 98, 1)
{ C[I][J] = (A[I-1][J]+A[I+1][J]+A[I][J-1]+A[I][J+1])/4.;
D[I][J] = (B[I-1][J]+B[I+1][J]+B[I][J-1]+B[I][J+1])/4.;
}
Массивы A и B имеют теневые грани в 1 элемент по умолчанию. Ожидание завершения обновления теневых граней откладывается на возможно более позднее время, т.е. до того момента, когда без них уже нельзя продолжить вычисления.
6.3Удаленные ссылки типа REMOTE
6.3.1Директива REMOTE_ACCESS
Удаленные ссылки типа REMOTE специфицируются директивой REMOTE_ACCESS.
remote-access-directive | ::= REMOTE_ACCESS [ remote-group-name : ] regular-reference... |
regular-reference | ::= dist-array-name [ regular-subscript ]… |
regular-subscript | ::= [ int-expr ] |
| [ do-variable-use ] | |
| [] | |
remote-access-clause | ::= remote-access-directive |
Директива REMOTE_ACCESS может быть отдельной директивой (область действия - следующий оператор) или дополнительной спецификацией в директиве PARALLEL (область действия – тело параллельного цикла).