cdvmLDr (1158335), страница 2
Текст из файла (страница 2)
Замечание1. Массив процессоров описывается в Си как массив типа void*.
Замечание2. Чтобы программа компилировалась как последовательная в ней должно присутствовать определение:
#define NUMBER_OF_PROCESSORS() 1
Пример 3.1. Описание массивов виртуальных процессоров.
DVM(PROCESSORS) void *P[N];
DVM(PROCESSORS) void *Q[NUMBER_OF_PROCESSORS()],
*R[2][NUMBER_OF_PROCESSORS()/2];
В этом примере значение N должно быть равно значению функции NUMBER_OF_PROCESSORS ( ) и оба должны быть четными.
4Распределение данных
C-DVM поддерживает распределение блоками (равными и неравными) и распределение через выравнивание.
4.1Директивы DISTRIBUTE и REDISTRIBUTE
Синтаксис:
distribute-directive | ::= | DISTRIBUTE [ dist-directive-stuff ] |
redistribute-directive | ::= | REDISTRIBUTE |
distributee | ::= | array-name |
dist-directive-stuff | ::= | dist-format... [ dist-onto-clause ] |
dist-format | ::= | [BLOCK] |
dist-onto-clause | ::= | ONTO dist-target |
dist-target | ::= | processors-name [ section-subscript ]… |
section-subscript | ::= | [ subscript [ : subscript ] ] |
Ограничения:
-
Длина списка dist-format... должна быть равна количеству измерений массива. Т.е. для каждого измерения должен быть задан формат распределения.
-
Количество распределяемых измерений массива (формат не ‘[ ]’) не должно превышать количество измерений dist-target. По лишним измерениям dist-target (может быть, даже по всем, когда нет распределяемых измерений массива) данные размножаются.
-
Массив block-array-name в спецификации GENBLOCK, должен быть одномерным целочисленным массивом, размер которого равен размеру соответствующего измерения массива процессоров, а сумма значений его элементов равна размеру распределяемого измерения.
-
Отсутствие dist-directive-stuff допустимо только в директиве DISTRIBUTE. В этом случае распределяемый массив может использоваться только после выполнения директивы REDISTRIBUTE.
-
Спецификация ONTO указывает массив или секцию массива виртуальных процессоров. Если спецификация ONTO не указана, то распределение осуществляется по текущему массиву виртуальных процессоров.
-
Спецификация NEW в директиве REDISTRIBUTE означает, что содержимое массива копировать не нужно, оно будет заново вычисляться.
Рассмотрим форматы распределения для одного измерения массива (одномерный массив A[N]) и для одного измерения массива процессоров (одномерный массив R[P]). Многомерные распределения рассматриваются в разделе 4.1.4.
4.1.1Формат BLOCK
Измерение массива распределяются последовательно блоками по [N/P] элементов. Если размерность не делится нацело, то образуется один частично заполненный и, возможно, несколько пустых блоков.
Пример 4.1. Распределение по формату BLOCK.
A | B | C | ||||
R[0] | 0 | 0 | 0 | |||
1 | 1 | 1 | ||||
DVM(PROCESSORS) void * R[4]; | 2 | 2 | ||||
DVM(DISTRIBUTE [BLOCK] ONTO R) | 3 | |||||
float A [12], B[13], C[5]; | ||||||
R[1] | 3 | 4 | 2 | |||
4 | 5 | 3 | ||||
5 | 6 | |||||
7 | ||||||
R[2] | 6 | 8 | 4 | |||
7 | 9 | |||||
8 | 10 | |||||
11 | ||||||
R[3] | 9 | 12 | ||||
10 | ||||||
11 | ||||||
4.1.2Формат GENBLOCK
Распределение блоками разных размеров позволяет влиять на балансировку загрузки процессоров для алгоритмов, которые выполняют разное количество вычислений на различных участках области данных.
Пусть NB[P] - массив целых чисел. Следующая директива
DVM(DISTRIBUTE [ GENBLOCK(NB) ] ONTO R) float A[N];
разделяет массив A на P блоков. Блок i размера NB[i] распределяется на процессор R[i]. При этом должно выполняться равенство
P-1 | |
NB[ i ] = N | |
i=0 |
Пример 4.2. Распределение неравными блоками.
A | ||
R[0] | 0 | |
DVM(PROCESSORS) void * R[ 4]; | 1 | |
int BS[4]={2,4,4,2}; | ||
DVM(DISTRIBUTE [ GENBLOCK(BS)] ONTO R) | R[1] | 2 |
float A[12]; | 3 | |
4 | ||
5 | ||
R[2] | 6 | |
7 | ||
8 | ||
9 | ||
R[3] | 10 | |
11 | ||
4.1.3Формат WGTBLOCK
Формат WGTBLOCK определяет распределение блоками по их относительным «весам».
Пусть задан формат WGTBLOCK(WB, NBL).
WB(i) определяет вес i‑го блока для 0 i NBL-1. Блоки распределяются на P процессоров с балансировкой сумм весов блоков на каждом процессоре. При этом должно выполняться условие P NBL.
Определим вес процессора как сумму весов всех блоков, распределенных на него. Измерение массива распределяется пропорционально весам процессоров.
Формат BLOCK является частным случаем формата WGTBLOCK(WB,P), где WB(i) = 1 для 0 i P-1 и NBL = P.
Формат GENBLOCK с некоторой точностью является частным случаем формата WGTBLOCK.
Пример 4.2 можно переписать с использованием формата WGTBLOCK следующим образом.
Пример 4.3. Распределение блоками по весам.
DVM(PROCESSORS) void * R[ 4]; |
int WS[12]={2.,2.,1.,1.,1.,1.,1.,1.,1.,1.,2.,2.}; |
DVM(DISTRIBUTE [ WGTBLOCK(WS,12)] ONTO R) |
float A[12]; |
В примере 4.3 P = 4 и распределение идентично примеру 4.2.
В отличие от распределения неравными блоками, распределение по формату WGTBLOCK можно выполнить для любого числа процессоров в диапазоне 1 P NBL. Для данного примера размер массива процессоров R может меняться от 1 до 12.
4.1.4Формат []
Формат ‘[ ]’ означает, что измерение не распределяется, т.е. присутствует на каждом процессоре целиком.
4.1.5Многомерные распределения
При многомерных распределениях формат распределения указывается для каждого измерения. Между измерениями распределяемого массива и массива процессоров устанавливается следующее соответствие.
Пусть массив процессоров имеет n измерений. Пронумеруем измерения массива без формата ‘[ ]’ слева направо d1, ..., dk.. Тогда измерение di будет распределяться на i-ое измерение массива процессоров. При этом должно выполняться условие kn.
Пример 4.3. Одномерное распределение.
DVM(PROCESSORS) void R1[2]; | Блоки A | Процессоры | ||||
DVM(DISTRIBUTE [BLOCK][] ONTO R1) | 1 | 0 | 1 | |||
float A[100][100]; | 2 | 1 | 2 | |||
Пример 4.4. Двумерное распределение.
DVM(PROCESSORS) void *R2 [2][2]; | Блоки A | Процессоры | |||
0 | 1 | ||||
DVM(DISTRIBUTE [BLOCK][BLOCK] | 1 | 2 | 0 | 1 | 2 |
ONTO R2) float A[100][100]; | 3 | 4 | 1 | 3 | 4 |
4.2Многомерные динамические массивы
4.2.1Динамические массивы в языке Си
DVM-система имеет расширенные возможности работы с динамическими массивами. Она позволяет создавать многомерные массивы, размеры которых по всем измерениям определяются во время выполнения. (Язык Cи позволяет не определять статически только старшую размерность). Многомерные массивы разных размеров (а иногда и размерностей) можно передавать как параметры. В языке C-DVM предлагаются два способа работы с многомерными динамическими массивами. Первый основан на использовании многомерных массивов Cи. Второй состоит в моделировании многомерных массивов одномерными.
4.2.2Использование многомерных массивов Си
Предлагается следующая дисциплина описания, создания, уничтожения и использования элементов многомерных динамических массивов:
-
n-мерный массив описывается как указатель на (n-1)-мерные массивы:
elem_type (*arrid)[dim2]...[dimn];
В частности, одномерный массив описывается как указатель (на скаляры):
elem_type *arrid;
-
Создание массива выполняется оператором:
arrid = malloc ( dim1*dim2...*sizeof ( elem_type ));