fdvmLDr (1158421), страница 4
Текст из файла (страница 4)
END
SUBROUTINE SUB1(A, N, B, M)
DIMENSION A(N , N), B(M , M)
CDVM$ DISTRIBUTE *(BLOCK , BLOCK) :: A, B
. . .
END
FUNCTION ALLOCATE(DESC, P)
INTEGER DESC(2), P
ALLOCATE = P
END
Другие примеры распределения динамических массивов см. в разделе 7.7.
4.3. Распределение через выравнивание
Выравнивание массива А на распределенный массив В ставит в соответствие каждому элементу массива А элемент или секцию массива В. При распределении массива В одновременно будет распределяться массив А. Если на данный процессор распределен элемент В, то на этот же процессор будет распределен элемент массива А, поставленный в соответствие выравниванием.
Метод распределения через выравнивание выполняет следующие две функции.
-
Одинаковое распределение массивов одной формы на один массив процессоров не всегда гарантирует, что соответствующие элементы будут размещены на одном процессоре. Это вынуждает специфицировать удаленный доступ (см. Раздел 6.) там, где его возможно нет. Гарантию размещения на одном процессоре дает только выравнивание соответствующих элементов массивов.
-
На один массив может быть выровнено несколько массивов. Изменение распределения одного массива директивой REDISTRIBUTE вызовет соответствующее изменение распределения группы массивов.
4.3.1. Директивы ALIGN и REALIGN
Выравнивание массива описывается следующими директивами:
| align-directive | is align-action alignee align-directive-stuff |
| or align-action [ align-directive-stuff ] :: alignee‑list | |
| align-action | is ALIGN |
| or REALIGN | |
| align-directive-stuff | is ( align-source-list ) align-with-clause |
| alignee | is array-name |
| align-source | is * |
| or align-dummy |
| align-dummy | is scalar-int-variable |
| align-with-clause | is WITH align-spec |
| align-spec | is align-target ( align-subscript-list ) |
| align-target | is array-name |
| or template-name |
| align-subscript | is int-expr |
| or align-dummy-use | |
| or * |
| align-dummy-use | is [ primary-expr * ] align‑dummy [ add-op primary-expr ] |
| primary-expr | is int-constant |
| or int-variable | |
| or ( int-expr ) | |
| add-op | is + |
| or - |
Ограничения:
-
Длина списка align-source-list должна быть равна количеству измерений выравниваемого массива.
-
Длина списка align-subscript-list должна быть равна количеству измерений базового массива align-target.
-
Директива REALIGN может применяться только к массивам со спецификацией DYNAMIC.
-
Отсутствие align-directive-stuff допустимо только в директиве ALIGN. В этом случае распределяемый массив может использоваться только после выполнения директивы REALIGN.
Пусть задано выравнивание двух массивов с помощью директивы
CDVM$ ALIGN A(d1, ,dn) WITH B(ard1, ,ardm)
где di - спецификация i-го измерения выравниваемого массива А,
ardj - спецификация j-го измерения базового массива В,
Если di задано целочисленной переменной I , то обязательно должно существовать одно и только одно измерение массива В , специфицированное линейной функцией ardj = a*I + b. Следовательно, количество измерений массива А, специфицированных идентификаторами (align-dummy) должно быть равно количеству измерений массива В, специфицированных линейной функцией.
Пусть i-ое измерение массива А имеет границы LAi : HAi , а j-ое измерение массива В, специфицированное линейной функцией a*I + b , имеет границы LBj : HBj Т.к. параметр I определен над множеством значений LAi : HAi , то должны выполняться следующие условия
a*LAi + b LBj , а* HAi + b HBj
Если di = * , то i-ое измерение массива А будет локальным на каждом процессоре при любом распределении массива В (аналог локального измерения в директиве DISTRIBUTE ).
Если ardi = * , то массив А будет размножен по j-му измерению массива В (аналог частичного размножения по массиву процессоров).
Если ardi = int-expr, то массив А выравнивается на секцию массива В.
Пример 4.7. Выравнивание массивов
REAL A(10), B(10,10), C(22,22), D(20), E(20), F(10), G(20), H(10,10)
CDVM$ DISTRIBUTE B ( BLOCK , BLOCK )
CDVM$ DISTRIBUTE D ( BLOCK )
C выравнивание на секцию массива (вектор на первую строку матрицы А)
CDVM$ ALIGN A( I ) WITH B( 1, I )
С размножение вектора - выравнивание на каждую строку
CDVM$ ALIGN F( I ) WITH B( *, I )
С сжатие матрицы - столбец матрицы соответствует элементу вектора
CDVM$ ALIGN C( *, I ) WITH D( I )
С выравнивание вектора на вектор с раздвижкой
CDVM$ ALIGN E( I ) WITH D( 2*I )
С выравнивание вектора на вектор с реверсом
CDVM$ ALIGN G( I ) WITH D( -I + 21)
С выравнивание матрицы на матрицу с поворотом и раздвижкой
CDVM$ ALIGN H( I, J ) WITH C( 2*J, 2*I )
Несколько массивов (A1, A2,…) можно выровнять одинаковым образом на один и тот же массив B одной директивой вида
CDVM$ ALIGN (d1, ,dn) WITH B(ard1, ,ardm) :: A1, A2, …
При этом массивы A1, A2… должны иметь одинаковое число измерений (n), но необязательно одинаковые размеры измерений.
Пусть задана цепочка выравниваний A f1 B f2 C, где f2 - выравнивание массива В на массив С , а f1 - выравнивание массива А на массив В. По определению массивы А и В считаются выровненными на массив С. Массив В выровнен непосредственно функцией f2, а массив А выровнен опосредовано составной функцией f1(f2). Поэтому применение директивы REALIGN к массиву В не вызовет перераспределения массива А.
В общем случае множество спецификаций ALIGN образует лес деревьев. При этом корень каждого дерева должен быть распределен директивами DISTRIBUTE или REDISTRIBUTE. При выполнении директивы REDISTRIBUTE перераспределяется все дерево выравниваний.
4.3.2. Директива TEMPLATE
Если значения линейной функции a*I + b выходят за пределы измерения базового массива, то необходимо определить фиктивный массив - шаблон выравнивания следующей директивой:
| template-directive | is TEMPLATE template-decl-list |
| template-decl | is template-name [ ( explicit-shape-spec-list ) ] |
Затем необходимо произвести выравнивание обоих массивов на этот шаблон. Шаблон распределяется с помощью директив DISTRIBUTE и REDISTRIBUTE. Элементы шаблона не требуют памяти, они указывают процессор, на который должны быть распределены элементы выровненных массивов.
Рассмотрим следующий пример.
Пример 4.8. Выравнивание по шаблону.
REAL A(100), B(100), C(100)
CDVM$ TEMPLATE TABC (102)
CDVM$ ALIGN B( I ) WITH TABC( I )
CDVM$ ALIGN A( I ) WITH TABC( I + 1 )
CDVM$ ALIGN C( I ) WITH TABC( I + 2 )
CDVM$ DISTRIBUTE TABC ( BLOCK )
. . .
DO 10 I = 2, 98
A(I) = C(I-1) + B(I+1)
10 CONTINUE
Для того, чтобы не было обмена между процессорами необходимо разместить элементы A(I), C(I-1) и B(I+1) на одном процессоре. Выравнивание массивов С и В на массив А невозможно, т.к. функции выравнивания I-1 и I+1 выводят за пределы индексов измерения А. Поэтому описывается шаблон TABC. На один элемент шаблона TABC выравниваются элементы массивов A, В и С, которые должны быть размещены на одном процессоре.
4.3.3. Выравнивание динамических массивов
Для спецификации выравнивания динамических массивов синтаксис директив ALIGN и REALIGN расширен следующим образом.
| alignee | is . . . |
| or pointer-name |
| align-target | is . . . |
| or pointer-name |
Если в директиве ALIGN в качестве выравниваемого массива (alignee) указана переменная с атрибутом POINTER, то выполнение директивы откладывается до выполнения функции ALLOCATE, которая определяет значение этой переменной. Директива REALIGN может выполняться только после выполнения функции ALLOCATE.
Пример 4.9. Выравнивание динамических массивов.
REAL HEAP(100000)
CDVM$ REAL, POINTER ( :, : ) :: PX, PY
INTEGER PX, PY, DESC(2)
CDVM$ ALIGN PY( I, J ) WITH PX( I, J )
CDVM$ DISTRIBUTE PX ( BLOCK, BLOCK )
. . .
PX = ALLOCATE(DESC, ...)
PY = ALLOCATE(DESC, ...)
. . .
CDVM$ REDISTRIBUTE PX ( BLOCK, * )
Пусть задана цепочка выравниваний директивами ALIGN
P1 f1 P2 f2 . . . fN-1 PN
где fi - функция выравнивания,
Pi - указатель на динамический массив.
Тогда размещение динамических массивов (выполнение функции ALLOCATE) должно происходить в обратном порядке, т.е.
PN = ALLOCATE(...)
. . .
P2 = ALLOCATE(...)
P1 = ALLOCATE(...)
Если указатель динамического массива является элементом массива указателей, то выравнивание динамического массива можно выполнить только директивой REALIGN. Т.к. директива REALIGN допускает лишь ссылку на имя указателя, то элемент массива указателей необходимо предварительно переслать в скалярную переменную-указатель. Выравнивание массива с указателем PT(I) на массив с указателем PT(J) можно выполнить с помощью следующей последовательности операторов:
P1 = PT( I )
P2 = PT( J )
CDVM$ REALIGN P1( I, J ) WITH P2( I+1, J )
4.4. Директивы DYNAMIC и NEW_VALUE
Массивы, перераспределяемые директивами REDISTRIBUTE и REALIGN, необходимо специфицировать в директиве DYNAMIC.
| dynamic-directive | is DYNAMIC alignee-or-distributee-list |
| alignee-or-distributee | is alignee |
| or distributee |
Если после выполнения директив REDISTRIBUTE и REALIGN перераспределяемые массивы получают новые значения, то перед этими директивами следует указать дополнительную (оптимизирующую) директиву NEW_VALUE.
| new-value-directive | is NEW_VALUE |
Эта директива отменяет пересылку значений распределенного массива.
Если массив указан в спецификации DYNAMIC и для него нет спецификации DISTRIBUTE или ALIGN , то его распределение откладывается до первого оператора REDISTRIBUTE или REALIGN. Такая необходимость возникает в двух случаях:
-
распределение (выравнивание) динамического массива с указателем, который является элементом массива указателей;
-
распределение массива на секцию массива процессоров, параметры которой определяются в процессе вычислений.
4.5. Распределение по умолчанию
Если для данных не указана директива DISTRIBUTE или ALIGN , то эти данные распределяются на каждом процессоре (полное размножение). Такое же распределение можно определить директивой DISTRIBUTE , указав для каждого измерения формат *. Но в этом случае доступ к данным будет менее эффективным.
5. Распределение вычислений
5.1. Параллельные циклы
5.1.1. Определение параллельного цикла
Моделью выполнения FDVM программы, как и программ на других языках с параллелизмом по данным, является модель ОПМД (одна программа - множество потоков данных). На все процессоры загружается одна и та же программа, но каждый процессор в соответствии с правилом собственных вычислений выполняет только те операторы присваивания, которые изменяют значения переменных, размещенных на данном процессоре (собственных переменных).















