rtsIDr (1158390), страница 17
Текст из файла (страница 17)
| ArrayHeader | | заголовок распределённого массива. |
| IndexArray | | массив, i-й элемент которого содержит значение индекса элемента по (i+1)-му измерению распределённого массива. |
Функция может быть успешно выполнена только тем процессором, в памяти которого размещён заданный элемент.
Возвращается указатель на первый байт элемента.
13.5Макрокоманды доступа к элементам локальных частей распределенных массивов размерностей от 1 до 7
В программах, написанных на языке C, для доступа к локальным элементам распределённых массивов размерностей от 1 до 7 можно воспользоваться макрокомандами вида
| <DAElmType> DAElm<Rank> ( | long | ArrayHeader[], |
| ArrayHeader | | заголовок распределённого массива. |
| Rank | | размерность распределённого массива. |
| DAElmType | | тип элементов распределённого массива. |
| Indexi | | значение индекса требуемого элемента для i-го измерения распределённого массива. |
Семь вышеописанных макрокоманд являются L-выражениями языка C.
Доступ к локальной части распределённого массива посредством макрокоманд эффективнее доступа с помощью описанных в п.13.4 функций.
Предполагается, что при создании массива с заголовком ArrayHeader базовый указатель был задан равным NULL.
13.6Последовательный опрос значений индексов элементов распределенного массива
| long setind_ ( | long | ArrayHeader[], |
| ArrayHeader | | заголовок распределённого массива. |
| InitIndexArray | | массив, i-й элемент которого содержит начальное значение устанавливаемого индекса элемента массива по (i+1)-му измерению. |
| LastIndexArray | | массив, i-й элемент которого содержит конечное значение устанавливаемого индекса элемента массива по (i+1)-му измерению. |
| StepArray | | массив, в i-м элементе которого задается шаг изменения индекса (i+1)-го измерения при последовательном опросе индексов. |
Функция setind_ устанавливает начальные и конечные значения и шаги изменения индексов элемента распределённого массива для последующего последовательного их опроса и продвижения с помощью рассмотренной ниже функции getind_.
Для полного охвата измерения распределённого массива без использования опроса размера объекта по заданному измерению (см.п.17.2) начальное значение индекса должно быть задано равным -1. В этом случае начальное значение индекса будет считаться равным нулю, шаг единице, а конечное значение размеру массива по рассматриваемому измерению минус 1.
Возвращается нулевое значение.
| long getind_ ( | long | ArrayHeader[], |
| ArrayHeader | | заголовок распределённого массива. |
| NextIndexArray | | массив, в i-й элемент которого будет возвращено очередное значение индекса массива по (i+1)-му измерению. |
Функция getind_ предназначена для последовательного опроса очередных значений индексов элемента заданного массива. При первом опросе будут возвращены индексы, установленные с помощью функции setind_ . После записи в массив NextIndexArray значения индексов продвигаются в соответствии с заданными функцией setind_ шагами. Индекс измерения с большим номером, как принято в языке С, меняется быстрее индекса измерения с меньшим номером.
Возвращается ненулевое значение, если очередные индексы опрошены, и нулевое, если подмножество элементов распределённого массива, заданное функцией setind_, исчерпано.
14Регулярный доступ к удаленным данным
Если элементы распределённого массива размещены не на всех процессорах, выполняющих текущую ветвь параллельной программы, где они требуются, то такой массив будем называть удалённым, а его элементы – удалёнными. Доступ к элементам удалённого распределённого массива осуществляется путём создания на каждом процессоре, где требуется и отсутствует хотя бы один из них, специального буфера (локального буфера удалённых элементов) и загрузки в него нужных удалённых данных.
14.1Создание буфера удалённых элементов распределённого массива
Если ветвью параллельной программы, востребовавшей элементы удалённого массива, является виток параллельного цикла, то будем рассматривать удалённые данные, необходимые для всех его витков, как единое целое.
В этом случае требуемые элементы удалённого распределённого массива определяются с помощью линейных правил выборки (регулярный доступ), задаваемых для каждого его измерения в виде
Ai*Vk(i) + Bi , где:
| i | | номер измерения удалённого распределённого массива; |
| Vk(i) | | индексная переменная k-го измерения параллельного цикла, меняющаяся в пределах своих начального и конечного значений; |
| Ai, Bi | | целые числа. |
Локальные буфера удалённых элементов каждого процессора, выполняющего витки параллельного цикла, рассматриваются как локальные части распределёного массива, который в дальнейшем будем называть глобальным буфером удалённых элементов (или просто буфером удалённых элементов). Буфер удалённых элементов отображён так же, как и параллельный цикл, но его i-му измерению соответствует k(i)-е измерение параллельного цикла (в том случае, когда для i-го измерения удалённого массива задано линейное правило выборки с ненулевым Ai).
В силу приведённых выше правил выборки требуемые удалённые элементы представляются в виде разреженного блока, но помещаются в буфер в уплотнённом (неразреженном) виде.
Работа с буфером удалённых элементов осуществляется аналогично работе с распределённым массивом (см.п.13).
В целях оптимизации буфера удалённых элементов могут объединяться в группы, а загрузка всех буферов группы осуществляться одной операцией (см. п.п. 14.6-14.10).
| long crtrbl_ ( | long | RemArrayHeader[], |
| RemArrayHeader | | заголовок удалённого распределённого массива. |
| BufferHeader | | заголовок создаваемого буфера удалённых элементов. |
| BasePtr | | базовый указатель для доступа к буферу удалённых элементов. |
| *StaticSignPtr | | признак создания статического буфера. |
| *LoopRefPtr | | ссылка на параллельный цикл, при выполнении которого необходимы размещённые в буфере элементы удалённого массива. |
| AxisArray | | массив i-й элемент которого содержит номер измерения параллельного цикла (k(i+1)), соответствующего (i+1)-му измерению удалённого массива. |
| CoeffArray | | массив, i-й элемент которого содержит коэффициент индексной переменной линейного правила выборки для (i+1)-го измерения удалённого массива (Ai+1). |
| ConstArray | | массив, i-й элемент которого содержит константу линейного правила выборки для (i+1)-го измерения удалённого массива (Bi+1). |
Функция crtrbl_ создаёт буфер для размещения в нём удалённых элементов распределённого массива с заголовком RemArrayHeader, необходимых для выполнения параллельного цикла, определённого ссылкой *LoopRefPtr. Удалённый массив должен быть отображён в процессорную систему, каждый элемент которой принадлежит текущей процессорной системе. Цикл на момент обращения к функции должен быть текущим и отображённым.
Создаваемый буфер является распределённым массивом, размерность которого меньше размерности удалённого массива на число константных линейных правил выборки удалённых элементов. Его заголовок BufferHeader представляет собой массив из 2*r+2 элементов типа «long », где r – размерность буфера (расширенный заголовок распределённого массива, см. п. 13.4). Размещение заголовка в памяти (статическое или динамическое) осуществляется пользовательской программой, а инициализация системой поддержки при выполнении функции crtrbl_ .
В любом i-м элементе массива AxisArray может быть задан либо номер измерения параллельного цикла, либо 0, либо –1. В первом случае CoeffArray[i] должен быть ненулевым (неконстантное правило выборки). Во втором случае CoeffArray[i] обязан быть нулевым (константное правило выборки). Наконец, третий случай определяет свободное (i+1)-е измерение удалённого массива, т. е. не связанное ни с каким измерением параллельного цикла («присутствующее везде»).
Таким образом, размерность буфера удалённых элементов равна числу ненулевых элементов массива AxisArray. Размер каждого j-го измерения буфера определяется значением j-го по счёту ненулевого элемента массива AxisArray (пусть индекс этого элемента будет i). Если AxisArray[i] > 0 (линейное правило выборки), то размер j-го измерения буфера равен размеру (AxisArray[i])-го измерения заданного параллельного цикла (размер измерения цикла в данном случае – увеличенное на единицу абсолютное значение разности между начальным и конечным значениями индексной переменной измерения). Если же AxisArray[i] = -1 (свободное измерение удалённого массива), то размер j-го измерения буфера совпадает с размером (i+1)-го измерения удалённого массива.
В массиве AxisArray не может быть задано два одинаковых номера измерения параллельного цикла.
Число элементов в каждом из массивов AxisArray, CoeffArray и ConstArray должно быть равно размерности удалённого распределённого массива.
Корректно заданные правила выборки не должны выводить за пределы удалённого распределённого массива.
Базовый указатель BasePtr должен ссылаться на любую переменную, имеющую тот же тип, что и элементы удалённого распределённого массива. Содержимое этой переменной несущественно, т.к. базовый указатель используется только для доступа к удалённым элементам распределённого массива, размещённым в создаваемом буфере.
Подробнее работа с заголовком буфера удалённых элементов и базовым указателем рассмотрена в п.14.5.
Задаваемый ненулевым значением *StaticSignPtr признак статического буфера означает создание буфера, не уничтожаемого при выходе из программного блока (см.п.8). Такой буфер может быть уничтожен только явно, с помощью рассмотренной ниже функции delrb_ .
Функция возвращает ненулевое значение, если созданный буфер имеет локальную часть на текущем процессоре, и нулевое – в противном случае.
Замечание 1. Если все правила выборки являются константами, то размерность создаваемого буфера, в силу изложенного выше, должна быть равной нулю. В этом случае система поддержки создаёт одномерный распределённый массив-буфер, состоящий из одного элемента.















