Параллельное программирование с использованием OpenMP. Антонов (2009) (Параллельное программирование с использованием OpenMP. Антонов (2009).pdf), страница 10
Описание файла
PDF-файл из архива "Параллельное программирование с использованием OpenMP. Антонов (2009).pdf", который расположен в категории "". Всё это находится в предмете "суперкомпьютерное моделирование и технологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Для множественного замка уменьшает на единицу коэффициент захваченности. Если коэффициент станет равен нулю, замок освобождается. Если после освобождения замка есть нити, заблокированные наоперации, захватывающей данный замок, замок будет сразу же захвачен одной из ожидающих нитей.62Пример 28 иллюстрирует применение технологии замков. Переменная lockиспользуется для блокировки. В последовательной области производитсяинициализация данной переменной с помощью функции omp_init_lock().В начале параллельной области каждая нить присваивает переменной n свойпорядковый номер. После этого с помощью функции omp_set_lock() однаиз нитей выставляет блокировку, а остальные нити ждут, пока нить, вызвавшая эту функцию, не снимет блокировку с помощью функцииomp_unset_lock().
Все нити по очереди выведут сообщения "Начало закрытой секции..." и "Конец закрытой секции...", при этом между двумясообщениями от одной нити не могут встретиться сообщения от другой нити.В конце с помощью функции omp_destroy_lock() происходит освобождение переменной lock.#include <stdio.h>#include <omp.h>omp_lock_t lock;int main(int argc, char *argv[]){int n;omp_init_lock(&lock);#pragma omp parallel private (n){n=omp_get_thread_num();omp_set_lock(&lock);printf("Начало закрытой секции, нить %d\n", n);sleep(5);printf("Конец закрытой секции, нить %d\n", n);omp_unset_lock(&lock);}omp_destroy_lock(&lock);}Пример 28a. Использование замков на языке Си.program example27binclude "omp_lib.h"integer (kind=omp_lock_kind) lockinteger ncall omp_init_lock(lock)!$omp parallel private (n)n=omp_get_thread_num()call omp_set_lock(lock)print *, "Начало закрытой секции, нить ", ncall sleep(5)print *, "Конец закрытой секции, нить ", ncall omp_unset_lock(lock)!$omp end parallelcall omp_destroy_lock(lock)endПример 28b.
Использование замков на языке Фортран.63Для неблокирующей попытки захвата замка используются функцииomp_test_lock() и omp_test_nest_lock().Си:int omp_test_lock(omp_lock_t *lock);int omp_test_nest_lock(omp_lock_t *lock);Фортран:logicalintegerintegerintegerfunction omp_test_lock(svar)(kind=omp_lock_kind) svarfunction omp_test_nest_lock(nvar)(kind=omp_lock_kind) nvarДанная функция пробует захватить указанный замок. Если это удалось, тодля простого замка функция возвращает 1 (для Фортрана – .TRUE.), а длямножественного замка – новый коэффициент захваченности. Если замок захватить не удалось, в обоих случаях возвращается 0 (для простого замка наязыке Фортран – .FALSE.).Пример 29 иллюстрирует применение технологии замков и использованиефункции omp_test_lock(). В данном примере переменная lock используется для блокировки.
В начале производится инициализация данной переменной с помощью функции omp_init_lock(). В параллельной области каждаянить присваивает переменной n свой порядковый номер. После этого с помощью функции omp_test_lock() нити попытаются выставить блокировку.Одна из нитей успешно выставит блокировку, другие же нити напечатаютсообщение "Секция закрыта...", приостановят работу на две секунды спомощью функции sleep(), а после снова будут пытаться установить блокировку. Нить, которая установила блокировку, должна снять её с помощьюфункции omp_unset_lock().
Таким образом, код, находящийся между функциями установки и снятия блокировки, будет выполнен каждой нитью поочереди. В данном случае, все нити по очереди выведут сообщения "Началозакрытой секции..." и "Конец закрытой секции...", но при этом междудвумя сообщениями от одной нити могут встретиться сообщения от другихнитей о неудачной попытке войти в закрытую секцию. В конце с помощьюфункции omp_destroy_lock() происходит освобождение переменной lock.64#include <stdio.h>#include <omp.h>int main(int argc, char *argv[]){omp_lock_t lock;int n;omp_init_lock(&lock);#pragma omp parallel private (n){n=omp_get_thread_num();while (!omp_test_lock (&lock)){printf("Секция закрыта, нить %d\n", n);sleep(2);}printf("Начало закрытой секции, нить %d\n", n);sleep(5);printf("Конец закрытой секции, нить %d\n", n);omp_unset_lock(&lock);}omp_destroy_lock(&lock);}Пример 29a.
Функция omp_test_lock() на языке Си.program example29binclude "omp_lib.h"integer (kind=omp_lock_kind) lockinteger ncall omp_init_lock(lock)!$omp parallel private (n)n=omp_get_thread_num()do while (.not. omp_test_lock(lock))print *, "Секция закрыта, нить ", ncall sleep(2)end doprint *, "Начало закрытой секции, нить ", ncall sleep(5)print *, "Конец закрытой секции, нить ", ncall omp_unset_lock(lock)!$omp end parallelcall omp_destroy_lock(lock)endПример 29b. Функция omp_test_lock() на языке Фортран.Использование замков является наиболее гибким механизмом синхронизации, поскольку с помощью замков можно реализовать все остальные варианты синхронизации.65Директива flushПоскольку в современных параллельных вычислительных системах можетиспользоваться сложная структура и иерархия памяти, пользователь должениметь гарантии того, что в необходимые ему моменты времени все нити будут видеть единый согласованный образ памяти.
Именно для этих целей ипредназначена директива flush.Си:#pragma omp flush [(список)]Фортран:!$omp flush [(список)]Выполнение данной директивы предполагает, что значения всех переменных(или переменных из списка, если он задан), временно хранящиеся в регистрах и кэш-памяти текущей нити, будут занесены в основную память; все изменения переменных, сделанные нитью во время работы, станут видимы остальным нитям; если какая-то информация хранится в буферах вывода, тобуферы будут сброшены и т.п.
При этом операция производится только сданными вызвавшей нити, данные, изменявшиеся другими нитями, не затрагиваются. Поскольку выполнение данной директивы в полном объёме можетповлечь значительных накладных расходов, а в данный момент нужна гарантия согласованного представления не всех, а лишь отдельных переменных, тоэти переменные можно явно перечислить в директиве списком. До полногозавершения операции никакие действия с перечисленными в ней переменными не могут начаться.Неявно flush без параметров присутствует в директиве barrier, на входе ивыходе областей действия директив parallel, critical, ordered, на выходе областей распределения работ, если не используется опция nowait, в вызовах функций omp_set_lock(), omp_unset_lock(), omp_test_lock(),omp_set_nest_lock(), omp_unset_nest_lock(), omp_test_nest_lock(),если при этом замок устанавливается или снимается, а также перед порождением и после завершения любой задачи (task).
Кроме того, flush вызывается для переменной, участвующей в операции, ассоциированной с директивойatomic. Заметим, что flush не применяется на входе области распределенияработ, а также на входе и выходе области действия директивы master.Задания• Что произойдёт, если барьер встретится не во всех нитях, исполняющих текущую параллельную область?• Могут ли две нити одновременно находиться в различных критическихсекциях?66• В чём заключается разница в использовании критических секций и директивы atomic?• Смоделируйте при помощи механизма замков:o барьерную синхронизацию;o критическую секцию.• Придумайте пример на использование множественного замка.• Когда возникает необходимость в использовании директивы flush?• Реализуйте параллельный алгоритм метода Гаусса решения систем линейных алгебраических уравнений.
Выберите оптимальные вариантыраспараллеливания и проведите анализ эффективности реализации.67Дополнительные переменные среды и функцииПеременная OMP_MAX_ACTIVE_LEVELS задаёт максимально допустимое количество вложенных параллельных областей. Значение может быть установлено при помощи вызова функции omp_set_max_active_levels().Си:void omp_set_max_active_levels(int max);Фортран:subroutine omp_set_max_active_levels(max)integer maxЕсли значение max превышает максимально допустимое в системе, будет установлено максимально допустимое в системе значение.
При вызове из параллельной области результат выполнения зависит от реализации.Значение переменной OMP_MAX_ACTIVE_LEVELS может быть получено припомощи вызова функции omp_get_max_active_levels().Си:int omp_get_max_active_levels(void);Фортран:integer function omp_get_max_active_levels()Функция omp_get_level() выдаёт для вызвавшей нити количество вложенных параллельных областей в данном месте кода.Си:int omp_get_level(void);Фортран:integer function omp_get_level()При вызове из последовательной области функция возвращает значение 0.Функция omp_get_ancestor_thread_num() возвращает для уровня вложенности параллельных областей, заданного параметром level, номер нити, породившей данную нить.Си:int omp_get_ancestor_thread_num(int level);Фортран:integer function omp_get_ancestor_thread_num(level)integer level68Если level меньше нуля или больше текущего уровня вложенности, возвращается -1.
Если level=0, функция вернёт 0, а если level=omp_get_level(),вызов эквивалентен вызову функции omp_get_thread_num().Функция omp_get_team_size() возвращает для заданного параметром levelуровня вложенности параллельных областей количество нитей, порождённыходной родительской нитью.Си:int omp_get_team_size(int level);Фортран:integer function omp_get_team_size(level)integer levelЕсли level меньше нуля или больше текущего уровня вложенности, возвращается -1. Если level=0, функция вернёт 1, а если level=omp_get_level(),вызов эквивалентен вызову функции omp_get_num_threads().Функция omp_get_active_level() возвращает для вызвавшей нити количество вложенных параллельных областей, обрабатываемых более чем однойнитью, в данном месте кода.Си:int omp_get_active_level(void);Фортран:integer function omp_get_active_level()При вызове из последовательной области возвращает значение 0.Переменная среды OMP_STACKSIZE задаёт размер стека для создаваемых изпрограммы нитей.