дз 2. 1-й поток (Практикум)
Описание файла
Файл "дз 2. 1-й поток" внутри архива находится в следующих папках: Практикум, 2016 Практикум (Дирихле, Пуассон). PDF-файл из архива "Практикум", который расположен в категории "". Всё это находится в предмете "суперкомпьютерное моделирование и технологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Задание по курсу «Суперкомпьютерноемоделирование и технологии»сентябрь 2016 - декабрь 2016СодержаниеСодержание11 Введение12 Математическая постановка дифференциальной задачи13 Численный метод решения задачи24 Варианты заданий35 Требования к отчету3Список литературы41ВведениеВ качестве модельной задачи предлагается задача для трехмерного гиперболическогоуравнения в области, представляющей из себя прямоугольный параллелепипед. Индивидуальные варианты заданий отличаются типом граничных условий.Задание необходимо выполнить на следующих ПВС Московского университета:1.
IBM eServer pSeries 690 Regatta (использовать данную ПВС необязательно, рекомендуется для отладки программ) [1],2. IBM Blue Gene/P. В качестве дополнительного задания предлагается реализоватьиспользование “мэппинга” [2],3. «Ломоносов» [3].2Математическая постановка дифференциальной задачиВ трехмерной замкнутой областиΩ = [0 6 x 6 L] × [0 6 y 6 L] × [0 6 z 6 L]1для (0 < t 6 T ] требуется найти решение u(x, y, z, t) уравнения в частных производных∂2u= ∆u∂t2(1)с начальными условиями(2)u|t=0 = φ(x, y, z),∂u = 0,∂t (3)t=0при условии, что на границах области заданы однородные граничные условия первогородаu(0, y, z, t) = 0,u(x, 0, z, t) = 0,u(x, y, 0, t) = 0,u(L, y, z, t) = 0,u(x, L, z, t) = 0,u(x, y, L, t) = 0,(4)(5)(6)либо периодические граничные условияu(0, y, z, t) = u(L, y, z, t),u(x, 0, z, t) = u(x, L, z, t),u(x, y, 0, t) = u(x, y, L, t),ux (0, y, z, t) = ux (L, y, z, t),uy (x, 0, z, t) = uy (x, L, z, t),uz (x, y, 0, t) = uz (x, y, L, t).(7)(8)(9)Конкретная комбинация граничных условий определяется индивидуальным вариантомзадания (см.
п. 4).3Численный метод решения задачиСодержание данного пункта основано на материале книги [4].Для численного решения задачи введем на Ω сетку ωhτ = ω̄h × ωτ , гдеT = L = 1,ω̄h = {(xi = ih, yj = jh, zk = kh), i = 0, 1, . . . , N, j = 0, 1, . . . , N, k = 0, 1, . . . , N, hN = 1},ωτ = {tn = nτ, n = 0, 1, . .
. , K, τ K = 1}.Через ωh обозначим множество внутренних, а через γh — множество граничных узловсетки ω̄h .Для аппроксимации исходного уравнения (1) c однородными граничными условиями (4)–(6) и начальными условиями (2)–(3) воспользуемся следующей системой уравнений:n−1n+1n− 2yijk+ yijkyijk= ∆h y n , (xi , yj , zk ) ∈ ωh , n = 1, 2, . . .
, K − 1,2τn+1= 0, (xi , yj , zk ) ∈ γh , n = 0, 1, . . . , K − 1.yijkЗдесь ∆h — семиточечный разностный аналог оператора Лапласа:∆h y n =nnnnnnnnnyi−1,j,k− 2yi,j,k+ yi+1,j,kyi,j−1,k− 2yi,j,k+ yi,j+1,kyi,j,k−1− 2yi,j,k+ yi,j,k+1++.h2h2h2n+1на (n + 1)-м шагеПриведенная выше разностная схема является явной — значения yijkможно явным образом выразить через значения на предыдущих слоях.2201Для начала счета (т.е. для нахождения yijk) должны быть заданы значения yijk, yijk,(xi , yj , zk ) ∈ ωh . Из условия (2) имеем0yijk= φ(xi , yj , zk ),(xi , yj , zk ) ∈ ωh .10Простейшая замена начального условия (3) уравнением (yijk− yijk)/τ = 0 имеет лишьпервый порядок аппроксимации по τ .
Аппроксимацию второго порядка по τ и h даетразностное уравнение10yijk− yijkτ= ∆h φ(xi , yj , zk ), (xi , yj , zk ) ∈ ωh .τ2Разностная аппроксимация для периодических граничных условий выглядит следующим образомn+1n+1y0jk= yNjk ,n+1n+1y1jk= yN+1jk ,n+1n+1yi0k= yiNk,n+1n+1yij0= yijN,n+1n+1yi1k= yiN+1k ,n+1n+1yij1= yijN+1 ,i, j, k = 0, 1, .
. . , N.4Варианты заданийИндивидуальные варианты заданий отличаются комбинацией граничных условий. Варианты приведены в следующей таблице 1. Значениям «1-го рода» и «периодические» вВариант12345678Таблица 1: Варианты заданийxyz1-го рода1-го рода1-го рода1-го рода1-го родапериодические1-го родапериодические1-го рода1-го родапериодические периодическиепериодические1-го рода1-го родапериодические1-го родапериодическиепериодические периодические1-го родапериодические периодические периодическиестолбце x отвечают формулы (4) и (7), в столбце y — (5) и (8), в столбце z — (6) и (9).5Требования к отчетуДля того, чтобы успешно сдать задание, необходимо• уверенно ориентироваться в программном коде;• понимать семантику всех используемых в коде функций MPI и директив OpenMP;• представить отчет с результатами исследования параллельных характеристик программы;• представить программный код.Исследование параллельных характеристик MPI-программы необходимо провести навсех трех ПВС.
На ПВС Blue Gene/P также необходимо провести исследование параллельных характеристик гибридной программы MPI/OpenMP и сравнить полученные результаты с программой, не используещей директивы OpenMP.Отчет о выполнении задания должен содержать3• математическую постановку задачи;• численные метод ее решения;• краткое описание проделанной работы по созданию гибридной реализации MPI/OpenMP;• результаты расчетов (см.
ниже).Расчеты проводятся для разных размеров задач и на разном числе процессоров. Результаты расчетов заносятся в таблицу. Значениями в ячейках таблицы являются времярешения и ускорение (таблица 2). Таблица результатов расчетов на системе Blue Gene/PТаблица 2: Пример оформления таблицы с результатами расчетовЧисло процессоров Np Число точек сетки N 3 Время решения T Ускорение S112832128341283812831256322563425638256315123251234512385123должна содержать три дополнительных столбца. В двух из них должны быть приведенывремя и ускорение для гибридной версии MPI/OpenMP, а в третьем — отношение временивыполнения MPI-версии программы к времени работы гибридной версии MPI/OpenMP.Следует выполнить около 20 шагов по времени.IBM eServer pSeries 690 RegattaРасчеты должны быть проведены для следующего числа процессоров: 1, 2, 4 и 8.
Расчеты должны быть проведены на сетках 1283 , 2563 , 5123 .IBM Blue Gene/PРасчеты должны быть проведены для следующего числа процессоров: 128, 256 и 512.MPI-версию следует запускать в режиме SMP, гибридную версию MPI/OpenMP — в режиме SMP, но использовать при этом не четыре, а только три процессорных ядра. Расчетыдолжны быть проведены на сетках 5123 , 10243 , 15363 .«Ломоносов»Расчеты должны быть проведены для следующего числа процессоров: 8, 16, 32, 64 и128.
Расчеты должны быть проведены на сетках 1283 , 2563 , 5123 .Список литературы[1] IBM eServer pSeries 690 Regatta. — http://www.regatta.cmc.msu.ru.4[2] IBM Blue Gene/P. — http://hpc.cmc.msu.ru.[3] Суперкомпьютер «Ломоносов». — http://hpc.cmc.msu.ru.[4] Самарский А.А., Гулин А.В. Численные методы. — М.: Наука. Гл. ред. физ-мат. лит.,1989.5.