Диссертация (786409), страница 14
Текст из файла (страница 14)
1 5.00 ( 4.50 ~ 4.00 ! ~ 5.50 з.оо — м4среднекеадратичное откконение е проГРамме 2.50 Среднекеадратичное откконение е 1ЯММР5 1.50 1 1.ОО 0.50 0.00 о 200 400 боо ЗОО 1000 1200 Рисунок 3.9. Уменьшение значения среднеквадратичного отклонения темяературы по длине образца от времени усреднения в программе н в ЬАММРБ Из рис. 3.9 видно, что увеличение периода усреднения по времени приводит к уменьшению колебаний вычисленного значения температуры по длине образца, причем можно видеть, что программное решение существенно быстрее приходит к заданной точности, чем решение ЬАММРБ. 3.2 Скорость вычисления многочастичных потенциалов на графических процессорах Для определения производительности разработанного программного комплекса рассматривается актуальная задача моделирования теплопереноса в углеродных структурах. Важным элементом здесь является определение коэффициента теплопроводности.
С этой целью по центру образца подводится тепловой импульс. Замеряется скорость распространения теплового импульса с течением времени. По характеру и скорости распространения определяется коэффициент теплопроводности. В качестве примера рассматривается лист графена типа «кресло». В течение 1000 шагов лист доводится термостатом до средней температуры 16К. После стабилизации атомам по центру в полоске шириной 20А придается тепловой импульс 600К. Характерное распределение температуры показано на рис. 3.10.
Осреднение проводится по 1000 временных шагов по области длиной 16А. Шаг моделирования 1 фемтосекунда. Проводится 10000 шагов моделирования. Выдерживается микроканонический ансамбль. Для моделирования листа на графических процессорах написана программа [1051. 'СППЯ Ьаепп1огЕЕримеи Иа1тл~рь Ож'1ОЕЕЕЕ И: -'" и Затраты памяти, Мб Програм ма Время расчета, с Програм ма Время расчета, с ЬАММР8 Затраты памяти, Мб 1.АММРЯ Время расчета, с Програм ма Затраты памяти, Мб Програм ма о 1- о и о и е ы Ы и к о Я сь 1 ядро Тез!а М2075 (448 яде ) ф~ас1го 4000 (256 яде ) 12,6 960 47,1 14,8 56,0 3,2 22,3 37,0 3,5 1920 58,0 3,9 28,9 38,0 99,9 5,5 50 27,3 73,0 33,6 3840 198,6 20,3 7,3 53,0 100 7680 407,4 134,1 37,6 72,0 10,8 1026,9 1 13,0 200 15360 797,1 189,0 12,0 170,0 62,8 1661,9 400 12,7 176,0 30720 1168,9 131,2 195,0 207,0 524,1 800 61440 3086,8 1230,1 276„3 11,2 188,0 Рисунок ЗЛО.
Распространение теплового импульса от центра листе графено Молекулярно-динамическое моделирование проводилось на аппаратном обеспечении 1п1е1 Хеоп СРЫ Е5-2650, 2.00 ГГц, 32 ядра в ОС, 128 Гб ВАМ, МУЮ1А Тез1а М2075 (443 ядер), МУПИА Яиайго 4000 (256 ядер) под управлением ОС Сеп1оз 6.2.
Максимальные значения количества вычислительных потоков в блоке: 11024, 1024, 641. В таблице 3.2 и на рис. 3.11 показано время, необходимое компьютеру для моделирования образцов различного размера. Таблица 3.2. Уско ение, достиги ое на СР11 в задаче теплопе еиоса. 1600 122880 9666,7 1389,8 524,0 1129,0 11,5 1002,4 1110,0 Рисунок 3.11. Зависимость времени расчета от количества частиц Представлены данные, полученные с помощью разработанного программного обеспечения и с использованием известного пакета молекулярно-динамического моделирования ЬАММРК.
Можно видеть, что разработанный подход с использованием вычислений на графических процессорах одной видеокарты позволяет существенно повысить производительность в сравнении с вычислениями ЬАММРЯ на многопроцессорных машинах вплоть до 32 ядер. В данной работе исследовались разные методы представления пространства моделирования. Отдельные методы повышали скорость работы или уменьшали сложность |69] представления пространства.
На рис. 3.12 представлено сравнение ячеистой модели движения и гибридного алгоритма; квадратными и треугольными маркерами отмечено время расчета коэффициентов по формуле (1.20). Ромбическими маркерами и крестиками отмечено время расчета потенциала Бреннера по формуле (1,18) с известными коэффициентами Ь». Видно, что время вычисления градиента потенциала Бреннера в случае ячеистой 96 модели росло в зависимости от количества атомов, тогда как в гибридном алгоритме оно постоянно.
Для расчета потенциала не требуются данные по трем и четырем атомам, эти коэффициенты уже известны, поэтому в обоих случаях время не зависит от количества атомов. мкс ~ 4500 4ООО ~ 55ОО -а-Времн расчета конбФициентон, мне ~ 3000 ~ 2500 ~ 2ООО ~ 1500 ! , 'бооо Время расчета потенциала, мне — — Гибридные списки.
коаббиси~еиты, мкс гибридные списки, бреннер, мкс 500 О тнтаааиаФж 44'-'е: '~-асс:-4:-Х '',-'.-''::-Х 1 ~ )О 100 200 500 400 500 боо 700 Кол нчестпо атомно Рисунок Злз. Время расчета потенциала Бреннера и его градиента На рис. 3.13 показана зависимость времени расчетов коэффициентов потенциала Бреннера и самого потенциала Бреннера и его градиента в случае использования гибридного алгоритма молекулярного моделирования. График имеет ступенчатый вид, что характерно для параллельного алгоритма. При увеличении количества частиц в 100 раз время расчетов увеличивается всего в б раз.
Использовалось аппаратное обеспечение 1п1е1 Соге 13, 2.93ГГц, 4 ядра, 4Гб 15АМ, пЧ1д1а СтеРогсе 12ТХ 480 (А) с программным обеспечением %шдо55 з 7 Рго Сида 5.0 и Сода 5.5. мнс иоо . Гооо —,"- Гибрирнме а!испи„ нидббпииенсм, мне боо боо — Гнбрпднме сирени, бреннер,мнс аоо знее сьбс ' о О бООО ГОООО збООО ЗОООО ЗЗООО ЗОООО Збсас)дииинпс'00 '""'" Риаз!иск 3.13. Время расчета потенциала Бреннера и его градиента в параллельных вычислениях время расчета задачи теплопроводности 1потенциал Терсоффа) — 1 епю время расчета задачитеплопроводности 1потенциал Леннарда-джонса) н д а ° н мсе 400 — !Мне 10 . 2 мне Он!Он — 4 ни 3 ! О дн Омн — Где 1Е!00 1220 иин, 10000 12ХО, О Задача теплопроводности листа графена решалась на сервере 1п1е1 Хеоп СРП Е5-2б50, 2.00 ГГц, 32 виртуальных ядра в ОС Сеп1оз б, 128Гб ВАМ, ЫЛО1А Тез!а М2075. Полученные результаты сравнивались с результатами моделирования на центральном процессоре с различным количеством потоков вычислений в программе ЬАММРБ (рис.
3.14). Также приведено сравнение времени расчета в программе ЬАММРБ для различных потенциалов — Леннарда-Джонса, Терсоффа, Бреннера. время расчета задачи теппопроводности ВРОШЛ ИРДООШРРООЧШР (потенциап Бреннера) р яра аюа — 4 яра — Очр ЮЮРО шапа ЗЮО 4ОЮ ШЮО ОХО КОЗ алаш О О Таблица 3.3. Метрики производительности решения задачи теплопроводности в п ог амме 1 АММРБ с использованием потенциала Лепна да-Джонса. Гс(п) (2.11) Ь (3.1) (2,5) (2.1 0) Г(2.8) Амдал (2.6) Г ста сон (2.9) в емя,с 694,78 9,67 6,73 1,44 0,72 0,39 0,58 0,36 1,44 1,61 999,12 1,50 1212,17 1,80 5,54 1,74 1,69 2,22 1253,02 2,00 1,80 0,45 0,41 2,83 1,84 0,37 0,42 3,44 1297,99 2,14 5,18 1,87 1,95 1405,85 2,25 1513,64 2,33 4,78 2,02 0,34 0,39 0,31 0,37 2,03 4,05 4,44 2,10 2,18 4,40 0,27 0,38 1526,20 2,40 2,20 2,14 Таблица 3.4, Метрики производительности решения задачи теплопроводности в п ог иммет АММРЯ с использованием потенциала Те со а.
й.(п) (2.1 1) время,с з (2.5) (2.10) Г(2.8) Амдал (2.6) Густафсон (2.9) Ь (3.1) 1 346,84 19,37 32,74 1,90 0,18 2 205,27 1,69 0,84 1,92 46,45 3 144,68 2,40 0,80 0,13 2,84 2,71 2,59 4 104,18 3,33 5 85,32 4,06 64,50 3,45 0,07 3,23 3,76 78,76 4,68 0,81 0,06 3,79 4,13 96„04 4,75 б 69,97 4,96 0,83 0,04 5,60 4,29 7 63,70 5,44 5,32 0,78 0,05 4,73 6,52 105,49 8 5630 616 30 31,83 10,90 7,44 119,35 0,77 0,04 5,13 5,85 0,36 0,06 9,04 27,68 211,09 11,88 Рисунок 334.
Время расчета задачи теплопроводности при использовании потенциала Бреннера н др. Метрики параллельных вычислений для решаемой задачи теплопроводности листа графена собраны в таблицах 3.3 — 3.5. Таблица 3.5. Метрики производительности решения задачи теплопроводности в программе 1.АММР8 и в разработанной программе для вычилений на графических и оцессо а с использованием потенциала Б ение а. К(п) (2.11) Ь (3.1) з (2.5) (2.10) т" (2.8) Амдал (2.6) Густа сон (2.9) время,с 366,61 18,33 1,91 213,09 1,72 0,86 0,16 1„87 31,54 1,77 40,66 165,27 2,22 0,74 0,18 2,38 2,74 113,! 6 3,24 0,81 0,08 2,88 3,61 59,39 3,50 61,17 109„86 3,34 0,67 0,12 3,29 4,48 73,61 5,35 4,85 91,29 3,64 4,02 0,67 4,21 0,60 0,10 5,44 86,99 6,22 77,25 3,93 0,1 1 81,04 4,52 0,57 7,09 82,92 6,00 4,19 0,1 1 30 77,07 0,18 6,29 26,23 87,19 12,60 4,76 0,16 448 СР11 22,87 16,03 0,04 0,06 7,58 389,89 293,84 20,10 Из графиков рис.
3.14 видно, что если продолжить тенденцию увеличения количества процессоров, то время выполнения не будет уменьшаться пропорционально, более того, эффективность масштабирования резко снижается. Значительное улучшение производительности при увеличении количества ядер позволяет достичь использование графических процессоров.
Рассмотрим кристаллическую решетку графена на рисунке 3.15. Рисунок ЗЛ5. Кристаллическая решетка графена. Штриховыми кружками отмечены атомы для рассмотрения связей, используемых в формуле потенциалов 100 В потенциалах Лени арда-Джонса, Терсоф фа, Бреннера используется выражение, зависящее от 2, 3, 4-х атомов соответственно. Один атом составляет 3 связи с соседними атомами, выбрать 1 из 3 атомов можнос' =с,' =3 способами, что является количеством сочетаний; для выбора угла, составленного из 3 атомов, из 6 возможных соседних есть С'=С,'=20 способов.