Диссертация (786409), страница 15
Текст из файла (страница 15)
Так как в графене вычисление двугранных углов не дает значительный вклад в сложность вычислений, то время моделирования потенциала Бреннера имеет тот же порядок, что и потенциал Терсоффа. В результате можно составить формулу ускорения, учитывающую информацию о структуре потенциала, в виде: 1 Ь= 1 С" — 1 — + где С' — количество способов составить связь или угол в потенциале. (3.1) Выражение (3.1) предлагается считать авторской метрикой для задач молекулярно-динамического моделирования.
В таблицах 3.3 — 3.5 видно, что такое выражение ускорения параллельных вычислений в зависимости от сложностей связей дает более точное представление об эффективности использования множества ядер. 3.3 Измерение производительности вычислений 3.3.1 Схема компьютерного эксперимента В данном разделе представлены результаты молекулярно-динамического моделирования на аппаратном обеспечении 1п1е1 Соге 15-4200(1, 1.6 ГГц, 2 ядра, 12 Гб ВАМ, ХУПЭ1А ОеРогсе 84ОМ (384 ядра) под управлением ОС %пн1оиз 8.1. Максимальные значения количества вычислительных потоков в блоке: 11024, 1024, Таблица 3.6.
Время выполнения функций (микросекунды) в зависимости от параметров инициализации СР11. 101 В качестве примера рассматривается материал графен, который находит все большее применение в различных отраслях современной индустрии. Моделирование позволяет подбирать необходимые размеры листов и структуру, подходящую для прикладных задач и синтезирования в лабораториях. Влияние количества потоков в элементарном вычислительном блоке на время расчета в зависимости от этапа показано в таблице 3.6 (где есть выбор), время измерялось в задаче моделирования листа графена, содержащего 6720 атомов.
Количество потоков в блоке [256,1, Ц [512,1, Ц Этап 32,1, Ц (64,1, Ц [128,1, Ц [1024,1„Ц Обновление координат и скоростей по алгоритму око остей Ве ле Вычисление хеш- 23 23 23 23 ункции Вы авнивание данных 71 72 75 Со ти овка 140 Формирование списка соседних атомов 2355 3045 2795 2600 2600 Вычисление коэффициентов потенциала 2630 2640 2650 3165 2630 Вычисление сил, ско ений 263 269 260 260 Таблица 3.7. Оптимальные конфигурации запуска вычислений на графических п оцессо ах. Максимальный Конфигурация вычислительных потоков Доля вычислительного времени на одном шаге, % прирост э ективности, % Этап Обновление координат и скоростей по алгоритму ско остей Ве ле [128,1, Ц 0.4 Вычисление хеш- функции [32,!,Ц 12.5 0.4 [32,1,Ц 9.3 Вы авнивание данных [1024,1, Ц [128,1, Ц 2.3 Сортировка Формирование списка соседних атомов 14.6 43.1 Вычисление коэффициентов потенциала [32,1, Ц 15.3 44.1 [32„1,1] 3.3 4.3 Вычисление сил, 102 В таблице 3.7 подобраны оптимальные параметры конфигурации запуска вычислений на графических процессорах для рассмотренной задачи.
Для каждой функции устанавливаются независимые параметры конфигурации. Значения конфигурации соответствуют логическому представлению вычислительных потоков в блоке. Реализованные методы выравнивания памяти и использование объединенных переменных позволяют задавать одномерную конфигурацию блоков, что имеет более простое логическое представление данных. ускорений Здесь же представлены показатели затрат времени функций в процентах от общего времени одного шага для образца из 6720 атомов.
Из таблицы видно, что 91% времени требуется для расчета потенциала и обновления списка соседних атомов. Отметим, что сортировка — единственный из списка этапов, который имеет вычислительную сложность 0(Ф1о8Щ, но он дает незначительный вклад в общее время вычислений. Для процедуры обновления координат подбирается максимальное количество вычислительных потоков в блоке. Подбор оптимального размера элементарного блока вычислений для каждой процедуры, составляющей один этап моделирования, позволяет ускорить общее выполнение программы на 13.3%. 3.3.2 Сравнение эффективности решения задач на различных СРУ Правильное конфигурирование вычислительных потоков на видеокарте дает многократный прирост производительности.
Необходимо распределять данные определенным образом для того, чтобы потоки исполнялись параллельно. Прямое вычисление потенциала многочастичного взаимодействия не всегда позволяет эффективно использовать графические вычислительные ресурсы. Сочетание техник молекулярной динамики позволяет достичь ускорения работы программы моделирования наносистем. На рис. 3.16 показано влияние программного обеспечения на скорость моделирования графена на стандартном аппаратном обеспечении 1п1е1 Соге 13, 2.93 ГГц, 4 ядра, 4 Гб ВАМ, ЭЛИА (Эег огсе ОТХ 480, 1.40 ГГц, 1536 Мб с программным обеспечением %1пс1ож 7 Рго СШ)А 5.0 и С1Л)А 5.5.
Видно, что программное обеспечение СШ)А влияет неоднородно на скорость расчетов: время расчетов потенциала Бреннера увеличилось на 55%, время расчетов коэффициентов увеличилось на 4%. Также можно отметить наблюдающуюся линейную зависимость затраченного времени от количества частиц, хотя в общем случае для расчета коэффициентов полным перебором требуется О(М~) операций.
103 О е кОООО ВОХИЮ 1ОСОЮО вОФХО вО ИО Рисунок 3.16. Время расчета потенциала Бреннера и его градиента при разных версиях СЮРА 5.0 и 5.5 На рис. 3.17 показано сравнение производительности стандартного аппаратного обеспечения с системой 1п1е1 Соте 17 2600, 3.4 ГГц, 8 ядер, 8 Гб ВАМ, ЬЖШ1А Яиаг1го 4000, 0.95 ГГц, 1984 Мб с программным обеспечением %гидов 7 Еп1егрг15е Сада 5.5. Видно, что аппаратное обеспечение тоже значительно влияет на скорость расчетов: несмотря на повышение мощности СР 1.1 время расчетов потенциала Бреннера увеличилось в 2.21 раза, время расчетов коэффициентов увеличилось в 2.73 раза. м~ о р. О ся 1ШОО 4ООООО ВЮО'.6 ОО:ООО 1М:ООО яЮ;ЮО вВХВО Рисунок 3.17.
Время расчета потенциала Бреннера и его градиента на разных видеокартах СТХ400 н Яяадго4000 104 На рис. 3.18 показано сравнение производительности стандартного аппаратного обеспечения и 1п1е1 Хеоп Е5-2650 2.006Нк, 32 ядра, 128Гб ВАМ, МЧИ)?А Тез1а М2075, 1,15 ОНх, 5301 Мб с программным обеспечением СепЮБ 6.2 Сида 5.5. Вновь время расчетов потенциала Бреннера увеличилось в 1.36 раза, время расчетов коэффициентов увеличилось в 1.62 раза. Можно сделать вывод, что в аппаратном обеспечении на скорость расчетов влияет производительность одного графического ядра, а не мощность и количество СР11.
Объем графической памяти следует учитывать только при увеличении размера задачи. 6СОМО ЗОБО 1ШЮОО 12СОМО 14ВЮЮН " Рисунок ЗЛ8. Врема расчета потенциала Бреннера и его градиента на разных видеокартах СТХ480 и Тез1а4000 На рис. 3.19 показано увеличение графика с рис.
3.18 в начальной области, где можно видеть ступенчатую структуру графика, что характерно для параллельных вычислений. Для разных вариантов аппаратного обеспечения ширина ступенек получается одинаковой, порядка 7300 атомов для задачи молекулярного моделирования графена. 105 .О" .1 ОО 100 11 о О 1010 10100 11001 ООО,ОО 10000 10000 11000 0 О 01110 ООООЕ Рисунок 3.19. Время расчета потенциала Бреннера ц его градиента на разных видеокартах СТХ400 и Тез1а4000 (увеличение) 3.4 Решение задачи термостатирования В настоящем разделе рассмотрены вопросы термостатирования. Эта задача актуальна для анализа режимов теплопроводности, который проводится в главе 4. Для примера рассматривались следующие материалы: сотовая ячейка графена (6 атомов углерода), лист графена размера 32.2х18.0 А', фуллерен Соо, нанотрубка (14,0) длиной 25 А.
Область моделирования представляет собой камеру в виде куба с ребром 40 А, так что ее объем равен 64е100 Аз, в который умещаются отмеченные структуры (рис. 3.20). Граничные условия заданы неупругим соударением о виртуальные стенки камеры с коэффициентом отражения 0.5, Они не имеют большого значения, так как во время моделирования структуры представляли собой твердые вещества и не прикасались к стенкам камеры. 106 Рисунок 3.26. Образцы углеродных структур для моделирования: ячейка графена, лист графена, фуллерен, нанотрубка (14,0) Для моделирования были выбраны 4 углеродных наноструктуры, задавались температуры 1К и ЗООК и выбраны два термостата.
Исследовались термостаты Берендсена и Нозе-Хувера, так как они ограничивают нагрев молекулярной системы, препятствуя ее распаду, и позволяют исследовать свойства теплопроводности. В процессе нагрева образец, ячейка графена из 6 атомов, не разрушается без контроля температуры, что позволяет задавать нулевые начальные скорости. Для остальных образцов заданы случайные начальные скорости для каждого атома в диапазоне [-227, 2271 и/с по каждой координате для трйх степеней свободы. Температура системы атомов вычисляется по формуле (1.88). Параметр для термостата Берендсена из формулы (1.77) выбран как — "=0.2. Параметр подобран Л~ экспериментальным путем; сильно меньшие значения приводят к изменению формы атомных колебаний, а сильно большие значения приводят к таким большим 107 колебаниям температуры„которые могут разорвать связи атомов в твердом веществе.
Параметр для термостата Нозе-Хувера из формулы 11.89) выбран как г =100ф, он подбирался экспериментально по таким же соображениям. Молекулярные системы моделировались 10000 шагов по 0.1 фемтосекунде до установления равновесного состояния, потом регистрировались скорости атомов в системе на следующих 10000 шагах моделирования. По ним построены плотности распределения модулей скоростей, и для сравнения нанесено распределение Максвелла с соответствующей температурой. На рис. 3.21 изображены распределение скоростей (м/с) для ячейки графена из шести атомов углерода без контроля температуры, с применением термостата Берендсена, Нозе-Хувера для двух температур 1К и 300К.
!08 Рисунок 3.21. Распределение скоростей прн моделировании ячейки графеиа При температуре 1К и случайном задании скоростей без контроля температуры скорости распределяются практически равномерно с небольшим пиком в области больших скоростей. Значения скоростей всех атомов равны между собой на одном шаге моделирования. При температуре ЗООК и масштабировании скоростей без контроля температуры наблюдается максвелловское распределение скоростей, параметр температуры соответствует заданной. Следует отметить, что использование термостата Нозе-Хувера гораздо точнее задает распределение скоростей, чем термостат Берендсена.
На рис. 3.22 изображены распределения скоростей листа графена с применением термостата Берендсена и Нозе-Хувера для двух температур 1К и ЗООК. Распределения близки к распределению Максвелла, при этом математическое ожидание соответствует заданной температуре.