Главная » Просмотр файлов » Диссертация

Диссертация (786409), страница 10

Файл №786409 Диссертация (Технология программирования алгоритмов молекулярно-динамического моделирования наносистем на графических процессорах) 10 страницаДиссертация (786409) страница 102019-03-12СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 10)

Параметры материала копируются в константную память ( сопб1ап1 ). Коэффициенты потенциала для расчета действующей на каждый атом силы копируются в дополнительную глобальную память. 2.1.5 Редукция данных для определения макропараметров Метод редукции реализован в двух процедурах.

Первая процедура выполняет вычисления по формуле (1.88): Во второй процедуре выполняются оставшиеся шаги, как показано на рис. 2.4. О 1 2 3 4 б б 7 б Р 10 11 12 13 '14 1б Т Т Т Т Т То То Тг То Т Т Тв Тг То Т, Т т= ~в 6+1 гг 2+3 Тг О+5 Тг 6+7 Т В+6 То ОО'гг Т„* го+го т„гв+гв О-З т 2+З т О-т т 6» т В.11 т го о т тво Т, о го 6-7 Т, 2+З т, 1-т то В+т т, аи т, гв О т„* гг-П то О О т Т Тг 2+3 Т 4-7 Т 6ОТ 7г В-16 Т гв'1г Тог и-16 то и+и Т, Рисунок 2.4. Иллюстрации модели параллельной редукции 59 Каждый вычислительный поток суммирует 2 значения и записывает результат в свою ячейку. Процесс получения глобального значения проходит в несколько этапов, Ж число которых равно 1од~У, что обеспечивает сложность — О( — 1оаУ), где Р— количество ядер графического процессора.

2.1.6 Отображение параллельных процессов на архитектуру ОРУ Рисунок 2.5. Иллюстрация отображения расчетной области на архитектуру СРЮ Задача отображения неоднородно взаимодействующих процессов на архитектуру вычислительной машины ставится в основном с целью уменьшения времени обмена данными ~52-541.

В качестве инструмента отображения в этих работах выбирается МР1, назначение которого — распределить вычисления между узлами. А исследуется и оптимизируется объем и время передачи данных между ними. В данной работе предлагается более общее отображение задачи на архитектуру графических процессоров. Таким образом есть набор взаимодействующих процессов, в каждом процессе проводится решение уравнения движения. Вычислительный процесс оперирует данными (координатами частиц), которые хранятся в памяти. 60 Один процесс решает уравнение для одной частицы, но для решения требуются координаты и других частиц, Назначим для каждого вычислительного процесса вычислительный поток.

Таким образом количество вычислительных потоков и блоков устанавливается перед каждым выполнением процедуры не менее необходимого количества вычислительных процессов. Для примера в таблице 2.1 собраны параметры видеокарты Тез1а М2050, характеризующие максимальное количество вычислительных потоков и блоков. Большее количество вычислительных потоков, чем поддерживает видеокарта в каждой размерности, задать технически нельзя.

Таблица 2.1. Вычислительные па амет ы Тек!а М2075. Максимальное количество вычислительных потоков в блоке [х,у,х1 1024, ! 024, 64! Максимальное количество вычислительных блоков [х,,х) [65535, 65535, 65535) 2.8823.10" Максимальное количество элементов С одной стороны необходимо задать такое количество потоков, чтобы каждый из них решал задачу, было минимальное количество простаивающих потоков. С другой стороны количество потоков имеет технические ограничения. Взаимодействие потоков замедляет их выполнение. Поэтому выделим дополнительную память каждому потоку и сделаем копии необходимых для расчета координат, чтобы процесс решения системы уравнений движения выполнялся вычислительными потоками без взаимодействия.

Далее рассмотрим детали каждого вычислительного процесса. Рассмотрим количество операций К = ! и, где ~ = 1..1000000 — количество итераций в конечно-разностной схеме, п=1..100000 — количество частиц, тогда К=!..10". Время расчета равно количеству операций поделенному на ускорение; К 1 — г Т = — = К(~+ ), гдето — доля последовательных вычислений, р = 32, 64, 128, 256, 5 р 512, 1024 в случае вычислений на графических процессорах. Рассмотрим вычисление сил в потенциальном поле Леннарда-Джонса: 61 гдето — РасстоЯние междУ атомами з' и 7', о — РасстоЯние, на котоРом энеРгиЯ взаимодействия становится равной нулю, а — глубина потенциальной ямы. Параметры о и г являются характеристиками атомов соответствующего вещества.

За счет увеличения количества памяти расчет межатомной силы можно 1 — ~ К полностью распараллелить, тогда Т = О, и зависимость Т = К(~+ ) -+ — условного Р Р времени расчетов представлена на рисунке 2.6. Рисунок 2.6. Условное время расчетов в зависимости от количества процессоров Эффективное ускорение достигается за счет полного распараллеливания у — О. При Т" ~ Околичество процессоров влияет в меньшей степени, чем близость Т к О.

Процесс вычислений можно представить как последовательный конвейер вычислений, замедляющийся в том случае, когда количества процессоров недостаточно для выполнения. Для того чтобы определить степень распараллеливания процесса вычислений, рассмотрим количество вычислений в итерационном процессе (рис. 2.7). 62 цп гп Обновление координат и скоростей по алгоритму ско остей Ве ле. роя я= че1 ' бе1сат1ае двббрся.х+ развея.дв1б51ве.» расяев.дстбявхе.х я двяброя. развея. язбзвяс,х + дг с(. я. Вычисление хашчфункций Сортировка сьвсвс;;вовс ьу кеу 'о) :,ш Формирование списка соседних атомов се((ссб (вся весна я а (К а Квас)бх.

х )) - ссбехг госсе я-- госссгте111(ров1,ровЛ '(чв(роз1,ровд) — ь ча(роз1,ров,т)); госсе .= гбсасгг(роя1,рояЛ'( (Чхс111(рсз1, ровд) — Ь'Чап111(раз1, ровд)) яо111(ааКе 11оасд(рсв1),ааКе 1 1оакд(равд)) — Ьс'Ча(ров1,раяЛ ); Вычисление сил. Обновление скоростей, ускорений по алго итм око остей Ве ле. 63 Рисунок 2Л. Диаграмма исполнения однога шага Мд процесса На рисунке 2.7 показано взаимодействие функций в разработанной программе [1051. Инициализация параметров и запуск вычислений на кдРБ выполняется центральным процессором.

Все расчеты проводятся в графической памяти и на графических процессорах. Данные организованы в специальных переменных, состоящих из 4 компонент, переменная координат имеет компоненты из 3 пространственных составляющих и массы атома. Переменная скорости имеет 3 компоненты скорости и значение температуры, переменная ускорения имеет 3 компоненты скорости и значение потенциальной энергии.

Такая организация переменных соответствует архитектуре графических карт по выравниванию памяти. гп роя (4*Н*11оас) че1 (4*Н*11оас) асе1 (4*Н*11оас) роя += че1 * с(е1сат1ие Чг1г)роя.г* раганя.дг1с(Б1ге.у* раганя.ог1с)Б1ге.х + Чг1ороя.у рагаея.Яг1сзгее,х + Яг[йроя.х и с(6г1с)Рагс1с1еиаяЬ (Н*1пс) т с)сг1орагс1с1е1поех (В*Рис) роя (4"Н*11оас) Гпгпяс::яогс Ьу )сеу се11впг)[япагес)наяЬ[гпгеас)14)х.х 1поехз тоссе += йспс0110111(роя1,ровд) *(чг(роя1,рояю) — Ь*ча(роя1,рояз)); госсе Е= гспсогг(роя1,рояд)*( (Чг01тт(роя1,рояЗ) — Ь*Ча0111(роя1, рояЛ ) *г0111 (наае 11оаГЗ (роя1 ),та)се 1 1оасз(рояЮ)) — Ьс)*уа(роя1,рояЗ) ); Рисунок 2.8. Объем памяти функций одного шага Мд процесса.

Отмечены переменные, зависящие от количества элементов для функции сортировки — в б'Ю раз, для функции формирования списка соседних атомов — в 14еФ раз, для функции вычисления сил — в 89еФ раз. 64 На рисунке 2.8 показано использование памяти в процедурах. Отмечены только переменные, которые зависят от количества элементов.

Увеличение количества атомов в системе увеличивает объем памяти в системе для функции обновления координат и скоростей в 12еФ раз, для функции вычисления хеш-функций — в бе1ч'раз, Рисуиок 2.9. Алгоритмическая сложность зтаиов моделирования Как показано на рис. 2.9, на центральном процессоре выполняются только последовательные части и вызовы процедур, подготовка и копирование данных на устройство, задание конфигурации вычислений на 0РБ и его запуск.

Справа показано использование памяти в процедурах, а также их вычислительная сложность. Для построения диаграммы использованных процессоров рассмотрим систему из Агит = 1ООО атомов и р = 1024 процессоров, Рисунок 2.10. Профиль параллелизма на одном шаге МД при использовании потенциала Леннарда- Джонса Из рисунка 2.10 видно, что при наличии количества процессоров большим, чем количество атомов, вычисления не проходят полностью параллельно. В столбце 3 количество вычислений превосходит количество процессоров в 3 раза, так как сложность этапа сортировки пропорциональна не 0(Л~), а 0(У1одЮ). В таком случае условное время вычислений равно 7 единиц.

Время вычислений оказалось больше, чем при использовании закона Амдала и подстановке доли параллельных вычислений и количества используемых процессоров. Рассмотрим вычисление сил в потенциальном поле Бреннера 11.41). Шаги итерационного процесса выполняются аналогично рис. 2.7 с заменой потенциала Леннарда-Джонса на потенциал Бреннера. Количество вычислений в итерационном процессе представлено на рис. 2.11. В столбце 5 количество вычислений превосходит количество процессоров в 4 раза, так как сложность этапа вычисления сил пропорциональна 4Ж. В таком случае условное время вычислений равно 10 единиц. 66 Рисунок 2.11. Количество вычислений на одном шаге МД прн использовании потенциала Бреннера Распределение количества вычислений в потоке вычислений не полностью отражает затраченное время, так как ускорение вычислений при параллельных расчетах достигается за счет использования дополнительной памяти.

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6489
Авторов
на СтудИзбе
303
Средний доход
с одного платного файла
Обучение Подробнее