20151014_MSU_rnd (1185575), страница 3
Текст из файла (страница 3)
Воронюк, М.В. Якобовский. 2012Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.74Сравнение LRND32-GPU и CURAND (NVidia)ТипПери-одВозм.перехода(skip-ahead)G(x) r 255M-посл-ть2255-1+149,5G(x) r 1023M-посл-ть21023-1+42,1XORWOWxor-shift231- 1+19,1MRG32k3a2 рекуррентных генра2191+38,2MTGP32Mersenne-Twister(MT)211213-1–Библио-тека/ГенераторPRANDNvidiaCUDANDПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.75Результат работы алгоритма для GPUБиблио-тека/ГенераторV, 106ПСЧ/сУск.
кPRANDУск. кANSIrand3000PRAND GPU-TG(x) r 255549,226,92,7G(x) r 1023539,329,22,6*106 ПСЧ/сPRAND2552500IntelMRG32k3arand2000PRAND GPUG(x) r 2552 591,0127,012,7G(x) r 10232 382,0128,811,7G(x) r 25520,410,1G(x) r 102318,510,11000204,1--1500105,3--0,51500PRANDANSIrandIntel MKLMRG32k3a076PRANDGPU255PRANDGPU-T255Отличия генерации ПСЧ на GPU от генерации на CPUГенерация ПСЧ возможна только порциями.При blockDim=128 и r=255 порция составляет 512 ПСЧ. На практике для полноценной загрузки GPU требуетсявыбирать размер порции гораздо больше, например106 ПСЧ. Время на генерацию ПСЧ в ~3-4 раза меньше временипередачи их с графической карты в оперативную памятьпри использовании page-locked-выделения памяти, и в ~89 раз меньше без использования. Использовать ПСЧ на GPU без передачи Латентность передачи можно частично покрыть, еслисовмещать передачу с генерацией следующей порции Скорость генерации сильнее зависит от шаблона доступак глобальной памяти, чем от вычислительной сложностиалгоритма (возрастающей к ростом r)Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.77ЗаключениеСформулированы требования к генераторампсевдослучайных чисел для многопроцессорныхсиcтем Рассмотрены параллельные алгоритмыгенерации псевдослучайных чиселобеспечивающие возможность использованияпроизвольного числа процессоровПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.78ЛитератураЯкобовский М.В.
Введение в параллельные методы решения задач: Учебное пособие /Предисл.: В. А. Садовничий. – М.: Издательство Московского университета, 2013. – 328с., илл. – (Серия «Суперкомпьютерное образование») ISBN 978-5-211-06382-2И.М.Соболь. Численные методы Монте-Карло.
– М.: Наука, 1973.Richard P. Brent, Uniform Random Number Generators for Supercomputers, ComputerSciences Laboratory; Australian National University Appeared in Proceedings Fifth AustralianSupercomputer Conference (Melbourne, December 1992), 95-104. c 1992, 5ASC OrganisingCommittee.Кнут Дональд Эрвин, искусство программирования, том.2. Получисленные алгоритмы,3-е издание.: Пер с англ., : Уч пос - М.: Издательский дом <Вильямс>, 2001. - 832 с., ил.G. Marsaglia, "Random numbers fall mainly on the planes", Proc. Nat.
Acad. Sci. USA 61, 1(1968), 25-28.П.Хоровиц, У.Хилл. Искусство схемотехники: В 2-х томах. Пер. с англ. – М.: Мир, 1983. Т.2 590с.Тарасевич Ю.Ю. Перколяция: теория, приложения, алгоритмы. 2002. 112 с.Л.Ю. Бараш. Алгоритм AKS проверки чисел на простоту и поиск констант генераторовпсевдослучайных чисел, Безопасность информационных технологий, 2 (2005) 27-38.В.Жельников. Криптография от папируса до компьютера – М., ABF, 1996, ил., 336 с.Якобовский М.В. Библиотека генерации псевдослучайных чисел lrnd32.Дистрибутив.
2007, http://www.imamod.ru/projects/FondProgramm/RndLib/lrnd32_v02Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.79КонтактыЯкобовский М.В.проф., д.ф.-м.н.,зав. сектором«Программного обеспечения многопроцессорныхсистем и вычислительных сетей»Института прикладной математики им.М.В.Келдыша Российской академии наукmail: lira@imamod.ruweb: http://lira.imamod.ruПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.80.