20151014_MSU_rnd (Лекции)
Описание файла
Файл "20151014_MSU_rnd" внутри архива находится в папке "Лекции". PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "параллельные методы решения задач" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Псевдослучайные числа для расчетов намногопроцессорных системахЯкобовский Михаил Владимировичпроф., д.ф.-м.н.Институт прикладной математикиим. М.В.Келдыша РАН, МоскваПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.1Применение последовательностей случайных ипсевдослучайных чиселЧисленное моделирование– Методы молекулярной динамики– Генетические алгоритмыЧисленные методы– Многомерная многоэкстремальная оптимизация– Определение многомерных интеграловПринятие решения Игры Лотереи…Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.2Определение площади фигуры140000120000100000800006000040000200000020000400006000080000100000 120000 140000Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.3Последовательный алгоритмM=0;140000for(i=0;i<N;i++)120000{X=rand();100000Y=rand();Если (точка (X,Y) принадлежит фигуре)80000то M++;60000}S=130000*130000*M/N;400002000000200004000060000Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.80000100000 120000 1400004Параллельный алгоритм для P процессоровКаждый процессор определяет число mrank«своих» N/P точек, попавших внутрь фигуры2.
Найдем общее число точек, попавших внутрьфигуры1.M P 1 mrankrank 03.S=S0*M/N;1400001400001200001200001000001000008000080000600006000040000400002000020000000500001000001500000Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.500001000001500005Другой параллельный алгоритм, на основе методагеометрического параллелизмаВозможенбольшойдисбаланснагрузки140000120000100000800006000040000200000020000400006000080000100000 120000 140000Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.6ВопросыДолжен ли ответ параллельной программы в точностисовпадать с ответом последовательной версии?НЕТГде взять нужноеколичество разных «своих»элементов?Физический генератор?Нельзя обеспечитьвопроизводимость.Как обеспечитьуверенность всохранении свойствгенератора?ДАКаким образом на каждом из процессороввычислить значения именно «своих»элементов, не вычисляя значений чужих?Брать на процессоре с номером rankчисла с номерами rank+P*IКак вычислять каждое P-ое число?Вычислять на процессоре с номеромrank числа из диапазона(2N/P)*rank … (2N/P)*(rank+1)-1Как попасть в начало диапазона?Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.7«Аппаратный» генератор СЧИнструкция rdrand.
Архитектура Ivy Bridgehttp://www.securitylab.ru/analytics/435181.phpunsigned int __builtin_ia32_rdrand32_step (unsigned int *);http://gcc.gnu.org/onlinedocs/gcc/X86-Built-inFunctions.html#X86-Built-in-FunctionsTHE INTEL® RANDOM NUMBER GENERATORCRYPTOGRAPHY RESEARCH, INC. WHITE PAPERPREPARED FOR INTEL CORPORATION Benjamin Jun andPaul Kocher April 22, 1999Нарушение идентичности размещения точекЕсли брать на процессоре с номером rank числас номерами rank+P*j, то– При P=1: (0,1), (2,3), (4,5), (6,7), (8,9), (10,11)– При P=2:• У первого процесса: (0,2), (4,6) (8,10)• У второго процесса: (1,3), (5,7), (9,11).Идентичность точек нужна:– Для получения одинакового результата– Для упрощения отладки– Для сохранения свойств последовательности• x1 x2 x3 x4 x5 x6 x7 x8 x9 …• x2 x4 x6 x8 x10 …Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.9Метод leapfrog генерации последовательностипсевдослучайных чиселОдин процессор1379253561426895Два процессора1 7 2 3 6 4 6 9 3 9 5 5 1 2 8 5Три процессора1379253561426895137925356142689575629Метод leapfrog генерации последовательностипсевдослучайных чисел70u(k)=(5u(k-1)+1)mod6460v(k)=u(4k)=(49v(k-1)+28)mod645040302010015913172125293337414549Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.5357616511Слу чай наяпос ледов ате льность ………70v(k)=(49v(k-1)+28)mod64605040302010015913172125293337414549Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.535761651213Решетка p=100%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.14Перколяционная решетка p=90%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.15Перколяционная решетка p=80%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.16Перколяционная решетка p=70%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.17Перколяционная решетка p=60%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.18Перколяционная решетка p=50%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.19Перколяционная решетка p=40%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.20Перколяционная решетка p=30%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.21Перколяционная решетка p=20%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.22Перколяционная решетка p=10%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.23Перколяционная решетка p=0%Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.24Генерация псевдослучайных чисел• Достаточная длина периода последовательностипсевдослучайных чиселСогласованность определениямножества открытых ребер припараллельной обработке Возможность определениялюбого элементапоследовательности за короткое,не зависящее от номераэлемента, времяПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.25Генерация псевдослучайных чиселлинейные конгруэнтные генераторы[Деррик Генри Леммер (Derrick Henry Lehmer), 1948]U n 1 aU n c mod mс=1mod2, a=1mod4, m=2k -> T=mПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.26,Вычисление элемента с номером n a 1c mod mU n a U 0 a 1 nnПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.27Использование для векторных компьютеровleapfrogНомер шага0 1230+P 0+2P 0+3P 0+4P1+P 1+2P 1+3P 1+4P2+P 2+2P 2+3P 2+4P3+P 3+2P 3+3P 3+4P4+P 4+2P 4+3P 4+4P....... n an 1 c mod mU n a U 0 a 1 na1 nc mod mA a mod m C a 1 U n AU 0 C mod mU P i AU i C mod mU P i 1 AU i 1 C mod mПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.28Как быстро вычислить? a 1c mod mU n a U 0 a 1 nna b mod m a mod m b mod m mod mkm r tm q k t m r qab mod m a mod m b mod m mod mkm r tm q ktm kq rt m rqПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.29Вычислить a^nЗа log(n) шаговa mod m nan n 2 n 2 mod m n n2 n a mod m a 2 mod m mod ma a1376a43 33a a2 2a21a21 21Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.a30Бинарное умножение13 8 4 113 1 2 1 2 0 2 1 21310 110123a a138 4 121a a a8401Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.31Вычислить a^n за O(logn) операций2*log(n) операцийa153 aa2*76a a a a aa222*92*38 2a a a a aa 82222*192 2Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.2232,Как вычислить быстро? a 1c mod mU n a U 0 a 1 nnПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.33,Разложение дроби a 1c mod mU n a U 0 a 1 nna 1 a a 1 a 1ntktn k t k n 2Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.34Понижение степени разложением дроби t a k 1 a t 1 an 1 c mod m ac mod m a 1 a 1 a 1 t a ak 1 at 1 c mod mm a 1 m a 1 m k n 2t nkПсевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.35Случайные точкиПоследовательностьxn1 845xn 2625 mod 1024512 точек вида x2i , x2i 1 лежат на несколькихпрямых1200100080060040020000200400600Псевдослучайные числа для расчетов на многопроцессорных системах© Якобовский М.В.8001000120038Линейные конгруэнтные генераторы [Лемер, 1948]При с=0 d-мерные точки расположены не более чемв d d!m гиперплоскостях[G.