Лекция. CUDA 3 (Колганов) (Электронные лекции), страница 3
Описание файла
Файл "Лекция. CUDA 3 (Колганов)" внутри архива находится в папке "Электронные лекции 2016 года". PDF-файл из архива "Электронные лекции", который расположен в категории "". Всё это находится в предмете "суперкомпьютерное моделирование и технологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Для доступав обратную сторону нужен отдельный вызовcudaDeviceEnablePeerAccessПрямой P2P доступcudaSetDevice(0); // Переключились на device 0float* p0;size_t size = 1024 * sizeof(float);cudaMalloc(&p0, size); // Выделить память на device 0cudaSetDevice(1); // Переключились на device 1cudaDeviceEnablePeerAccess(0, 0); // Включить peer-to-peerдоступ к 0// Запуск на device 1// p0 указывает на память, выделенную на device 0MyKernel<<<1000, 128>>>(p0);P2P на tesla-cmcfor (int device = 0..deviceCount) {for (int peerDevice = 0..deviceCount){if (device == peerDevice) {printf("- "); continue;}int canAccessPeer = -1;cudaDeviceCanAccessPeer(&canAccessPeer,device, peerDevice);printf("%1d ", canAccessPeer);}0 1 2 3printf("\n");0 - 0 0 0}1 0 - 1 02 0 1 - 03 0 0 0 -Тест прямого P2P копиронияprintf("\nCopying %d MB\n", sizeOfMem / (1024 * 1024));cudaSetDevice(1);cudaMalloc(&memoryOnDevice1, sizeOfMem);cudaSetDevice(2);cudaMalloc(&memoryOnDevice2, sizeOfMem);...;/* замерить время cudaMemcpyPeer или cudaMemcpy */printf("\nElapsed time %f \n", elapsedTime);cudaDeviceEnablePeerAccess(1, 0);printf("Enable peer access\n");...;/* замерить время cudaMemcpyPeer или cudaMemcpy */printf("Elapsed time %f\n", elapsedTime);Тест прямого P2P копирония$./a.out 402410240Copying 383 MBElapsed time 475.087402Enable peer accessElapsed time 75.842880Выводы Поддержка P2P-копирований упрощает хост-код принеобходимости организации пересылок междуустройствами Поддержка прямых P2P-копирований дает ускорениекопирований в несколько раз Поддержка прямого P2P-доступа избавляет отнеобходимости организации пересылок междуустройствами.